Beruflich Dokumente
Kultur Dokumente
Santo Andr-SP
2014
EMANOEL FABIANO MENEZES PEREIRA
Santo Andr-SP
2014
Agradecimentos
Aos meus antigos gerentes e supervisores Luiz Carlos Gomes, Edy Hayashida
e Cristina Campoi pelo incentivo aos estudos e por acreditarem em mim.
Ao grande amigo Ronaldo Rodrigues Chaves, pelo apoio, pelo tempo que es-
tudamos juntos desde a graduao, certamente muito do que sei devo a ele.
Ao meu orientador Sinu Dayan Barbero Lodovici pelo apoio, pela ateno e
por acreditar no projeto.
The games enchanted mankind since ancient times. Especially, abstract games
(or mathematical) attracted the attention of illustrious mathematicians like Ber-
noulli, among many. And this attraction gave rise to new areas of mathematics,
highlighted, also appeared to Game Theory. The theory behind the beauty of trans-
forming human interactions in games, modeling phenomena that can be observed
when two or more decision-makers interact with conflict and / or cooperation.
The study of Games Theory uses mathematical modeling resources equating
different situations of different fields of study and this interdisciplinary characteristic
that inspired this work. The Games Theory has been used in various areas, such
as economics, biology, sociology, etc.
This paper intends spending the basics of Games Theory to elementary school te-
achers as a possible tool to foster among the students, the interest in applied mathe-
matics and these be benefited by the development of strategic thinking, attention,
logical reasoning, planning action and sequencing, very useful skills in problem-
solving competence.
Its desire to happen the construction of students knowledge in a more attractive
way.
2 Racionalidade e Utilidade 30
2.1 Comportamento Estratgico . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Racionalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2.1 A escolha racional. . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3 Funo Utilidade e Funo Recompensa . . . . . . . . . . . . . . . . 35
3 Jogos Estticos 39
3.1 Descrio de Jogos Estticos . . . . . . . . . . . . . . . . . . . . . . . 42
3.2 Soluo de um jogo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.1 Resolvendo Jogos usando dominncia . . . . . . . . . . . . . . 48
3.2.2 Deleo Iterativa de Estratgias Dominadas . . . . . . . . . . 58
3.2.3 Equilbrio de Nash . . . . . . . . . . . . . . . . . . . . . . . . 68
3.2.4 Existncia do Equilbrio de Nash . . . . . . . . . . . . . . . . 76
4 Experincias de Campo 78
4.1 Jogo das Notas e dois tipos de jogadores . . . . . . . . . . . . . . . . 79
4.2 A Batalha de Bismarck e a tomada de deciso da rota de ataque. . . 79
4.3 Jogo da Escolha e a Deleo Iterativa de Estratgias Dominadas . . . 81
4.4 O Dilema do Prisioneiro . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.5 Respostas de exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . 83
SUMRIO 8
5 Consideraes finais 84
Notao
A Teoria dos Jogos teve inicio em 1920 com os estudos de John Von Neumann
(1903-1957) para desenvolver uma abordagem cientfica que pudesse ser utilizada
em uma partida de pquer. Em seus estudos Neumann percebeu que as estrat-
gias aplicadas neste jogo poderiam ser utilizadas tambm no mundo dos negcios.
Nascido na Hungria, emigrou para os Estados Unidos na dcada de 1930. Em 1928
publicou Zur Theorie der Gesellschaftsspiele, Mathematische Annalen, onde mos-
tra que jogos de soma-zero (onde h um perdedor sempre que h um vencedor) tem
soluo determinada por tcnicas matemticas.
No entanto importante falar de precursores da ideia, citamo-los abaixo:
Antoine Augustin Cournot, matemtico francs que viveu entre 1801 e 1877,
publicou, em 1838, Recherches sur les Principes Mathmatiques de la Thorie
des Richesses, pesquisas sobre os Princpios Matemticos da Teoria da Ri-
queza. Nesta obra, Cournot estabeleceu os princpios tericos da teoria dos
jogos, apresentando o modelo de duoplio onde duas empresas que competiam
entre si comercializando um mesmo produto, decidiam quais as quantidades
que maximizariam seus lucros, sabendo que a produo de cada uma influen-
ciava nos lucros da outra.(O Dupolio de Cournot). Os elementos apresentados
por Cournot so considerados precursores do desenvolvimento da Teoria dos
Jogos, por isso algumas referncias na literatura chamam ao equilbrio de Nash
1.1 Breve Histrico 13
Flix Edouard Justin Emile Borel (1871-1956), outro matemtico francs disse:
Com isso utiliza de forma pioneira o conceito moderno de estratgia. Para cada
circunstncia possvel (finitas em nmeros), Borel mostrava o que o agente
deve fazer, chamou isso de mtodo de jogo. O termo jogos utilizado por ele
refere-se especificamente a jogos estratgicos.
Em 1944, surge formalmente a Teoria dos Jogos com a publicao do livro Teoria
dos Jogos e Comportamento Econmico (The Theory of Games and Economic Beha-
vior) do matemtico hngaro John Von Neumann em co-autoria com o economista
alemo Oskar Morgenstern (1902-1977).
Nesta obra os autores desenvolveram a anlise dos jogos de soma zero, definiram
a representao dos jogos em forma extensiva alm de discutirem a cooperao e a
formao de coalizao entre os jogadores.
Considerada um marco no estudo da teoria dos jogos, a obra mostrou-se bastante
restritiva pois focava-se na anlise dos jogos de soma zero, que no refletia todas as
das situaes de interao entre indivduos ou entre organizaes. Era necessrio
ferramentas tericas mais abrangentes que fossem capazes de analisar outros modelos
de interao estratgica.
1.1 Breve Histrico 14
modo que ele ir preferir cessar a ameaa. Naquele momento estava em pauta a
corrida armamentista e o temor a guerra nuclear. Seu trabalho tratou tambm de
coordenao de decises entre indivduos de forma a promover um resultado melhor
para todos.
Hoje a teoria dos jogos aplicada a economia, administrao, direito, cincia
poltica, questes de natureza militar e biologia, essencial no estudo de situaes
que envolvam interaes estratgicas.
1.2 Definies
ao). Por ltimo cada jogador tem interesse ou preferncias por cada situao (ou
por cada resultado) e isto estabelece o ganho ou pagamento deste jogador. Vamos
colocar uma linguagem comum para a compreenso geral de um jogo.
No decorrer desse trabalho as diferenas entre jogos no seu sentido mais geral
e jogos em teoria dos jogos ser evidenciado, no entanto daremos alguns exemplos
aqui para ilustrarmos a ideia.
Exemplo 1.2. Uma prefeitura cogita diminuir os impostos fiscais para tentar atrair
as empresas, gerando empregos e aumentando a arrecadao. No entanto teme que
isso seja feito tambm pelas cidades vizinhas e se assim ocorrer corre o risco de ver
sua arrecadao diminuda pois as empresas que l j esto tambm pagariam menos
impostos e novas empresas acabariam por no se instalarem nessa cidade.
H uma interao entre as decises das cidades envolvidas e isso uma situao
de jogos em teoria dos jogos.
1.2 Definies 17
Exemplo 1.3. Cliente de um banco temem por sua falncia e decidem se devem
correr ao banco para tentar retirar suas economia, se todos solicitarem a retirada,
o banco fatalmente ir falir e muito provvel que no conseguir pagar a todos os
credores e clientes alm de gerar um crise que resultar em prejuzos a populao.
Caso resolvam confiar, h chance que o banco saia da crise. Aqui tambm vemos
interaes nas aes, nesta teoria isto um jogo.
1
A palavra estratgia derivada da palavra grega strategos ( o)
1.2 Definies 18
Dado um jogador qualquer i, podemos falar das estratgias escolhidas pelos de-
mais jogadores no jogo. Neste caso utilizaremos a notao por si para represnetar
uma combinao das estratgias de todos jogadores exceto do jogador i, tambm
chamado de perfil de estratgia para todos os jogadores exceto o jogador i:
2
Muitas vezes diferentes estratgias podem levar a resultados iguais, e se estes iguais resultados so os
melhores, todas sero melhor estratgia, desde que nenhuma outra estratgia resulte em um retorno mais
alto.
3
Ben Polak Professor de Economia e Gerenciamento no Departamento de Economia e da Escola de
Gerenciamento da Universidade de Yale, formado em Ph.D. da Universidade de Harvard.
1.2 Definies 19
Qn
S= i=1 Si = S1 S2 ... Si ... Sn , assim (s1 , s2 , ..., si , ..., sn ) S onde
cada si uma estratgia pura do jogador i e o smbolo denota o produto cartesiano.
Quando todos os jogadores fizeram todas suas escolhas (ou quando um perfil de
estratgia acontece) o jogo terminou e obviamente h uma consequncia.
Clubes Pontos SG GP
A 39 11 28
B 37 9 24
C 40 10 26
Temos aqui trs possveis resultados para o campeonato, esses resultados depen-
dem apenas de como termina o ltimo jogo entre A e B:
Vice-campeo - 50 pontos
Suponha que o time A se importa apenas com sua posio no campeonato, pode-
mos dizer que A, prefere o resultado R1 sobre todos os outros e indiferente entre
R2 e R3 (pois nesse caso melhor terminar em primeiro do que em terceiro). Em
termos de recompensa, a recompensa de A pode ser considerada os pontos obtidos
no ranking, pois estes mostram suas preferncias. O time A no tem muita tradio
e ser campeo no trar grandes mudanas no ranking entre os times.
O time B e C so rivais e disputam o ttulo e a posio no ranking. A rivali-
dade entre B e C influencia diretamente suas preferncias quanto aos resultados (e
consequentemente suas recompensas), pois alm de sua classificao, o time B, por
exemplo, preocupa-se com a pontuao do time C no ranking geral, em especial se
B est mais preocupado com a pontuao no ranking, podemos colocar como recom-
pensa de B a diferena entre os pontos que ele obtm no ranking e os pontos que C
obtm.
A prxima tabela rene as recompensas de A e B, que dependem do resultado do
ltimo jogo.
8
Entenda como ranking geral, um ranking externo ao campeonato, como o caso do Ranking da Fifa
que atribui pontos aos times de acordo com sua performance em campeonatos oficiais.
1.2 Definies 22
Observe que para B vencer por diferena de 1 pior do que empatar pois embora
a vitria simples lhe assegure uma melhor posio neste campeonato do que se
B vir a empatar, do ponto de vista de recompensa, B melhor recompensado
com este segundo resultado, pois em sua ponderao impede a vitria de C no
1.2 Definies 23
Concluso
A especificao das consequncias das aes realizadas pelos jogadores (os re-
sultados).
h dois jogadores;
um jogador que der check mate no rei do outro jogador ganha o jogo, de outra
forma, um empate declarado (h tambm casos de vitria por jogadas ilegais
do oponente);
escolhas (ou estratgias). Por hiptese assumamos que nenhum deles saiba o que o
outro vai escolher.
As possveis interaes (neste caso a combinao entre as escolhas) e seus res-
pectivos resultados so:
DUE
C A
UNO
D B
DUE
C D
UNO
A B
As combinaes das notas recebidas por UNO e por DUE resultam na Tabela 1.5
, por conter todos os resultados do jogo, esta tabela tambm leva o nome de Matriz
de Resultados.
Nas linha 1 e coluna 1 esto os jogadores Uno e Due, na linha 2, as estratgias
do jogador Due e na coluna 2 as estratgias do jogador UNO. No interior da Tabela
1.3 Matriz de Resultado e Matriz de Recompensa 26
DUE
(C,C) (A,D)
UNO
(D,A) (B,B)
NOTA VALOR
A 3
B 1
C 0
D -1
Embora tenhamos atribudo valores s notas, ainda no podemos dizer que esses
valores representam a recompensa de cada jogador pois outros aspecto podem influ-
enciar na importncia que cada jogador d a cada resultado e essa importncia
que deve definir sua recompensa. Neste momento sabemos que a recompensa depende
do resultado do jogo e no necessariamente igual quando mudamos o jogador pois
seus anseios podem ser diferentes logo:
Seja X o conjunto ordenado dos pares (i,j) dos resultados do jogo onde i a
nota tirada pelo jogador UNO e j a nota tirada pelo jogador DUE
Jogador Egocntrico:
Este jogador se preocupa apenas com sua nota, para ele sua recompensa pode
ser representada pelo valores obtidos na tabela 1.1 j que essa representa nu-
mericamente qual nota melhor.
Jogador Socialista13 :
Para este jogador ter bom resultado (tirar boa nota) importante mas considera
que os jogadores devem receber a mesma nota e por isso v a diferena entre
os valores de sua nota e do outro jogador como algo negativo.
Supondo agora, UNO um jogador socialista podemos definir uma funo re-
compensa rU no (i, j)14 em funo dos valores das notas dos dois jogadores que
considera o valor da nota que recebe (i) e subtrai desta a diferena entre os
valores da nota que recebe e da nota que o outro jogador recebe:
13
O nome Socialista no deve ser empregado no seu sentido mais complexo, trata-se apenas de um
cognome criado para este fictcio tipo de jogador, a rigor poderia ser dado outro nome. Apropriamos deste
pois esta designao dada a doutrina politico-econmica cujos princpios se baseiam na coletividade dos
mecanismos de distribuio, na propriedade coletiva e na organizao de uma sociedade sem a separao
por classes sociais, de certo modo caracteriza um pouco os anseios deste jogador
14
Observe que este um jogador fictcio cuja funo recompensa modelada para este jogador.
1.3 Matriz de Resultado e Matriz de Recompensa 28
Temos agora um jogo onde conhecemos sua Matriz de Resultados e temos a re-
compensa para dois tipos de jogadores, caso os jogadores sejam um dos dois tipos
estudados possvel construir a Matriz de Recompensas. Observe que h apenas uma
Matriz de Resultados mas pode haver mais de uma Matriz de Recompensa pois esta
depende de como o jogador recebe um resultado de um jogo. A tabela a seguir mostra
possveis diferentes matrizes de recompensa de acordo com os tipos de jogadores para
este jogo.
exemplo). Presume-se que cada jogador atue simultaneamente ou, ao menos, sem
conhecer a ao dos outros.
DUE
(0,0) (3,-1)
UNO
(-1,3) (1,1)
DUE
(0,0) (3,-5)
UNO
(-1,-1) (1,1)
DUE
(0,0) (-1,-5)
UNO
(-5,-1) (1,1)
Racionalidade e Utilidade
Conta a lenda que na Copa de 1958, durante a preleo antes do jogo contra
a antiga Unio Sovitica, o tcnico brasileiro Vicente Feola reuniu os jogadores e
combinou a estratgia da partida. Segundo Nelson Correa, foi algo assim:
No dia do jogo o tcnico Vicente Feola tentava enfiar na cabea de Garrincha um
esquema ttico mortal que seria usado pela primeira vez na Seleo, contra os russos:
No meio de campo - dizia Feola - Nilson Santos, Zito e Didi trocariam passes curtos
para atrair a ateno dos russos... Vav puxaria a marcao da defesa deles caindo
para o lado esquerdo do campo... Depois da troca de passes no meio do campo,
repentinamente a bola seria lanada por Nilton Santos nas costas do marcador de
Garrincha. Garrincha venceria facilmente seu marcador na corrida e com a bola
dominada iria at rea do adversrio, sempre pela direita, e ao chegar linha de
fundo cruzaria a bola na direo da marca de pnalti; Mazzola viria de frente em
grande velocidade j sabendo onde a bola seria lanada e faria o gol!
Garrincha com a camisa jogada no ombro, ouvia sem muito interesse a preleo,
entre divertido e distrado, e em sua natural simplicidade pergunto ao tcnico: T
legal, Seu Feola!... Mas o senhor j combinou tudo isso com os russos?. [4]
Garrincha, gnio do futebol e tido por muitos como algum com escasso racio-
cnio, mostra que para uma estratgia ser bem sucedida deve considerar todas as
reaes do seu adversrio.
A eleio deveria ser feita em dois turnos onde disputariam dois esportes no
primeiro turno (pois assim, um necessariamente teria dois votos contra o outro) e
o ganhador disputaria contra esporte que no participou do primeiro turno.
Exerccio 2.1. No exemplo 2.1 as meninas foram as mais prejudicadas, uma vez
que o campeonato escolhido era sua terceira opo. Caso a lder das meninas tenha
previsto a estratgia da direo, sugira o que elas poderiam fazer para serem menos
prejudicadas.
2.2 Racionalidade 33
2.2 Racionalidade
Aqui a ao racional tida como aquela que utiliza os melhores meios tendo em
vista os seus objetivos. A racionalidade est ligada ao meio que um agente utiliza
para alcanar seus fins e no com os fins em sim mesmo. No se discute se o objetivo
do jogador bom ou ruim, no h julgamento tico ou moral, o que se discute que
uma vez conhecido seu objetivo, a melhor deciso a que melhor pode alcan-lo.2
f %m
Ento para Joo almoar feijoada pelo menos to bom quanto almoar macar-
ronada.
x y x % y mas no y % x.
x y, l-se x estritamente prefervel a y.
( ou x sempre prefervel a y)
x y x % y e y % x.
x y, l-se x indiferente a y.
( ou x equivalente a y)
No ato de uma deciso, um agente racional far sua escolha de acordo com suas
relaes de preferncia.
No decorrer dos jogo, todos os jogadores fazem sua escolha at que um resultado
seja obtido. O objetivo da teoria dos jogos analisar os possveis resultados e
apontar qual a estratgia mais adequada para se obter o melhor desses. Para isso
deve-se modelar o jogo matematicamente e em especial, modelar os resultados
encontrar uma funo que determine como um jogador avalia os resultados, segundo
suas preferncias. A ideia que o valor que maximiza essa funo seja o valor
atribudo a preferncia do jogador entre os resultados.
Na unidade 2.2.1 vimos sobre escolha racional e preferncia, a funo recompensa
est relacionada com o processo de escolha. O agente tem uma ordem de preferncia
em relao aos possveis resultados e esses resultados que a priore no so neces-
sariamente nmeros passam a ser representada por nmeros. Mais precisamente
esperamos que uma funo possa descrever uma situao onde, para quaisquer dois
eventos alternativos que so colocadas diante de um agente como possibilidades e
o agente seja capaz de dizer qual dos dois prefere, isto , a funo deva descrever
numericamente a ordem de preferncia.
uma extenso muito natural que a funo recompensa possa permitir com-
parar no s os eventos, mas tambm combinaes de eventos com probabilidades
declaradas.
Por utilizar a utilidade de cada resultado, a funo recompensa tambm recebe
o nome de funo utilidade, embora alguns autores faam uma pequena distino
entre as duas.
O termo recompensa e funo recompensa so muito utilizado quando se estuda
teoria das decises, que no necessariamente fazem parte da Teoria dos Jogos pois
nem todas as decises so advindas de interaes estratgicas. Em [2], a funo
recompensa definida no estudo das decises simples como uma funo que associa
um valor numrico a uma ao tomada por um agente (dentro de um conjunto de
possveis aes)e a funo utilidade definida como uma funo que associa um
valor numrico a cada resultado de uma interao estratgica. Assim para Webb:
Se uma ao a produz um resultado w(a), e f e g so respectivamente as funes
recompensa e utilidade ento f (a) = g(w(a))
J Neumann em [9] no utiliza o termo recompensa (payoff em ingls) e trata o
assunto utilizando apenas utilidade (utility).
Por sua vez, Ronaldo Fiani em [1] fala sobre utilidade mas utiliza apenas a funo
recompensa, com a mesma definio da funo utilidade feita por Webb em [2].
Observe que a funo recompensa da definio 2.6 est associando nmero ao
resultado de um jogo(assim como definido a funo utilidade em [2]), no entanto o
estudo da teoria dos jogos procura analisar a maneira como se chega a um resultado
ou qual a estratgia para se alcanar uma determinada recompensa. Um outro fato
importante que embora a utilidade feita de acordo as preferncias dos possveis
desta propriedade a funo recompensa foi definida em funo do resultado. No entanto, ao estudarmos
um jogo avaliamos como chegar a um determinado resultado preferido e por esse motivo mais comum
relacionar a funo recompensa em funo do perfil de estratgia, uma vez que para cada perfil h sempre
um resultado.
2.3 Funo Utilidade e Funo Recompensa 37
Definio 2.8. Em um jogo com n jogadores e N = (1, ..., i, ...n) , o conjunto desses
jogadores, o vetor de recompensa o vetor (p1 , ..., pi , ..., pn ) onde pi a recom-
pensa do jogador i N associado a um resultado do jogo. Logo para cada perfil
estratgia s temos um vetor de recompensas (p1 , ..., pi , ..., pn ).
Nesse momento podemos definir uma nova funo que associa diretamente o
perfil de estratgia s a recompensa do jogador i e usaremos em muitos casos essa
funo como funo recompensa de i em detrimento da funo definida em 2.6.
Definio 2.9. Para cada jogador i, a funo ui : S R que associa cada perfil de
estratgia s S a um nmero real que representa a utilidade do resultado do jogo
quando s desenvolvido. A funo ui chamada de funo recompensa do jogador
i e ui (s) sua recompensa.
Definio 2.10. Um jogador i est satisfeito com s = (s1 , s2 , ..., si , ..., sn ) se:
ui (s) = ui (si , si ) = ui (s1 , s2 , s3 , ...si , ..., sn ) > ui (si , si ) , para toda estratgia si
em Si .
2.3 Funo Utilidade e Funo Recompensa 38
Esse jogo possui uma nica rodada e a recompensa de cada jogador depende da
combinao das escolhas feitas simultaneamente por ambos jogadores. A prxima
tabela a Matriz de Recompensas para esse jogo. Observe que o nmero de estrat-
gias para cada jogador diferente 5
DUE
Esq Cent Dir
Sup ( 2, 5 ) ( 4, 3 ) ( 7, 0 )
UNO
Inf (3 , 3) ( 4, 4 ) ( 6, 0 )
Descrio
5
Um jogo denominado assimtrico quando o nmero de estratgias dos jogadores so diferentes.
Captulo 3
Jogos Estticos
Jogos estticos so aqueles em que feita uma nica deciso por cada jogador, e
cada jogador no tem conhecimento da deciso tomada pelos outros jogadores antes
de tomar sua prpria deciso, a forma mais simples de interdependncia estratgica
que prevalece em contextos nos quais as aes so tomadas, quer simultaneamente
ou sem o conhecimento das escolhas dos outros jogadores de ao.
So tambm chamados de jogos de deciso simultneos porque qualquer ordem
real em que so feitas as decises irrelevante, uma vez que um jogador no sabe
qual foi a deciso do outro. O exemplo mais famoso de um problema de deciso
interativa , provavelmente, o Dilema dos Prisioneiros.
Trata-se de um jogo aplicvel a vrias situaes onde as pessoas tm que tomar
decises que signifiquem cooperar ou desertar simultaneamente.
O Dilema do Prisioneiro foi originalmente formulado por Merrill Flood e Melvin
Dresher e apresentado pela primeira vez em 1950 na Universidade de Princeton1 ,
tornando-se um clssico problema da Teoria dos Jogos. Mais tarde, Albert W.
Tucker adaptou o problema original, adicionando a questo do tempo da sentena
de priso, e deu ao problema o nome pelo qual conhecido hoje.
O interesse por este jogo surge da observao que ambos os jogadores, seguindo
seu prprio interesse individual, acabam pior do que se tivessem se mantido quietos.
Este resultado aparentemente paradoxal encapsula uma grande diferena entre os
modelos de deciso no-interativos e interativos, pois na tentativa de maximizao
individual h um prejuzo coletivo.
Existem vrias verses do problema, com diferenas no tempo de sentena ou na
forma de apresentao da situao, mantendo-se a anlise dos resultados.
Uma verso do Dilema do Prisioneiro clssico funciona como no exemplo a seguir:
1
John Nash foi Matemtico Snior de Investigao nesta Universidade.
40
Se algum dos parceiros confessar o crime e o outro no, o traidor fica livre da
priso, enquanto o outro pega sete anos de cadeia.
Nessa forma apresentada, dado perdo pelo primeiro crime ao traidor e a pena
pelo segundo crime ao trado. Cada prisioneiro faz a sua deciso sem saber que
deciso o outro vai tomar. A tabela 3.1 a matriz de recompensa para este jogo.
P2
Nega Delata
Nega ( 2, 2 ) ( 8, 0 )
P1
Delata (0 , 8) ( 5, 5 )
Uma vez que nenhum deles pode ter a certeza da cooperao do outro, a tendncia
que ambos iro optar por denunciar o colega pois na pior das hipteses, cumpriro
uma pena de 5 anos e, na melhor, sairo em liberdade. Caso tivessem cooperado
um com o outro, teriam tido melhor resultado, mas:
Pode-se argumentar que eles deveriam ter tido um acordo antes de serem presos
que iriam se calar. No entanto, cada prisioneiro no tem nenhuma maneira de
garantir que o outro segue este acordo. claro que um prisioneiro poderia se vingar
no futuro - mas isso um outro jogo (com diferentes recompensas).
41
problemas.
P2
C D
C ( r, r ) ( s, t )
P1
D (t, s) ( p, p )
N amorado
pera(O) Filme(F)
pera(O) ( 4, 2 ) ( 1, 1 )
N amorada
Filme(F) (1, 1) ( 2, 4 )
S1 = S2 = {O, F }
u1 (O, O) = 4 > u1 (F, F ) = 2 > u1 (O, F ) = 1 > u1 (F, O) = 1
u2 (F, F ) = 4 > u2 (O, O) = 2 > u2 (F, O) = 1 > u2 (O, F ) = 1
3
Assim como no Dilema dos Prisioneiros, h vrias formas de contar essa histria.
3.1 Descrio de Jogos Estticos 44
(S1 , S2 , u1 , u2 ).
ento uma estratgia mista pode ser representada por um vetor de probabilidades:
Pmi
i = (p(s1i ), p(s2i ), ..., p(sji ), ..., p(sm
i )) e
i
j=1 p(sji ) = 1 onde p(sji ) a probabili-
dade da estratgia pura sji ser jogada.
Pmi j
j=1 p(si ) = 1}
Uma estratgia pura ski com k {1, 2, ..., mi } pode ser representada por um vetor:
Pmi j j
i = j=1 p(si )si
= 1 2 ... n
ou
Pm1 Pm2 Pmn j1 j2 jn j1 j2 jn
ui () = j1 =1 j2 =1 ... jn =1 [p(s1 )p(s2 )...p(sn ).ui (s1 , s2 , ..., sn )]
quando cada jogador tem apenas duas estratgias puras, isto , Si = {s1i , s2i } para
cada jogador i, a expresso desenvolvida pode ser transformada em pruduto de
matrizes.
ui () = 2j1 =1 2j2 =1 ( 2k=1 p(sjkk ))ui (sj11 , sj22 ) =
P P Q
P2 j1 j1 1
= 1
j1 =1 [(p(s1 )p(s2 ).ui (s1 , s2 )) + (p(sj11 )p(s22 ).ui (sj11 , s22 ))] =
= 2j1 =1 (p(sj11 )p(s12 ).ui (s1j1 , s12 )) + 2j1 =1 (p(sj11 )p(s22 ).ui (sj11 , s22 )) =
P P
= p(s12 ) 2j1 =1 (p(sj11 ).ui (sj11 , s12 )) + p(s22 ) 2j1 =1 (p(sj11 ).ui (sj11 , s22 ))
P P
= [ 2j1 =1 (p(sj11 ).ui (sj11 , s12 ))]p(s12 ) + [ 2j1 =1 (p(sj11 ).ui (sj11 , s22 ))]p(s22 )
P P
h P
2 j1 j1 1 P2 j1 j1 2
i p(s12 )
= j1 =1 (p(s1 ).ui (s1 , s2 )) j1 =1 (p(s1 ).ui (s1 , s2 ))
=
p(s22 )
h i p(s12 )
= {p(s11 ).ui (s11 , s12 ) + p(s21 ).ui (s21 , s12 )} {p(s11 ).ui (s11 , s22 ) + p(s21 ).ui (s21 , s22 )} =
p(s22 )
h i ui (s11 , s12 ) ui (s11 , s12 ) p(s12 )
= p(s12 ) p(s22 ) =
ui (s21 , s22 ) ui (s21 , s22 ) p(s22 )
h i ui (s11 , s12 ) ui (s11 , s12 ) q
ui () = ui (p, q) = p 1p =
ui (s21 , s22 ) ui (s21 , s22 ) 1q
h i
= p.q.ui (s11 , s12 ) + (1 p).q.ui (s21 , s12 ) + p.(1 q).ui (s11 , s22 ) + (1 p).(1 q).ui (s21 , s22 )
Exerccio 3.1. Jogo de par ou mpar. Nesse jogo, dois jogadores exibem, ao mesmo
tempo, uma das mos mostrando de 0 a 5 dedos. Se a soma dos dedos apresentados
pelos dois jogadores der par o primeiro jogador ganha, se der mpar o segundo ganha.
Por simplicidade, basta saber se o nmero apresentado por cada jogador foi par ou
mpar (no h necessidade de saber a quantidade de dedos apresentados) j que cada
um tem trs possibilidades de escolher par e trs de escolher mpar (supondo que entre
3.1 Descrio de Jogos Estticos 47
q 1q
J2
s12 s22
p s11 (u1 (s11 , s12 ), u2 (s11 , s12 )) (u1 (s11 , s22 ), u2 (s11 , s22 ))
J1
1p s21 (u1 (s21 , s12 ), u2 (s21 , s12 )) (u1 (s21 , s22 ), u2 (s21 , s22 ))
1/3 2/3
Jogador 2
Par mpar
1/4 Par (+1, 1) (1, +1)
Jogador 1
3/4 mpar (1, +1) (+1, 1)
P2 P2 Q2 jk j1 j2
u1 () = j1 =1 j2 =1 ( k=1 p(sk )u1 (s1 , s2 ))
P2 P2 j1 j2 j1 j2
u1 () = j1 =1 j2 =1 (p(s1 ).p(s2 ).u1 (s1 , s2 ))
P2 j1 j1 1
u1 () = 1
j1 =1 [(p(s1 ).p(s2 ).u1 (s1 , s2 )) + (p(sj11 ).p(s22 ).u1 (sj11 , s22 ))]
u1 () = {[(p(s11 ).p(s12 ).u1 (s11 , s12 ))+(p(s11 ).p(s22 ).u1 (s11 , s22 ))]+[(p(s21 ).p(s12 ).u1 (s21 , s12 ))+
(p(s21 ).p(s22 ).u1 (s21 , s22 ))]}
u1 () = {[(1/4.1/3.(+1) + 1/4.2/3.(1))] + [3/4.1/3.(1) + 3/4.2/3.(+1)]}
u1 () = 1/4(1/3 2/3) + 3/4(1/3 + 2/3) = 1/12 + 3/12 = 1/6
ou
h i +1 1 1/3 h i 1/3
u1 () = u1 (1 , 2 ) = 1/4 3/4 = 1/2 +1/2 =
1 +1 2/3 2/3
3.2 Soluo de um jogo 48
h i
= 1/6
4
Veja definio 1.6 de perfil de estratgia.
3.2 Soluo de um jogo 49
Queremos dizer que uma estratgia si domina fracamente outra estratgia si para
o jogador i, se independentemente do que os outros jogadores faam, a recompensa
obtida por si , pelo menos, to boa quanto a recompensa obtida pela estratgia
si i, e para algum perfil dos outros jogadores si tem recompensa melhor do que a
recompensa de si . Se ao escolher a estratgia si , o jogador obtm recompensa es-
tritamente maior do que quando escolhe si , independentemente do que os outros
jogadores fazem, ento dizemos que si domina estritamente si .
Fica evidente que no h motivos para um agente racional utilizar uma estratgia
si sabendo que esta tem sempre uma recompensa pior ou igual a qualquer outra
estratgia si , uma vez que se pretende maximizar os ganhos.
Ao no usarmos estratgias estritamente ou fracamente dominadas estamos eli-
minando piores recompensas.
3.2 Soluo de um jogo 51
Jogador 2
Esq Dir
Sup ( 2, 2 ) ( 1, 1 )
Jogador 1
Inf (1 , 0) ( 1, 0 )
Para o jogador 1, Sup domina fracamente Inf e, para o jogador 2, Esq domina
fracamente Dir. Consequentemente, espera-se que o jogador 1 no jogue Inf e o
jogador 2 no jogue Dir, e a soluo do jogo usando dominncia (Sup, Dir).
Exemplo 3.5. Vamos verificar a Matriz de Recompensas da tabela 1.12 para de-
terminar se algum dos jogadores, UNO ou DUE, possui uma estratgia estritamente
dominada.
DUE
(0,0) (-1,-5)
UNO
(-5,-1) (1,1)
uU N O (, ) = 1 > uU N O (, ) = 1,
uU N O (, ) = 0 > uU N O (, ) = 5
Para UNO escolher melhor que escolher quando DUE escolhe ao passo
que quando DUE escolhe , a melhor escolha para UNO . Logo, verificamos que
UNO no possui uma estratgia estritamente dominante.
3.2 Soluo de um jogo 52
uU N O (, ) = 0 > uU N O (, ) = 1,
uU N O (, ) = 3 > uU N O (, ) = 1
e
uDU E (, ) = 0 > uDU E (, ) = 5,
uDU E (, ) = 1 > uDU E (, ) = 1
DUE
(0,0) (3,-5)
UNO
(-1,-1) (1,1)
No difcil de ver nesse caso que para o UNO a estratgia dominante escolher
, e para DUE a melhor estratgia6 escolher quando UNO escolhe e escolher
quando DUE escolher .
Escolher para UNO uma estratgia estritamente dominante, no h porque esco-
lher algo que lhe dar pior resultado. Para DUE, a melhor escolha est condicionada
na escolha feita por UNO, como poderia DUE fazer uso dessa informao? Quando
5
obviamente, a segunda instruo que ser dada poderia resolver o problema, se os jogadores so
racionais, poderiam observar que escolher a melhor escolha para ambos, nos limitamos aqui a anlise
apenas em ter ou no uma estratgia estritamente dominante (ou dominada)
6
Entenda como melhor estratgia aquela que d a melhor recompensa.
3.2 Soluo de um jogo 53
Exemplo 3.7. No Jogo das Notas, no caso em que UNO e DUE eram jogadores
egocntricos, chegamos na Matriz de Recompensas da tabela 1.10. Note que ao es-
colher a estratgia , UNO tem seu retorno maior independente da escolha feita por
DUE pois:
7
uU N O (, ) = 3 > uU N O (, ) = 1,
uU N O (, ) = 0 > uU N O (, ) = 18
DUE
(0,0) (3,-1)
UNO
(-1,3) (1,1)
se um dos jogadores souber que o outro escolher , ter um motivo ainda maior
para escolher pois neste caso receber 3 como recompensa, levando aquele que es-
colheu a recompensa de -1. Lembre-se que so jogadores preocupados apenas em
maximizar seus ganhos.
Por outro lado, a estratgia Dir no dever ser usada por Due uma vez que
uma estratgia estritamente dominada.
Uno, colocando-se no lugar de Due, sabe que no vivel que Due escolha Dir e
re-analisa a tabela 2.2 que pode ser reescrita como abaixo:
Sup agora fracamente dominada pela estratgia Inf e Uno racionalmente adota
a estratgia Inf .
Na tab. 3.7, Due continua sem uma estratgia estritamente (ou fracamente) do-
10
racionalidade coletiva quando jogadores agem racionalmente procurando o melhor resultado coletivo
3.2 Soluo de um jogo 55
DUE
Esq Cent
Sup ( 2, 5 ) ( 4, 3 )
UNO
Inf (3 , 3) ( 4, 4 )
pelo caminho fcil: poderia chegar com 2 tropas no alvo ou, caso interceptados
pelos romanos, teriam ainda uma tropa chegando ao alvo.
Cartagos
Fcil Difcil
Fcil (1,1) (1,1)
Romanos
Difcil (0,2) (2,0)
pessoas sabem como voc joga e como se colocaro no seu lugar muda completamente
o resultado de um jogo.
Para se resolver um jogo por estratgias dominadas, assumindo que:
1. Os jogadores so racionais.
3. Os jogadores sabem que os outros jogadores sabem do fato que todos os agentes
do jogo so racionais.
4. Os jogadores sabem que todos jogadores tem conhecimento do fato de que todos
os agentes do jogo saberem que todos sabem que os envolvidos so racionais.
13
Jogo 3.1. Jogo da Escolha
Os n jogadores escolhem, sem que os outros saibam, um nmero entre 1 e 100.
Vence aquele que escolheu o nmero mais prximo da metade da mdia, recebendo
1 (o mesmo valor em caso de empate), os demais jogadores nada recebem.
fi (si ) = |si m|
m = ni=1 2n si
P
0 se s s i tal que f (s ) > f (s )
j i i j j
u(si , si ) =
1 se sj s i, fj (sj ) > fi (si )
14
100 > M > 1 50 > m > 0, 5
13
Jogo baseado no exemplo dado na aula 1 e depois trabalhado na aula 2 do curso de Teoria dos Jogos
da Universidade de Yale nos Estados Unidos, o curso est disponvel em www.veduca.com.br .
14
Os extremos correspondem aos casos onde todos os jogadores escolhem 1 ou todos escolhem 100.
3.2 Soluo de um jogo 59
u (50, s ) > u (s , s ) para todo s , com s > 51
i i i i i i i
ui (50, si ) > ui (s , si ) para algum si
i
si >50> m e portanto:
(si m) > (50 m) > 0 fi (si ) > fi (50)
Se:
2. ui (50, si ) = 0 ento sj s i tal que fi (50) > fj (sj ) disso e do fato que
fi (si ) > fi (50) temos que ui (si , si ) = 0 pois fi (si ) > fj (sj )
fracamente dominadas.
A prxima tabela mostra delees iterativas, deletamos estratgias dominadas,
refazemos a anlise e deletamos novas estratgias dominadas que aparecem aps a
deleo das estratgias dominadas da primeira anlise. A deleo iterativa nos leva
a concluir que a melhor escolha seria o nmero 1, tendo como hiptese que todos os
jogadores so racionais e utilizam estratgias racionais.
Percebemos pela tabela 3.9 que a deleo iterativa mostra que a melhor escolha
seria 1, mais resultados obtidos em experimentos em sala de aula mostram que 1
acaba no sendo o melhor resultado pois no todos os jogadores reais agem estrate-
gicamente e mais uma vez escolhas racionais por pessoas racionais podem no levar
aos melhores resultados.
Obviamente que para o jogo transcorrer como na tabela 3.9 necessrio que
algumas coisas aconteam:
Um processo eleitoral pode ser visto como um jogo estratgico, em que os can-
didatos fazem promessas para conquistar eleitores.
Em 1957, o economista Anthony Downs, autor do clssico Uma teoria econ-
mica da democracia, concretizou o teorema do eleitor mediano, segundo o qual
num eleitorado distribudo de forma normal por um conjunto de preferncias (nessa
distribuio, o grosso do eleitorado ficaria no centro) e numa eleio majoritria,
espera-se que vena aquele que conquistar o eleitor mediano. O eleitor mediano,
nessa distribuio, tem metade dos eleitores a sua esquerda e a outra metade a sua
direita.
De forma simplria podemos entender que os eleitores so colocados em uma fila
imaginria de acordo com o maior ou menor interesse desse eleitor em determinada
proposta do candidato. Digamos que a proposta seja, por exemplo, a mudana da
maioridade penal 16
, ento o primeiro da fila seria o candidato que mais apoiasse
essa ideia, em segundo na fila ficaria o segundo eleitor que mais apoiasse a ideia,
16
Obviamente em uma eleio so muitas propostas e a mesma anlise deve ser feita para cada proposta.
3.2 Soluo de um jogo 62
assim por diante, at que o ltimo da fila seria o eleitor que fosse mais contra a
mudana da maioridade penal.
O Teorema diz que cada candidato deve sempre se aproximar, com suas propos-
tas, ao eleitor colocado mais ao centro da fila,aproximando-se mais de um maior
nmero de eleitores, e afastando-se da posio que deixaria mais insatisfeito aqueles
eleitores mais radicais, isto , que se encontrem nos extremos da fila. Uma promessa
muito radical pode perder completamente os votos dos eleitores que se encontram
na outra ponta da fila.
Exemplo 3.10.
Neste caso o candidato 1 recebe 15% e o candidato 2 recebe 85% dos votos.
Candidato 2
P1 P2 P3 P4 P5 P6 P7 P8 P9 P10
P1 50% 10% 15% 20% 25% 30% 35% 40% 45% 50%
P2 90% 50% 20% 25% 30% 35% 40% 45% 50% 55%
P3 85% 80% 50% 30% 35% 40% 45% 50% 55% 60%
P4 80% 75% 70% 50% 40% 45% 50% 55% 60% 65%
P5 75% 70% 65% 60% 50% 50% 55% 60% 65% 70%
Candidato 1
P6 70% 65% 60% 55% 50% 50% 60% 65% 70% 75%
P7 65% 60% 55% 50% 45% 40% 50% 70% 75% 80%
P8 60% 55% 50% 45% 40% 35% 30% 50% 80% 85%
P9 55% 50% 45% 40% 35% 30% 25% 20% 50% 90%
P10 50% 45% 40% 35% 30% 25% 20% 15% 10% 50%
Candidato 2
P2 P3 P4 P5 P6 P7 P8 P9
P2 50% 20% 25% 30% 35% 40% 45% 50%
P3 80% 50% 30% 35% 40% 45% 50% 55%
P4 75% 70% 50% 40% 45% 50% 55% 60%
P5 70% 65% 60% 50% 50% 55% 60% 65%
Candidato 1
P6 65% 60% 55% 50% 50% 60% 65% 70%
P7 60% 55% 50% 45% 40% 50% 70% 75%
P8 55% 50% 45% 40% 35% 30% 50% 80%
P9 50% 45% 40% 35% 30% 25% 20% 50%
e P8 .
Observe que P2 estritamente dominada por P3 apenas depois de ter sido elimado
a estratgia P1 pois uC1 (P3 , P1 ) < uC1 (P2 , P1 ). Assim usando a deleo iterativa
de estratgias estritamente dominadas podemos deletar novas estratgias que so
dominadas apenas depois de eliminarmos a possibilidade da utilizao das estratgias
estritamente dominadas inicialmente.
Aps uma iterao chegamos a tabela 3.12, continuando o raciocnio a segunda
iterao nos levar a tabela 3.13 e finalmente, depois da terceira iterao, apresen-
tamos a matriz de recompensas dos candidatos na tabela 3.14.
Na tabela 3.14 os Canditatos C1 e de C2 concentram-se prximo aos eleitores P5
e P6 , a j no h mais uma estratgia dominante, este modelo onde os candidatos se
aglomeram no centro chamado na Cincia Poltica de Teorema do Eleitor Mediano.
17
17
Desenvolvido inicialmente por Bowen (1943), Black (1948), Donws (1957), entre outros, o Modelo do
Eleitor Mediano diz que em um sistema eleitoral majoritrio, os eleitores escolhero o candidato cuja cesta
ofertada de bens e servios pblicos mais se aproxime da cesta demandada pelo eleitor mediano. Podemos
imaginar todos os eleitores disponveis em um local colocados em uma fila de acordo com o maior ou
menor interesse desse eleitor em determinada proposta do candidato. O primeiro da fila seria o eleitor
mais satisfeito com essa proposta, at que no ltimo lugar dessa fila ficaria o eleitor mais radicalmente
contra. Cada candidato deve sempre se aproximar, com suas promessas de campanha, ao eleitor colocado
mais ao meio da fila, pois assim poder se aproximar mais de um maior nmero de eleitores, deixando de
de estar muito distante dos eleitores muito contrrios a determinada proposta. Esse modelo bastante
razovel, e muito utilizado em economia.
3.2 Soluo de um jogo 65
Candidato 2
P3 P4 P5 P6 P7 P8
P3 50% 30% 35% 40% 45% 50%
P4 70% 50% 40% 45% 50% 55%
P5 65% 60% 50% 50% 55% 60%
Candidato 1
P6 60% 55% 50% 50% 60% 65%
P7 55% 50% 45% 40% 50% 70%
P8 50% 45% 40% 35% 30% 50%
Candidato 2
P4 P5 P6 P7
P4 50% 40% 45% 50%
P5 60% 50% 50% 55%
Candidato 1
P6 55% 50% 50% 60%
P7 50% 45% 40% 50%
Candidato 2
P5 P6
P5 (50%,50%) (50%,50%)
Candidato 1
P6 (50%,50%) (50%,50%)
1a Opo
2a Opo
3a Opo
Diretor 2
( 2,0,1 ) ( 0,1,2 ) ( 0,1,2 )
Diretor 1 ( 0,1,2 ) ( 1,2,0 ) ( 0,1,2 )
( 0,1,2 ) ( 0,1,2 ) ( 0,1,2 )
Diretor 2
( 2,0,1 ) ( 2,0,1 ) ( 2,0,1 )
Diretor 1 ( 2,0,1 ) ( 1,2,0 ) ( 0,1,2 )
( 2,0,1 ) ( 0,1,2 ) ( 0,1,2 )
Diretor 2
( 2,0,1 ) ( 1,2,0 ) ( 0,1,2 )
Diretor 1 ( 1,2,0 ) ( 1,2,0 ) ( 1,2,0 )
( 2,0,1 ) ( 1,2,0 ) ( 0,1,2 )
respectivamente, , e .
Aplicando a deleo iterativa de estratgias dominadas (neste caso, fracamente
dominadas) neste jogo, teremos:
P2
E C D
S ( 1,3 ) ( 0,4 ) ( 4,4 )
P1
I ( 0,2 ) ( 1,1 ) ( 4,2 )
ORDEM 1:
2. P1 ento elimina S;
ORDEM 2:
2. P1 ento elimina I;
J2
Local 1 Local 2
Local 1 ( 4, 1 ) ( 1, 2 )
J1
Local 2 (0, 4) ( 3, 3 )
1 arg max1 1 u1 (1 , 2 ).
2 arg max2 2 u1 (1 , 2 ).
i arg maxi i ui (i , i
), i {1, 2, ..., n}
u1 (1 , 2 ) u1 (1 , 2 ) 1 1
e
u2 (1 , 2 ) u2 (1 , 2 ) 2 2
Em outras palavras, dada a estratgia adotada pelo outro jogador, nenhum jo-
gador poderia fazer estritamente melhor (ou seja, aumentar a sua recompensa) ao
adotar outra estratgia.
Podemos encontrar o equilbrio de Nash mais facilmente para um jogo de dois
jogadores atravs as melhores respostas, focalizando nas estratgias em vez de nas
recompensas:
Para encontrar equilbrio de Nash usando esta definio encontramos, para cada
jogador, o conjunto de melhores respostas para todas as estratgias possveis do outro
jogador. Em seguida, procurar pares de estratgias que so melhores respostas para
ambos.
Existem jogos que no possuem equilbrios de Nash em estratgias puras no
entanto podemos encontrar um equilbrio de Nash para estratgias mistas.
Jogador2
Cara Coroa
Cara (+1, 1) (1, +1)
Jogador1
Coroa (1, +1) (+1, 1)
Podemos facilmente verificar que no existe par estratgia pura que um equil-
brio de Nash:
u1 (1 , 2 ) = u2 (1 , 2 ) = 0
Iremos estudar como encontra o Equilbrio de Nash para jogos com dois jogadores
fazendo uso dos dois prximos teoremas, o primeiro deles especialmente utilizado
para encontrar equilbrio de Nash de estratgias puras.
Teorema 3.1. 21
Suponha que exista um par de estratgias puras (s1 , s2 ) tal que:
u1 (s1 , s2 ) u1 (s1 , s2 ) s1 S1
e
u1 (s1 , s2 ) u1 (s1 , s2 ) s2 S2
Exemplo 3.13. Dois caadores famintos foram para a floresta com o objetivo de
pegar um veado, ou, pelo menos, uma lebre. Eles podem pegar um veado somente
se ambos permanecerem alertas e dedicarem seus tempos e energias para captur-lo.
Pegar uma lebre menos exigente e no requer a cooperao do outro caador. Cada
caador prefere dividir um veado do que ter uma lebre. V denota a ao de ir atrs
do veado, e L a ao de pegar uma lebre, podemos representar este jogo pela matriz
de recompensas da tabela 3.22.
Caador 2
V L
V (+2, +2) (0, +1)
Caador 1
L (+1, 0) (+1, +1)
u1 (s1 , 2 ) = u1 (1 , 2 ), s1 S(1 )
22
Demonstrao pode ser encontrada na pgina 75 de[2]
3.2 Soluo de um jogo 76
e
u2 (1 , s2 ) = u2 (1 , 2 ), s2 S(2 )
Vamos resolver agora o Exemplo 3.12 utilizando este teorema. Suponha que o
jogador 2 joga Cara, chamaremos de K com probabilidade q e portanto Cora,
chamaremos de C com probabilidade 1 q. Se o jogador 1 est jogando uma
estratgia mista do equilbrio de Nash, S(1 ) = {K, C}, temos:
u1 (K, 2) = u1 (C, 2)
q.u1 (K, K) + (1 q).u1 (K, C) = q.u1 (C, K) + (1 q).u1 (C, C)
1
q.1 + (1 q).0 = q.0 + (1 q).1 q = 2
O prximo teorema foi provado por John Forbes Nash Jr. em 1950, como parte
da tese de seu doutorado, dado sua importncia, solues de equilbrio para jogos
de interao so chamados de Equilbrio de Nash.
J2
E D
S (, ) (, )
J1
I (, ) (, )
u1 (S, 2 ) = u1 (I, 2 )
q. + (1 q). = q. + (1 q).
q= +
u2 (1 , E) = u2 (1 , D)
p. + (1 p). = p. + (1 p).
p= +
Experincias de Campo
Autores
CONTEUDO: Ernesto Kemp
ROTEIRO: Marta Nehring
GUIA: Luiz Antonio Mesquiari
Revisores
CONTEUDO: Margarida Mello, Samuel Rocha de Oliveira
ROTEIRO: Frederico Gualberto de Souza, Sarah Yakhni
GUIA: Jos Plinio de Oliveira Santos
GRAFICOS: Raphael Garcia
4.1 Jogo das Notas e dois tipos de jogadores 79
Lorenzo tem pensamento altrusta, quer receber uma boa nota mas se preocupa
com a nota do outro jogador, ele enxerga este jogo como um jogo de cooperao.
J Rebecca se preocupou em maximizar sua nota, quer ter nota A e sabe que sua
chance de receber A passa pela estratgia de escolher .
As foras aliadas tinham avies para pesquisar uma rota por vez, isto , levava um
dia inteiro de buscas em qualquer das rotas de modo que se a busca fosse mal suce-
dida os aliados perderiam um dia de ataque. Caso obtivesse sucesso no primeiro dia
de busca, os aliados conseguiriam 3 dias de bombardeiros na rota sul ou 2 dias de
bombardeiro na rota norte. Dadas estas premissas qual foi a escolha do comandante
das tropas aliadas e qual a rota escolhida pelo comboio do Japo?
A mdia geral foi 30,47 e ganhador escolheu o nmero 15, que foi o mais
prximo da metade da mdia.
4.4 O Dilema do Prisioneiro 82
Exerccio 2.1: As meninas mudam seu voto no primeiro turno para futebol, desse
modo, ao preterirem sua primeira opo, garantem que ao menos sua segunda opo
vena.
Captulo 5
Consideraes finais
[1] FIANI, Ronaldo. Teoria dos Jogos. Com Aplicaes em Economia, Adminis-
trao e Cincias Sociais. 3 ed. Rio de Janeiro: CAMPUS 2009
[2] WEBB, James N. Game Theory. Decisions, Interaction and Evolution. New
York, USA: SPRINGER, 2007
ao, 13 recompensa, 15
agentes, 12 resultados, 15
informaes, 15
jogadores, 12
jogos, 12
estticos, 34
jogos de informao completa, 50
matriz de recompensa, 20
matriz de resultado, 20
melhor resposta, 62