Sie sind auf Seite 1von 88

UNIVERSIDADE FEDERAL DO ABC

CENTRO DE MATEMTICA COMPUTAO E COGNIO


MESTRADO PROFISSIONAL EM MATEMTICA - PROFMAT

EMANOEL FABIANO MENEZES PEREIRA

TEORIA DOS JOGOS COM APLICAES NO ENSINO MDIO

Santo Andr-SP
2014
EMANOEL FABIANO MENEZES PEREIRA

TEORIA DOS JOGOS COM APLICAES NO ENSINO MDIO

Dissertao apresentada no Mestrado Profissional


em Matemtica (PROFMAT) na Universidade Fe-
deral do ABC, como requisito parcial para obten-
o do ttulo de Mestre em Matemtica. rea de
concentrao: Matemtica Aplicada

Orientador: Prof. Dr. Sinu Dayan Barbero Lo-


dovici

Santo Andr-SP
2014
Agradecimentos

A Deus, sem O Qual nada poderia ser feito.

Aos meus pais, pessoas inspiradoras.

A minha amada esposa, companheira de todos os momentos, a fora que me


foi dada por Deus.

A minha tia Zeza, pelo primeiro presente quando passei no vestibulinho da


Escola Tcnica Federal de So Paulo, o primeiro grande reconhecimento e
incentivo aos estudos de algum que ainda hoje no sabe ler.

A minha tia Ana pela preocupao e carinho.

Aos meus filhos, meus maiores presentes.

A toda minha famlia, meu grande tesouro.

Aos meus antigos gerentes e supervisores Luiz Carlos Gomes, Edy Hayashida
e Cristina Campoi pelo incentivo aos estudos e por acreditarem em mim.

Aos eternos amigos Marcio Oliveira e Adriana Prioste, sempre presentes.

Ao grande amigo Ronaldo Rodrigues Chaves, pelo apoio, pelo tempo que es-
tudamos juntos desde a graduao, certamente muito do que sei devo a ele.

A minha primeira professora inspiradora, Dona Amlia da terceira srie pri-


mria da Escola Estadual Walfredo Arantes Caldas, incrvel e inesquecvel.

A Doutora Maria Cristina Bonomi pela didtica impecvel em sala de aula,


inspiradora.

A Universidade Federal de Santo Andr pela qualidade de ensino e pelo traba-


lho srio.
4

Ao meu orientador Sinu Dayan Barbero Lodovici pelo apoio, pela ateno e
por acreditar no projeto.

A todos que me ajudaram direta ou indiretamente sou muito grato.


Resumo

Os jogos encantam a humanidade desde os tempos mais remotos. Especialmente,


os jogos abstratos (ou matemticos) atraram a ateno de matemticos ilustres
como Bernoulli, dentre tantos. E esta atrao deu origem a novas reas da mate-
mtica, em destaque, surgiu tambm a Teoria dos Jogos. Esta teoria trs a beleza
de transformar interaes humanas em jogos, modelando fenmenos que podem ser
observados quando dois ou mais agentes de deciso interagem entre si com conflitos
e/ou cooperao.
O estudo da Teoria dos Jogos utiliza recursos da modelagem matemtica equa-
cionando diferentes situaes de diferentes campos de estudo e esta caracterstica
interdisciplinar que inspirou este trabalho. A Teoria dos Jogos vem sendo utilizada
em vrias reas, como economia, biologia, sociologia, etc.
Neste trabalho pretende-se passar as noes bsicas da Teoria dos Jogos para
professores do ensino bsico como uma possvel ferramenta para fomentar entre os
educandos o interesse pela matemtica aplicada alm deles serem beneficiados pelo
desenvolvimento do pensamento estratgico, da ateno, raciocnio lgico, planeja-
mento de ao e sequenciamento, habilidades muito teis na competncia de resolver
problemas.
Almeja-se que acontea a construo do conhecimento dos alunos de uma forma
mais atraente.

Palavras chave: Teoria de Jogos, Jogos estticos, Equlbrio de Nash


Abstract

The games enchanted mankind since ancient times. Especially, abstract games
(or mathematical) attracted the attention of illustrious mathematicians like Ber-
noulli, among many. And this attraction gave rise to new areas of mathematics,
highlighted, also appeared to Game Theory. The theory behind the beauty of trans-
forming human interactions in games, modeling phenomena that can be observed
when two or more decision-makers interact with conflict and / or cooperation.
The study of Games Theory uses mathematical modeling resources equating
different situations of different fields of study and this interdisciplinary characteristic
that inspired this work. The Games Theory has been used in various areas, such
as economics, biology, sociology, etc.
This paper intends spending the basics of Games Theory to elementary school te-
achers as a possible tool to foster among the students, the interest in applied mathe-
matics and these be benefited by the development of strategic thinking, attention,
logical reasoning, planning action and sequencing, very useful skills in problem-
solving competence.
Its desire to happen the construction of students knowledge in a more attractive
way.

key words: Game Theory, Static Games, Nash Equilibrium


Sumrio

1 Conceitos Bsicos da Teoria dos Jogos 12


1.1 Breve Histrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2 Definies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3 Matriz de Resultado e Matriz de Recompensa . . . . . . . . . . . . . 24

2 Racionalidade e Utilidade 30
2.1 Comportamento Estratgico . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Racionalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2.1 A escolha racional. . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3 Funo Utilidade e Funo Recompensa . . . . . . . . . . . . . . . . 35

3 Jogos Estticos 39
3.1 Descrio de Jogos Estticos . . . . . . . . . . . . . . . . . . . . . . . 42
3.2 Soluo de um jogo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.1 Resolvendo Jogos usando dominncia . . . . . . . . . . . . . . 48
3.2.2 Deleo Iterativa de Estratgias Dominadas . . . . . . . . . . 58
3.2.3 Equilbrio de Nash . . . . . . . . . . . . . . . . . . . . . . . . 68
3.2.4 Existncia do Equilbrio de Nash . . . . . . . . . . . . . . . . 76

4 Experincias de Campo 78
4.1 Jogo das Notas e dois tipos de jogadores . . . . . . . . . . . . . . . . 79
4.2 A Batalha de Bismarck e a tomada de deciso da rota de ataque. . . 79
4.3 Jogo da Escolha e a Deleo Iterativa de Estratgias Dominadas . . . 81
4.4 O Dilema do Prisioneiro . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.5 Respostas de exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . 83
SUMRIO 8

5 Consideraes finais 84
Notao

ui : Funo utilidade do jogador i


ai : Ao do jogador i
Si : Espao de estratgias do jogador i
si : Estratgia pura do jogador i
si : Uma combinao de estratgia de todos jogadores exceto i
Si : Espao de estratgias do jogo, exceto do jogador i
S : Espao de estratgias do jogo
s : Perfil de estratgia ou vetor de estratgia
% : Ao menos to bom quanto
: estritamente prefervel a
: indiferente a
i : Estratgia mista do jogador i
i : Conjunto das possveis estratgias mistas do jogador i
p(sji ) : Probabilidade do jogador i utilizar sua estratgia j-sima estratgia
: Perfil de estratgia mista
: Espao de estratgias mistas
Bi (si ) : Melhor resposta do jogador i para si .
Introduo

Este trabalho foi desenvolvido como tese do Mestrado profissional em Matemtica


da Universidade Federal de Santo Andr. Ele traz discusses de carter terico,
prtico e reflexes sobre a utilizao da Teoria dos Jogos no auxlio a atividades
ldicas que visam o desenvolvimento sistematizado do raciocnio lgico e de conceitos
matemticos.
A sistematizao do pensamento lgico beneficia as decises que so tomadas a
todo instante nas relaes inter- pessoais e defende-se que faa parte do cotidiano
do aluno.
Atividades pedaggicas que utilizam jogos como metodologia do ensino da ma-
temtica esto sendo amplamente apontadas e discutidas por diferentes autores e
j aceitas em muitas escolas. Nessas usa-se a sala de aula como um ambiente pro-
pcio reflexo e a anlise do jogo a partir de interveno pedaggica do professor
responsvel pelo grupo de alunos. Alm disso, aproveitar o ambiente competitivo
e colaborativo natural da sociedade do sculo XX um outro caminho no processo
educativo. uma tendncia em Educao Matemtica.
Uma atividade ldica com intuito de ensinar conceitos matemticos, pode ser
paralelamente usada para desenvolver a capacidade de tomada de decises com isso
o conhecimento do professor em Teoria dos Jogos ser importante na modelagem e
na orientao da resoluo ou desenvolvimento da mesma.
Alm disso a descentralizao no aprendizado do conceito, a priori, deixar por
vezes de oferecer obstculos a execuo do mesmo, uma vez que as tticas podero
ser mais atrativas queles que no tem afinidade com os mecanismos tradicionais da
matemtica. No se pretende tirar a importncia desses mecanismos mas apoi-los
indiretamente, desmistificando a dificuldade de aprender matemtica. A exemplo
disso, e afirmando o que aqui se diz, usamos alguns jogos na prtica, focando as
estratgias e indiretamente se ensinando algum conceito matemtico com a inter-
SUMRIO 11

veno do professor no processo.


Na Teoria dos Jogos o educando poder no somente jogar mas tambm modelar
um jogo.
A utilizao jogos tem uma potencialidade no desenvolvimento do pensar ma-
temtico, da criatividade e da autonomia dos educandos. A modelagem por sua
vez desenvolve a formulao e resoluo de problemas abrangendo ideias e conceitos
matemticos.[5]
Na anlise de um jogo h um processo lgico, modelagem, mtodos de inferncia,
anlise de argumentos, tabelas, combinatria entre outros, assuntos considerados
difceis no ensino mdio e reforados aqui.
A reflexo desenvolvida pelos alunos sobre os procedimentos utilizados na elabo-
rao de estratgias e resoluo de situaes-problema presentes no jogo ou definidos
a partir dele um momento de aprendizagem dentro da anlise de um jogo.
Por estudar as tomadas de decises estratgicas e a lgica das interaes huma-
nas, a Teoria dos Jogos tem tambm caracterstica interdisciplinar que requisitada
no plano nacional do ensino.
Esse novo ramo da matemtica tem grande aceitao nos cursos de administrao
e economia e vem sendo aplicada nas cincias polticas, cincias militares, filosofia,
jornalismo, cincias biolgicas e at mesmo na cincia da computao em aplicaes
na inteligncia artificial e ciberntica.
Captulo 1

Conceitos Bsicos da Teoria dos Jogos

1.1 Breve Histrico

A Teoria dos Jogos teve inicio em 1920 com os estudos de John Von Neumann
(1903-1957) para desenvolver uma abordagem cientfica que pudesse ser utilizada
em uma partida de pquer. Em seus estudos Neumann percebeu que as estrat-
gias aplicadas neste jogo poderiam ser utilizadas tambm no mundo dos negcios.
Nascido na Hungria, emigrou para os Estados Unidos na dcada de 1930. Em 1928
publicou Zur Theorie der Gesellschaftsspiele, Mathematische Annalen, onde mos-
tra que jogos de soma-zero (onde h um perdedor sempre que h um vencedor) tem
soluo determinada por tcnicas matemticas.
No entanto importante falar de precursores da ideia, citamo-los abaixo:

No sculo XVIII, James Waldegrave em correspondncia dirigida a Nicolas


Bernoulli, analisa um jogo de cartas chamado Le Her e fornece uma soluo
que um equilbrio de estratgia mista, contudo, Waldegrave no estendeu sua
abordagem para uma teoria geral.

Antoine Augustin Cournot, matemtico francs que viveu entre 1801 e 1877,
publicou, em 1838, Recherches sur les Principes Mathmatiques de la Thorie
des Richesses, pesquisas sobre os Princpios Matemticos da Teoria da Ri-
queza. Nesta obra, Cournot estabeleceu os princpios tericos da teoria dos
jogos, apresentando o modelo de duoplio onde duas empresas que competiam
entre si comercializando um mesmo produto, decidiam quais as quantidades
que maximizariam seus lucros, sabendo que a produo de cada uma influen-
ciava nos lucros da outra.(O Dupolio de Cournot). Os elementos apresentados
por Cournot so considerados precursores do desenvolvimento da Teoria dos
Jogos, por isso algumas referncias na literatura chamam ao equilbrio de Nash
1.1 Breve Histrico 13

de equilbrio de Cournot-Nash, embora h discordncia quanto a isso alguns


argumentam que Cournot no propunha uma teoria das interaes estrat-
gicas mas apenas possua caractersticas de um mtodo que mais tarde fora
utilizadas em jogos no cooperativos, outros creditam aos trabalhos de Nash
um aperfeioamento na interpretao de Cournot.

Em 1913 o matemtico alemo Ernest Friedrich Ferdinand Zermelo (1871-1953)


demonstrou que o jogo de xadrez sempre tem uma soluo, significando que
para qualquer jogada de um participante, seu oponente tem uma estratgia
vencedora. Esta demonstrao foi importante pois utilizava um mtodo que
antecipava a tcnica de soluo, posteriormente conhecida como a tcnica da
induo reversa.

Flix Edouard Justin Emile Borel (1871-1956), outro matemtico francs disse:

Os problemas de probabilidade e anlise que se propem com relao arte da


guerra, ou especulaes econmicas e financeiras, no so isentos de analogia
com os problemas que dizem respeito a jogos, embora possuam um maior grau
de complexidade.

Com isso utiliza de forma pioneira o conceito moderno de estratgia. Para cada
circunstncia possvel (finitas em nmeros), Borel mostrava o que o agente
deve fazer, chamou isso de mtodo de jogo. O termo jogos utilizado por ele
refere-se especificamente a jogos estratgicos.

Em 1944, surge formalmente a Teoria dos Jogos com a publicao do livro Teoria
dos Jogos e Comportamento Econmico (The Theory of Games and Economic Beha-
vior) do matemtico hngaro John Von Neumann em co-autoria com o economista
alemo Oskar Morgenstern (1902-1977).
Nesta obra os autores desenvolveram a anlise dos jogos de soma zero, definiram
a representao dos jogos em forma extensiva alm de discutirem a cooperao e a
formao de coalizao entre os jogadores.
Considerada um marco no estudo da teoria dos jogos, a obra mostrou-se bastante
restritiva pois focava-se na anlise dos jogos de soma zero, que no refletia todas as
das situaes de interao entre indivduos ou entre organizaes. Era necessrio
ferramentas tericas mais abrangentes que fossem capazes de analisar outros modelos
de interao estratgica.
1.1 Breve Histrico 14

Essas ferramentas surgiram partir de 1950 com a contribuio do matemtico


John F. Nash Jr, do economista John C. Harsanyi e do matemtico e economista
Reinhard Selten, que possibilitaram a anlise de uma maior variedade de modelos
de interao.
Nash mostrou o equilbrio para jogos que no fossem de soma zero. Este conceito
ficou conhecido como equilbrio de Nash, situao em que a jogada de um agente
ser sempre a melhor resposta a estratgia adotada pelos demais jogadores.
O economista hngaro John C. Harsanyi (1920-2000) formulou o modelo de in-
formao incompleta que mostrava que em situaes onde apareciam informaes
assimtricas (como algum jogador ter informaes privilegiadas) poderiam ser apli-
cados o conceito de equilbrio de Nash. Isso foi de especial importncia em economia
pois antes disso os economistas modelavam estas situaes inadequadamente.
Em 1965 Selten publicou um artigo responsvel pelo refinamento da noo de
equilbrio cujo contedo principal o modelo equilbrio perfeito em subjogos. A
partir deste conceito, Selten, diz que uma estratgia para ser tima tem que levar em
considerao todos os possveis desdobramentos do processo de interao estratgica.
A importncia da contribuio de Selten foi significativa, principalmente para a
anlise daqueles jogos que envolvem ameaas e compromissos, pois permitiu avaliar
quais compromissos ou ameaas poderiam ser cumpridas.
Robert J. Aumann, matemtico cujos estudos possibilitaram entender que as
relaes entre indivduos ou organizaes tem uma boa chance de durar por tempo
indeterminado. Esta ideia est vinculada as 12 premissas de cooperao, tempo de
realizao dos ganhos e respeito a um contrato. Como exemplos de situaes que
podem ser estudadas a partir da contribuio de Aumann podemos citar a formao
de cartis. Nesta estrutura de mercado as empresas abrem mo de parte da sua
oferta para que o preo de mercado se eleve, mas existir sempre a tentao de que
uma ou todas empresas aumentem suas ofertas e, consequentemente, seus lucros
decretando o fim do cartel.
Durante a a Guerra Fria entre os EUA e a extinta Unio Sovitica, Thomas
C. Schelling publicou o The Strategy of Conflit. Neste livro Schelling, aplicando
os preceitos da Teoria dos Jogos, mostra que uma forma convincente para anular
uma ameaa tornar a resposta a mesma imprevisvel. Se o agente ameaador
no pode prever a reao a sua agresso, ento seus riscos de perda aumentam de
1.2 Definies 15

modo que ele ir preferir cessar a ameaa. Naquele momento estava em pauta a
corrida armamentista e o temor a guerra nuclear. Seu trabalho tratou tambm de
coordenao de decises entre indivduos de forma a promover um resultado melhor
para todos.
Hoje a teoria dos jogos aplicada a economia, administrao, direito, cincia
poltica, questes de natureza militar e biologia, essencial no estudo de situaes
que envolvam interaes estratgicas.

1.2 Definies

Teoria dos Jogos rene ferramentas matemticas para estudo e modelagem de


problemas que envolvam conflito de interesses por parte de dois ou mais tomadores
de decises. Estas ferramentas so um conjunto de regras mentais que tornam o
raciocnio mais rpido e direcionado, ajudando a escolher para cada situao a es-
tratgia mais adequada, a potencializao do pensamento estratgico. Sua rigorosa
linguagem matemtica oferece preciso nas ideias afastando ambiguidades.
De origem relativamente recente, a Teoria dos Jogos uma modelagem mate-
mtica onde os objetos de estudo a serem modelados so as situaes que envolvam
interaes entre agentes racionais com comportamento estratgico. A interao
se d quando as escolhas ou aes de cada agente afetam os resultados dos demais
agentes envolvidos.
Essas situaes colaborativas ou competitivas, no determinadas pelo acaso, po-
dem ser expressadas matematicamente e analisadas dando um norteamento de qual
resultado dever prevalecer, caso as decises estratgicas sejam tomadas racional-
mente. A essas situaes chamamos de jogos e aos agentes participantes chama-
mos de jogadores.
A palavra jogos utilizada pois assim como em muitos jogos tradicionais voc
precisa tomar uma deciso enquanto imagina a deciso do outro.
Cada jogador tem um conjunto de aes em cada momento do jogo. A forma
como escolhe e ordena essas aes a estratgia. Quando todos os jogadores es-
colhem uma estratgia para si, temos ento uma situao ou perfil, (quando todos
jogam de uma das maneiras possveis). Ocorrido o jogo, o comportamento final da
situao o resultado da estratgia (ou resultado do jogo para esta especfica situ-
1.2 Definies 16

ao). Por ltimo cada jogador tem interesse ou preferncias por cada situao (ou
por cada resultado) e isto estabelece o ganho ou pagamento deste jogador. Vamos
colocar uma linguagem comum para a compreenso geral de um jogo.

Definio 1.1. Jogos so situaes onde haja interao estratgica e conflitos de


interesses entre dois ou mais participantes.

Definio 1.2. Agentes ou Jogadores so indivduo ou grupo de indivduos que


participam das situaes estratgicas e cujas decises e interaes podem influenciar
o resultado do jogo.
Podemos represent-los por i, onde i N = {1, 2, 3, 4, ...}, conjunto dos jogado-
res. Em jogos de dois jogadores comum serem usadas as denominaes Uno e Due
ou i e j.

No decorrer desse trabalho as diferenas entre jogos no seu sentido mais geral
e jogos em teoria dos jogos ser evidenciado, no entanto daremos alguns exemplos
aqui para ilustrarmos a ideia.

Exemplo 1.1. Um casal de idosos vo a um bingo todo final de semana. O esposo


sempre compra duas cartelas (pois acha que ter mais chances de ganhar) a esposa
por sua vez compra apenas uma cartela. Est evidente que a estratgia do esposo
em ter mais cartelas no influencia no resultado positivo ou negativo de sua esposa
que preferiu economizar ao comprar apenas uma cartela. Embora os dois tivessem
uma estratgia, no houve interao e esta situao dependia apenas da sorte, por
isso no um jogo na teoria dos jogos.

Exemplo 1.2. Uma prefeitura cogita diminuir os impostos fiscais para tentar atrair
as empresas, gerando empregos e aumentando a arrecadao. No entanto teme que
isso seja feito tambm pelas cidades vizinhas e se assim ocorrer corre o risco de ver
sua arrecadao diminuda pois as empresas que l j esto tambm pagariam menos
impostos e novas empresas acabariam por no se instalarem nessa cidade.
H uma interao entre as decises das cidades envolvidas e isso uma situao
de jogos em teoria dos jogos.
1.2 Definies 17

Exemplo 1.3. Cliente de um banco temem por sua falncia e decidem se devem
correr ao banco para tentar retirar suas economia, se todos solicitarem a retirada,
o banco fatalmente ir falir e muito provvel que no conseguir pagar a todos os
credores e clientes alm de gerar um crise que resultar em prejuzos a populao.
Caso resolvam confiar, h chance que o banco saia da crise. Aqui tambm vemos
interaes nas aes, nesta teoria isto um jogo.

Outros exemplos de jogos nessa teoria so:

Casais escolhendo onde vo jantar.

Empresas competindo em um mercado.

Diplomatas negociando um tratado.

Apostadores em um jogo de cartas.

As tcnicas adequadas para a anlise de decises interdependentes diferem signi-


ficativamente daquelas para as decises individuais. Mesmo para jogos estritamente
competitivos, o objetivo simplesmente identificar uma estratgia ideal e no pro-
priamente vencer como ocorre em outros jogos.

Definio 1.3. Cada deciso ou escolha de um jogador em um dado momento do


jogo denominado de ao. O conjunto de aes disponveis ser denotado A. Pode
ser um conjunto discreto, por exemplo, {a1 , a2 , a3 , ...}, ou um conjunto contnuo, por
exemplo, o intervalo de unidade de [0, 1]. Ao fazer a escolha da ao dizemos que o
jogador efetuou um movimento ou lance.

O papel de anlise da teoria dos jogos o de identificar a sequncia de movimen-


tos que dever ser usada, isto , a estratgia que dever ser usada.1

1
A palavra estratgia derivada da palavra grega strategos ( o)
1.2 Definies 18

Definio 1.4. Estratgia a sequncia de movimentos de um agente em um jogo,


uma regra para a escolha de uma ao em cada ponto que uma deciso pode ter
que ser feita. Uma estratgia pura aquela em que no h nenhuma distribuio
aleatria.
A melhor estratgia2 uma sequncia de movimentos que resulta em um me-
lhor resultado. comum, como faz Ben Polak 3
no seu curso Teoria dos Jogos na
Universidade De Yale, chamar cada ao de estratgia quando tratamos de jogos
simples com decises simultneas.

Definio 1.5. Dado um jogo, chamamos de Si ao espao de estratgia do jo-


gador i que o conjunto de todas as escolhas possveis para o jogador i, ou seja, Si
um conjunto que compreende cada uma das possveis estratgias de jogador i no
jogo. Usamos si para determinar uma particular escolha ou estratgia do jogador i,
assim si Si tambm chamada de estratgia pura do jogador i.

Definio 1.6. Um perfil de estratgia ou vetor de estratgia a reunio de


todas as escolhas efetivadas em um jogo, isto , o perfil de estratgia descreve a es-
tratgia utilizada por todos os jogadores em um jogo. Cada jogador i utiliza uma de
suas estratgias si Si , uma vez escolhido uma estratgia por cada jogador temos
uma situao ou perfil no espao de todas as possveis situaes ou perfis. Um
perfil de estratgia ento o vetor s = (s1 , s2 , ..., si , ..., sn ), onde si uma estratgia
pura do jogador i e s uma combinao das estratgias de todos os jogadores. Tam-
bm denominado perfil de estratgia pura.

Dado um jogador qualquer i, podemos falar das estratgias escolhidas pelos de-
mais jogadores no jogo. Neste caso utilizaremos a notao por si para represnetar
uma combinao das estratgias de todos jogadores exceto do jogador i, tambm
chamado de perfil de estratgia para todos os jogadores exceto o jogador i:
2
Muitas vezes diferentes estratgias podem levar a resultados iguais, e se estes iguais resultados so os
melhores, todas sero melhor estratgia, desde que nenhuma outra estratgia resulte em um retorno mais
alto.
3
Ben Polak Professor de Economia e Gerenciamento no Departamento de Economia e da Escola de
Gerenciamento da Universidade de Yale, formado em Ph.D. da Universidade de Harvard.
1.2 Definies 19

s = (s1 , s2 , ..., si1 , si+1 ..., sn )

Eventualmente representamos como i o conjunto formado por todos os opo-


nentes4 do jogador i, podemos ainda representar perfil de estratgia s separando a
estratgia si do jogador i e si o perfil de estratgia dos demais jogadores, assim:

s = (s1 , s2 , ..., si , ..., sn ) = (si , si )

Definio 1.7. Chamamos de espao de estratgias pura do jogo ao conjunto


de todos os perfis de estratgias puras de todos jogadores.

Qn
S= i=1 Si = S1 S2 ... Si ... Sn , assim (s1 , s2 , ..., si , ..., sn ) S onde
cada si uma estratgia pura do jogador i e o smbolo denota o produto cartesiano.

O conjunto formado por todos os possveis si representado por Si .

Para tomar a deciso ou escolher sua estratgia, o jogador utiliza as informaes


que tem sobre o jogo.

Definio 1.8. Informaes so os dados disponveis para cada jogador no mo-


mento que este vai efetuar um lance, estes dados sero utilizados na anlise e tomada
de decises.

Quando todos os jogadores fizeram todas suas escolhas (ou quando um perfil de
estratgia acontece) o jogo terminou e obviamente h uma consequncia.

Definio 1.9. Resultados 5


so as possveis consequncias das interaes, acon-
tece quando cada jogador envolvido age, isto , escolhe e executa suas estratgias ou
quando um jogo encerrado. O resultado depende apenas do desenvolvimento do
jogo e no do jogador, assim, se trocarmos os jogadores e mantivermos as mesmas
aes, o resultado o mesmo. Cada perfil de estratgia tem seu prprio resultado
(embora alguns perfis possam levar ao mesmo resultado. Cada perfil de estratgia
4
Em jogos cooperativos esta notao no bem aceita assim como a palavra oponente.
5
do ingls outcome.
1.2 Definies 20

descreve o caminho do jogo escolha a escolha, o a ao tomada pelos participantes


at que haja um produto final, o resultado do jogo.

Se agirem da mesma forma (tomarem as as mesmas estratgias) diferentes tipos


de jogadores (egocntricos ou altrustas, por exemplo) chegaro ao mesmo resultado
mas podero ter diferentes expectativas frente a estes.

Definio 1.10. Recompensa6 a forma como um jogador recebe o resultado de


um jogo. Ela traduz a expectativa que cada jogador tem de um resultado comparado
a outro resultado e por isso determina como um jogador avalia um determinado re-
sultado de um jogo. A grosso modo a recompensa o valor7 que cada jogador d a
um determinado resultado do jogo.

Os prximos exemplos pontuam as diferenas entre resultado e recompensa.

Exemplo 1.4. Em um jogo de futebol em um campeonato de pontos corridos, em


caso de empate por nmero de pontos os critrios de desempate so: maior saldo
de gols (SG) seguido de gols pr. Os times A e B faro o ltimo jogo enquanto C
aguarda o resultado. A Tabela 1.1 a seguir mostra como estava o campeonato antes
desse jogo:

Clubes Pontos SG GP
A 39 11 28
B 37 9 24
C 40 10 26

Tabela 1.1: Tabela de Pontuao

O time A precisa de um empate para ser campeo(empate vale 1 ponto), ficando


C em segundo e B em terceiro. O time B precisa vencer por uma diferena de 2 gols
(vitria vale 3 pontos), se empatar fica em terceiro, se vencer por uma diferena de
um gol fica em segundo e v o time C ser campeo.
6
tambm chamada de retorno, compensao ou pagamento, este termo em ingls payoff, podendo ser
monetria ou em termos de utilidade, termo que ser melhor explicado no decorrer deste artigo
7
A atribuio de um valor numrico que informa como o jogador avalia um determinado jogo a funo
recompensa. Veremos funo recompensa mais adiante.
1.2 Definies 21

Temos aqui trs possveis resultados para o campeonato, esses resultados depen-
dem apenas de como termina o ltimo jogo entre A e B:

1. Time A campeo - C vice - B terceiro lugar (Resultado 1 - R1 )

2. Time B campeo - C vice - A terceiro lugar (Resultado 2 - R2 )

3. Time C campeo - B vice - A terceiro lugar (Resultado 3 - R3 )

Vamos mostrar o retorno de cada resultado pode depender da rivalidade entre os


times B e C, isto , a preferncia de cada time pode no estar ligada apenas a sua
classificao. Vamos considerar algumas informaes importantes para analisar a
recompensa de cada time mediante os possveis resultados:
O campeonato d aos times pontos no ranking geral8 conforme sua classificao:

Campeo - 100 pontos

Vice-campeo - 50 pontos

Terceiro lugar - 30 pontos

Suponha que o time A se importa apenas com sua posio no campeonato, pode-
mos dizer que A, prefere o resultado R1 sobre todos os outros e indiferente entre
R2 e R3 (pois nesse caso melhor terminar em primeiro do que em terceiro). Em
termos de recompensa, a recompensa de A pode ser considerada os pontos obtidos
no ranking, pois estes mostram suas preferncias. O time A no tem muita tradio
e ser campeo no trar grandes mudanas no ranking entre os times.
O time B e C so rivais e disputam o ttulo e a posio no ranking. A rivali-
dade entre B e C influencia diretamente suas preferncias quanto aos resultados (e
consequentemente suas recompensas), pois alm de sua classificao, o time B, por
exemplo, preocupa-se com a pontuao do time C no ranking geral, em especial se
B est mais preocupado com a pontuao no ranking, podemos colocar como recom-
pensa de B a diferena entre os pontos que ele obtm no ranking e os pontos que C
obtm.
A prxima tabela rene as recompensas de A e B, que dependem do resultado do
ltimo jogo.
8
Entenda como ranking geral, um ranking externo ao campeonato, como o caso do Ranking da Fifa
que atribui pontos aos times de acordo com sua performance em campeonatos oficiais.
1.2 Definies 22

Resultado Final Recompensa de A Recompensa de B


R1 100 30-50=-20
R2 30 50-100=-50
R3 30 100-50=50

Tabela 1.2: Tabela de Pontuao

Com base nessas informaes vamos analisar possveis recompensas em decor-


rncia dos possveis resultados do jogo entre A e B:

Resultado 1: Empate entre A e B(observe que o retorno o mesmo caso


A vena B, pois A ser campeo e B terminar em terceiro do mesmo jeito):

Retorno de B: B recebe 30 pontos por sua posio no ranking, mas v


seu adversrio receber 50, pontos, isso na sua viso significa um retorno
de -20, considerando negativo seu adversrio e principal rival receber 20
pontos a mais no ranking.

Resultado 2: B vence A por uma diferena de 1 gol:

Retorno de B: B recebe 50 pontos por sua posio no ranking, mas v


seu adversrio receber 100 pontos e ser campeo, como no critrio ante-
rior seu retorno de -50.

Resultado 3: B vence A por uma diferena maior que 1 gol:

Retorno de B: B campeo recebe 100 pontos por sua posio no ran-


king, seu principal rival e adversrio no ranking fica em segundo recebendo
50 pontos, seu retorno de 50.

Observe que para B vencer por diferena de 1 pior do que empatar pois embora
a vitria simples lhe assegure uma melhor posio neste campeonato do que se
B vir a empatar, do ponto de vista de recompensa, B melhor recompensado
com este segundo resultado, pois em sua ponderao impede a vitria de C no
1.2 Definies 23

campeonato. Logo, B preferir o empate a vitria simples do ponto de vista


da Teoria dos Jogos, um comportamento estratgico e uma ao racional9 .

No seria estranho se aos 48 minutos do segundo tempo, em um jogo com


resultado empatado, se B no tentasse mais fazer o gol da vitria (quem sabe
at errar uma cobrana de penalidade)10.

O valor numrico atribudo a recompensa uma representao numrica da pre-


ferncia de cada jogador e tem como propsito a ordenao das preferncias e ser
melhor explicado adiante.

Concluso

H diversas maneiras de descrever jogos matematicamente. Os seguintes elemen-


tos. A representao formal tem como elementos:

Uma lista de agentes (ou jogadores), a entidade de tomada de deciso, racional


e auto-interessado.

Uma descrio do que os jogadores podem fazer (suas possveis aes).

Uma descrio do que os jogadores sabem quando jogam (suas informaes).

Uma regra que dizque a ao escolher a cada instante do jogo.

A especificao das consequncias das aes realizadas pelos jogadores (os re-
sultados).

Informaes sobre as preferncias dos jogadores sobre os resultados. A satis-


fao pessoal obtida a partir de um determinado resultado (o pagamento ou
recompensa).

Neste nvel de abstrao, a representao matemtica de um jogo semelhante


descrio de jogos de lazer. Para exemplificar vamos usar as regras do jogo de
tabuleiro de xadrez
9
ser revisto quando for falado de escolha racional
10
Este comentrio reafirma que no se discute em Teoria dos Jogos, conceitos ticos ou morais,nesta
teoria, atravs da modelagem e anlise de um jogo, procura-se determinar as possveis consequncias das
interaes nele contidas, em outras palavras, os possveis resultados, que retorno esses resultados traro
aos agentes ou jogadores e qual a melhor escolha para obter a melhor recompensa.
1.3 Matriz de Resultado e Matriz de Recompensa 24

h dois jogadores;

os jogadores se alternam no movimento das peas no tabuleiro sujeitos a regras


pr estabelecidas;

os jogadores podem observar movimentos um do outro, de modo que cada um


sabe toda a progresso do jogo;

um jogador que der check mate no rei do outro jogador ganha o jogo, de outra
forma, um empate declarado (h tambm casos de vitria por jogadas ilegais
do oponente);

de maneira geral podemos assumir que jogadores preferem vitria a empate e


conquistar um empate ao invs de derrota.

Existem duas formas comuns onde jogos so representados matematicamente: a


forma extensiva e a forma normal (estratgica). Iniciaremos com uma descrio no-
tcnica da forma estratgica, neste momento apenas para reforar a diferena entre
resultado e recompensa. Em unidades posteriores reforaremos essas representaes.

1.3 Matriz de Resultado e Matriz de Recompensa

Uma das formas de apresentar os resultados e as recompensas de um jogo dado


as escolhas feitas pelos jogadores atravs de tabelas. A essas Tabelas chamamos,
respectivamente, de Matriz de Resultado e Matriz de Recompensas de um
jogo. A compreenso das diferenas entre essas matrizes passa pelo entendimento
das diferenas entre Resultado e Recompensa
Ilustraremos o uso dessas tabelas modelando um jogo que chamaremos de Jogo
das Notas.11 .

Jogo 1.1. Jogo das Notas

Dois jogadores, UNO e DUE, escolhem simultaneamente entre ou


Cada jogador receber uma nota resultante da combinao (ou interao) de suas
11
A base desse jogo foi utilizado na aula 1 do curso de Teoria dos Jogos da Universidade de Yale,
ministrado pelo Professor Doutor Ben Polak. Aqui fizemos algumas adaptaes por convenincia
1.3 Matriz de Resultado e Matriz de Recompensa 25

escolhas (ou estratgias). Por hiptese assumamos que nenhum deles saiba o que o
outro vai escolher.
As possveis interaes (neste caso a combinao entre as escolhas) e seus res-
pectivos resultados so:

Combinao 1: Se ambos escolherem ento os dois recebem B

Combinao 2: Se ambos escolherem os dois recebem C

Combinao 3: UNO escolhe e DUE escolhe , nesse caso UNO recebe A


e DUE recebe D .

Combinao 4: DUE escolhe e UNO escolhe , nesse caso o UNO recebe


D e o DUE recebe A .

As tabelas 1.3 e 1.4 representam as notas recebidas respectivamente pelos joga-


dores UNO e DUE, em funo das combinaes das estratgias utilizadas por cada
um deles.

DUE

C A
UNO
D B

Tabela 1.3: Notas de UNO

DUE

C D
UNO
A B

Tabela 1.4: Notas de DUE

As combinaes das notas recebidas por UNO e por DUE resultam na Tabela 1.5
, por conter todos os resultados do jogo, esta tabela tambm leva o nome de Matriz
de Resultados.
Nas linha 1 e coluna 1 esto os jogadores Uno e Due, na linha 2, as estratgias
do jogador Due e na coluna 2 as estratgias do jogador UNO. No interior da Tabela
1.3 Matriz de Resultado e Matriz de Recompensa 26

DUE

(C,C) (A,D)
UNO
(D,A) (B,B)

Tabela 1.5: Matriz de Resultados

so registrados os Resultados dos Jogos como um par (i,j) de informaes, onde i


a nota recebida por UNO e j a nota recebida por Due.
Assumimos que de modo geral melhor tirar A a B, B a C e C a D. Os valores
numricos dados s notas na tabela 1.6 buscam refletir de maneira simplria esse
resultado.

NOTA VALOR
A 3
B 1
C 0
D -1

Tabela 1.6: Valor atribudo a nota

Embora tenhamos atribudo valores s notas, ainda no podemos dizer que esses
valores representam a recompensa de cada jogador pois outros aspecto podem influ-
enciar na importncia que cada jogador d a cada resultado e essa importncia
que deve definir sua recompensa. Neste momento sabemos que a recompensa depende
do resultado do jogo e no necessariamente igual quando mudamos o jogador pois
seus anseios podem ser diferentes logo:

Seja X o conjunto ordenado dos pares (i,j) dos resultados do jogo onde i a
nota tirada pelo jogador UNO e j a nota tirada pelo jogador DUE

Definio 1.11. A recompensa12 rn do jogador n a funo rn : X R que ordena


as preferncias do jogador n por cada resultado obtido.

Estudaremos as caractersticas de alguns jogadores e escolheremos uma funo


12
A funo recompensa est sendo definida com o propsito de estudar este tipo de jogo, posteriormente
falaremos de funo utilidade e daremos uma definio mais geral para a funo recompensa.
1.3 Matriz de Resultado e Matriz de Recompensa 27

rn que descreva as preferncias do jogador n analisado.

Jogador Egocntrico:

Este jogador se preocupa apenas com sua nota, para ele sua recompensa pode
ser representada pelo valores obtidos na tabela 1.1 j que essa representa nu-
mericamente qual nota melhor.

Logo, supondo que este jogador seja Uno teremos:

rU no (i, j) = k onde k o valor da nota i tirada por Uno.

A Tabela 1.7 a seguir representa a recompensa de um jogador egocntrico em


funo da nota tirada.

NOTA TIRADA RECOMPENSA


A 3
B 1
C 0
D -1

Tabela 1.7: Recompensa de um Jogador Egocntrico

Jogador Socialista13 :

Para este jogador ter bom resultado (tirar boa nota) importante mas considera
que os jogadores devem receber a mesma nota e por isso v a diferena entre
os valores de sua nota e do outro jogador como algo negativo.

Supondo agora, UNO um jogador socialista podemos definir uma funo re-
compensa rU no (i, j)14 em funo dos valores das notas dos dois jogadores que
considera o valor da nota que recebe (i) e subtrai desta a diferena entre os
valores da nota que recebe e da nota que o outro jogador recebe:
13
O nome Socialista no deve ser empregado no seu sentido mais complexo, trata-se apenas de um
cognome criado para este fictcio tipo de jogador, a rigor poderia ser dado outro nome. Apropriamos deste
pois esta designao dada a doutrina politico-econmica cujos princpios se baseiam na coletividade dos
mecanismos de distribuio, na propriedade coletiva e na organizao de uma sociedade sem a separao
por classes sociais, de certo modo caracteriza um pouco os anseios deste jogador
14
Observe que este um jogador fictcio cuja funo recompensa modelada para este jogador.
1.3 Matriz de Resultado e Matriz de Recompensa 28

rU no (k, l) = k |k l| onde k o valor da nota i tirada por Uno e l o


valor da nota j tirada por Due.

Abaixo a tabela 1.8 com a Recompensa do Jogador Socialista em funo do par


de notas da Matriz de Resultado. ( A primeira nota a do jogador Socialista
e a segunda do outro jogador).

PAR DE NOTAS VALORES DAS NOTAS RECOMPENSA


(A,D) (3,-1) -1
(B,B) (1,1) 1
(C,C) (0,0) 0
(D,A) (-1,3) -5

Tabela 1.8: Tabela das Recompensas do Jogador Socialista

Temos agora um jogo onde conhecemos sua Matriz de Resultados e temos a re-
compensa para dois tipos de jogadores, caso os jogadores sejam um dos dois tipos
estudados possvel construir a Matriz de Recompensas. Observe que h apenas uma
Matriz de Resultados mas pode haver mais de uma Matriz de Recompensa pois esta
depende de como o jogador recebe um resultado de um jogo. A tabela a seguir mostra
possveis diferentes matrizes de recompensa de acordo com os tipos de jogadores para
este jogo.

MATRIZ DE RECOMPENSAS UNO DUE


DUPLA 1 EGOCNTRICO EGOCNTRICO
DUPLA 2 EGOCNTRICO SOCIALISTA
DUPLA 3 SOCIALISTA SOCIALISTA

Tabela 1.9: Tabela de Possibilidades de Matrizes de Recompensas.

Veremos as trs diferentes Matrizes de Recompensas de acordo com as duplas


da tabela 1.9. So tabelas que mostram os jogadores, estratgias, e pagamentos (ou
recompensas).
O jogador UNO escolher as linhas e o jogador DUE escolher as colunas. Os
pagamentos so registrados no seu interior.
O primeiro nmero o pagamento recebido pelo jogador da linha (UNO em nosso
exemplo); e o segundo o pagamento para o jogador da coluna (DUE em nosso
1.3 Matriz de Resultado e Matriz de Recompensa 29

exemplo). Presume-se que cada jogador atue simultaneamente ou, ao menos, sem
conhecer a ao dos outros.

DUE

(0,0) (3,-1)
UNO
(-1,3) (1,1)

Tabela 1.10: Matriz de Recompensas - Egocntrico X Egocntrico

DUE

(0,0) (3,-5)
UNO
(-1,-1) (1,1)

Tabela 1.11: Matriz de Recompensas - Egocntrico X Socialista

DUE

(0,0) (-1,-5)
UNO
(-5,-1) (1,1)

Tabela 1.12: Matriz de Recompensas - Socialista X Socialista


Captulo 2

Racionalidade e Utilidade

O conto do idiota e a escolha entre as moedas.1

Numa cidade do interior vivia um pobre coitado, de pouca inteligncia, cuja


sobrevivncia baseava-se de pequenos biscates e esmolas.
O pobre homem era motivo de ateno quando era frequentemente chamado por
grupos de pessoas que o chamavam e ofereciam a ele a escolha entre duas moedas,
uma grande de 25 centavos de reais (25 mm de dimetro) e a outra menor de 50
centavos de reais (23 mm de dimetro).
Ele sempre escolhia a de 25 centavos e provocava risos pois era para todos muito
cmico algum cometer o erro de atrelar o valor da moeda ao seu tamanho.
Certo dia, o padre da cidade, se compadeceu e disse para o pobre homem que a
maior moeda era tambm menos valiosa. Surpreendentemente o padre foi surpreen-
dido com a resposta que o suposto tolo lhe deu:
Sempre soube disso, meu bom padre. Prefiro receber metade do que acabar com
a brincadeira.

A histria ilustra dois componentes do que considerado ser o comportamento


estratgico. Primeiro, recompensas imediatas so dispensadas na expectativa de um
retorno no futuro, faz-se o necessrio para uma melhor recompensa. Em segundo
lugar, o comportamento dos outros levado em conta. Ento, como podemos definir
a racionalidade? A primeira coisa a notar que a racionalidade no deve ser equipa-
rado com o raciocnio desapaixonado. Os desejos de um indivduo devem levar a um
1
Esse conto pode ser encontrado em vrias fontes com diferentes personagens, aqui foi contado
adaptando-se a moeda nacional e a costumes de pequenas cidades brasileiras. No foi possvel encon-
tra a primeira verso. A bibliografia [2] na pgina 23 tem uma diferente verso desse conto.
2.1 Comportamento Estratgico 31

ranking de resultados em termos de preferncia. Estas preferncias no precisam


conferir com os de outra pessoa; no entanto, eles devem ser consistentes interna-
mente, para que possam constituir a base para a escolha. Assim, vamos definir uma
pessoa racional como aquele que tem preferncias consistentes dos resultados e vai
tentar alcanar um resultado preferido.

2.1 Comportamento Estratgico

Conta a lenda que na Copa de 1958, durante a preleo antes do jogo contra
a antiga Unio Sovitica, o tcnico brasileiro Vicente Feola reuniu os jogadores e
combinou a estratgia da partida. Segundo Nelson Correa, foi algo assim:
No dia do jogo o tcnico Vicente Feola tentava enfiar na cabea de Garrincha um
esquema ttico mortal que seria usado pela primeira vez na Seleo, contra os russos:
No meio de campo - dizia Feola - Nilson Santos, Zito e Didi trocariam passes curtos
para atrair a ateno dos russos... Vav puxaria a marcao da defesa deles caindo
para o lado esquerdo do campo... Depois da troca de passes no meio do campo,
repentinamente a bola seria lanada por Nilton Santos nas costas do marcador de
Garrincha. Garrincha venceria facilmente seu marcador na corrida e com a bola
dominada iria at rea do adversrio, sempre pela direita, e ao chegar linha de
fundo cruzaria a bola na direo da marca de pnalti; Mazzola viria de frente em
grande velocidade j sabendo onde a bola seria lanada e faria o gol!
Garrincha com a camisa jogada no ombro, ouvia sem muito interesse a preleo,
entre divertido e distrado, e em sua natural simplicidade pergunto ao tcnico: T
legal, Seu Feola!... Mas o senhor j combinou tudo isso com os russos?. [4]
Garrincha, gnio do futebol e tido por muitos como algum com escasso racio-
cnio, mostra que para uma estratgia ser bem sucedida deve considerar todas as
reaes do seu adversrio.

Definio 2.1. Comportamento estratgico quando cada agente no tomar de


sua deciso, sabe que sua deciso influenciar na deciso dos demais agentes, e vice-
versa. Portanto o que um agente decide, depende do que acha que o outro decidir,
assim como a deciso de outrem depender do que acha que este agente far, e assim
por diante.

O comportamento estratgico leva em considerao que h uma interdependncia


2.1 Comportamento Estratgico 32

de decises, de forma que a deciso estratgica visa um resultado que depende da


combinao de escolhas dos demais agentes tomadores de deciso.

Exemplo 2.1. A Estratgia da escolha do campeonato escolar.

Precisava-se decidir qual campeonato ser disputado na escola. A direo apoia


o grmio que, por interesses, tem uma preferncia diferente dos meninos e das me-
ninas. O Quadro mostra a ordem de preferncia da direo, meninos e meninas:

Preferncias Meninas Meninos Direo

1a Opo Voleibol Futebol Handebol


2a Opo Futebol Handebol Futebol
3a Opo Handebol Voleibol Voleibol

Tabela 2.1: Quadro de preferncia entre os esportes.

A eleio deveria ser feita em dois turnos onde disputariam dois esportes no
primeiro turno (pois assim, um necessariamente teria dois votos contra o outro) e
o ganhador disputaria contra esporte que no participou do primeiro turno.

A direo estrategicamente, conhecendo o quadro 2.1, organizou e agiu da se-


guinte forma:

No primeiro turno participariam os esportes voleibol e futebol.

Mesmo preferindo futebol a voleibol, o voto da direo no primeiro turno foi


para voleibol pois no segundo turno, voleibol perderia para handebol que era a
primeira opo da direo.

Aqui est um exemplo de comportamento estratgico, a direo levou em con-


siderao a influencia da deciso dos demais agentes e com isso fez uma escolha
estratgica visando o resultado de sua preferncia.

Exerccio 2.1. No exemplo 2.1 as meninas foram as mais prejudicadas, uma vez
que o campeonato escolhido era sua terceira opo. Caso a lder das meninas tenha
previsto a estratgia da direo, sugira o que elas poderiam fazer para serem menos
prejudicadas.
2.2 Racionalidade 33

2.2 Racionalidade

Aqui a ao racional tida como aquela que utiliza os melhores meios tendo em
vista os seus objetivos. A racionalidade est ligada ao meio que um agente utiliza
para alcanar seus fins e no com os fins em sim mesmo. No se discute se o objetivo
do jogador bom ou ruim, no h julgamento tico ou moral, o que se discute que
uma vez conhecido seu objetivo, a melhor deciso a que melhor pode alcan-lo.2

Exemplo 2.2. Dois investidores A e B recebem um relatrio com todas as infor-


maes relevantes sobre as decises dos demais investidores, o comportamento das
empresas e a situao dos mercados de capitais. O investidor A resolve aplicar seu
dinheiro em aes das empresas com melhores perspectivas de ganho, enquanto o
investidor B aplica seu dinheiro nas empresas que tem maior comprometimento com
causas ambientais3. Segue que B estaria agindo to racionalmente quanto A uma
vez que objetivo de A era obter melhores ganhos e o de B investir considerando
o comportamento ambiental da empresa. Ambas escolhas foram feitas com anli-
ses, considerando seus objetivos e o fato de uma ser egosta e a outra altrusta no
muda o fato de serem racionais. Para entender as tomadas de decises importante
verificar as preferncias desses jogadores.

O agente racional considera todas as informaes disponveis para tomar suas


decises. Ele escolher uma alternativa que lhe d o maior ganho , ou ainda, uma
alternativa que ter a consequncia que considere melhor, segundo suas preferncias.

2.2.1 A escolha racional.

A escolha racional parte do princpio que os jogadores so racionais, suas decises


so tomadas segundo suas preferncias e alm disso suas preferncias so racionais.
Para entender o que so preferncias racionais primeiramente vamos definir as se-
guintes relaes:
2
A racionalidade a suposio de que os agentes buscam a maximizao de sua utilidade, para tanto
ser definido o termo utilidade.
3
A racionalidade nem sempre leva aos melhores ganhos de um jogador, uma vez que pode no ser este
seu objetivo, por vezes um jogador pode preferir que um outro ganhe mais ser considerado racional se
tomar as aes necessrias para garantir essa sua preferncia.
2.2 Racionalidade 34

Definio 2.2. Dado um conjunto O, agora denominado conjunto opes de esco-


lhas do jogador i ento %, l-se ao menos to bom quanto, a relao de prefe-
rncia entre os elementos de O.
Assim se x e y so elementos do conjunto O ento:

x % y se x para i uma opo ao menos to boa quanto y.


( ou x fracamente prefervel a y)

Exemplo 2.3. Seja A o cardpio de opes de almoo de um restaurante, e f =feijoada


e m =macarronada opes desse cardpio. Se para Joo:

f %m

Ento para Joo almoar feijoada pelo menos to bom quanto almoar macar-
ronada.

Definio 2.3. Dados x e y elementos do conjunto O, opes de escolha do jogador


i, a relao de preferncia estrita, representada por tal que:

x y x % y mas no y % x.
x y, l-se x estritamente prefervel a y.
( ou x sempre prefervel a y)

Para o jogador i, a escolha de de x to boa quanto a escolha de y, mas a escolha


de y no to boa quanto a escolha de x.

Definio 2.4. Dados x e y elementos do conjunto O, opes de escolha do jogador


i, a relao de indiferena, representada por tal que:

x y x % y e y % x.
x y, l-se x indiferente a y.
( ou x equivalente a y)

Nesse caso o jogador i indiferente a escolha de x ou de y.


Por fim:

Definio 2.5. A relao de prefercia % sobre um conjunto O de possveis


escolhas racional se para todo x, y, z O temos que:
2.3 Funo Utilidade e Funo Recompensa 35

a relao de prefercia % sobre um conjunto O completa, isto , ocorre


x % y, y % x ou ambos (significa que o agente sempre capaz de definir suas
preferncias).

a relao % transitiva, ou seja, se x % y e y % z ento x % z (h consistncia


na ordem entre as escolhas).

As preferncias completas e transitivas so chamadas de preferncias ordinais


pois ordenam as preferncias de um jogador em relao a um conjunto de resultados.

No ato de uma deciso, um agente racional far sua escolha de acordo com suas
relaes de preferncia.

2.3 Funo Utilidade e Funo Recompensa

No decorrer dos jogo, todos os jogadores fazem sua escolha at que um resultado
seja obtido. O objetivo da teoria dos jogos analisar os possveis resultados e
apontar qual a estratgia mais adequada para se obter o melhor desses. Para isso
deve-se modelar o jogo matematicamente e em especial, modelar os resultados
encontrar uma funo que determine como um jogador avalia os resultados, segundo
suas preferncias. A ideia que o valor que maximiza essa funo seja o valor
atribudo a preferncia do jogador entre os resultados.
Na unidade 2.2.1 vimos sobre escolha racional e preferncia, a funo recompensa
est relacionada com o processo de escolha. O agente tem uma ordem de preferncia
em relao aos possveis resultados e esses resultados que a priore no so neces-
sariamente nmeros passam a ser representada por nmeros. Mais precisamente
esperamos que uma funo possa descrever uma situao onde, para quaisquer dois
eventos alternativos que so colocadas diante de um agente como possibilidades e
o agente seja capaz de dizer qual dos dois prefere, isto , a funo deva descrever
numericamente a ordem de preferncia.

Definio 2.6. Seja A o conjunto de resultados de uma interao estratgica, a


funo recompensa para um jogador obedece a seguinte relao:
f :AR
f (x) f (y) x % y, com x, y A4
4
A preferncia de um jogador se d pelo resultado de um jogo, por isso para uma melhor compreenso
2.3 Funo Utilidade e Funo Recompensa 36

Assim, se um agente prefere o resultado x em detrimento do resultado y, atri-


bumos um nmero para x maior do que atribumos a y. Chamamos este nmero
de utilidade.

Definio 2.7. A utilidade a representao numrica da preferncia que nos


permite classificar as escolhas dos agentes.

uma extenso muito natural que a funo recompensa possa permitir com-
parar no s os eventos, mas tambm combinaes de eventos com probabilidades
declaradas.
Por utilizar a utilidade de cada resultado, a funo recompensa tambm recebe
o nome de funo utilidade, embora alguns autores faam uma pequena distino
entre as duas.
O termo recompensa e funo recompensa so muito utilizado quando se estuda
teoria das decises, que no necessariamente fazem parte da Teoria dos Jogos pois
nem todas as decises so advindas de interaes estratgicas. Em [2], a funo
recompensa definida no estudo das decises simples como uma funo que associa
um valor numrico a uma ao tomada por um agente (dentro de um conjunto de
possveis aes)e a funo utilidade definida como uma funo que associa um
valor numrico a cada resultado de uma interao estratgica. Assim para Webb:
Se uma ao a produz um resultado w(a), e f e g so respectivamente as funes
recompensa e utilidade ento f (a) = g(w(a))
J Neumann em [9] no utiliza o termo recompensa (payoff em ingls) e trata o
assunto utilizando apenas utilidade (utility).
Por sua vez, Ronaldo Fiani em [1] fala sobre utilidade mas utiliza apenas a funo
recompensa, com a mesma definio da funo utilidade feita por Webb em [2].
Observe que a funo recompensa da definio 2.6 est associando nmero ao
resultado de um jogo(assim como definido a funo utilidade em [2]), no entanto o
estudo da teoria dos jogos procura analisar a maneira como se chega a um resultado
ou qual a estratgia para se alcanar uma determinada recompensa. Um outro fato
importante que embora a utilidade feita de acordo as preferncias dos possveis
desta propriedade a funo recompensa foi definida em funo do resultado. No entanto, ao estudarmos
um jogo avaliamos como chegar a um determinado resultado preferido e por esse motivo mais comum
relacionar a funo recompensa em funo do perfil de estratgia, uma vez que para cada perfil h sempre
um resultado.
2.3 Funo Utilidade e Funo Recompensa 37

resultados, estamos interessados em estudar as estratgias para se chegar a um


determinado resultado, o que nos leva a pensar em uma funo pagamento que
tenha como domnio o espao de estratgias.
Cada perfil de estratgia s descreve totalmente a forma como o jogo jogado. Ou
seja, um perfil de estratgia nos diz exatamente o caminho do jogo que seguido e,
de forma equivalente, qual o resultado alcanado ao fim do jogo. Associado a cada
perfil de estratgia h um resultado e a cada resultado ha diferentes recompensas,
uma para cada jogador, de acordo com suas preferncias entre os possveis resultados,
podemos dizer que a cada perfil de estratgia s temos um vetor de recompensa
especfico.

Definio 2.8. Em um jogo com n jogadores e N = (1, ..., i, ...n) , o conjunto desses
jogadores, o vetor de recompensa o vetor (p1 , ..., pi , ..., pn ) onde pi a recom-
pensa do jogador i N associado a um resultado do jogo. Logo para cada perfil
estratgia s temos um vetor de recompensas (p1 , ..., pi , ..., pn ).

Nesse momento podemos definir uma nova funo que associa diretamente o
perfil de estratgia s a recompensa do jogador i e usaremos em muitos casos essa
funo como funo recompensa de i em detrimento da funo definida em 2.6.

Definio 2.9. Para cada jogador i, a funo ui : S R que associa cada perfil de
estratgia s S a um nmero real que representa a utilidade do resultado do jogo
quando s desenvolvido. A funo ui chamada de funo recompensa do jogador
i e ui (s) sua recompensa.

Atente que ui (s) = ui (s1 , s2 , ..., si , ..., sn ) = ui (si , si ) (pagamento ou recompensa


do jogador i caso os jogadores 1,2,3,...,i,...,n, tenham usado as respectivas estratgias
s1 ,s2 ,s3 ,...si ,...,sn ).

Podemos ainda definir satisfao de um jogador, assim:

Definio 2.10. Um jogador i est satisfeito com s = (s1 , s2 , ..., si , ..., sn ) se:
ui (s) = ui (si , si ) = ui (s1 , s2 , s3 , ...si , ..., sn ) > ui (si , si ) , para toda estratgia si
em Si .
2.3 Funo Utilidade e Funo Recompensa 38

Vamos aplicar a notao at aqui desenvolvida no jogo do prximo exemplo.

Jogo 2.1. Jogo das Posies

Esse jogo possui uma nica rodada e a recompensa de cada jogador depende da
combinao das escolhas feitas simultaneamente por ambos jogadores. A prxima
tabela a Matriz de Recompensas para esse jogo. Observe que o nmero de estrat-
gias para cada jogador diferente 5

DUE
Esq Cent Dir
Sup ( 2, 5 ) ( 4, 3 ) ( 7, 0 )
UNO
Inf (3 , 3) ( 4, 4 ) ( 6, 0 )

Tabela 2.2: Matriz de Recompensas (Jogo assimtrico)

Descrio

Jogadores: Uno e Due

Conjunto de Estratgias: SU no = {Sup, Inf} e SDue = {Esq, Cent, Dir}

Pagamento. Exemplos: uU no( Sup,Esq )= 2 e uDue ( Sup,Esq )= 5

O jogador Uno est satisfeito com s = (Inf, Esq) pois:


uU no(Inf, Esq) = 3 uU no(Sup, Esq) = 2

O jogador Due est satisfeito com s = (Sup, Esq) pois:


uDue (Sup, Esq) = 5 uDue (Sup, Cent) = 3 e uDue (Sup, Esq) = 5 uDue (Sup, Dir) =
0.

5
Um jogo denominado assimtrico quando o nmero de estratgias dos jogadores so diferentes.
Captulo 3

Jogos Estticos

Jogos estticos so aqueles em que feita uma nica deciso por cada jogador, e
cada jogador no tem conhecimento da deciso tomada pelos outros jogadores antes
de tomar sua prpria deciso, a forma mais simples de interdependncia estratgica
que prevalece em contextos nos quais as aes so tomadas, quer simultaneamente
ou sem o conhecimento das escolhas dos outros jogadores de ao.
So tambm chamados de jogos de deciso simultneos porque qualquer ordem
real em que so feitas as decises irrelevante, uma vez que um jogador no sabe
qual foi a deciso do outro. O exemplo mais famoso de um problema de deciso
interativa , provavelmente, o Dilema dos Prisioneiros.
Trata-se de um jogo aplicvel a vrias situaes onde as pessoas tm que tomar
decises que signifiquem cooperar ou desertar simultaneamente.
O Dilema do Prisioneiro foi originalmente formulado por Merrill Flood e Melvin
Dresher e apresentado pela primeira vez em 1950 na Universidade de Princeton1 ,
tornando-se um clssico problema da Teoria dos Jogos. Mais tarde, Albert W.
Tucker adaptou o problema original, adicionando a questo do tempo da sentena
de priso, e deu ao problema o nome pelo qual conhecido hoje.
O interesse por este jogo surge da observao que ambos os jogadores, seguindo
seu prprio interesse individual, acabam pior do que se tivessem se mantido quietos.
Este resultado aparentemente paradoxal encapsula uma grande diferena entre os
modelos de deciso no-interativos e interativos, pois na tentativa de maximizao
individual h um prejuzo coletivo.
Existem vrias verses do problema, com diferenas no tempo de sentena ou na
forma de apresentao da situao, mantendo-se a anlise dos resultados.
Uma verso do Dilema do Prisioneiro clssico funciona como no exemplo a seguir:
1
John Nash foi Matemtico Snior de Investigao nesta Universidade.
40

Exemplo 3.1. A polcia prende dois indivduos suspeitos de cometerem um crime


e os coloca em duas celas separadas, sem possibilidade de comunicao entre eles.
O detetive suspeita que tenham cometido tambm outro crime mais grave oferece a
ambos o mesmo acordo:

Se algum dos parceiros confessar o crime e o outro no, o traidor fica livre da
priso, enquanto o outro pega sete anos de cadeia.

Se os dois se acusarem mutuamente, os dois pegam cinco anos, pelo segundo


crime.

Se ambos ficarem em silncio, s podero ser acusados do primeiro crime pe-


gando dois anos de cadeia cada um.

Nessa forma apresentada, dado perdo pelo primeiro crime ao traidor e a pena
pelo segundo crime ao trado. Cada prisioneiro faz a sua deciso sem saber que
deciso o outro vai tomar. A tabela 3.1 a matriz de recompensa para este jogo.

P2
Nega Delata
Nega ( 2, 2 ) ( 8, 0 )
P1
Delata (0 , 8) ( 5, 5 )

Tabela 3.1: Matriz de Recompensas do Exemplo 3.1, P1 e P2 so os prisioneiros.

Uma vez que nenhum deles pode ter a certeza da cooperao do outro, a tendncia
que ambos iro optar por denunciar o colega pois na pior das hipteses, cumpriro
uma pena de 5 anos e, na melhor, sairo em liberdade. Caso tivessem cooperado
um com o outro, teriam tido melhor resultado, mas:

Confiaro no cmplice e negaro o crime, mesmo correndo o risco de serem


colocados numa situao ainda pior se o outro falar?

Ou confessam e esperam ser libertados, arriscando, se o outro fizer o mesmo,


a ambos ficarem numa situao pior do que se permanecessem calados?

Pode-se argumentar que eles deveriam ter tido um acordo antes de serem presos
que iriam se calar. No entanto, cada prisioneiro no tem nenhuma maneira de
garantir que o outro segue este acordo. claro que um prisioneiro poderia se vingar
no futuro - mas isso um outro jogo (com diferentes recompensas).
41

Definio 3.1. A soluo dito timo de Pareto(do economista italiano Vilfredo


Pareto) se nenhum retorno de um jogador pode ser aumentada sem reduzir a recom-
pensa para um outro jogador. Tais solues so tambm denominados socialmente
eficiente ou apenas eficiente.

De um ponto de vista puramente egocntrico racional para cada prisioneiro,


confessar. Mas esta escolha d a cada um pior resultado do que se pensassem
coletivamente.
Observemos que, no Dilema do Prisioneiro, a combinao de estratgias (Delatar,
Delatar), no parece proporcionar um resultado muito satisfatrio pois tanto o P1
quanto P2 lucrariam mais se escolhessem (Negar, Negar), ora, levariam 2 anos de
priso em vez de 5. Dizemos, ento, que (Delatar, Delatar) no timo de Pareto.
Uma combinao de estratgias timo de Pareto, se no se puder mudar para uma
outra combinao de modo que nenhum jogador fique prejudicado e pelo menos um
seja beneficiado. Trata-se de um conceito que analisa a eficincia social, isto , a
busca da maximizao dos ganhos coletivos. Neste aspecto o perfil de estratgia
(negar,negar) a indicada sob o ponto de vista social ao passo que o perfil de
estratgia (Delatar, Delatar) a indicada sob o ponto de vista individual.
Casos como este so recorrentes em diversas reas da sociedade, e em diversas
e complexas situaes. O Dilema dos Prisioneiros frequentemente usado como
o ponto de partida para uma discusso sobre o contrato social (ou seja, como as
sociedades se formam e como eles se sustentam) porque a natureza socialmente
ineficiente de sua soluo uma reminiscncia de muitos recursos da sociedade. Por
exemplo, considere a utilizao de um recurso natural como uma pesca. Quanto
mais voc pescar, economicamente melhor. No entanto, se no houver controle
e todos pescarem indiscriminadamente o recurso pode sessar (porque, como voc,
todos esto seguindo seu prprio interesse prprio), ento pode no haver mais o
recurso no futuro e todo mundo est pior do que se todos tivessem controlado sua
explorao ao recurso.
Este jogo ilustra a contradio entre a procura do bem individual e a procura do
bem coletivo.
Na sua verso clssica (jogado uma nica vez) ou em sua verso modificada
(possibilidade de interao, jogado mais de uma vez), tem sido usado para estudar
o problema da cooperao entre indivduos, grupos e naes em diversos tipos de
3.1 Descrio de Jogos Estticos 42

problemas.

Exemplo 3.2. Dilema dos Prisioneiros normalizado

De maneira geral um jogo chamado de Dilema dos Prisioneiros se tiverem uma


matriz de resultado similar a tabela 3.2 com t > r > p > s.

P2
C D
C ( r, r ) ( s, t )
P1
D (t, s) ( p, p )

Tabela 3.2: Matriz de Recompensas do Dilema dos Prisioneiros normalizado

A letra C representa cooperar e a letra D representa desertar( ou trair ). Pelo


exemplo 3.1 devemos esperar que ambos jogadores acabem por trair se buscarem
a maximizao de ganhos individuais, no caso teriam como recompensa p mas esta
soluo socialmente ineficiente, uma vez que a soluo (C,C) melhor para ambos,
uma vez que r > p.

3.1 Descrio de Jogos Estticos

Para descrio de um jogo esttico so necessrios:

Um conjunto de jogadores, representados por i N = 1, 2, ..., i, ..., n.

Um conjunto de estratgias pura, Si , para cada jogador i.

As recompensas para cada jogador em cada possvel situao de jogo, ou seja,


para cada combinao de estratgias puras de todos jogadores. A recompensa
do jogador i ser representada por uma das similares notaes:

ui (s) = ui (si , si ) = ui (si , s1 , s2 , ..., si , ..., sn ), onde:

s o perfil de estratgia dos n jogadores pertencentes a N.2

Definio 3.2. Uma apresentao em tabula de um jogo, usando estratgias puras,


chamado de forma normal de forma estratgica de um jogo. A matriz de
2
Veja definio 1.6
3.1 Descrio de Jogos Estticos 43

recompensas descrita na seo 1.3 uma forma normal de representao de um


jogo.

Especificamente para jogos estticos no h distino entre as estratgias puras


e aes dos jogadores, na definio de forma estratgica utiliza-se estratgias pu-
ras pois esta representao pode ser usada em outros jogos onde esta distino
evidente.

Exemplo 3.3. A batalha dos sexo um jogo em que um casal de namorados


tm que decidir se quer ver um filme ou ir pera. Infelizmente, eles trabalham
em diferentes partes da cidade e, devido a problema de telefonia, encontram-se em
regime de incomunicabilidade. Eles devem simultaneamente e independentemente
selecionar um evento para participar. H apenas uma sala de cinema e apenas um
local de pera, de modo que o casal vo conhecer um aos outro se eles conseguem
coordenar suas decises. Ambos preferem estar juntos, independentemente de qual
evento que eles frequentam. No entanto, o jogador 1(a namorada) prefere a pera e
o jogador 2(o namorado) prefere o filme.3
A tabela 3.3 a forma normal que representa este jogo.

N amorado
pera(O) Filme(F)
pera(O) ( 4, 2 ) ( 1, 1 )
N amorada
Filme(F) (1, 1) ( 2, 4 )

Tabela 3.3: Matriz de Recompensas da Batalha dos Sexos

As recompensas da tabela respeitam as preferncias:


Estar junto em seu evento favorito Estar junto no evento favorito do par-
ceiro Estar sozinho em seu evento favorito Estar sozinho no evento favorito
do parceiro.
Pois sendo a namadora o jogador 1 e o namorado o jogador 2 temos que:

S1 = S2 = {O, F }
u1 (O, O) = 4 > u1 (F, F ) = 2 > u1 (O, F ) = 1 > u1 (F, O) = 1
u2 (F, F ) = 4 > u2 (O, O) = 2 > u2 (F, O) = 1 > u2 (O, F ) = 1
3
Assim como no Dilema dos Prisioneiros, h vrias formas de contar essa histria.
3.1 Descrio de Jogos Estticos 44

Resumindo, definimos formalmente um jogo de forma estratgica como a tripla:

(N, {Si }iN , {ui }iN ).

Em particular se um jogo de dois jogadores(com N=1,2) precisamos exatamente


de 4 informaes:

(S1 , S2 , u1 , u2 ).

Definio 3.3. A estratgia mista para o jogador i uma distribuio de probabili-


dade sobre suas estratgias puras, ou seja, d as probabilidades de que cada estratgia
pura si Si do jogador i ser jogada. A estratgia mista ser denotado i e o con-
junto de todas as possveis estratgias mistas para o jogador i ser denotado por
i .

Seja Si = {s1i , s2i , ..., sji , ..., sm


i } o conjunto das mi estratgias puras do jogador i
i

ento uma estratgia mista pode ser representada por um vetor de probabilidades:

Pmi
i = (p(s1i ), p(s2i ), ..., p(sji ), ..., p(sm
i )) e
i
j=1 p(sji ) = 1 onde p(sji ) a probabili-
dade da estratgia pura sji ser jogada.

Podemos ainda representar o conjunto de todas as estratgias mistas do jogador


i por:

i = {(p(s1i ), p(s2i ), ..., p(sji ), ..., p(sm


i )) R
i mi
| p(s1i ) 0, ..., p(sm
i ) 0 e
i

Pmi j
j=1 p(si ) = 1}

Uma estratgia pura ski com k {1, 2, ..., mi } pode ser representada por um vetor:

i = (p(s1i ), p(s2i ), ..., p(sji ), ..., p(sm j


i )), p(si ) = 1 e p(si ) = 0 para todo j 6= k.
i k

Em outras palavras uma estratgia pura um vetor onde todas as entradas so


zero exceto uma.
Estratgias mistas podem, portanto, serem representadas como combinaes li-
neares de estratgias puras:
3.1 Descrio de Jogos Estticos 45

Pmi j j
i = j=1 p(si )si

Definio 3.4. Um perfil de estratgia mista ou vetor de estratgia mista a com-


binao das estratgias mistas, uma de cada jogador, descreve a estratgia mista
usada por todos os jogadores em um jogo, isto , cada jogador i utiliza uma es-
tratgia i . Um perfil de estratgia mista pode ser representado pelo vetor =
(1 , 2 , 3 , ..., i , ..., n ) onde i uma estratgia mista do jogador i.

Definio 3.5. O espao de todos os perfis de estratgia mista o produto cartesi-


ano:

= 1 2 ... n

Usaremos a notao i para para determinar a estratgia de todos os jogadores


com exceo de i e i para o espao de estratgias de todos os jogadores, exceto
i, isto , i = 1 2 ... i1 i+1 ... n .
Cada perfil de estratgia mista = (1 , 2 , 3 , ..., i , ..., n ) determina uma
recompensa esperada. Sabendo que i = (p(s1i ), p(s2i ), ..., p(sji ), ..., p(sni )) e mi o
nmero de estratgias puras do jogador i podemos definir utilidade esperada como:

Definio 3.6. Utilidade esperada de um perfil de estratgia uma mdia das


recompensas ponderadas pelas distribuies de probabilidades 1 , 2 , ..., i , ..., n , isto
:

Pm1 Pm2 Pmn Qn jk j1 j2 jn


ui () = j1 =1 j2 =1 ... jn =1 [( k=1 p(sk ))ui (s1 , s2 , ..., sn )]

ou
Pm1 Pm2 Pmn j1 j2 jn j1 j2 jn
ui () = j1 =1 j2 =1 ... jn =1 [p(s1 )p(s2 )...p(sn ).ui (s1 , s2 , ..., sn )]

A utilidade esperada de um jogador da definio 3.6 para um jogo com 2 jogadores


Pm1 Pm2 Q2 jk j1 j2
pode ser reescrita como ui () = j1 =1 j2 =1 ( k=1 p(sk )ui (s1 , s2 ), em especial

quando cada jogador tem apenas duas estratgias puras, isto , Si = {s1i , s2i } para
cada jogador i, a expresso desenvolvida pode ser transformada em pruduto de
matrizes.
ui () = 2j1 =1 2j2 =1 ( 2k=1 p(sjkk ))ui (sj11 , sj22 ) =
P P Q

= 2j1 =1 2j2 =1 (p(sj11 )p(sj22 ).ui (sj11 , sj22 )) =


P P
3.1 Descrio de Jogos Estticos 46

P2 j1 j1 1
= 1
j1 =1 [(p(s1 )p(s2 ).ui (s1 , s2 )) + (p(sj11 )p(s22 ).ui (sj11 , s22 ))] =
= 2j1 =1 (p(sj11 )p(s12 ).ui (s1j1 , s12 )) + 2j1 =1 (p(sj11 )p(s22 ).ui (sj11 , s22 )) =
P P

= p(s12 ) 2j1 =1 (p(sj11 ).ui (sj11 , s12 )) + p(s22 ) 2j1 =1 (p(sj11 ).ui (sj11 , s22 ))
P P

= [ 2j1 =1 (p(sj11 ).ui (sj11 , s12 ))]p(s12 ) + [ 2j1 =1 (p(sj11 ).ui (sj11 , s22 ))]p(s22 )
P P

Vamos colocar este resultado parcial em forma matricial.


ui () = 2j1 =1 2j2 =1 ( 2k=1 p(sjkk ))ui (sj11 , sj22 ) =
P P Q


h P
2 j1 j1 1 P2 j1 j1 2
i p(s12 )
= j1 =1 (p(s1 ).ui (s1 , s2 )) j1 =1 (p(s1 ).ui (s1 , s2 ))
=
p(s22 )


h i p(s12 )
= {p(s11 ).ui (s11 , s12 ) + p(s21 ).ui (s21 , s12 )} {p(s11 ).ui (s11 , s22 ) + p(s21 ).ui (s21 , s22 )} =
p(s22 )


h i ui (s11 , s12 ) ui (s11 , s12 ) p(s12 )
= p(s12 ) p(s22 ) =
ui (s21 , s22 ) ui (s21 , s22 ) p(s22 )

No caso em que p(s11 ) = p e p(s12 ) = q ento p(s21 ) = 1 p e p(s22 ) = 1 q, segue


que = (p, q) com 1 p 0 e 1 q 0.


h i ui (s11 , s12 ) ui (s11 , s12 ) q
ui () = ui (p, q) = p 1p =
ui (s21 , s22 ) ui (s21 , s22 ) 1q

h i
= p.q.ui (s11 , s12 ) + (1 p).q.ui (s21 , s12 ) + p.(1 q).ui (s11 , s22 ) + (1 p).(1 q).ui (s21 , s22 )

Exerccio 3.1. Jogo de par ou mpar. Nesse jogo, dois jogadores exibem, ao mesmo
tempo, uma das mos mostrando de 0 a 5 dedos. Se a soma dos dedos apresentados
pelos dois jogadores der par o primeiro jogador ganha, se der mpar o segundo ganha.
Por simplicidade, basta saber se o nmero apresentado por cada jogador foi par ou
mpar (no h necessidade de saber a quantidade de dedos apresentados) j que cada
um tem trs possibilidades de escolher par e trs de escolher mpar (supondo que entre
3.1 Descrio de Jogos Estticos 47

q 1q
J2
s12 s22
p s11 (u1 (s11 , s12 ), u2 (s11 , s12 )) (u1 (s11 , s22 ), u2 (s11 , s22 ))
J1
1p s21 (u1 (s21 , s12 ), u2 (s21 , s12 )) (u1 (s21 , s22 ), u2 (s21 , s22 ))

Tabela 3.4: Matriz de Recompensas

as trs opes de pares a probabilidade de escolha a mesma, assim como entre as


trs opes de mpar). Assim podemos separar o conjunto de estratgias de cada
jogador i em Si = {par, impar}. A seguir apresentamos a tabela de recompensas:

1/3 2/3
Jogador 2
Par mpar
1/4 Par (+1, 1) (1, +1)
Jogador 1
3/4 mpar (1, +1) (+1, 1)

Tabela 3.5: Matriz de Recompensas do Par e mpar

1 = (1/4, 3/4) e 2 = (1/3, 2/3)), vamos calcular a utilidade esperada para o


jogador 1:

P2 P2 Q2 jk j1 j2
u1 () = j1 =1 j2 =1 ( k=1 p(sk )u1 (s1 , s2 ))
P2 P2 j1 j2 j1 j2
u1 () = j1 =1 j2 =1 (p(s1 ).p(s2 ).u1 (s1 , s2 ))
P2 j1 j1 1
u1 () = 1
j1 =1 [(p(s1 ).p(s2 ).u1 (s1 , s2 )) + (p(sj11 ).p(s22 ).u1 (sj11 , s22 ))]
u1 () = {[(p(s11 ).p(s12 ).u1 (s11 , s12 ))+(p(s11 ).p(s22 ).u1 (s11 , s22 ))]+[(p(s21 ).p(s12 ).u1 (s21 , s12 ))+
(p(s21 ).p(s22 ).u1 (s21 , s22 ))]}
u1 () = {[(1/4.1/3.(+1) + 1/4.2/3.(1))] + [3/4.1/3.(1) + 3/4.2/3.(+1)]}
u1 () = 1/4(1/3 2/3) + 3/4(1/3 + 2/3) = 1/12 + 3/12 = 1/6

ou


h i +1 1 1/3 h i 1/3
u1 () = u1 (1 , 2 ) = 1/4 3/4 = 1/2 +1/2 =
1 +1 2/3 2/3
3.2 Soluo de um jogo 48

h i
= 1/6

3.2 Soluo de um jogo

Uma soluo de um jogo um perfil de estratgia4 s (no necessariamente nico)


que n jogadores racionais podem usar. Em jogos de dois jogadores, solues sero
indicadas colocando um par de estratgias entre parnteses, como (A, B) ou (1 , 2 ),
onde vamos colocar a estratgia adotada pelo jogador 1 primeiro. Por exemplo, a
soluo da Batalha dos Sexos do exemplo 3.3 pode ser representada por (O,O).

3.2.1 Resolvendo Jogos usando dominncia

Ao estudarmos o Dilema dos Prisioneiros de forma intuitiva simples, observamos


que a estratgia para o jogador 1 de delatar era sempre melhor do que manter o
silncio, para cada estratgia escolhida pelo jogador 2, parece razovel tentar resol-
ver jogos, eliminando estratgias pobres para cada jogador, isto , estratgias que
no sejam as melhores.

Em alguns casos estudaremos interaes estratgicas que envolvam apenas dois


agentes estratgicos (por simplicidade), por isso algumas definies estaro contem-
plando apenas esses casos.

Definio 3.7. Dizemos que uma estratgia si de um jogador estritamente do-


minante sobre uma estratgia si deste jogador se o retorno obtido com a escolha de
si estritamente maior que o retorno ao se escolher si independente das escolhas
ou estratgias utilizadas pelos demais jogadores.
Assim, a estratgia si do jogador i domina estritamente a estratgia si do jogador
i se:

ui (si ,si )>ui (si ,si ) para todo si

Definio 3.8. A estratgia si do jogador i fracamente dominante sobre a es-


tratgia si do jogador i se:

4
Veja definio 1.6 de perfil de estratgia.
3.2 Soluo de um jogo 49

ui (si ,si )>ui (si ,si ) para todo si

ui (si ,si )>ui (si ,si ) para algum si

Queremos dizer que uma estratgia si domina fracamente outra estratgia si para
o jogador i, se independentemente do que os outros jogadores faam, a recompensa
obtida por si , pelo menos, to boa quanto a recompensa obtida pela estratgia
si i, e para algum perfil dos outros jogadores si tem recompensa melhor do que a
recompensa de si . Se ao escolher a estratgia si , o jogador obtm recompensa es-
tritamente maior do que quando escolhe si , independentemente do que os outros
jogadores fazem, ento dizemos que si domina estritamente si .

Definio 3.9. Uma estratgia si fracamente dominante se domina fracamente


todas as estratgias em Si . E chamada de estritamente dominante se domina
estritamente todas as estratgias em Si .

A estratgia estritamente dominante nica.

Demonstrao. (i) Seja si uma estratgia estritamente dominante de Si , isto , para


todo sji Si (exceto si , obviamente) temos que ui (si ,si )>ui (sji ,si ) para todo si .
(ii) Suponha que ski Si seja tambm uma estratgia estritamente dominante de
Si , segue que ui (ski ,si )>ui (si ,si ) contradizendo (i)

Definio 3.10. A estratgia pura si do jogador i estritamente dominada pela


estratgia si do jogador i se:

ui (si , si ) > ui (si , si ) para todo si

A prxima definio contempla o caso de dois jogadores com estratgias mistas.

Definio 3.11. A estratgia 1j do jogador 1 estritamente dominada pela estra-


tgia 1 do jogador 1 se:
3.2 Soluo de um jogo 50

ui (1 , 2 ) > ui (1j , 2 ) para todo 2 2

Ou seja, qualquer que seja a estratgia mista do jogador 2 , sempre melhor


para o jogador usar 1 ao invs de 1j . Da mesma forma, uma estratgia 2k para o
jogador 2 estritamente dominada por 2 se:

ui (1 , 2 ) > ui (1 , 2k ) para todo 1 1

Definio 3.12. A estratgia si do jogador i fracamente dominada pela estratgia


si do jogador i se:

ui (si ,si )>ui (si ,si ) para todo si


e
ui (si ,si )>ui (si ,si ) para algum si

Do mesmo modo, como fizemos anteriormente vamos refazer a definio anterior


para o caso de dois jogadores utilizando estratgias mistas.

Definio 3.13. A estratgia 1j do jogador 1 fracamente dominada pela estratgia


1 do jogador 1 se:

ui (1 , 2 ) > ui (1j , 2 ) para todo 2 2


e
ui (1 , 2 ) > ui (1j , 2 ) para algum 2 2

Definio 3.14. Uma estratgia si fracamente dominada se domina fracamente


por todas as estratgias em Si . E chamada de estritamente dominada se domi-
nada estritamente por todas as estratgias em Si .

Fica evidente que no h motivos para um agente racional utilizar uma estratgia
si sabendo que esta tem sempre uma recompensa pior ou igual a qualquer outra
estratgia si , uma vez que se pretende maximizar os ganhos.
Ao no usarmos estratgias estritamente ou fracamente dominadas estamos eli-
minando piores recompensas.
3.2 Soluo de um jogo 51

A eliminao de estratgias dominadas, seja fracamente ou estrita-


mente uma ferramenta utilizada para resolvermos jogos em Teoria dos
Jogos.

O Dilema dos Prisioneiros um exemplo de jogos que resolvemos eliminando


as estratgias estritamente dominadas. O prximo exemplo ilustra um jogo que
resolvido eliminando-se as estratgias fracamente dominadas.

Exemplo 3.4. Considere o jogo representado pela seguinte forma estratgica:

Jogador 2
Esq Dir
Sup ( 2, 2 ) ( 1, 1 )
Jogador 1
Inf (1 , 0) ( 1, 0 )

Tabela 3.6: Matriz de Recompensas do exemplo 3.4

Para o jogador 1, Sup domina fracamente Inf e, para o jogador 2, Esq domina
fracamente Dir. Consequentemente, espera-se que o jogador 1 no jogue Inf e o
jogador 2 no jogue Dir, e a soluo do jogo usando dominncia (Sup, Dir).

H jogos em que no possvel obter uma soluo por dominncia. Veja um


exemplo a seguir.

Exemplo 3.5. Vamos verificar a Matriz de Recompensas da tabela 1.12 para de-
terminar se algum dos jogadores, UNO ou DUE, possui uma estratgia estritamente
dominada.

DUE

(0,0) (-1,-5)
UNO
(-5,-1) (1,1)

uU N O (, ) = 1 > uU N O (, ) = 1,
uU N O (, ) = 0 > uU N O (, ) = 5

Para UNO escolher melhor que escolher quando DUE escolhe ao passo
que quando DUE escolhe , a melhor escolha para UNO . Logo, verificamos que
UNO no possui uma estratgia estritamente dominante.
3.2 Soluo de um jogo 52

Vejamos o que ocorre com DUE:

uDU E (, ) = 1 > uDU E (, ) = 1,


uDU E (, ) = 0 > uDU E (, ) = 5

Assim como para UNO, no h uma estratgia estritamente dominante para


DUE. Neste jogo, entre dois jogadores socialistas, a melhor escolha de um depende
da escolha feita pelo outro. Observe que neste caso, uma coordenao entre os jo-
gadores, poderia levar ao melhor resultado para ambos, no haveria incentivo para
que um mudasse a escolha acordada com o outro. Jogos com coordenao sero
estudados adiante.5

Exemplo 3.6. Da Matriz de Recompensas da tabela 1.11 observamos que:

uU N O (, ) = 0 > uU N O (, ) = 1,
uU N O (, ) = 3 > uU N O (, ) = 1
e
uDU E (, ) = 0 > uDU E (, ) = 5,
uDU E (, ) = 1 > uDU E (, ) = 1

DUE

(0,0) (3,-5)
UNO
(-1,-1) (1,1)

No difcil de ver nesse caso que para o UNO a estratgia dominante escolher
, e para DUE a melhor estratgia6 escolher quando UNO escolhe e escolher
quando DUE escolher .
Escolher para UNO uma estratgia estritamente dominante, no h porque esco-
lher algo que lhe dar pior resultado. Para DUE, a melhor escolha est condicionada
na escolha feita por UNO, como poderia DUE fazer uso dessa informao? Quando
5
obviamente, a segunda instruo que ser dada poderia resolver o problema, se os jogadores so
racionais, poderiam observar que escolher a melhor escolha para ambos, nos limitamos aqui a anlise
apenas em ter ou no uma estratgia estritamente dominante (ou dominada)
6
Entenda como melhor estratgia aquela que d a melhor recompensa.
3.2 Soluo de um jogo 53

estudarmos quo importante colocar-se no lugar do outro, responderemos a esta


questo, no momento se supormos que Due saiba que Uno racional e que Uno
ir, portanto, escolher por ser estritamente dominante, ento certamente Due ir
tambm j que melhor escolha quando Uno escolhe . A soluo deste jogo
(,).

Exemplo 3.7. No Jogo das Notas, no caso em que UNO e DUE eram jogadores
egocntricos, chegamos na Matriz de Recompensas da tabela 1.10. Note que ao es-
colher a estratgia , UNO tem seu retorno maior independente da escolha feita por
DUE pois:

7
uU N O (, ) = 3 > uU N O (, ) = 1,
uU N O (, ) = 0 > uU N O (, ) = 18

DUE

(0,0) (3,-1)
UNO
(-1,3) (1,1)

Conclumos ento que UNO possui uma estratgia estritamente dominada. A


mesma observao pode ser feita quando analisamos a Matriz de Recompensa da
desta tabela e vemos que DUE tambm tem uma estratgia estritamente dominada.
A saber, escolher uma estratgia estritamente dominada tanto para UNO
quanto para DUE. Ora, UNO e DUE so jogadores racionais, buscando maiores
recompensas, ento razovel que ambos escolham e recebam portanto 0 como
recompensa. Estranhamente, vemos que se ambos escolhessem cada um dos joga-
dores receberia 1, o que mostra que escolhas racionais feitas por jogadores racionais
nem sempre levam a melhores recompensas9.
O leitor deve achar que seria interesse ambos jogadores escolherem , suas re-
compensas seriam maiores do que se ambos escolhessem . O leitor ento proporia
a ambos jogadores que assim o fizessem, o problema que o jogo simultneo e
7
Uno tem recompensa maior ao escolher quando Due escolhe
8
Uno tem recompensa maior ao escolher quando Due escolhe
9
Em seu curso de Teoria dos Jogos, Ben Polak, d uma grande importncia a essa informao, colocando-
a como uma das 5 primeiras lies da Teoria dos Jogos, saiba mais em [6]
3.2 Soluo de um jogo 54

se um dos jogadores souber que o outro escolher , ter um motivo ainda maior
para escolher pois neste caso receber 3 como recompensa, levando aquele que es-
colheu a recompensa de -1. Lembre-se que so jogadores preocupados apenas em
maximizar seus ganhos.

Vemos no ltimo exemplo a contradio entre emprego da racionalidade indivi-


dual e da coletiva. Este tipo de situao onde jogadores egostas agindo racional-
mente, tm pior retorno do que se ambos tivessem agindo com como racionalidade
coletiva10 o j conhecido Dilema dos Prisioneiros.
No jogo das posies cuja matriz de resultados representado pela tabela 2.2
no h uma estratgia estritamente dominada para UNO pois:

uU N O (Inf, Esq) = 3 > uU N O (Sup, Esq) = 2


uU N O (Sup, Dir) = 7 > uU N O (Inf, Dir) = 6

Por outro lado, a estratgia Dir no dever ser usada por Due uma vez que
uma estratgia estritamente dominada.

uDU E (Inf, Cent) = 4 > uDU E (Inf, Dir) = 0


uDU E (Sup, Cent) = 3 > uDU E (Sup, Dir) = 0

uDU E (Inf, Esq) = 3 > uDU E (Inf, Dir) = 0

uDU E (Sup, Esq) = 5 > uDU E (Sup, Dir) = 0

Uno, colocando-se no lugar de Due, sabe que no vivel que Due escolha Dir e
re-analisa a tabela 2.2 que pode ser reescrita como abaixo:

Sup agora fracamente dominada pela estratgia Inf e Uno racionalmente adota
a estratgia Inf .

Na tab. 3.7, Due continua sem uma estratgia estritamente (ou fracamente) do-
10
racionalidade coletiva quando jogadores agem racionalmente procurando o melhor resultado coletivo
3.2 Soluo de um jogo 55

DUE
Esq Cent
Sup ( 2, 5 ) ( 4, 3 )
UNO
Inf (3 , 3) ( 4, 4 )

Tabela 3.7: Matriz de Recompensas da Tab. 2.2 eliminado a estratgia Dir

minada, sua melhor escolha depende da escolha de UNO, no entanto, colocando-se


no lugar de UNO, sua escolha ser Cent pois:

uDU E (Inf, Cent) = 4 > uDU E (Inf, Esq) = 3

Resumidamente temos que inicialmente o jogador Uno no tem nenhuma estrat-


gia dominada pois escolher sup melhor quando Due escolhe dir( sua recompensa
7 ao invs de 6) mas para as demais escolhas de Due, Uno tem uma recompensa to
boa ou melhor quando escolhe inf em detrimento da escolha de sup. Mas para Due
a escolha de Dir estritamente dominada e por isso eliminada. Em seguida para
Uno a eliminao da estratgia Dir faz com que a estratgia sup seja fracamente
dominada pela estratgia inf e tambm eliminada por Uno, com isso a melhor
escolha para Due passa a ser cent levando a (Inf, Cent) como nica soluo.

Colocar-se no lugar do adversrio a segunda importante ferramenta


utilizada em Teoria dos Jogos. No entanto para resolvermos o jogo anterior
assumimos que Uno e Due alm de serem racionais, sabiam que os dois envolvidos
eram racionais e tinham conhecimento que ambos tinham essa informao.

Exemplo 3.8. Anibal, general e estrategista cartagins nascido em Cartago, filho


do fundador do Imprio Pnico na Espanha, Amilcar Barca, fundador do imprio
cartagins na Espanha e comandante da primeira guerra pnica contra os romanos.
Famoso por sua genialidade, ainda hoje considerado por muitos o maior estrate-
gista da Antiguidade, cujas manobras blicas so ainda hoje estudadas.
De maneira simplista vamos analisar uma ofensiva militar dos cartagos contra
os romanos. Nessa havia dois caminhos, um fcil pela costa e o outro difcil atra-
vessando os Alpes, pelos quais Anibal tentaria atingir Roma utilizando duas tropas.
3.2 Soluo de um jogo 56

pelo caminho difcil: Anibal, perderia 1 tropa no caminho e, se por l estivessem


os Romanos esperando, perderia a outra e no chegaria a Roma.

pelo caminho fcil: poderia chegar com 2 tropas no alvo ou, caso interceptados
pelos romanos, teriam ainda uma tropa chegando ao alvo.

Os Romanos precisavam decidir por qual caminho deveria esperar e defender-se


dos cartagos.
Na linguagem da Teoria dos Jogos a recompensa para os romanos o nmero de
tropas inimigas abatidas e a recompensa para os Cartagos o nmero de tropas que
chegam ao alvo.
A Tabela a seguir a Matriz de recompensa para este jogo.

Cartagos
Fcil Difcil
Fcil (1,1) (1,1)
Romanos
Difcil (0,2) (2,0)

Tabela 3.8: Prmios da Estratgia

Para os romanos no h uma estratgia estritamente dominada , defender pela


via fcil melhor quando atacado pela via fcil, assim como defender pela via di-
fcil melhor quando atacado pela via difcil. No entanto a segunda instruo (ou
ferramenta) nos ensina a colocar-se no lugar do oponente e desse modo, os roma-
nos sabem que para Anibal, atacar pela via fcil lhe d vantagem caso os Romanos
defendam-se pela via difcil e caso os romanos defendam-se pela via fcil, a escolha
dos cartagos torna-se indiferente (sob o aspecto do prmio adotado).
No difcil para os romanos optar por defender a via fcil ao perceber que atacar
pela via difcil era para Anibal, uma estratgia fracamente dominada.11

Algumas vezes em um jogo no h diretamente uma estratgia dominada (seja


estritamente ou fracamente)para um jogador mas, ao colocar-se no lugar do outro,
e excluir a estratgia dominada deste outro jogador, estratgias dominadas surgem.
Colocar-se no lugar das outras pessoas pensando nas recompensas delas e mais
que isso, saber como essas pessoas so sofisticadas ao jogar, se especialmente essas
11
Embora a histria mostra que Anibal optou por atacar pela via difcil.
3.2 Soluo de um jogo 57

pessoas sabem como voc joga e como se colocaro no seu lugar muda completamente
o resultado de um jogo.
Para se resolver um jogo por estratgias dominadas, assumindo que:

1. Os jogadores so racionais.

2. Cada jogador sabe que todos os agentes do jogo so racionais.

3. Os jogadores sabem que os outros jogadores sabem do fato que todos os agentes
do jogo so racionais.

4. Os jogadores sabem que todos jogadores tem conhecimento do fato de que todos
os agentes do jogo saberem que todos sabem que os envolvidos so racionais.

5. e assim por diante, at o infinito.

Esta cadeia de premissas chamado de Conhecimento Comum sobre a racio-


nalidade12 (chamaremos de CCR) . Ao aplicar o pressuposto CCR como hiptese,
podemos resolver um jogo por deleo iterativa de estratgias dominadas.
A ideia que sustenta esta soluo que no h nenhuma razo, qualquer que
seja o que pensa o jogador i a cerca da estratgia que o jogador j escolher, para
i utilizar a estratgia si sabendo que qualquer outra estratgia si d um resultado
melhor para i, independente da escolha de j.

Exemplo 3.9 (Conhecimento mtuo e Conhecimento comum). Joo e Maria


vo a um parque onde as pessoas que l adentram recebem um carimbo na testa, no
possvel ver a cor que carimbaram em si prprio. Ambos receberam um carimbo verde
na testa e ao se olharem, ambos sabiam que pelo menos uma pessoa havia recebido
um carimbo verde na testa (ora, um pode ver a testa do outro). Saber que pelo
menos uma pessoa havia recebido um carimbo verde na testa era um conhecimento
mtuo mas, um no sabe o que o outro est vendo, no sabe a cor do prprio carimbo
e portanto no sabe que o outro tem o conhecimento que h pelo menos uma pessoa
com carimbo verde na testa. Esse conhecimento portanto embora seja mtuo, no
um conhecimento comum.
12
conhecimento comum: Eu sei de algo, voc tambm sabe, eu sei que voc sabe disso, voc sabe que eu
sei disso, eu sei que voc sabe que eu sei disso, voc sabe que eu sei que voc sabe disso, eu sei que voc
sabe que eu sei que voc sabe disso, voc sabe que eu sei que voc sabe que eu sei disso.
3.2 Soluo de um jogo 58

Afirmar que as recompensas dos jogadores so de conhecimento comum significa


dizer que nenhum jogador tem dvidas sobre o resultado buscado pelos demais
jogadores, isto , cada jogador sabe os objetivos dos demais jogadores.

Definio 3.15. Jogos de Informao completa so jogos onde as recompensas


dos jogadores so de conhecimento comum.

3.2.2 Deleo Iterativa de Estratgias Dominadas

13
Jogo 3.1. Jogo da Escolha
Os n jogadores escolhem, sem que os outros saibam, um nmero entre 1 e 100.
Vence aquele que escolheu o nmero mais prximo da metade da mdia, recebendo
1 (o mesmo valor em caso de empate), os demais jogadores nada recebem.

Vamos verificar se h alguma estratgia dominada (fracamente ou estritamente).

Podemos definir a funo fi : A R definida em A = {1, 2, 3, ..., 100}, conjunto


das escolhas do jogador i, i {1, 2, ..., n}, tal que:

fi (si ) = |si m|
m = ni=1 2n si
P

A funo fi d a distncia do nmero si escolhido pelo jogador i metade da


mdia aritmtica de s, onde s a combinao das escolhas de todos n jogadores.
Logo:


0 se s s i tal que f (s ) > f (s )
j i i j j
u(si , si ) =
1 se sj s i, fj (sj ) > fi (si )

Sendo M a mdia entre as escolhas dos n jogadores ento:

14
100 > M > 1 50 > m > 0, 5

13
Jogo baseado no exemplo dado na aula 1 e depois trabalhado na aula 2 do curso de Teoria dos Jogos
da Universidade de Yale nos Estados Unidos, o curso est disponvel em www.veduca.com.br .
14
Os extremos correspondem aos casos onde todos os jogadores escolhem 1 ou todos escolhem 100.
3.2 Soluo de um jogo 59

Sendo si =50 uma estratgia de um jogador i e si uma outra estratgia de i, onde


si > 51 ento si uma estratgia fracamente dominada pela estratgia si =50.

Demonstrao: Queremos mostrar que:


u (50, s ) > u (s , s ) para todo s , com s > 51
i i i i i i i
ui (50, si ) > ui (s , si ) para algum si
i

si >50> m e portanto:
(si m) > (50 m) > 0 fi (si ) > fi (50)

Se:

1. ui (50, si ) = 1 como ou ui (si , si ) = 1 ou ui (si , si ) = 0 temos que ui (50, si ) >


ui (si , si )

2. ui (50, si ) = 0 ento sj s i tal que fi (50) > fj (sj ) disso e do fato que
fi (si ) > fi (50) temos que ui (si , si ) = 0 pois fi (si ) > fj (sj )

3. Seja sj > si = 50 para sj si como 50 > m segue que:


sj m > 50 m fj (sj ) > fi (50) ui (50, si ) = 1
em particular se sj = si = 50, como (si m) > (50 m)
temos que fi (si ) > fj (sj ) = fi (50) ui (50, si ) = 1 > ui (si , si )=0 .

De 1 e 2 temos que ui (50, si ) > ui (si , si )


De 3 temos que existe pelo menos um si tal que ui (50, si ) > ui (si , si ).
Por 1,2 e 3 mostramos que as estratgias si > 50 so fracamente dominadas pela
estratgia si = 50. 

Se conhecemos os demais jogadores e sabemos que estes tambm pensam racio-


nalmente, ao colocar-se no lugar deles chegaremos a concluso que nenhum escolher
um nmero superior a 50, por ser uma estratgia fracamente dominada. fcil cons-
tar que o novo valor mximo de m, supondo a excluso da estratgia fracamente
dominada por todos os jogadores, ser 25.
Fazendo uma nova iterao, isto , analisando de forma anloga como feito ante-
riormente, substituindo o valor mximo de m de 50 por 25, surgiro novas estratgias
3.2 Soluo de um jogo 60

fracamente dominadas.
A prxima tabela mostra delees iterativas, deletamos estratgias dominadas,
refazemos a anlise e deletamos novas estratgias dominadas que aparecem aps a
deleo das estratgias dominadas da primeira anlise. A deleo iterativa nos leva
a concluir que a melhor escolha seria o nmero 1, tendo como hiptese que todos os
jogadores so racionais e utilizam estratgias racionais.

Raciocnios Motivao Excluo


1 Eliminar estratgias fracamente dominadas >50
2 Colocar-se no lugar do outro, supondo que este utiliza 1 >25
3 Colocar-se no lugar do outro, supondo que este utiliza 2 >12
4 Colocar-se no lugar do outro, supondo que este utiliza 3 >6
5 Colocar-se no lugar do outro, supondo que este utiliza 4 >3
6 Colocar-se no lugar do outro, supondo que este utiliza 5 >1

Tabela 3.9: Deleo Iterativa de Estratgias Dominadas

Percebemos pela tabela 3.9 que a deleo iterativa mostra que a melhor escolha
seria 1, mais resultados obtidos em experimentos em sala de aula mostram que 1
acaba no sendo o melhor resultado pois no todos os jogadores reais agem estrate-
gicamente e mais uma vez escolhas racionais por pessoas racionais podem no levar
aos melhores resultados.

Obviamente que para o jogo transcorrer como na tabela 3.9 necessrio que
algumas coisas aconteam:

Dado um jogador i, no passo 1 da tabela, i deve ser racional15 e portanto, no


escolher uma estratgia fracamente dominada.

No passo 2, i deve saber que os demais jogadores so racionais e por isso


tambm no utilizaram uma estratgia fracamente dominada.

Para o passo 3, deve ser do conhecimento de i que os demais jogadores sabem


que os jogadores envolvidos so racionais, por isso alm de no utilizarem uma
estratgia fracamente dominada, sabem que os outros tambm no utilizaro.
15
Entendemos como jogador racional, aquele que est tentando maximizar seus ganhos e que tomar as
melhores atitudes para isto.
3.2 Soluo de um jogo 61

Todos os jogadores devem ter conhecimento que todos os jogadores so racio-


nais;

Para a completa iterao necessrio o conhecimento comum sobre a raci-


onalidade dos envolvidos.

Um experimento semelhante foi feito pela Universidade de Yale durante alguns


anos, l ganhava aquele que escolhesse o nmero que ficasse mais prximo de 2/3
da mdia, as mdias dos nmeros escolhidos foram:

Ano de 2003: Mdia de 18,4.

Ano de 2004: Mdia de 21,5.

Ano de 2005: Mdia de 23.

Ano de 2006: Mdia de 13.

A Deleo Iterativa e o Teorema do Eleitor Mediano

Um processo eleitoral pode ser visto como um jogo estratgico, em que os can-
didatos fazem promessas para conquistar eleitores.
Em 1957, o economista Anthony Downs, autor do clssico Uma teoria econ-
mica da democracia, concretizou o teorema do eleitor mediano, segundo o qual
num eleitorado distribudo de forma normal por um conjunto de preferncias (nessa
distribuio, o grosso do eleitorado ficaria no centro) e numa eleio majoritria,
espera-se que vena aquele que conquistar o eleitor mediano. O eleitor mediano,
nessa distribuio, tem metade dos eleitores a sua esquerda e a outra metade a sua
direita.
De forma simplria podemos entender que os eleitores so colocados em uma fila
imaginria de acordo com o maior ou menor interesse desse eleitor em determinada
proposta do candidato. Digamos que a proposta seja, por exemplo, a mudana da
maioridade penal 16
, ento o primeiro da fila seria o candidato que mais apoiasse
essa ideia, em segundo na fila ficaria o segundo eleitor que mais apoiasse a ideia,
16
Obviamente em uma eleio so muitas propostas e a mesma anlise deve ser feita para cada proposta.
3.2 Soluo de um jogo 62

assim por diante, at que o ltimo da fila seria o eleitor que fosse mais contra a
mudana da maioridade penal.
O Teorema diz que cada candidato deve sempre se aproximar, com suas propos-
tas, ao eleitor colocado mais ao centro da fila,aproximando-se mais de um maior
nmero de eleitores, e afastando-se da posio que deixaria mais insatisfeito aqueles
eleitores mais radicais, isto , que se encontrem nos extremos da fila. Uma promessa
muito radical pode perder completamente os votos dos eleitores que se encontram
na outra ponta da fila.

Jogo 3.2. : Jogo da Poltica

Dois candidatos disputam uma eleio e consequentemente os votos do eleito-


rado. Para isso, precisa tomar sua posio poltica. Sabe-se que h dez posies
polticas, da extrema esquerda extrema direita e supem-se que o eleitorado dividi-
se equitativamente entre as dez posies.

O conjunto de posies polticas da esquerda para a direita so: P1 , P2 , P3 , P4 ,


P5 , P6 , P7 , P8 , P9 e P10 . Cada posio tem 10% do eleitorado, alm disso o eleitor
vota no candidato que est mais prximo de sua posio poltica. Em caso de dois
polticos estarem a mesma distncia de um grupo de eleitorado, este grupo se divi-
dir igualmente entre os candidatos.

A recompensa de um poltico so seus votos obtidos, que aqui estamos represen-


tando percentualmente em relao ao total de eleitores.

Exemplo 3.10.

O candidato 1 se posiciona em P1 e o candidato 2 se posiciona em P3, ento:

Os eleitores de P1 votam em massa no candidato 1 que recebe 10% do total.

Os eleitores de P2 esto a mesma distncia de P1 e de P3, por isso se divi-


dem igualmente entre os dois candidatos, isto , O candidato 1 recebe 5% e o
candidato 2 recebe 5%.
3.2 Soluo de um jogo 63

Os eleitores de P3 a P10 esto mais prximos de P3 e todos esses votam no


candidato 2 que recebem 70% dos votos.

Neste caso o candidato 1 recebe 15% e o candidato 2 recebe 85% dos votos.

A prxima tabela trs a porcentagem dos votos do candidato 1 em funo das


posies escolhidas pelos candidatos 1 e 2. Assume-se que o eleitorado necessari-
amente os eleitores votem em algum dos candidatos (no h brancos e nulos)logo
a recompensa do candidato 2 pode ser facilmente obtida fazendo 100% menos a
recompensa do candidato 1.

Candidato 2
P1 P2 P3 P4 P5 P6 P7 P8 P9 P10
P1 50% 10% 15% 20% 25% 30% 35% 40% 45% 50%
P2 90% 50% 20% 25% 30% 35% 40% 45% 50% 55%
P3 85% 80% 50% 30% 35% 40% 45% 50% 55% 60%
P4 80% 75% 70% 50% 40% 45% 50% 55% 60% 65%
P5 75% 70% 65% 60% 50% 50% 55% 60% 65% 70%
Candidato 1
P6 70% 65% 60% 55% 50% 50% 60% 65% 70% 75%
P7 65% 60% 55% 50% 45% 40% 50% 70% 75% 80%
P8 60% 55% 50% 45% 40% 35% 30% 50% 80% 85%
P9 55% 50% 45% 40% 35% 30% 25% 20% 50% 90%
P10 50% 45% 40% 35% 30% 25% 20% 15% 10% 50%

Tabela 3.10: Tabela da Recompensa do Candidato 1

Observe que para C1 (chamaremos o candidato 1 de C1 e candidato 2 de C2 ) a es-


colha P1 estritamente dominada pela escolha de P2 pois uC1 (P2 , Pi ) > uC1 (P1 , Pi ), i
{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}. Do mesmo modo a estratgia P10 estritamente dominada
pela estratgia P9 . O raciocnio estratgico faz com que C1 no adote as estratgias
P1 e P10 por serem estritamente dominadas.
O mesmo raciocnio pode ser feito para C2 e quando C1 , coloca-se no lugar de C2
e elimina tambm a possibilidade de C2 utilizar suas estratgias estritamente domi-
nadas. Com isso construmos uma nova tabela ignorando as estratgias estritamente
dominadas de C1 e C2 .
A tabela 3.11 mostra que uma vez excludos as estratgias P1 e P10 , as estratgias
P2 e P9 passam a ser estritamente dominadas respectivamente pelas estratgias P3
3.2 Soluo de um jogo 64

Candidato 2
P2 P3 P4 P5 P6 P7 P8 P9
P2 50% 20% 25% 30% 35% 40% 45% 50%
P3 80% 50% 30% 35% 40% 45% 50% 55%
P4 75% 70% 50% 40% 45% 50% 55% 60%
P5 70% 65% 60% 50% 50% 55% 60% 65%
Candidato 1
P6 65% 60% 55% 50% 50% 60% 65% 70%
P7 60% 55% 50% 45% 40% 50% 70% 75%
P8 55% 50% 45% 40% 35% 30% 50% 80%
P9 50% 45% 40% 35% 30% 25% 20% 50%

Tabela 3.11: Tabela de Recompensa de C1 , excluidos P1 e P10 de C1 e de C2

e P8 .
Observe que P2 estritamente dominada por P3 apenas depois de ter sido elimado
a estratgia P1 pois uC1 (P3 , P1 ) < uC1 (P2 , P1 ). Assim usando a deleo iterativa
de estratgias estritamente dominadas podemos deletar novas estratgias que so
dominadas apenas depois de eliminarmos a possibilidade da utilizao das estratgias
estritamente dominadas inicialmente.
Aps uma iterao chegamos a tabela 3.12, continuando o raciocnio a segunda
iterao nos levar a tabela 3.13 e finalmente, depois da terceira iterao, apresen-
tamos a matriz de recompensas dos candidatos na tabela 3.14.
Na tabela 3.14 os Canditatos C1 e de C2 concentram-se prximo aos eleitores P5
e P6 , a j no h mais uma estratgia dominante, este modelo onde os candidatos se
aglomeram no centro chamado na Cincia Poltica de Teorema do Eleitor Mediano.
17

17
Desenvolvido inicialmente por Bowen (1943), Black (1948), Donws (1957), entre outros, o Modelo do
Eleitor Mediano diz que em um sistema eleitoral majoritrio, os eleitores escolhero o candidato cuja cesta
ofertada de bens e servios pblicos mais se aproxime da cesta demandada pelo eleitor mediano. Podemos
imaginar todos os eleitores disponveis em um local colocados em uma fila de acordo com o maior ou
menor interesse desse eleitor em determinada proposta do candidato. O primeiro da fila seria o eleitor
mais satisfeito com essa proposta, at que no ltimo lugar dessa fila ficaria o eleitor mais radicalmente
contra. Cada candidato deve sempre se aproximar, com suas promessas de campanha, ao eleitor colocado
mais ao meio da fila, pois assim poder se aproximar mais de um maior nmero de eleitores, deixando de
de estar muito distante dos eleitores muito contrrios a determinada proposta. Esse modelo bastante
razovel, e muito utilizado em economia.
3.2 Soluo de um jogo 65

Candidato 2
P3 P4 P5 P6 P7 P8
P3 50% 30% 35% 40% 45% 50%
P4 70% 50% 40% 45% 50% 55%
P5 65% 60% 50% 50% 55% 60%
Candidato 1
P6 60% 55% 50% 50% 60% 65%
P7 55% 50% 45% 40% 50% 70%
P8 50% 45% 40% 35% 30% 50%

Tabela 3.12: Tabela da Recompensa do Candidato 1

Candidato 2
P4 P5 P6 P7
P4 50% 40% 45% 50%
P5 60% 50% 50% 55%
Candidato 1
P6 55% 50% 50% 60%
P7 50% 45% 40% 50%

Tabela 3.13: Tabela da Recompensa do Candidato 1

Candidato 2
P5 P6
P5 (50%,50%) (50%,50%)
Candidato 1
P6 (50%,50%) (50%,50%)

Tabela 3.14: Matriz de Recompensa dos Candidato C1 e C2


3.2 Soluo de um jogo 66

Dizemos que um jogo solucionvel por dominncia quando aps a elimi-


nao iterativa de estratgias estritamente dominadas restar apenas uma estratgia
para cada jogador.
Dominncia estrita iterada nada mais do que um processo onde se eliminam as
estratgias que so estritamente dominadas.

Exemplo 3.11. Paradoxo do Presidente [7]


Considere-se um comit de trs pessoas, Diretor 1, Diretor 2 e Presidente, cuja
tarefa escolher uma forma alternativa do conjunto de escolha {, , }, por meio
de votao. A alternativa ser escolhida com base na maioria. Em caso de empate
ento o presidente do comit vai decidir unilateralmente sobre o resultado da eleio,
segundo suas preferncias. Este no um jogo simtrico, verifica-se que a posio
do jogador 3 estrategicamente superior ao resto dos jogadores.
O quadro abaixo representa a preferncia dos eleitores:

Preferncias Diretor 1 Diretor 2 Presidente

1a Opo
2a Opo
3a Opo

Tabela 3.15: Quadro de preferncia dos eleitores.

Obviamente se todos os eleitores votassem em sua primeira preferncia haveria


um empate e a deciso passaria para o presidente que supondo-o racional escolheria
. Vamos agora modelar este jogo com a forma estratgica, para isso vamos colocar
que a recompensa para cada jogador ser 2, 1 ou 0 segundo suas preferncias, isto
, esses valores sero a utilidade para cada jogador de cada possvel resultado.

Diretor 2

( 2,0,1 ) ( 0,1,2 ) ( 0,1,2 )
Diretor 1 ( 0,1,2 ) ( 1,2,0 ) ( 0,1,2 )
( 0,1,2 ) ( 0,1,2 ) ( 0,1,2 )

Tabela 3.16: Matriz de Recompensas caso o presidente vote

Como exemplo, em (0,1,2) temos que a recompensa do diretor 1 0, do diretor


2 1 e do presidente 2, que como se o que acontece quando as escolhas so
3.2 Soluo de um jogo 67

Diretor 2

( 2,0,1 ) ( 2,0,1 ) ( 2,0,1 )
Diretor 1 ( 2,0,1 ) ( 1,2,0 ) ( 0,1,2 )
( 2,0,1 ) ( 0,1,2 ) ( 0,1,2 )

Tabela 3.17: Matriz de Recompensas caso o presidente vote

Diretor 2

( 2,0,1 ) ( 1,2,0 ) ( 0,1,2 )
Diretor 1 ( 1,2,0 ) ( 1,2,0 ) ( 1,2,0 )
( 2,0,1 ) ( 1,2,0 ) ( 0,1,2 )

Tabela 3.18: Matriz de Recompensas caso o presidente vote

respectivamente, , e .
Aplicando a deleo iterativa de estratgias dominadas (neste caso, fracamente
dominadas) neste jogo, teremos:

1. Eliminar para o diretor 1;

2. Eliminar e para o diretor 2;

3. Eliminar e para o presidente;

4. Eliminar para o diretor 1.

Estas aes levam ao resultado ( , , ) o que significa que o vencedor da


eleio . Este resultado contrasta com o resultado, no caso de votao sincera.
Com voto estratgico, observa-se que o pior resultado eleito para presidente que
supostamente um jogador mais poderoso do que os outros; por isso que o presente
jogo s vezes chamado paradoxo do presidente.

Definimos a eliminao iterada de aes fracamente dominadas de forma anloga


a dominncia estrita iterada. Mas este um conceito um pouco mais problemtico
do que aes o primeiro, a soluo pode depender da ordem em que as estratgias
so eliminados, isto no acontece com as solues com a eliminao de estratgias
estritamente dominadas. Veja o exemplo:
3.2 Soluo de um jogo 68

P2
E C D
S ( 1,3 ) ( 0,4 ) ( 4,4 )
P1
I ( 0,2 ) ( 1,1 ) ( 4,2 )

Tabela 3.19: Matriz de Recompensas - Soluo conforme ordem de iterao

ORDEM 1:

1. P2 elimina E por ser fracamente dominada;

2. P1 ento elimina S;

3. P2 elimina C soluo (I,D).

ORDEM 2:

1. P2 elimina C por ser fracamente dominada;

2. P1 ento elimina I;

3. P2 elimina E soluo (S,D).

Portanto a ordem de eliminao importa em caso de eliminao de estratgias


fracamente dominadas.

3.2.3 Equilbrio de Nash

Como vimos em exemplos anteriores nem todos os jogos apresentam estratgias


dominadas tornando isto uma limitao para o mtodo da eliminao iterativa de
estratgias dominadas.
H jogos onde nenhum jogador tem todas as estratgias dominadas levando
previso imprecisa de que qualquer coisa pode acontecer.
Observe o jogo abaixo onde duas pessoas esto escolhendo o local para uma
atividade.

J2
Local 1 Local 2
Local 1 ( 4, 1 ) ( 1, 2 )
J1
Local 2 (0, 4) ( 3, 3 )

Tabela 3.20: Matriz de Recompensas Escolha do Local


3.2 Soluo de um jogo 69

No h uma soluo por dominncia no entanto, existe uma soluo de evidente


para este jogo, ou seja, (Local 2, Local 2), que maximiza o resultado de ambos os
jogadores, fixado a escolha do outro. possvel definir uma soluo em termos
de algo que no seja a (iterada) eliminao de estratgias dominadas que, tanto
identifica essas solues bvias e mantm muitos dos resultados obtidos atravs de
tcnicas de dominao, tal soluo pode ser fornecido pela definio de um equilbrio
de Nash.
Observe que se ambos jogadores estiverem com a estratgia Local 2, no h
porque um deles mudar de estratgia sozinho.
Uma soluo estratgica ou equilbrio de Nash de um jogo um ponto onde
cada jogador no tem incentivo de mudar sua estratgia se os demais jogadores no
o fizerem.
Equilbrio de Nash um perfil de estratgia (um conjunto de estratgias, uma
para cada jogador) de tal forma que cada estratgia uma melhor resposta (maxi-
miza a recompensa) para todas as outras estratgias.
A tomada de deciso resume-se a resolver o problema de maximizar a recom-
pensa, o que torna uma situao de um jogo estratgico, no entanto, o fato de que
o que melhor para uma pessoa, em geral, depende de aes de outros indivduos.
O problema de deciso de um indivduo deve ser formulada considerando como as
escolhas de outros indivduos afetam o retorno deste, ou seja, achar para cada joga-
dor i, maxsi Si ui (si , si ). A principal dificuldade com este problema o fato de que
o indivduo no conhecer as escolhas dos outros jogadores. Portanto, determinar a
melhor ao para um indivduo requer uma anlise conjunta de todos os indivduos
envolvidos.
H situaes em que este problema pode ser contornado, e, portanto, podemos
analisar o problema, apenas considerando-o do ponto de vista de um nico indivduo.
o caso onde, independente das aes dos outros jogadores, o indivduo em ques-
to tem uma ao ideal, ento a racionalidade requer tomar essa ao, e, portanto,
podemos analisar de forma isolada da deciso de outras pessoas. Se cada indivduo
est em uma situao semelhante isso leva ao equilbrio de estratgia (fracamente
ou estritamente) dominante. Lembre-se que, as nicas premissas que usamos para
atingir o equilbrio de estratgia dominante a racionalidade dos jogadores que
requer o conhecimento da funo prpria recompensa. Infelizmente, muitos jogos
3.2 Soluo de um jogo 70

interessantes no tm um equilbrio de estratgia dominante e isso nos obriga a


aumentar as exigncias de racionalidade para os indivduos. O segundo conceito
soluo a eliminao iterada de estratgias dominadas. necessrio no s a raci-
onalidade de cada indivduo e os conhecimentos de funes prprias de recompensa,
mas tambm o conhecimento (comum) de racionalidade e de recompensa funes
de outros jogadores. No entanto, neste caso, nos deparamos com outros problemas:
pode diferentes resultados podem surgir como resultado dependendo da ordem de
eliminao(no caso de estratgias fracamente dominadas) ou h casos onde no h
estratgias dominadas.
O conceito de equilbrio de Nash o conceito de equilbrio mais comumente usado,
supera alguns dos problemas dos conceitos de soluo introduzidas antes. A presena
de interao entre os jogadores requer que cada indivduo forme uma crena sobre as
possveis aes de outros indivduos. Equilbrio de Nash baseada nas premissas de
que: cada indivduo age racionalmente dadas suas crenas sobre as aes dos outros
jogadores, e que essas crenas so corretas. o segundo elemento que torna este um
conceito de equilbrio. Neste sentido podemos considerar o resultado de equilbrio
de Nash como um estado constante de uma interao estratgica. Uma vez que cada
indivduo est agindo de acordo com o equilbrio de Nash, ningum tem incentivo
para desviar-se de forma unilateral e tomar outra ao. Mais formalmente, temos a
seguinte definio:

Definio 3.16. Um perfil de estratgia (s1 , s2 , ..., si , ..., sn ) de um jogo J um


Equilbrio de Nash se para cada jogador i:

ui (si , si ) > ui (si , si ) para todo si Si .

O conjunto de todos os equilbrios de Nash do jogo J representado por N(J).


O Equilbrio de Nash auto-impositivo: nenhum jogador tem um incentivo para
desviar unilateralmente.

Definio 3.17. Seja x X e f (x) uma funo definida para qualquer x X.


O conjunto dos argumentos x que maximizam a funo f (x) representado por
argmax e definido pela seguinte equivalncia :

x arg maxxX f (x) f (x ) = maxxX f (x).


3.2 Soluo de um jogo 71

Em um jogo de dois jogadores, por exemplo, um perfil de estratgia (s1 , s2 ) um


equilbrio de Nash se as duas condies seguintes so asseguradas:

s1 arg maxs1 S1 u1 (s1 , s2 )


s2 arg maxs2 S2 u2 (s1 , s2 )

Portanto, podemos dizer que, em um equilbrio de Nash, a escolha de cada es-


tratgia de um jogador a melhor resposta para as aes realmente tomadas por
seus oponentes. Isto sugere, e s vezes mais til, a definio de equilbrio de Nash,
baseado na noo de melhor resposta.

Definio 3.18. A melhor resposta do jogador i em um jogo de forma estratgica


pela correspondncia18
Bi : Si Si dada por:

Bi (si ) = {si Si : ui (si , s i) ui (si , s i) si Si }

Na matriz de resultado3.19 podemos destacar os seguintes melhores resultados:

BP1 (E) = {S}, BP1 (C) = {I}, BP1 (D) = {S, I}


BP2 (S) = {C, D}, BP2 (I) = {E, D}

No caso de um jogo com dois jogadores com estratgias mistas: 19

Definio 3.19. Uma estratgia para o jogador 1, 1 , a melhor resposta para


alguma fixada estratgia do jogador 2, 2 , se:

1 arg max1 1 u1 (1 , 2 ).

Similarmente 2 a melhor resposta para 1 se:

2 arg max2 2 u1 (1 , 2 ).

No caso em que as estratgias de cada jogador so mistas podemos redefinir o


equilbrio de Nash como:
18
Uma correspondncia f do conjunto A no conjunto B associa cada x A a um subconjunto de B e
neste caso escrevemos f : A B, em particular caso a correspondncia seja um conjunto unitrio ela pode
ser representada por uma funo.
19
Ou puras, uma vez que toda estratgia pura tambm uma estratgia mista.
3.2 Soluo de um jogo 72

Definio 3.20. Equilbrio de Nash um perfil de estratgia (uma conjunto de


estratgias, uma para cada jogador) onde cada estratgia do jogador i tem a maior
recompensa em relao a todas as outras estratgias do jogador i. Considere o perfil
de estratgia = (1 , 2 , ..., i , ..., n ) onde i i para todo jogador i. O perfil
um Equilbrio de Nash se e somente se:

ui (i , i) ui (si , i) para todo si Si de cada jogador i.

Segue que i a melhor resposta para i .

Podemos ainda definir equilbrio de Nash para n jogadores utilizando as melhores


respostas dos jogadores:

Definio 3.21. O perfil de estratgias mistas = (1 , 2 , ..., n ) um equilbrio


de Nash para um jogo de n jogadores se:

i arg maxi i ui (i , i

), i {1, 2, ..., n}

Vamos definir para dois jogadores com estratgias mistas:

Definio 3.22. Um equilbrio de Nash para dois jogadores um par de estratgias


(1 , 2 ) tal que:

u1 (1 , 2 ) u1 (1 , 2 ) 1 1
e
u2 (1 , 2 ) u2 (1 , 2 ) 2 2

Em outras palavras, dada a estratgia adotada pelo outro jogador, nenhum jo-
gador poderia fazer estritamente melhor (ou seja, aumentar a sua recompensa) ao
adotar outra estratgia.
Podemos encontrar o equilbrio de Nash mais facilmente para um jogo de dois
jogadores atravs as melhores respostas, focalizando nas estratgias em vez de nas
recompensas:

Definio 3.23. Um par de estratgias (1 , 2 ) um equilbrio de Nash se:

1 arg max1 1 u1(1 , 2 )


e
2 arg max2 2 u1 (1 , 2 ).
3.2 Soluo de um jogo 73

Para encontrar equilbrio de Nash usando esta definio encontramos, para cada
jogador, o conjunto de melhores respostas para todas as estratgias possveis do outro
jogador. Em seguida, procurar pares de estratgias que so melhores respostas para
ambos.
Existem jogos que no possuem equilbrios de Nash em estratgias puras no
entanto podemos encontrar um equilbrio de Nash para estratgias mistas.

Exemplo 3.12. O jogo de combinar moedas (matching pennies)20


Nesse jogo, dois jogadores exibem, ao mesmo tempo, a moeda que cada um esconde
em sua mo. Se ambas as moedas apresentam cara ou coroa, o primeiro jogador
recebe fica com as duas moedas. Se uma das moedas apresenta cara, enquanto a
outra apresenta coroa, o segundo jogador fica com as duas moedas (ou ganha a
moeda do jogador 1, e continua com a sua). Considerando a recompensa +1 quando
ganha e -1 quando perde a moeda temos:

Jogador2
Cara Coroa
Cara (+1, 1) (1, +1)
Jogador1
Coroa (1, +1) (+1, 1)

Tabela 3.21: Matriz de Recompensas do Matching Pennies

Podemos facilmente verificar que no existe par estratgia pura que um equil-
brio de Nash:

(Cara,Cara) no um equilbrio porque o Jogador 2 teria um incentivo para


mudar para Coroa (seu ganho mudaria de -1 para +1);

(Cara,Coroa) tambm no um incentivo pois para o jogador 1 seria melhor


mudar para Coroa;

(Coroa,Coroa) igualmente no um equilbrio pois nesse caso o jogador 2 teria


como preferncia mudar para Cara;

(Coroa,Cara) desta vez o Jogador 1 que deve mudar para Cara.

Vamos considerar as estratgias mistas 1 = (p, 1 p) para o jogador 1 e 2 =


20
Esse exemplo citado em vrias das bibliografias consultadas, em especial a anlise feita semelhante
a de [2].
3.2 Soluo de um jogo 74

(q, 1 q) para o jogador 2, isto , o Jogador 1 tira Cara, com probabilidade p e


jogador 2 tira Coroa, com probabilidade q. Segue disso que:
u1 (1 , 2 ) = pq p(1 q) (1 p)q + (1 p)(1 q) = 1 2q + 2p(2q 1)

u2 (1 , 2 ) = pq + p(1 q) + (1 p)q (1 p)(1 q) = 1 + 2p + 2q(1 2q)

Neste caso, analisando u1 (1 , 2 ), se q < 1


2
como p 0 a funo maximizada
com p = 0, isto 1 = (0, 1) (tirar Coroa). Por outro lado se q > 1
2
ento p = 1
maximiza u1 , logo 1 = (1, 0) (tirar cara). No caso em que q = 1
2
temos que a
recompensa do jogador 1 ser a mesma para qualquer valor de p, pela definio
qualquer valor ser ento a melhor resposta.
Quanto a u2 (1 , 2 ), se p < 1
2
a melhor resposta para o jogador 2 q = 1,
2 = (1, 0) (tirar Cara). Para p > 1
2
a melhor resposta para o jogador 2 q = 0,
2 = (0, 1) (tirar Coroa). Finalmente caso p = 1
2
qualquer estratgia mista(ou pura)
ser melhor resposta.
Logo o par de estratgia 1 = ( 21 , 21 ) e 2 = ( 21 , 21 ) soluo, isto , (1 , 2 )
equilbrio de Nash.
Neste caso a expectativa de utilidade para cada jogador :

u1 (1 , 2 ) = u2 (1 , 2 ) = 0

Iremos estudar como encontra o Equilbrio de Nash para jogos com dois jogadores
fazendo uso dos dois prximos teoremas, o primeiro deles especialmente utilizado
para encontrar equilbrio de Nash de estratgias puras.

Teorema 3.1. 21
Suponha que exista um par de estratgias puras (s1 , s2 ) tal que:
u1 (s1 , s2 ) u1 (s1 , s2 ) s1 S1
e
u1 (s1 , s2 ) u1 (s1 , s2 ) s2 S2

Ento (s1 , s2 ) equilbrio de Nash.


21
Observe que a definio de equilbrio de Nash foi feita para estratgia mista, a demonstrao est em
[2]pg. 73
3.2 Soluo de um jogo 75

Caa ao Veado (CV)

Exemplo 3.13. Dois caadores famintos foram para a floresta com o objetivo de
pegar um veado, ou, pelo menos, uma lebre. Eles podem pegar um veado somente
se ambos permanecerem alertas e dedicarem seus tempos e energias para captur-lo.
Pegar uma lebre menos exigente e no requer a cooperao do outro caador. Cada
caador prefere dividir um veado do que ter uma lebre. V denota a ao de ir atrs
do veado, e L a ao de pegar uma lebre, podemos representar este jogo pela matriz
de recompensas da tabela 3.22.

Caador 2
V L
V (+2, +2) (0, +1)
Caador 1
L (+1, 0) (+1, +1)

Tabela 3.22: Matriz de Recompensas do Caadores

Uma recompensa de um jogador, correspondente a uma estratgia pura, que


melhor resposta para uma das estratgias puras do adversrio colocadas em negrito.
Um par de recompensas, uma de cada jogador, onde ambas recompensas esto em
negrito significa que o par de estratgias que geram estas recompensas o equilbrio
de Nash pois uma estratgia melhor resposta para a outra. Neste caso os pares
(V,V) e (L,L) so equilbrio de Nash. N(CV ) = {(V, V ), (L, L)}.
Pmi j j
Definio 3.24. O suporte de uma estratgia i = j=1 p(si )si o conjunto
Si (i ) Si de todas as estratgias puras sji de i tal que p(sji ) > 0.

Exemplo 3.14. Dado o conjunto de estratgias puras S1 = {E, C, D}, e a estratgia


mista 1 = (p, 0, 1 p), onde as probabilidades so listadas na mesma ordem que
aparece no conjunto S1 e 0 < p < 1. Ento Si (i ) = {E, D}.

Teorema 3.2. Igualdade de recompensas.22

Seja (1 , 2 ) um equilbrio de Nash, S(1 ) o suporte de 1 e S(2 ) o suporte de


2 . Ento:

u1 (s1 , 2 ) = u1 (1 , 2 ), s1 S(1 )
22
Demonstrao pode ser encontrada na pgina 75 de[2]
3.2 Soluo de um jogo 76

e
u2 (1 , s2 ) = u2 (1 , 2 ), s2 S(2 )

Vamos resolver agora o Exemplo 3.12 utilizando este teorema. Suponha que o
jogador 2 joga Cara, chamaremos de K com probabilidade q e portanto Cora,
chamaremos de C com probabilidade 1 q. Se o jogador 1 est jogando uma
estratgia mista do equilbrio de Nash, S(1 ) = {K, C}, temos:
u1 (K, 2) = u1 (C, 2)
q.u1 (K, K) + (1 q).u1 (K, C) = q.u1 (C, K) + (1 q).u1 (C, C)
1
q.1 + (1 q).0 = q.0 + (1 q).1 q = 2

Neste caso 2 = ( 12 , 21 ), semelhantemente achamos 1 = ( 21 , 21 ).

3.2.4 Existncia do Equilbrio de Nash

O prximo teorema foi provado por John Forbes Nash Jr. em 1950, como parte
da tese de seu doutorado, dado sua importncia, solues de equilbrio para jogos
de interao so chamados de Equilbrio de Nash.

Teorema 3.3. Teorema de Nash: 23


Todo jogo finito, isto , com finitos jogadores
em forma estratgica e um conjunto limitado de estratgias, tem uma soluo em
estratgias mistas.

J2
E D
S (, ) (, )
J1
I (, ) (, )

Tabela 3.23: Matriz de Recompensas-Representao Normal

1. Consideramos primeiro os casos em que h equilbrio de Nash de estratgias


puras:
23
A prova geral do teorema de Nash se baseia no uso do teorema de ponto fixo (por exemplo, de Brouwer
ou de Kakutani). A grosso modo, estes teoremas de ponto fixo afirmam que para um conjunto compacto
S e um mapa f : S S que satisfazem vrias condies, o mapa tem um ponto fixo, isto , que f (p) = p
para algum p S. A prova do Teorema de Nash, em seguida mostra que a melhor resposta do mapa
satisfaz as condies necessrias para que ele tenha um ponto fixo. Uma demonstrao detalhada pode ser
encontrada em [8].
3.2 Soluo de um jogo 77

se e ento (S, E) um equilbrio de Nash de estratgias


puras;

se e ento (I, E) um equilbrio de Nash de estratgias


puras.

se e ento (S, D) um equilbrio de Nash de estratgias


puras;

se e ento (I, D) um equilbrio de Nash de estratgias


puras;

2. Quando no h equilbrio de Nash em estratgias puras usaremos o Teorema


das Igualdades de Recompensas (Teorema 3.2).

Seja N(J) = ( 1, 1), 1 = (p, 1 p) e 2 = (q, 1 q), ento:

u1 (S, 2 ) = u1 (I, 2 )

q. + (1 q). = q. + (1 q).

q= +

u2 (1 , E) = u2 (1 , D)

p. + (1 p). = p. + (1 p).

p= +

Observe que 0 < p, q < 1.


Captulo 4

Experincias de Campo

Sugesto: 1. Atividade para Introduzir a Teoria dos Jogos

Passar Vdeo disponvel em: http://m3.ime.unicamp.br/recursos/1123 Aqui voc


pode baixar o vdeo e o seu respectivo Guia do Professor com alguns aprofundamen-
tos de contedo e sugestes de atividades que podem ser utilizadas antes ou depois
a exibio do vdeo.

Contedos: TEORIA DOS JOGOS


Objetivos: Apresentar conceitos bsicos e classificao da Teoria dos Jogos

Autores
CONTEUDO: Ernesto Kemp
ROTEIRO: Marta Nehring
GUIA: Luiz Antonio Mesquiari

Revisores
CONTEUDO: Margarida Mello, Samuel Rocha de Oliveira
ROTEIRO: Frederico Gualberto de Souza, Sarah Yakhni
GUIA: Jos Plinio de Oliveira Santos
GRAFICOS: Raphael Garcia
4.1 Jogo das Notas e dois tipos de jogadores 79

4.1 Jogo das Notas e dois tipos de jogadores

Experimento 4.1. Foi apresentado a alunos do ensino fundamental, o Jogo das


notas com os Resultados de acordo a escolha feita, e foi lhes perguntado qual seria
sua estratgia e o porqu. Selecionamos dois diferentes alunos com perfis distintos:

Lorenzo - 6o ano do Ensino Fundamental: Escolho pois se meu amigo


escolher , ns dois ficamos com B+ .

Rebecca - 9o ano do Ensino Fundamental: Escolho pois terei chance


de receber um A.

Motivos diferentes levaram a escolhas diferentes, obviamente no foi pensado es-


trategicamente em como obter o resultado esperado mas, podemos perceber que os
resultados tem diferentes retornos para esses alunos.

Lorenzo tem pensamento altrusta, quer receber uma boa nota mas se preocupa
com a nota do outro jogador, ele enxerga este jogo como um jogo de cooperao.

J Rebecca se preocupou em maximizar sua nota, quer ter nota A e sabe que sua
chance de receber A passa pela estratgia de escolher .

A experincia acima mostra duas possibilidades de perfis que caracterizam dois


tipos de jogadores. Do ponto de vista de seus objetivos, o resultado do jogo pode ter
diferentes recompensas.

4.2 A Batalha de Bismarck e a tomada de deciso da rota de


ataque.

Experimento 4.2. A BATALHA DO MAR DE BISMARCK

Em dezembro 1942 o Japo decidiu transferir um substancial reforo, da China


e do Japo, para Nova Guin. O comboio japons dispunha de duas rotas para
alcanar seu destino:
4.2 A Batalha de Bismarck e a tomada de deciso da rota de ataque. 80

A rota sul, que normalmente tinha tempo bom e boa visibilidade.

A rota norte, frequentemente com tempo ruim e pssima visibilidade.

As foras aliadas tinham avies para pesquisar uma rota por vez, isto , levava um
dia inteiro de buscas em qualquer das rotas de modo que se a busca fosse mal suce-
dida os aliados perderiam um dia de ataque. Caso obtivesse sucesso no primeiro dia
de busca, os aliados conseguiriam 3 dias de bombardeiros na rota sul ou 2 dias de
bombardeiro na rota norte. Dadas estas premissas qual foi a escolha do comandante
das tropas aliadas e qual a rota escolhida pelo comboio do Japo?

A histria acima foi contada a um grupo de 6 alunos, com ajuda de mapas e


globos. Em seguida os alunos foram divididos em duas equipes que representariam
respectivamente os aliados e os japoneses.
Como objetivo principal para cada equipe foi discutido que os japoneses deveriam
evitar o maior nmero de dias de bombardeio e os aliados deveriam tentar acertar
a rota correta para ganhar um dia de ataque.
As duas equipes chegaram a mesma concluso, a que a melhor rota deveria ser
a rota norte, tanto para o Japo, quanto para os aliados.
Para os japoneses a rota norte era a melhor das escolhas caso os aliados esco-
lhessem o sul e era uma opo to boa quanto a rota sul se os aliados escolhessem
o norte. Dentre os argumentos apresentados pelos alunos que representavam os ja-
poneses, destacamos que no mximo levariam 2 dias de bombardeio. J os alunos
que representavam os aliados, argumentaram, entre outros, que se buscassem inicial-
mente pela rota Norte garantiriam pelo menos dois dias de ataques. Os argumentos
dos alunos foi muito prximo da critrio de minmax ou maxmin 1 .
Em seguida os alunos foram orientados a construrem uma tabela com as in-
formaes dos dias dos bombardeios (basicamente uma matriz de recompensas e a
partira dela foi discutido como analisar metodicamente as respostas ou solues do
problema.
1
Desenvolvido originalmente por John von Neumann, consiste no fato de cada jogador quer maximizar
seu ganho mnimo ou equivalentemente minimizar sua perda mxima esperada
4.3 Jogo da Escolha e a Deleo Iterativa de Estratgias Dominadas 81

4.3 Jogo da Escolha e a Deleo Iterativa de Estratgias Do-


minadas

Experimento 4.3. Jogo da Escolha

Solicitado a um grupo de pessoas que escolhessem um nmero entre 1 e 100,


ganharia o aluno que escolhesse o nmero mais prximo de metade da mdia. A
recompensa seria 1 para o ganhador (ou para dividir entre os ganhadores, em caso
de empate) e 0 para os demais.

Foram pesquisadas 62 pessoas e de acordo suas justificativas foram divididas em


3 grupos:

1. Grupo 1 - pessoas que fizeram escolhas aleatrias

2. Grupo 2 - pessoas que utilizaram a informao matemtica para de algum modo


fazer sua escolha

3. Grupo 3 - pessoas que utilizaram a informao matemtica e o raciocnio es-


tratgico.

As seguintes observaes foram tiradas deste experimento:

45 pessoas deram respostas aleatrias como nmero de sorte e data importante.


72,58% no utilizaram nenhuma racionalidade, a mdia entre os nmeros es-
colhidos por esse grupo foi 32,06.

12 pessoas (19,35% dos entrevistados) tentaram utilizar algum raciocnio ma-


temtico na escolha do nmero. A mdia desse grupo foi 30,37.

5 pessoas (8,06% dos entrevistados) fizeram suas escolhas baseadas em racio-


cnio estratgico. A mdia das escolhas deste grupo foi 16,4.

A mdia geral foi 30,47 e ganhador escolheu o nmero 15, que foi o mais
prximo da metade da mdia.
4.4 O Dilema do Prisioneiro 82

4.4 O Dilema do Prisioneiro

Experimento 4.4. O Dilema do Prisioneiro entre alunos do ensino fundamental.

Foi contado contado o exemplo 3.1 a um grupo de alunos e em seguida foram


separados em duplas. Depois disso as duplas foram separadas e tinham que tomar a
deciso de denunciar ou de se calar, conforme sugerido no exemplo. Abaixo alguns
resultados:

Dupla 1: Geovanna e Ithaniely.


Geovanna: - No denuncio. Somos unidas e isso seria melhor pras duas.
Ithaniely: - No denuncio. No justo a outra pagar sozinha.

Dupla 2: Caio e Denis.


Geovanna: - Confesso. melhor confessar que mentir.
Ithaniely: - Confesso. Ou estou livre ou me ferro.

Dupla 3: Julia e Thais.


Julia: - Denuncio. Tenho chance de sair livre.
Thais: - Denuncio. No quero ficar muito tempo presa.

Dupla 4: Camile e Vinicius Silva.


Camile: - Denuncio. (...risos...) Quero sair livre.
Vinicius Silva: - No denuncio. Eu pensei nos dois.

Dupla 5: Jeferson e Vinicius Darisi.


Jeferson: - No confesso. Confio no Vincius.
Vinicius Darisi: - Denuncio. sempre a melhor opo.

Depois de passado o resultado aos alunos e refeito o processo, as duplas onde um


delatou o parceiro houve mudana de comportamento, levando aos dois delatarem.
4.5 Respostas de exerccios 83

4.5 Respostas de exerccios

Exerccio 2.1: As meninas mudam seu voto no primeiro turno para futebol, desse
modo, ao preterirem sua primeira opo, garantem que ao menos sua segunda opo
vena.
Captulo 5

Consideraes finais

O conhecimento humano cresce atravs da observao do mundo e da gerao


de abstraes do mesmo, isto, geralmente, se d construindo modelos, sejam eles
modelos mentais ou definidos atravs de algum tipo de linguagem, para representar e
analisar os problemas. Naturalmente qualquer que seja a linguagem1 adotada requer
algum tipo de formalismo que seja simples e claro o suficiente para representar o
problema. Neste sentido as linguagens naturais as vezes apresentam ambiguidade
ou impreciso podem tornar as observaes inadequadas ou errneas. A construo
de modelos matemticos naturalmente tm um rigor formal maior e caracterizam-se
por uma preciso semntica.
Neste aspecto este trabalho caracterizado por uma utilizao um tanto quanto
exagerada da linguagem verbal seguida pela formulao, curta e simples, matem-
tica. A contraposio entre as duas linguagens deixa claro o poder que a segunda
tem em ser concisa e objetiva.
A teoria dos jogos a aplicao da lgica matemtica no processo de tomada de
decises nos jogos, utilizada, na economia, na poltica, na guerra e caracterizadas,
como nos jogos, por conflitos de interesse determinando a melhor estratgia para
cada jogador. O desafio tornar esta teoria uma auxiliadora no desenvolvimento do
raciocnio lgico e do pensamento estratgico para alunos da educao bsica.
Os jogos de tabuleiros, dados, cartas, os jogos de salo, entre outros, divertem a
humanidade desde a formao das primeiras civilizaes, por colocarem as pessoas
em situaes nas quais vencer ou perder, competir ou colaborar, dependem das
escolhas feitas no incio das partidas, de modo que o jogo se tornou uma ferramenta
para o desenvolvimento das pessoas. Em especial, a teoria dos jogos coloca situaes
1
Linguagem o sistema atravs do qual o homem comunica suas ideias e sentimentos, seja atravs da
fala, da escrita ou de outros signos convencionais.
85

novas, reais ou no, como jogos, despertando o interesse de um estudo sistematizado


onde coloca a matemtica como uma ferramenta de anlise das interaes humanas.A
teoria dos jogos um tema da matemtica aplicada.
Referncias Bibliogrficas

[1] FIANI, Ronaldo. Teoria dos Jogos. Com Aplicaes em Economia, Adminis-
trao e Cincias Sociais. 3 ed. Rio de Janeiro: CAMPUS 2009

[2] WEBB, James N. Game Theory. Decisions, Interaction and Evolution. New
York, USA: SPRINGER, 2007

[3] WATSON, Joel. Strategy. An Introduction to Game Theory. 3 ed. California,


USA: NORTON 2013.

[4] BARRICHELO, Fernando. A Cincia da Estratgia. Insights


da Teoria dos Jogos para Competir e Colaborar. Disponvel em:
<http://www.cienciadaestrategia.com.br/teoriadosjogos/capitulo.asp?cap=i2>
Acesso em 20 de fevereiro de 2014.

[5] RIBEIRO, Flvia D. Jogos e Modelagem na Educao Matemtica. So


Paulo: SARAIVA 2009

[6] POLAK, Ben. Curso: Teoria dos Jogos e Estrat-


gia.Vdeo aulas da Universidade de Yale. Disponvel em:
<http://http://www.veduca.com.br/play/4873> Acesso em 10 de abril
de 2014.

[7] KESEN, Levent Koc. Curso: An Introduction to Game Theory-


ECON 333.Notas de Aula. Disponvel em Levent Kokesens Web Page:
<http://home.ku.edu.tr/ lkockesen/teaching.html> Acesso em 20 de maio de
2014.

[8] FUDENBERG, D. TIROLE, J. Game Theory. The MIT Press. CAM-


BRIDGE: 2013.
REFERNCIAS BIBLIOGRFICAS 87

[9] NEUMANN, John Von. MORGENSTERN, Oskar. Theory of Games and


Economic Behavior. 3 ed. Princeton University Press, USA: PRINCETON
1953.
ndice Remissivo

ao, 13 recompensa, 15
agentes, 12 resultados, 15

Comportamento estratgico, 26 satisfeito, 32


conhecimento comum sobre a racionali- situao, 14
dade, 50
Teorema de Nash, 67
dilema dos prisioneiros, 34
utilidade, 30
equilbrio de Nash, 60
vetor de recompensa, 31
espao de estratgia, 14
estratgia, 13
estritamente dominante, 42

forma estratgica, 19, 37


forma extensiva, 19
forma normal, 19, 37
fracamente dominante, 42
funo recompensa, 30

informaes, 15

jogadores, 12
jogos, 12
estticos, 34
jogos de informao completa, 50

matriz de recompensa, 20
matriz de resultado, 20
melhor resposta, 62

perfil de estratgia pura, 14

Das könnte Ihnen auch gefallen