Teoria Dos Jogos

TEORIA DOS JOGOS E DA COOPERAO PARA FILSOFOS
SEO I

1 Unidade: Histria e Conceitos Bsicos
Antecedentes histricos, principais obras e autores
Por Antnio Rogrio da Silva

Jogos de tabuleiro, dados, cartas ou, em geral, jogos de salo
divertem a humanidade desde a formao das primeiras civilizaes.
Escavaes feitas em stios arqueolgicos localizados na regio do
Oriente Mdio conhecida como Mesopotmia encontraram em tmulos
de nobres e membros da famlia real da antiga cidade de Ur,
importante centro da civilizao sumeriana, por volta de 3000 a.C., um
jogo de tabuleiro que passou a ser conhecido como Jogo Real de Ur -
provvel antecessor dos jogos da famlia do moderno gamo. A se
acreditar nas lendas indianas, a atividade ldica, alm de entreter seus
praticantes, tambm serviria como simulao alegrica de batalhas ou
deliberaes que as pessoas tm de fazer ao longo de sua vida
cotidiana - o xadrez e o j mencionado gamo seriam exemplos disto.
Por colocar as pessoas em situaes nas quais vencer ou perder
dependem das escolhas feitas adequadamente logo no incio das partidas, os jogos se
mostraram como excelente ferramenta para o desenvolvimento da personalidade e da
inteligncia das crianas.
Entretanto, apesar desse aspecto pedaggico, os jogos raramente eram considerados
objetos de estudo srio. Foi a curiosidade do nobre Cavaleiro de Mr e inveterado jogador,
Antoine Gombaud (1607-1684), que, em 1654, incentivou o filsofo francs Blaise Pascal
(1623-1662) a iniciar correspondncia com outro brilhante matemtico francs, Pierre de
Fermat (1601-1665), no intuito de solucionar com maior rapidez o problema dos pontos, num
jogo de dados que fora interrompido, e cujo dinheiro das apostas teria de ser dividido
justamente de acordo com as probabilidades iguais de ganho de cada jogador, caso o jogo
tivesse continuado at o final. A resposta fornecida por ambos ao problema de Gombaud
revelou as regras matemticas que subjazem aos jogos de azar, desenvolvendo a teoria da
probabilidade que de um modo independente, outro genial matemtico e famoso trapaceiro,
o italiano Girolamo Cardano (1501-1576), havia iniciado antes. Contudo, a soluo
encontrada por Pascal e Fermat s foi publicada mais tarde atravs do primeiro livro
exclusivo sobre teoria da probabilidade, chamado Sobre o Raciocnio em Jogos de Azar, do
fsico e astrnomo holands Christian Huygens (1629-1695), lanado em 1657. Isso porque,
na metade do sculo XVII, mesmo a matemtica era considerada uma atividade amadora de
eruditos que no deveria ter consequncias srias para as vidas dos demais mortais.
No obstante, alm dos jogos de azar - dados e roleta -, que foram cruciais para o
desdobramento da teoria da probabilidade, jogos de estratgia, aqueles que no dependem
apenas da sorte, mas oferecem alternativas para que os jogadores possam escolher qual a
melhor linha de ao que deve adotar para atingir um resultado esperado, tendo em mente o
que a outra parte far - pquer e damas -, tambm so passveis de formalizao
matemtica por intermdio de simplificaes que permitem a simulao de cada tipo de
jogo, constitudo por regras bem definidas.
A Teoria dos Jogos trata, portanto, de sistematizar matematicamente, atravs dos
modelos de jogos, as situaes que envolvem duas ou mais pessoas, cujas decises por
uma estratgia de ao adequada influenciaro o resultado da interao e o comportamento
subsequente das partes interessadas.
Em 1730, a matemtica j havia alcanado um respeito considervel, devido ao
sucesso dos trabalhos do filsofo ingls Isaac Newton (1642-1727). Nesta poca, o suo
Daniel Bernoulli (1700-1782), membro de uma ilustre famlia de matemticos, j podia ser
visto como um solucionador de problemas profissional, contratado para ensinar sua matria
em diversas cortes europias. Em So Petersburgo, Rssia, ele pde conceber a noo de
utilidade como um valor de incremento inversamente proporcional quantidade inicial. Isto
, tendo em vista o comportamento dos jogadores, haveria uma medida subjetiva de
satisfao que explicaria a reao das pessoas em situaes de risco, nos termos de
maximizao de sua utilidade. Circunstncia que s dois sculos depois, receberia uma
formulao moderna pela mo do matemtico francs mile Borel (1871-1956), na forma do
teorema minimax. Usando a noo de estratgias mistas - que aplicam as estratgias puras
a uma taxa de variao proporcional aos ganhos -, em 1927, Borel conseguiu resolver jogos
com duas pessoas que tivessem at cinco opes de estratgias a sua escolha. Uma
soluo geral, entretanto, s viria a ser alcanada pelo matemtico hngaro John Von
Neumann (1903-1957), em 1928, consolidando as bases de uma moderna Teoria dos
Jogos, em que o conceito de utilidade fundamental.
Outro conceito chave dessa teoria comeou a ser trabalhado pelo filsofo e economista
francs Antoine Augustin Cournot (1801-1877). Em suas anlises sobre os casos de
duoplio, Cournot formalizou uma verso restrita do conceito de equilbrio que iria ser
generalizada, no sculo seguinte, por John Forbes Nash Jr. em trabalhos que tornaram a
Teoria dos Jogos pertinente a situaes em que um lado pode vencer sem precisar,
necessariamente, derrotar o adversrio. Cenrios que filsofos como o ingls Thomas
Hobbes (1588-1679), o escocs David Hume (1711-1776) e o suo Jean-Jacques
Rousseau (1712-1778) descreveram de modo intuitivo em suas respectivas obras: Leviat
(1651), Tratado da Natureza Humana (1739) e Discurso sobre a Origem e os Fundamentos
da Desigualdade entre os Homens (1755).
Hobbes descreveu, de modo bastante criativo, a soluo cooperativa a qual podem
chegar agentes racionais motivados apenas pelas satisfao imediata de seus interesses,
em conflito no estado de natureza. Dada a simetria e fragilidade de cada um dos que se
enfrentam na natureza, apenas a busca da cooperao poderia atender os anseios de todos
os envolvidos, preservando a paz necessria para realizao de seus projetos pessoais.
Contudo, de modo espontneo, ningum abriria mo de lutar pela posse de todos os meios
indispensveis para sua sobrevivncia se seus potenciais rivais no fizessem o mesmo (1).
Hume, por sua vez, imaginou a situao vivida por dois fazendeiros que vem ameaadas
as suas safras pela dificuldade de convencerem um ao outro a colaborar nas suas
respectivas colheitas, considerando que ambos so naturalmente egostas e no nutrem
simpatias mtuas (2). Enquanto Rousseau imaginou o contexto de caadores que
dependem da atuao de vrios participantes, a fim de que se obtenha caa suficiente para
todos, embora seja provvel esperar a desero daqueles que tenham a oportunidade de,
individualmente, capturar uma presa menor, mas que os satisfizesse a ponto de estimular o
abandono do grupo (3).

Inspiraes como estas no so exclusivas da literatura moderna ou contempornea,
ou de uma concepo de indivduo tpica apenas da modernidade. No tempo em que
Hammurabi (sculo XVIII a.C) reinava sobre toda Mesopotmia, a coleo de sentenas que
este rei babilnico mandou gravar em estelas de pedra negra e publicar em frente a seus
monumentos j difundia a noo de direito, fundada na reciprocidade, que ainda hoje serve
de lastro s leis contemporneas. Suas clebres sentenas "olho por olho; dente por dente"
(4) esto subjacentes s tradies judaicas, crists e todas as demais que propuseram
variaes da Regra de Ouro (fazer ao outro o que se quer que faa a si mesmo).
Sobre outro aspecto, em A Vida dos Doze Csares (c. 120), Caio Suetnio Tranquilo
(69-141) narrou uma atitude que frequentemente Caio Jlio Csar (101-44 a.C.) tomava
para evitar a desero de seus soldados. Csar, quando pressentia que uma batalha seria
difcil de prever a vitria, afugentava todos os cavalos, incluindo o seu prprio, com o
objetivo de impedir a fuga dos menos corajosos, obrigando todos a lutarem com afinco, j
que no teriam outra opo disponvel (5). Soluo semelhante a que Hernn Corts (1485-
1547) tomou quando fez destruir os barcos que poderiam servir de meio para fuga de seus
soldados, antes da iniciativa de derrubar o imprio asteca, forando os descontentes a se
unirem a ele, pois estavam em territrio hostil, sem qualquer outra sada. Assim, ocasies
com estas, onde sempre pode haver conflito de interesses entre duas ou mais partes
capazes de deliberarem sobre uma ao que implique numa reao recproca consequente,
a Teoria dos Jogos tenta encontrar uma formulao passvel de ser tratada de modo to
rigoroso quando possvel, a fim de apontar respostas factveis.
Concorrncia
At que John von Neumann e Oskar Morgenstern (1902-1977) publicassem o livro que
deu origem a esse novo ramo da matemtica, diversos economistas e matemticos, alm
dos j mencionados, contriburam com conceitos e teoremas que mais tarde foram
incorporados, como por exemplo a regra de Thomas Bayes (1702-1761) para calcular a
probabilidade de um evento ocorrer a partir de uma informao dada e o teorema de Ernst
Zermelo (1871-1953) sobre a existncia de uma estratgia vitoriosa em jogos de informao
perfeita e soma zero (em que um s ganha se outro perde). Essa distribuio inicial dos
conceitos espalhada por vrios pases e autores ao longo da histria moderna dificultou a
identificao de um marco histrico ntido para fundao da Teoria dos Jogos. Os quatro
artigos que Borel publicou no incio do sculo passado, introduzindo a noo de estratgias
mistas e soluo minimax, serviram ento para reivindicao desta prerrogativa, por parte
de autores franceses, em favor de seu ilustre compatriota (6).
No obstante, o polivalente Herbert Alexander Simon (1916-2001), por sua vez,
embora tenha preparado a verso preliminar de seu Comportamento Administrativo (1945)
antes de surgir Theory of Games and Economic Behavior (1944), abriu mo de qualquer
mrito de ter descoberto um novo conceito de jogos estratgicos, abordado em seu livro sob
a tica do homem administrativo, ao invs do homem econmico enfocado por von
Neumann e Morgenstern. Segundo Simon, o carter administrador procuraria
"'contemporizar' ao invs de 'maximizar', (...) [realizando] suas escolhas sem precisar de
examinar previamente todas as possveis alternativas de comportamento, e sem ter de
certificar-se de que essas so de fato todas as alternativas que se lhe oferecem"(7). Se a
verso do homem administrativo, lanada por Simon tivesse prevalecido, no seria
necessrio levar em conta todas as relaes dos objetos envolvidos para deliberao, como
quer a Teoria dos Jogos. Bastaria apenas o apoio regras empricas simples que no
sobrecarregassem o clculo para uma escolha razovel, ao invs de uma forte formao
matemtica que, por vezes, alvo de crtica por parte de psiclogos e antroplogos.
Para a Teoria dos Jogos que prevaleceu, entretanto, todo processo de deliberao
parte da noo de um agente cuja racionalidade instrumental mnima, tpica do homem
econmico, visa to somente maximizar os ganhos de seus esforos, encarando o mundo
real em toda sua complexidade de relacionamento. Em Theory of Games and Economic
Behavior, von Neumann e Morgenstern estabeleceram, como parmetros de sua teoria, os
jogos de duas pessoas com soma zero, em geral, cooperativos, isto , quando jogados com
mais de dois jogadores e com a permisso de transferncia de utilidade interna s coalizes
que forem constitudas. Por conta disso, produziram uma consistente axiomatizao da
teoria da utilidade que foi amplamente aplicada nos diversos domnios econmicos e fora
destes.
No entanto, por mais inspirada e detalhada que fossem a prova do teorema minimax e
a formalizao dos jogos de soma zero, a Teoria dos Jogos surgiu incompleta, ao deixar em
segundo plano os jogos de soma varivel e os no-cooperativos. Cedo, matemticos
brilhantes trabalharam para preencher as lacunas deixadas. John Nash procurou generalizar
o teorema de minimax de von Neumann para todo tipo de jogo - soma zero ou varivel, com
n-pessoas. A soluo encontrada foi batizada de "ponto de equilbrio", como se fosse um
repouso natural nas ocasies em que nenhum jogador poderia melhorar sua posio,
mudando de estratgia, sem que piorasse os resultados dos demais envolvidos. Nash
conseguiu provar que, para qualquer tipo de jogo, existe pelo menos um ponto de equilbrio
que pode ser encontrado usando estratgias mistas, como uma variao na proporo em
que so aplicadas as estratgias originais, puras. Com isso, ao lado do teorema minimax, o
equilbrio de Nash tornou-se um dos alicerces fundamentais da Teoria dos Jogos, pois
permitiu que os jogos no-cooperativos, que envolvem cooperao e competio
pudesssem ser tratados, alm dos chamados cooperativos - aqueles nos quais os jogadores
podem usar a comunicao e fazerem acordos que forcem a colaborao dos demais.
A elegncia e preciso das provas matemticas de von Neumann e Nash, apesar de
formarem uma base terica slida, levaram os pesquisadores interessados em obter contra-
exemplos que consolidassem a Teoria dos Jogos, a prepararem experimentos laboratoriais
que pudessem ou no confirmar na prtica aquelas teses duras acerca da racionalidade dos
agentes. Em janeiro de 1950, os laboratrios da corporao estadunidense Rand tinham em
seus quadros matemticos astutos do porte de Melvin Dresher e Merrill Flood que
prepararam uma experincia que se tornou histrica, a fim de verificar se pessoas de "carne
e osso" seriam capazes de encontrar as estratgias em equilbrio previstas pela teoria. Por
cem vezes, realizaram os testes com a participao do matemtico John Williams, chefe de
departamento da Rand, e do economista Armen A. Alchian, da UCLA, que interagiam entre
si. Entretanto, em vez de buscarem suas estratgias dominantes e pararem num ponto de
equilbrio, eles optaram por cooperar mais vezes, do que trair o outro. Este famoso
experimento ficou conhecido, depois, como Dilema dos Prisioneiros, graas histria
contada pelo canadense Albert William Tucker (1905-1995) - que fora orientador de Nash -
em um seminrio para psiclogos, na Universidade de Stanford (8).
Na verso de Tucker, dois suspeitos de terem cometido um crime grave so presos e
interrogados separadamente. Na tentativa de incrimin-los, o inspetor encarregado da
investigao, de modo reservado, oferece a cada um as opes de confessar o delito e
entregar o comparsa, ou ficar calado. Caso um dos suspeitos denunciasse o outro que
ficasse calado, o denunciante obteria a liberdade, por colaborar com a justia, enquanto seu
colega arcaria sozinho com a pena mxima. Se ambos permanecessem em silncio,
pegariam uma sentena mais branda pelo crime leve que os levaram priso em flagrante.

Contudo, se os dois se delatassem mutuamente seriam punidos com uma mesma
condenao: menor do que a mxima, mas maior do que a pena leve. Por conta disto, a
nica estratgia que domina todas as outras a da confisso mtua, uma vez que,
independente da reao do outro, o melhor que cada um faria por si mesmo confessar o
crime grave, ao contrrio de se expor possibilidade de ficar mais tempo na cadeia
pagando a maior pena. Tal previso, contradita pela experincia na Rand, mostrava a
existncia de algum problema na concepo de racionalidade concebida, pois, em vez de
buscar resultados mais favorveis para si, os jogadores tendiam a escolher a cooperao
para maximizar seus ganhos, sem buscar, aparentemente, o equilbrio Nash. Ao saber
disso, Nash atribuiu a falha na experincia ao fato dos jogadores interagirem em "um grande
jogo de movimentos mltiplos", lamentando a ineficincia deles em comportarem-se mais
racionalmente (9).
Por outro lado, o conceito de utilidade - que no exclusivo da Teoria dos Jogos, mas
pertence ao domnio prprio da economia - foi alvo de fortes questionamentos em dois
aspectos: primeiro, devido a suposta impossibilidade de se medir coisas incomessurveis;
depois, pela duvidosa manuteno de uma racionalidade capaz de preservar a
intransitividade e substituio das preferncias, bem como a ateno s probabilidades
objetivas em detrimento das subjetivas. O economista francs Maurice F. Charles Allais, em
seu artigo "Le Comportement de L'Homme Rationnel Devant Le Risque" (1953), atacou a
manuteno rgida do conceito de racionalidade para todo tipo de situao. Em sua
pesquisa, Allais constatou que, diante do risco e ou incerteza, os agentes racionais
assumiam uma perspectiva subjetiva da probabilidade de um evento acontecer, sem atentar
para estatsticas objetivas. Alm do mais, no preservavam a independncia de suas
escolhas, quando na substituio de alternativas irrelevantes. Fatores psicolgicos que
influenciavam decisivamente os processos deliberativos, virtualmente, impediam qualquer
tentativa de formalizao.
Em verdade, as crticas relevantes de Allais, embora fossem direcionadas noo de
utilidade adotada pela teoria econmica estadunidense, atingiram em parte a Teoria dos
Jogos, que tem elementos comuns a esta. Nesse contexto, os ataques diretos que a Teoria
dos Jogos comeava a receber, em parte, arrefecera o entusiasmo inicial da primeira
metade do sculo XX. Testes empricos mostravam que aspectos de ordem psicolgicas
impunham algumas restries e exigiam novas tcnicas de abordagem aos tericos.
Limites e Superao
Enquanto problemas prticos persistiam, outros autores ajudavam a desenvolver e
aplicar a Teoria dos Jogos em diversos setores do conhecimento. Em 1955, Richard Bevan
Braithwaite (1900-1990) lanou o primeiro livro de filosofia a tratar desta teoria, chamado
Theory os Games as a Tool the Moral Philosopher, onde props um princpio equitativo,
segundo orientao fornecida por uma "fronteira de eficincia". Outros
filsofos, como o canadense David Gauthier que desenvolveu toda uma
teoria contratualista da moral fundada na Teoria dos Jogos, em Morals
by Agreement (1986), reconheceram o novo instrumento de anlise que
lhes surgia. Martin Hollis (1938-1998), por sua vez, com o auxlio da
Teoria dos Jogos procurou atacar a noo limitada que v a razo
instrumental incompatvel com a confiana, buscando na reciprocidade
e no bem comum as bases iluministas de racionalidade e identidade
comprometidas com o relacionamento local e o universalizvel (10).

Nos anos que se seguiram II Guerra Mundial, os modelos matemticos de jogos
serviram de orientao para o desenvolvimento e teste de estratgias militares empregadas
durante a Guerra Fria.
O que fez com que Von Neumann e outros "tericos dos jogos" inspirassem o caricato
personagem principal do filme Dr. Strangelove (Dr. Fantstico, 1963), de Stanley Kubrick
(1928-1999), interpretado por Peter Sellers (1925-1980). O apelo anti-militarista da maioria
da populao mundial, naquela poca, somado aos problemas inerentes teoria emergente,
mas incompleta, lanou uma sombra sobre os propsitos nebulosos dos pesquisadores
desta rea. Apesar de sua "m-fama", diversos novos conceitos foram criados no sentido de
aproximar a teoria da realidade vivida pelas pessoas nos seus conflitos cotidianos. Estudos
de jogos repetitivos, com vrias rodadas seguidas; estocticos, cujos pagamentos sofrem
variao numa porcentagem fixa; novos modelos de jogos, como a Batalha dos Sexos; e as
representaes de jogos na forma extensiva, de rvores com ns e ramos que
esquematizam os movimentos tomados, e estratgica, com matrizes onde figuram a lista de
estratgias de cada jogador e seus resultados cruzados em clulas individuais, so alguns
exemplos dos muitos aspectos desenvolvidos depois de 1950.
Em 1960, Thomas C. Schelling descreveu os efeitos da comunicao implcita e do
chamado ponto focal para deliberao em jogos de motivao mista, intermedirios
competio irrestrita e pura colaborao. Mais uma vez, destacou-se os aspectos
psicolgicos e culturais que no eram passveis de uma abordagem meramente matemtica.
Ao longos dessa dcada, outros dois autores - que, em 1994, dividiriam o prmio Nobel de
economia com John Nash -, Reinhard Selten e John C. Harsanyi (1920-2000), propuseram,
respectivamente, o conceito de perfeito equilbrio de subjogo como refinamento do equilbrio
de Nash e uma distino precisa dos compromissos, onde eles so obrigatrios e quando
no so plenamente factveis; bem como a teoria dos jogos de informao incompleta, para
jogadores que tm de se valer da probabilidade, a fim de encontrarem uma soluo.
Em 1972, John Maynard Smith (1920-2004), bilogo evolucionista ingls, introduz a
idia de estratgias evolutivamente estveis (EEE, ou ESS, sigla de evolutionarily stable
strategy) em uma teoria dos jogos evolucionrios que transformou a biologia em uma das
disciplinas que mais empregam a teoria dos jogos na anlise dos problemas trabalhados.
Em 1979, Daniel Kahneman - psiclogo israelense que ganhou o prmio Nobel de economia
de 2002 -, ao lado de seu colega e compatriota, Amos Tversky (1937-1996), publicou a
Teoria das Perspectivas (Prospect Theory) como uma resposta aos desafios e crticas feitos
por Allais, anos antes, sobre os aspectos psicolgicos dos conceito de utilidade e
racionalidade adotados pela Teoria dos Jogos.
Os problemas que Nash havia percebido nos jogos repetidos foram aprofundados na
teoria de Maynard Smith, cujo principal livro, Evolution and the Theory of Games, fora
lanado em 1982, e na Teoria da Cooperao de Robert Axelrod, iniciada em 1984 no seu
The Evolution of Cooperation. Da em diante, a Teoria dos Jogos deixa de ser assunto
exclusivo de economistas e matemticos, passando a ser discutida abertamente por
cientistas das mais diversas reas do conhecimento. A biologia evolutiva destacou-se, mas
tambm a psicologia, a neurologia e alguns filsofos mais avanados foram atrados pelos
jogos e sua capacidade de modelar o comportamento de agentes (racionais ou no)
envolvidos numa interao e interessados nos resultados que os favoream
preferencialmente.

Estgio Atual
Muitas correntes, alm daquelas apontadas aqui, derivaram da Teoria dos Jogos e no
exagero dizer que milhares de artigos nos mais diversos campos tm sido publicados
todos os anos. Depois que Axelrod popularizou os torneios com simulaes de estratgias
para o Dilema do Prisioneiro Iterado (DPI), uma nova abordagem completamente diferente
da tradio filosfica surgiu para avaliar a cooperao e o modo de interao entre agentes
com um grau mnimo de racionalidade. Desde ento, comeou-se analisar como a
cooperao, paradoxalmente, poderia emergir mesmo entre sujeitos egostas, interessados,
primeiro, em satisfazer seus desejos imediatos de sobreviver e reproduzir.
Qualquer que fosse o cenrio, determinista ou indeterminista, simultneo ou alternado,
se constatou que o entendimento mtuo poderia ocorrer, desde que aplicada a estratgia
adequada para cada situao. Outros modelos de jogos criados mostraram isso mais de
perto. No jogo conhecido como Ultimato, pode-se perceber com nitidez a necessidade da
atuao do comportamento equitativo para a soluo alcanada. N'outro modelo, chamado
de Bens-Pblico, o papel da punio e de um agente institucional so detectados no sentido
de fazer valer os compromissos estabelecidos. A tais atributos - equidade e funo do
Estado -, que so centrais na filosofia poltica e na tica, acrescenta-se ainda o elemento
discursivo, que em alguns jogos falados, no cooperativos, podem levar ao refinamento da
soluo, quando vrios equilbrios esto disponveis.
A simulao por meio de jogos tornou-se ainda um elemento essencial na concepo
de um programa de pesquisa, chamado Vida Artificial, que amplia as fronteiras da
Inteligncia Artificial a todo sistema de interao dos seres vivos. Do comportamento dos
vrus a grandes imprios da histria, o ciclo de "origem-escalada-apogeu-declnio"
reproduzido vrias vezes em computadores, com objetivo de desvendar o programa que
subjaz evoluo, de um modo geral. Tamanha diversidade de aplicaes impede que o
assunto tratado por este curso adote uma gama to ampla da maneira detalhada que
mereceria o fenmeno interdisciplinar da Teoria dos Jogos. Para os propsitos deste curso,
pretende-se focar a apresentao nos conceitos e princpios bsicos da Teoria dos Jogos e
da Cooperao, nos pontos de interesse direto aos filsofos prticos (tica e poltica),
destacando, na primeira seo, o papel da comunicao e, na segunda, o mtodo da
simulao e os jogos onde se emerge a equidade e o papel de instituies, como o Estado.
Notas
1. Veja HOBBES, Th. Leviat, I part., cap. XIV, pp. 78/9.
2. Veja HUME, D. Treatise of Human Nature, III, part. II, se. V, pp. 287/8.
3. Veja ROUSSEAU, J. J. Discurso sobre a Origem e os Fundamentos da Desigualdade
entre os Homens, II part., p. 261.
4. Veja BOUZON, E. O Cdigo de Hamurabi, 196 a 200, pp. 181/2.
5. Veja SUETNIO TRANQUILO, C. A Vida dos Doze Csares, p. 38.
6. Em Games and Decisions, Luce e Raiffa citam o economista Maurice Frchet como um
dos autores desta proposta. Veja LUCE, R.D. & RAIFFA, H. Games and Decisions, cap. 1, p.
2.
7. SIMON, H. A. Comportamento Administrativo, pp. XXVIII-XXIX.
8. Veja NASAR, S. Uma Mente Brilhante, cap. 12, p. 147.
9. NASAR, S. Op. cit, cap. 13, p. 149.
10. Veja HOLLIS, M. Trust within Reason.
A seguir: A Estrutura do Jogo: Conceitos e princpios
SEO I

A Estrutura do Jogo: Conceitos e princpios
A palavra "jogo", que d nome teoria, foi alvo de diversos malentendidos
desnecessrios. Muitos consideravam a Teoria dos Jogos como algo frvolo, pouco srio, ou
simplesmente no-cientfico, dada sua origem em estudos de jogos de salo, como pquer,
xadrez ou "pedra, papel e tesoura". Por ter sido gerada num ambiente predominante de
homens e antes dos movimentos sociais exigirem do mundo acadmico a colocao de
expresses "politicamente corretas", a teoria est povoada por conceitos cujos termos fazem
referncias "batalha dos sexos", "conversa barata" (cheap talk), "blefe" e "pato" (sucker),
entre outros jarges menos chocantes. Tecnicamente, no entanto, essa m impresso
desfaz-se quando se percebe que a aparente simplificao das relaes entre indivduos
fornecida pela formalizao matemtica da teoria permite analisar com uma preciso at
ento desconhecida nas cincias sociais o comportamento dos agentes "racionais",
humanos ou no.
Para a Teoria dos Jogos, um jogo definido por um conjunto de regras que estabelece
seus cinco elementos constitutivos:
1. o nmero de participantes;
2. as aes ou estratgias possveis;
3. os resultados de cada jogador;
4. a funo que permite a cada parte combinar suas estratgias e
5. a relao de preferncias de cada um diante dos resultados.
Alm disso, as regras delimitam o grau de informao permitido aos agentes. Os jogos
so representaes simplificadas de situaes onde pelo menos uma pessoa age no sentido
de maximizar a utilidade de suas aes levando em conta as reaes de outros agentes.
Trata-se, portanto, da descrio formal de uma situao interativa estratgica em que as
partes devem resolver qual a melhor deciso a ser tomada, segundo o ponto de vista de um
agente capaz de computar quais meios sero necessrios para obteno do fim esperado.
Por conseguinte, um jogador possui como requisito mnimo uma racionalidade instrumental
ou estratgica.
Jogos com apenas uma pessoa so considerados jogos contra a natureza (ou Sorte) -
nico agente considerado no-racional, mas que pode gerar indeterminao aos resultados,
que passam a ser influenciados pela lei da probabilidade. A rigor, no h empecilhos formais
para o estudo de jogos com um nmero infinito de participantes, embora seja mais frequente
a pesquisa dos casos que envolvem duas partes, cuja visualizao pode ser feita facilmente
na forma dita normal, ou estratgica, e na forma extensiva. Na sua representao normal,
ou estratgica, os jogos so apresentados em matrizes nas quais as estratgias de cada
jogador so listadas respectivamente nas linhas e colunas. Em cada clula da tabela
aparecem os ganhos que cada uma das partes obter caso realize as aes s quais ambas
esto vinculadas.
Os ganhos do jogador da linha so grafados na primeira posio, esquerda do par
ordenado, e os do jogador da coluna vm aps a vrgula que os separa, direita. A figura 1
expe a representao geral da forma estratgica:

Coluna Figura 1 -
Matriz Geral
de Estratgias
Puras
1 2 .... y
2
.... y
n

1
f(1,
1)
f(1,
2)
....
f(1,
y
2
)
....
f(1,
y
n
)
2
f(2,
1)
f(2,
2)
....
f(2,
y
2
)
....
f(2,
y
n
)
:
:
:
:
:
:

:
:

:
:
x
1

f(x
1
,
1)
f(x
1
,
2)
....
f(x
1
,
y
2
)
....
f(x
1
,
y
n
)
:
:
:
:
:
:

:
:

:
:
Linha
x
m

f(x
m
,
1)
f(x
m
,
2)
....
f(x
m
,
y
2
)
....
f(x
m
,
y
n
)
As matrizes servem para mostrar de forma compacta as respostas que podem ser
esperadas em funo das aes escolhidas simultaneamente. Aqui a ordem em que os
jogadores atuam irrelevante ao resultado. Tambm so desconsideradas a quantidade de
vezes que os jogos se repetem, sendo a matriz o resumo de todos jogos possveis em suas
rodadas infinitas, ou indeterminadas. A matriz concentra as informaes disponveis a cada
jogador por igual. Por outro lado, dificulta a incluso de um nmero muito grande de
jogadores. Acima de dois jogadores, a representao deixa de ser bidimensional e passa a
ser tridimensional, com trs participantes, ou multidimensional, para mais de quatro
jogadores.
Jogos em que os detalhes omitidos pela forma estratgica so relevantes ficam melhor
representados na descrio completa fornecida pela forma extensiva, desenhada no modelo
estrutural de "rvores". No esquema de rvores, a ordem deliberativa de cada jogador
observada, bem como o conjunto de informaes de cada um. Os pontos apresentados - ou
"ns" - so as decises disponveis e os traos - ou "ramos" - as alternativas de movimento
e as aes que levam de um n a outro, desde o ponto inicial - ou "raiz" - at o resultado
final em cada terminal. O caminho traado, da raiz "folha", delineia todas as estratgias
que podem ser realizadas. Motivo pelo qual as rvores s devem ser empregadas em jogos
finitos. A forma extensiva permite uma anlise direta da situao, j que apresenta toda
estrutura das jogadas e das informaes disponveis de uma vez. Observando os ns e
ramos da rvore, podem ser percebidos o nmero de jogadores, suas opes nos pontos de
deciso, as posies intermedirias - ou movimentos - at os ns terminais e a quantidade
de jogadas a cada passo executado (1). O conjunto de informao de cada jogador
limitado em cada rodada por uma linha que circunda os ns de deciso. Quando o jogador
tem certeza em qual n se encontra, este conjunto de informao unitrio.
Cada n e conjunto de informao rotulado com o nmero ou letra de cada jogador,
enquanto os ramos so rotulados com as alternativas de ao que partem de cada n. As
rvores so apropriadas para os jogos sequenciais, onde os agentes se movimentam numa
ordem predeterminada (figura 2).

No exemplo da figura 2, v-se a raiz, representada pelo ponto aberto "a", corresponder
ao conjunto unitrio de informao inicial do jogador I, que tem duas linhas de ao a sua
escolha, 1 ou 2. O jogador II dever na sequncia escolher tambm entre suas opes 1 ou
2. Contudo, dependendo do n em que se localize, "b" ou "c", poder levar com que a
natureza, jogador 0, venha executar o prximo movimento, caso sua alternativa 1 seja
adotada a partir do n "b". Assim, haveria a probabilidade dos resultados de "R
1
" a "R
3
",
ocorrerem nas propores que nomeiam seus respectivos ramos. De outro modo, se II
selecionasse a estratgia 2, desde o ponto de deciso "c", o jogador III entraria em cena
para optar por uma de suas trs aes que conduzem aos ganhos de "R
8
" a "R
10
". Do
contrrio, as demais alternativas retornam a I a chance de escolher entre "R
4
" e "R
5
",
decidindo a partir de "e", ou "R
6
" e "R
7
", saindo de "f". Todos os dez resultados possveis
deste exemplo distribuiriam, ao final, os pagamentos devidos aos trs jogadores envolvidos
(I, II, III), j que a natureza (0), embora possa atuar como um agente irracional gerador de
incerteza, no obtm nenhum ganho das aes empreitadas.
A definio mais geral da forma extensiva para jogos com n-pessoas foi estabelecida
por Harold W. Kuhn, em 1953, no artigo "Extensive Games and the Problem of Information",
ampliando a verso apresentada por John von Neumann, em 1928. A chamada rvore de
Kuhn atende a sete condies:
i. Um conjunto de n jogadores;
ii. Estrutura de rvore enraizada, chamada rvore do jogo;
iii. Partio do conjunto de ns em diversos subconjuntos, entre os jogadores;
iv. Distribuio de probabilidade rotulando cada ramo brotado de um n do subconjunto
da natureza, jogador 0;

v. A formao de conjunto de informaes para cada subconjunto de ns de um jogador
deve respeitar (a) o mesmo nmero de ramos correspondentes, saindo de cada n
diferente, e (b) cada caminho, partindo da raiz folha, s pode cruzar um conjunto de
informao uma nica vez;
vi. Cada folha contm, ao final, os pagamentos resultantes a cada participante do jogo;
vii. E, por fim, a descrio completa da rvore de conhecimento comum a todos
jogadores. Ou seja, cada um sabe o que os outros tambm sabem (2).
Tantos os jogos cooperativos como os no-cooperativos - duas das principais divises
dos modelos de jogos tericos que so abordadas a seguir - podem ocorrem em condies
cujas tomadas de decises dos participantes so feitas simultaneamente, em sequncia ou
a cada vez que os jogos so repetidos. Os jogos simultneos so aqueles em que as
escolhas das estratgias acontecem ao mesmo tempo, sendo de preferncia representados
por matrizes. Quando a ordem de atuao influencia o seu desenvolvimento, os jogos so
chamados sequnciais. Nos jogos sequenciais finitos, a melhor forma de representao se
d por meio do esquema de rvores. Por fim, os jogos repetidos exigem que as mesmas
opes de estratgias sejam exibidas em rodadas sucessivas, nas quais os jogadores tm
de decidir novamente se mantm suas escolhas anteriores ou trocam de alternativa. A
iterao que ocorre nos ltimos faz surgir misturas de estratgias que no poderiam levar a
uma soluo equilibrada, quando jogadas de uma nica vez, na condio pura do jogo base
apresentado na primeira rodada. Jogos repetitivos tambm so chamados de superjogos.
Nos superjogos, a memria exerce um papel crucial na construo de um equilbrio que se
torna muito difcil quando as aes dos jogadores no so plenamente recordadas ou so
perturbadas pelo acaso. Os superjogos servem de base aos modelos de simulao
utilizados em larga escala pela biologia, cincia da computao e cincias, em geral.
Informaes
De acordo a possibilidade ou no de comunicao e a quantidade de informao
acessvel, os jogos podem ser divididos em cooperativos ou no-cooperativos, de
informao completa ou incompleta, perfeita ou imperfeita. Jogos cooperativos so aqueles
em que a comunicao prvia permitida entre os jogadores, antes de decidirem a
estratgia que adotaro durante o jogo. Com isso, acordos irrevogveis e auto-motivantes
so passveis de estabelecimento. Para ser eficaz, a comunicao precisa ser livre de
distoro e sem qualquer custo para os falantes, isto , a emisso de mensagens no
implica em uma alterao direta da matriz original do jogo. Entretanto, embora a
comunicao, primeira vista, parea facilitar a realizao de contratos, tambm abre
espao para imposio de coalizes, ameaas e blefes que perturbam a produo dos
melhores resultados para uma das partes. Uma viso mais abrangente do papel da
comunicao ser discutida de perto na prxima unidade, toda dedicada a esse tema
importante para a Teoria dos Jogos.
Jogos no-cooperativos proibem que a comunicao prvia seja estabelecida, apesar
de haver situaes em que a sinalizao acontece, bem como o encontro de convenes
que ajudam a coordenar as aes dos agentes, com base no conhecimento comum
partilhado pela cultura, convvio social ou capacidade cognitiva dos jogadores. Nestas
ocasies, um efeito chamado de "telepatia" emerge como forma de comunicao implcita
entre falantes de uma mesma lngua ou habitantes de uma mesma regio ou grupo social,
dotados de mentes semelhantes e conhecimento comum.

De todo modo, sendo ou no implementada a comunicao, quando os jogadores tm
pleno conhecimento do nmero de participantes, da posio que cada um ocupa em cada
etapa do jogo e dos resultados que todos podem obter, diz-se que o jogo de informao
completa. Na falta de um desses elementos informativos, o jogo de informao incompleta
e as caractersticas sobre o tipo dos jogadores deixam de ser de conhecimento comum,
quebrando a simetria entre eles. Em jogos de informao perfeita, por meio de induo
reversa, os jogadores podem conhecer toda histria do jogo, antes mesmo de tomarem suas
decises. Todos conjuntos de informao de uma rvore de jogo de informao perfeita so
unitrios. O que vale dizer que cada parte sabe em qual n de um jogo sequencial est.
Caso contrrio, o jogo chamado de informao imperfeita. Os participantes que se
lembram, a cada rodada, de todos os lances anteriores efetuados desde o incio do jogo
possuem memria perfeita, enquanto nos jogos em que no possvel ter toda essa
informao do passado so chamados de memria imperfeita.
Uma maneira de trabalhar a falta de informaes na modelagem dos jogos introduzir
a natureza como uma parte atuante em alguma jogada. Assim, as incertezas dos demais
jogadores, em relao definio das regras, podem ser interpretadas como probabilidades
subjetivas, que a psicologia dos jogadores trata de estabelecer. Em diversos textos do final
dos anos 1960 - onde se destaca "Games with Incomplete Information Played by 'Bayesian'
Players" (1967-68) -, John Harsanyi sistematizou essa situao tratando os agentes como
jogadores "bayesianos", isto , aqueles cujas incertezas podem ser operadas atravs de
uma distribuio da probabilidade subjetiva conjunta partilhada por todos (3). Embora a
aplicao destas idias seja dficil de ser observada por humanos e outros animais no seu
dia-a-dia, o modelo de Harsanyi serviu para descrever as circunstncias em que a
informao assimtrica, quando algum dispe de um conhecimento privilegiado sobre os
ingredientes do jogo que no de domnio dos outros envolvidos na mesma situao dos
jogos chamados de informao incompleta. De uma certa forma, tambm foi uma resposta
proposta feita por Thomas Schelling no segundo apndice de The Strategy of Conflict para o
abandono da simetria na Teoria dos Jogos. A adoo desta sugesto trazia algumas
dificuldades para a teoria, uma vez que o equilbrio de Nash tinha como condio a simetria
entre os jogadores, apesar da maioria dos casos interessantes envolver movimentos
assimtricos. A soluo de Harsanyi produziu, ento, equilbrios Bayes-Nash para cada tipo
de jogador que maximiza os valores esperados de acordo com as estratgias seguidas
pelos outros, subentendendo a incerteza quanto ao tipo do outro jogador, que pode ser
diferente tendo em vista a crena subjetiva na probabilidade prvia de distribuio desses
tipos na natureza (4). A crena prvia comum a expectativa que todos jogadores tm
sobre o modo da natureza produzir alternativas de forma aleatria. Tal crena nada mais ,
portanto, que o conhecimento comum da probabilidade estimada de que um tipo de jogador
venha fazer parte do jogo. De posse dessas informaes os jogadores podem avaliar suas
escolhas a partir de probabilidades predeterminadas de que esteja enfrentando um tipo
diferente ou semelhante de respectivos oponentes. Toda essa discusso, entretanto,
depende da maneira que a comunicao tratada, tema que ser mais desenvolvido na
segunda unidade deste curso.
Soma Zero ou Varivel
Jogos no-cooperativos incluem, entre outras, uma categoria de confronto de
interesses que definida como estritamente competitiva. So situaes extremas nas quais
para um jogador ganhar o outro tem necessariamente de perder, ou ento as partes
terminam o jogo sem saldo algum. Nos assim chamados jogos de soma zero, no h
possibilidade de cooperao entre dois agentes egostas, j que seus interesses so
totalmente opostos.
Contudo, com mais de duas pessoas, coalizes de jogadores podem ser formadas
contra a outra parte, motivo pelo qual os jogos passam a ser considerados cooperativos,
admitindo a influncia da comunicao prvia. No obstante, a soma dos resultados de
todos os jogadores envolvidos nessa interao sempre igual a zero. Na matriz de jogos de
duas pessoas e soma zero, por conveno omite-se os relativos coluna, que passam a ser
inferidos a partir do resultado expresso para a linha, multiplicado por menos um (figura 3).

Coluna Figura
3 - Matriz
de
Jogo de
Soma Zero
Estratgias
Pedra Papel Tesoura
Pedra 0 -1 1
Papel 1 0 -1
Linha
Tesoura -1 1 0
O tradicional Pedra, Papel ou Tesoura (originrio
do Japo) um tpico jogo simultneo de soma zero.
Quem escolhe a estratgia "pedra" (mo fechada)
quebra "tesoura" (dedos indicador e mdio abertos),
empata com "pedra" e perde de "papel" (mo aberta).
"Papel" cobre a "pedra", empata com "papel" e perde de "tesoura".
Esta, por fim, corta "papel", empata com "tesoura" e perde de
"pedra".
De acordo com o teorema de Zermelo, publicado em 1913, no artigo "Uber eine
Anwendung der Mengenlehre auf die Theorie des Schachspiels" (Sobre uma Aplicao da
Doutrina Mista Teoria do Jogo de Xadrez), jogos finitos de soma zero com informao
perfeita so estritamente determinados. Qualquer um dos jogadores tem a sua disposio
uma estratgia capaz de garantir a vitria, ou ao menos o empate, a despeito de como o
adversrio atuar. Tal pressuposto pode ser demonstrado por contradio: ao admitir-se que
um jogo soma zero finito, com informao perfeita, no estritamente determinado, deve-se
supor que nenhum jogador possui uma linha de ao que, desde o incio do jogo lhe traga a
vitria, posto que, do contrrio, o oponente no poderia encontrar outra que o permitisse
vencer. Assim, o primeiro lance do jogo no ser uma posio vitoriosa, qualquer que seja a
posio inicial. Caso houvesse, o primeiro jogador mover-se-ia imediatamente para l. Alm
disso, tal posio tambm no ser vitoriosa para o adversrio, pois se fosse assim teria
desde o incio condies de ganhar o jogo.
Por conseguinte, se a primeira jogada no assegura vitria, a segunda tambm no a
garante, muito menos as demais, at o infinito. Contudo, se o jogo finito, tem de haver
uma posio final, na qual um dos jogadores alcance a vitria ou o empate. Logo, a
condio da finitude do jogo contradiz a afirmao de que o jogo no estritamente
determinado, demonstrando, ento, a validade do Teorema (5). Pedra, Papel ou Tesoura
no um jogo estritamente determinado por ser simultneo e, portanto, de informao
imperfeita, pois, qualquer estratgia que venha a ser adotada pode ser vencida por uma
outra adequada do adversrio.
Ambos escolhem suas aes ao mesmo tempo, sem saber qual ser a deciso do
outro, o que torna impossvel uma soluo usando apenas as estratgias puras. No h,
como se ver mais adiante, uma estratgia dominante, ponto de sela, ou equilbrio entre as
opes dos jogadores nessa circunstncia. J o xadrez - aquele jogo "sem graa" -, tal como
o jogo da velha, estritamente determinado.
Os jogos de soma zero tiveram sua anlise esgotada em Theory of Games and
Economic Behavior, de John von Neumann e Oskar Morgenstern. E durante o curto perodo
que antecedeu a tese de John Nash, mesmo os jogos de soma diferente de zero poderiam
ser tratados como de soma zero, bastando para tanto, introduzir um jogador a mais que
assumisse as perdas da totalidade ganha pelos outros jogadores. Como propunham Von
Neumann e Morgenstern, esse jogador "no teria influncia direta no curso do jogo" (6). Seu
papel, embora fictcio, muitas vezes poderia ser associado funo exercida pela natureza,
ou o tesouro nacional de um pas qualquer, nos jogos de uma ou mais pessoas em que os
recursos naturais ou monetrios so partilhados pelos jogadores que tomam a deciso de
dividir esses bens entre si. Nesses casos, a natureza ou o tesouro assumiriam os prejuzos
ou absorveriam os excedentes gerados pela interao dos demais jogadores. Muitos
autores consideram a reduo dos modelos de jogos soma zero de pouca utilidade para
as cincias sociais, pois, como lembra Silvia Nasar, "at mesmo na guerra h, quase
sempre, algo a ser obtido da cooperao" (7). No obstante essas opinies, reconhecer
jogos de soma zero, numa escala mais ampla, ajuda a entender melhor os problemas
ambientais, na perspectiva da tragdia dos comuns apresentada pelo bilogo Garrett Hardin
(1915-2003) no artigo The Tragedy of the Commons, de 1968.
Hardin imaginou a situao de pecuaristas que mantm a maior quantidade de gado
possvel em terras devolutas, sem dono, mas de uso comum. Tudo vai bem enquanto o
crescimento vegetativo da populao fica abaixo da capacidade da terra se recuperar.
Porm, paradoxalmente, quando as metas de bem estar social conseguem tornar prsperas
as vidas das pessoas, o nmero crescente de gado no pasto, acaba por levar runa os
criadores que buscam maximizar o seu ganho com a venda de carne ou leite, uma vez que
o custo de manuteno de cada animal no pode mais ser suportado pelos recursos
"gratuitos", mas limitados da natureza (8). O mesmo acontece com o crescimento
populacional, a poluio, a devastao das florestas e todo tipo de ao que vise tirar
proveito das externalidades dos bens pblicos. Assunto a ser discutido na segunda unidade
da seo II, deste curso.
No obstante, jogos que no so estritamente competitivos permitem aos participantes
preferirem opes que no esto em total oposio entre eles. Um jogador pode desejar
obter um resultado que o favorea, sem necessariamente causar prejuzo ao outro. O que
no possvel em jogos de duas pessoas e soma zero. Ademais, jogos de soma variante,
diferente de zero, ao serem repetidos vrias vezes podem promover a cooperao, apesar
de nenhuma comunicao prvia ter ocorrido. Atravs de vias indiretas, como a sinalizao,
convenes ou encontro de pontos focais, tacitamente, as escolhas de estratgias
favorveis entre as partes acontecem assim que uma soluo nica se mostre distinta a
todos de modo semelhante.
Ao contrrio dos jogos de soma zero, onde uma soluo direta passvel de ser
encontrada por meio de estratgias minimax, ou maximin - abordadas no prximo ponto -,
os de soma varivel apresentam caractersticas de competio e cooperao que dificultam
bastante a busca de uma soluo que seja aplicvel a todos os casos.

Sem embargo, a abordagem ampla de jogos no estritamente competitivos e de soma
diferente de zero s foi possvel depois de John Nash ter descoberto para os jogos no-
cooperativos uma soluo geral que abrangeu tambm os cooperativos. Enquanto nos jogos
cooperativos os acordos obtidos tornavam obrigatria sua execuo, nos jogos no-
cooperativos no fica claro se os contratos possveis sero cumpridos, em parte ou em sua
totalidade, como ocorre quando se defrontam seres egostas, dotados de racionalidade
instrumental, que usam de qualquer meio para satisfazerem seus interesses imediatos. A
prova da existncia de um ponto de equilbrio, do qual nenhum jogador poderia fugir
unilateralmente sem afetar o resultado do outro, serviu no s para resolver os problemas
formais restritivos da Teoria dos Jogos cooperativos, mas fez com que as cincias sociais
pudessem aplicar esse tipo de ferramenta de anlise fora dos domnios da economia e da
matemtica.
De qualquer maneira, todos os jogos proporcionam a oportunidade de avaliar
formalmente a relao das listas de preferncias manifestas, de duas ou mais pessoas.
Contudo, durante o desenrolar das partidas, aspectos psicolgicos esto a todo momento
ameaando a manuteno da racionalidade estratgica pressuposta pela Teoria da Utilidade
adotada no modelo de jogos. Utilidade um dos diversos termos da teoria que causam
confuso entre os filsofos, uma vez que a moderna teoria da utilidade traada por Von
Neumann e Morgenstern difere em muitos pontos da antiga noo de utilidade que subjaz,
principalmente, ao Utilitarismo dos seguidores de Jeremy Bentham (1748-1832) - sobretudo
o carter moral que obrigaria aos governos maximizar a utilidade da maioria da populao, a
grosso modo, sem considerar os ganhos individuais em primeiro lugar (9).
Utilidade
Tudo que Von Neumann e Morgenstern pretendiam construir com o livro de 1944 era
um mero procedimento matemtico que pudesse servir como instrumento de anlise de
situaes em que se pode comparar as utilidades das pessoas envolvidas. Em outras
palavras, o problema da comparao das utilidades era visto como uma tentativa de avaliar
o conjunto de possibilidades de atuao de um agente (indivduo ou grupo), com objetivo de
maximizar ou minimizar a sua satisfao ou frustrao, segundo uma lista de preferncias.
O que no quer dizer que a maximizao da utilidade tenha de contemplar apenas
interesses mesquinhos ou egostas, no sentido de exclusividade. Irm Dulce (1914-1992) ou
a Madre Teresa de Calcut (1910-1997), ao buscarem fornecer o mximo de recursos aos
pobres e miserveis, no Brasil e na ndia, respectivamente, estavam tambm, do ponto de
vista da teoria dos jogos, maximizando seus prprios interesses. Como diria o psiclogo e
matemtico canadense Anatol Rapoport, "no h contradio entre esse impulso de
caridade e a maximizao da utilidade" (10).
A seleo da linha de ao que ser adotada faz-se sob condies de certeza, risco,
incerteza ou, como Luce e Raiffa acrescentaram, luz de evidncias empricas que
misturam risco e incerteza (11). Num cenrio de certeza, sabe-se que cada ao conduzir
invariavelmente a um resultado especfico. Sob risco so tomadas as decises cujas aes
levam a um dos possveis resultados esperados a uma taxa de probabilidade conhecida -
como os 50% de chances de sair ou cara ou coroa no lanamento de uma moeda ao ar. A
incerteza diferencia-se do risco pelo fato da probabilidade no ter uma proporo fixa
predeterminada - as chances de chover amanh, por exemplo.

Para que as escolhas sejam plausveis, um conjunto de axiomas propostos por Von
Neumann e Morgenstern e sustentado por vrios autores postula, em geral, que haja pelo
menos:
a. ordenamento das alternativas;
b. transitividade das preferncias;
c. continuidade;
d. combinao e substituio delas por chances de obteno de um ganho ao
qual se indiferente.
O ordenamento das preferncias, ou indiferena, exige que o jogador prefira uma
oportunidade a outra ou seja indiferente s duas. Assim, para o terico dos jogos no
haveria coisa alguma que no fosse passvel de comparao com outro objeto, alvo de
crena ou desejo. Na comparao entre objetos, a probabilidade de obteno de um outro
qualquer, sorteios compostos, nos quais se passa de um sorteio para o outro, podem ser
reduzidos a uma simples loteria em que a probabilidade final de alcanar um resultado
incorpora as chances de cada ramo que traa o caminho que leva at o n terminal. A
transitividade das preferncias e indiferenas das coisas e loterias uma relao que evita a
circularidade e inconsistncia que tornariam praticamente intratvel a teoria da utilidade.
Pois, se algum prefere "A" a "B" (A > B) e "B" a "C" (B > C), conclui-se que tambm prefira
"A" a "C" (A > C), ou seja indiferente caso haja indiferena entre "A" e "B" (A = B) e "B" e "C"
(B = C). Se a probabilidade de ganhar algo desejado for indiferente posse de um outro
objeto de ganho certo, o jogador dever arriscar-se ao sorteio sempre que existir um nmero
racional entre 0 e 1 ao qual se esteja indiferente entre uma loteria que envolva o objeto mais
querido e a posse de outra coisa inferior. O que, em resumo, equivale a dizer haver uma
continuidade na lista de preferncias de um agente e um ponto em que se possa
estabelecer comparaes entre elas: "tudo tem seu preo". Por conseguinte, exige-se que
um sorteio possa ser substitudo por outro, exceto no caso de alternativas relevantes. Ou
seja, um jogador que se mostrar indiferente entre um prmio novo e o anterior, tambm
dever s-lo quando duas outras loterias nas mesmas condies forem propostas. Tal
pressuposto conhecido ainda como a hiptese de independncia das alternativas
relevantes, ponto crucial na discusso que o economista francs Maurice Allais estabeleceu
em 1953. Afinal, havendo a possibilidade de mais de um sorteio ocorrer, aquele cuja
probabilidade de obteno de algo que seja melhor for maior dever ser o escolhido, de
acordo com uma ltima condio chamada monotonicidade.
A funo de utilidade, portanto, faz a associao de nmeros s preferncias e s
circunstncias em que a sorte leva a resultados finais almejados. Ela permite a comparao
das utilidades de diferentes pessoas como medidas intervalares de escalas diferentes ou
mesmo desconhecidas. Como explica Rapoport, o ponto zero e a unidade das escalas
podem ser arbitrrios, bastando apenas a determinao da proporo de cada par de
diferenas da utilidade, do mesmo modo que se comparam as escalas de temperatura, seja
em graus Celsius, Fahrenheit ou Kelvin (12). Entretanto, a preteno de quantificar qualquer
objeto que seja alvo do interesse de um agente, incluindo sentimentos subjetivos, abriu
espao para diversas especulaes, apoiadas em experimentos laboratoriais e de campo.
Allais argumentou que indivduos, em geral, no consideram as probabilidades objetivas em
suas decises, mas adotam probabilidades subjetivas, representaes psicolgicas, quando
defrontados a situaes de risco. Na prtica, isso poria abaixo os axiomas de independncia
forte ou substituio.

Entre escolhas de ganhos certos e indeterminados como neste exemplo em que a...
A. certeza de receber 100 milhes ou a
B. probabilidade de 10% de ganhar 500 milhes e 89% de ganhar 100 milhes e
1% de nada obter;
...a maioria das pessoas prefere a opo "A" mais do que "B" (A > B). Contudo, quando
o quadro muda e so oferecidas as chances de...
C. ganhar 100 milhes a 11% e 89% de nada ganhar ou
D. 10% de ganhar 500 milhes e 90% de obter zero
...agora a maior parte responde preferir "C" a "D" (C > D), embora o valor de cada
alternativa seja respectivamente:
100 milhes para "A"; 139 milhes para "B"; 11 milhes para "C" e 50 milhes para "D".
O que significa que a relao de preferncias entre esses resultados no preserva os
mesmos valores em circunstncias objetivamente semelhantes, pois o desejo pelo ganho
certo que a maioria das pessoas manifesta, quando indica "A > B", no se repete na
variao presente em "C > D", cuja diferena de 39 milhes igual nas duas loterias
apresentadas (13).
Este exemplo fornecido por Allais apontou para uma forte deformao provocada pelos
valores psicolgicos sobre a expectativa de resultados, cuja pretenso de satisfao
absoluta da utilidade, atravs de escolhas aleatrias, se mostrou invivel, devido aos
desvios empreendidos s estratgias preferidas na presena de fatores de risco. Os
componentes psicolgicos, que tanto influenciam as decises corretas, tiveram ento de
serem melhor avaliados pelos psiclogos e tericos dos jogos que, embora reconhecessem
as dificuldades de formalizao do processo amplo de deliberao que envolve os
sentimentos emersos de cenrios incertos, percebiam que suas principais falhas recaam
sobre a descrio da condio natural do agente e no sobre o mtodo de axiomatizao,
propriamente dito, empregado na teoria. As tentativas de Harsanyi ou Kahneman e Tversky,
para citar apenas os laureados com Nobel, ajudaram a traar com maior preciso a maneira
adequada de se chegar a uma soluo com o uso do clculo das probabilidades e com a
percepo dos efeitos da averso e busca do risco nos casos de ganhos e perdas,
respectivamente. Problemas que sero examinados logo depois de outros conceitos bsicos
sobre estratgias terem sido expostos no prximo texto.
Notas
1. Veja SHUBIK, M. Teora de Juegos en las Ciencias Sociales, III.3.1 a III.3.3, pp. 48-53.
2. Veja HART, S. "Games in Extensive and Strategic Forms", in AUMANN, R. & HART, S.
Handbook of Game Theory with Economic Application, vol. 1, cap. 2, 1, pp. 22/5.
3. Harsanyi aplicou em trs artigos sucessivos chamados Game with Incomplete
Information Played by Bayesian Players (Jogos com Informao Incompleta Jogados por
Jogadores Bayesianos, 1967-68) a estatstica bayesiana em jogos em que os participantes
no so totalmente informados e tm incerteza quanto aos resultados obtidos, com intuito
de achar uma soluo racional para esses casos. A contribuio de Thomas Bayes (1702-
1761), neste caso, resume-se ao seu mtodo de encontrar a probabilidade de ocorrncia de
determindas causas, antes do evento qualquer ser observado. Pelo teorema de Bayes, a
probabilidade (P) de uma hiptese (h), ou informao, dividida por sua evidncia (e), ou
evento, igual ao produto das probabilidades da hiptese e da evidncia dividida pela
hiptese, sendo o resultado uma frao da probabilidade da evidncia, ou P(h/e) = [P(h)
P(e/h)] P(e). Tudo isso, claro, na suposio de que existam seres vivos capazes de
respeitar a regra de Bayes.
4. Veja SCHELLING, Th. C. The Strategy of Conflict, ap. B, pp. 277 e ss; VARIAN, H. R.
Intermediate Microeconomics, cap. 15, 15.12-13, pp. 279/82 e FIANI, R. Teoria dos
Jogos, cap. 7, pp. 175 e ss. para introduo ao assunto.
5. Veja DAVIS, M. Teoria dos Jogos, cap. 2, apndice, p. 32/4.
6. VON NEUMANN, J. & MORGENSTERN, O. Theory of Games and Economic Behavior,
56.2.2, p. 506.
7. Veja NASAR, S. Uma Mente Brilhante, cap. 9, p. 120.
8. Veja HARDIN, G. "The Tragedy of the Commons".
9. O que no impediu o psiclogo Daniel Kahneman de tentar uma aproximao entre os
dois conceito no artigo "Experienced Utility and Objective Happiness" (2000), includo na
coletnea KAHNEMAN, D. & TVERSKY, A. Choice, Values and Frames, bem como
Harsanyi de defender a validade do utilitarismo frente a outras teorias morais, com base na
teoria dos jogos (em HARSANYI, J. "Game and Decision Theoric Models in Ethics").
10. RAPOPORT, A. Lutas, Jogos e Debates, part. II, cap. VI, p. 97.
11. De acordo com LUCE, R. D. & RAIFFA, H. Games and Decisions, 2.9, p. 37.
12. Veja RAPOPORT, A. Op. cit., part. II, cap. VI, pp. 98 e ss. para conhecer essa
passagem e os detalhes do exemplo esclarecedor da temperatura.
13. Veja ALLAIS, M. F. Ch. "Le Comportement de l'Homme Rationnel Devant le Risque", p.
527.

SEO I

Estratgias Dominantes, Maximin, Mistas e Noo de Equilbrio
Aps estabelecer a lista ordenada de suas preferncias e relacion-las a uma funo
de utilidade, os agentes devem estar aptos agora para preencherem as matrizes e os
esquemas de rvores, segundo as linhas de ao disponveis. Os valores que cada parte
receber com o encontro dessas estratgias depender das escolhas que fizer
individualmente. Por princpio, supe-se que todos busquem maximizar seus resultados e,
ainda que no consigam, se empenhem para que isto ocorra. A Teoria dos Jogos tem
instrumental suficiente para analisar jogos de azar - dados e roleta, por exemplo -, mas vai
alm da simples teoria dos jogos de azar que tem sua sustentao na teoria da
probabilidade. Enquanto no jogo de azar, a natureza o nico jogador com o qual se tem
que defrontar, bastando apenas apurar a utilidade esperada com base no clculo das
chances de um resultado acontecer, nos jogos de estratgias - desde o jogo da velha ao
xadrez, passando pelos jogos de cartas como pquer, bridge ou sueca - presume-se que
haja mais de um jogador racional, cujas deliberaes levam em conta, recursivamente,
aquilo que o adversrio far em consequncia de seu raciocnio pressuposto. Ademais jogos
de estratgias que envolvem habilidade dos jogadores - como o duelo e os esportes
olmpicos, em geral - tambm so passveis de estudos semelhantes aos feitos por Martin
Shubik em Teoria dos Jogos nas Cincias Sociais, de 1982, onde se avalia o momento
exato de se realizar as melhores estratgias disponveis, com as chances adequadas de se
acertar o alvo.
Para no sobrecarregar demais esta introduo Teoria dos Jogos e da Cooperao,
este curso concentrar-se- nos jogos de estratgia entre dois jogadores que disponham de
duas estratgias (2 x 2) que, embora faam forosas simplificaes, servem de modelo
explicativo para um vasto espectro de situaes cotidianas em que os interesses dos
jogadores podem coincidir ou divergir em parte. Na perspectiva dos jogos, estratgias so
programas que instruem qual linha de ao um jogador adotar durante toda partida, antes
mesmo dela comear, dependendo do que o adversrio far. Em termos de jogos
extensivos, uma estratgia descreve o caminho que um jogador percorrer desde o seu
primeiro lance at o n terminal. Quando o jogo ou a interao entre mais de um agente
interessado em satisfazer ao mximo sua utilidade acontece em mais de uma etapa de
deciso, as estratgias devem traar um plano de escolhas para cada ponto de deciso,
formando uma sequncia completa de movimentos, atravs dos conjuntos de informaes
disponveis, tendo em vista os melhores valores oferecidos no final. H uma forte
interdependncia das decises que os adversrios tomaro em suas expectativas
recprocas do comportamento do outro. O processo de deliberao que visa maximizar os
ganhos finais tem, portanto, de compreender adequadamente a capacidade do oponente
reagir a suas aes, conforme a conduta esperada entre seres semelhantes, nem sempre
racionais de todo.
Cada jogador dispe de um conjunto de estratgias puras que podem ser misturadas
entre si e combinadas com as dos outros agentes. De acordo com a combinao especfica
para as estratgias de diferentes jogadores, os resultados finais para cada indivduo
corresponder um ganho prprio que corresponde ou no soluo do jogo.

Na matriz simples, desenhada na figura 1...
Coluna
Figura
1
Estratgias
Esquerda Direita
Alto 1, 1 1, 0
Linha
Baixo 0, 1 0, 0
...no difcil para as partes coordenarem suas aes em direo ao resultado do alto,
esquerda. Pois ambos possuem estratgias dominantes que se encontram naquela clula
da matriz 2 x 2. Para Linha, Alto a estratgia que domina Baixo, qualquer que seja a
escolha que a Coluna faa. Isto , garante-lhe o melhor ganho (1) caso Coluna jogue
Esquerda ou Direita, frente aos ganhos de Baixo (0). Por sua vez, Coluna tem em Esquerda
a sua dominante, j que a nica a lhe fornecer um a mais do que o zero da Direita, a
despeito do que Linha jogue. Assim, (1, 1) ser o par de recompensas que soluciona
facilmente interaes desse tipo entre agentes racionais, sem muitos sustos, graas
dominncia de suas estratgias mtuas. Os interesses de ambos convergem para o alto,
esquerda.
At aqui, nenhum problema em relao aos aspectos psicolgicos da outra parte pode
afetar os ganhos esperados de um jogador racional. Coisa diferente enfrentam as pessoas
quando uma pequena mudana nos ganhos da matriz passa a comprometer uma eficiente
coordenao das aes. A figura 2 apresenta dois resultados conjuntos que favorecem
ambos jogadores:
Coluna
Figura
2
Estratgias
Esquerda Direita
Alto 1, 1 0, 0
Linha
Baixo 0, 0 1, 1
Agora no h uma estratgia dominante a orientar as escolhas dos dois. No entanto,
preciso que os atores cheguem a um acordo sobre quais de suas estratgias conjuntas,
(alto, esquerda) ou (baixo, direita), ambos adotaro a fim de maximizar suas utilidades
esperadas. Na ausncia de qualquer meio de comunicao ou de uma dica que indique uma
regra de coordenao, os jogadores precisam buscar um ponto focal que sirva como sinal
para o encontro no lugar adequado. Esse sinal deve estar oculto de tal modo que permita
sua localizao de forma rpida, mas no to fcil como no jogo da figura 1. A soluo
desse enigma s possvel se estiver ao alcance da capacidade racional dos agentes.
Alguma experincia comum prvia dever ter sido partilhada antes pelos jogadores, para
facilitar o estabelecimento de uma conveno que, na ausncia de uma outra "cola", ser
adotada tacitamente pelos participantes de uma mesma cultura. Por exemplo, membros da
cultura ocidental, que desde a infncia so acostumados a iniciar a escrita da esquerda para
a direita e de cima para baixo, poderiam concordar em selecionar as estratgias "alto-
esquerda". Contudo essa dica poderia ser confusa caso "baixo, direita" viesse grafada com
letras maisculas ou um mediador confivel sugerisse sua escolha. Segundo Thomas C.
Schelling, para situaes como essas a Teoria dos Jogos deveria incorporar habilidades ao
agente que vo alm da mera racionalidade estratgica, tais como restries estticas,
casusticas e geomtricas que ajudassem a eliminar as ambiguidades que perturbam os
acordos tcitos (1).

Tanto "alto-esquerda", como "baixo-direita", no constituem a rigor uma soluo para
jogos do tipo da figura 2. De fato, no sentido que Ducan Luce e Howard Raiffa deram
soluo no estrito senso, para que ela ocorra em jogos no-cooperativos seria necessrio:
1. existir um par em equilbrio entre os conjuntos de pares de estratgias
admissveis; e
2. que todos os pares em equilbrio admissveis fossem ambos intercambiveis e
equivalentes (2)
Desde John Nash, um ponto de equilbrio todo aquele que seja o encontro das
estratgias timas de cada jogador com as dos adversrios (3). Por exemplo, "alto-
esquerda" est em equilbrio nas Figuras 1 e 2, enquanto "baixo-direita" apenas na segunda
matriz. Entretanto, na Figura 1, s "alto-esquerda" uma soluo no estrito senso, embora
no seja na Figura 2, bem como "baixo-direita". Pois, neste caso, no se pode trocar as
estratgias da linha pelas da coluna de modo a formar outros pares equivalentes, ou seja:
"alto-esquerda" (1, 1) e "baixo-direita" (1, 1) no so intercambiveis, porque "alto-direita" (0,
0) ou "baixo-esquerda" (0, 0) no formam os mesmos resultados em equilbrio. Para soluo
de jogos onde os interesses dos participantes coincidem, a comunicao pode vir a resolver
satisfatoriamente, promovendo a cooperao e coordenando as aes. Contudo, em jogos
tcitos, quando ela no possvel explicitamente, as dificuldades tcnicas podem ser
superadas por normas culturais, convenes ou pontos focais partilhados e pela simetria
que assegura um comportamento semelhante aos agentes em jogos cooperativos.
Assim que a estratgia comum acertada, no h porque desviar do consenso, sem
perdas mtuas. Se nenhum acordo implcito previsto, s se pode esperar que o resultado
alcanado seja a mdia dos pares em equilbrio, no caso da figura 2, meio para ambos
jogadores.
Ao transformar-se a matriz da figura 2 em um jogo de soma zero, como na figura 3:
Coluna Mnimo Mximo
Figura
3
Estratgias
Esquerda Direita linha linha
Alto 1, -1 0, 0 0 0
Linha
Baixo 0, 0 -1, 1 -1 1
Mximo coluna 1 0 0 -
Mnimo coluna -1 0 - 0
Desaparece o interesse por uma soluo que vise coordenar as escolhas conjuntas,
uma vez que cada um procura jogar sua estratgia dominante alto e direita,
respectivamente, para a Linha e Coluna. O encontro dessas duas estratgias resulta em
zero para ambos jogadores, em "alto direita". Um ponto de equilbrio que corresponde ao
chamado ponto de sela dos jogos de soma zero. Este representa, para Linha, o mximo dos
ganhos mnimos em suas linhas e o mnimo dos mximos de suas colunas. De modo
inverso, para Coluna, o mnimo dos mximos em suas linhas e o mximo dos mnimos de
suas colunas. Em outras palavras, do ponto de vista da Linha, o ganho menor em uma
linha que seja o maior na mesma coluna (maximin); ou, da perspectiva da Coluna, o maior
ganho de uma linha que tambm o menor da coluna. Trata-se de uma posio em que
cada um dos jogadores procura fazer o melhor para si tendo em vista a oposio do outro,
diminuindo ao mnimo suas perdas esperadas. Aqui, a comunicao em nada ajuda a
melhorar o resultado final do jogo, pois os interesses so totalmente opostos: para Linha
escolher "alto" a nica soluo admissvel, j que se optasse por "baixo", Coluna, ao
selecionar "direita", lhe proporcionaria o pior resultado (-1), ao passo que permanecendo no
"alto", o mnimo que ganharia seria zero. Por outro lado, Coluna tambm sabe que, se
escolhesse "esquerda", poderia perder -1, enquanto "direita" lhe garante ao menos zero (4).
No jogo de soma zero, o encontro de duas estratgias dominantes correspondem a um
ponto de sela. Entretanto, quando no h uma dominncia entre as estratgias, pode haver
mais de um ponto de sela ou nenhum deste. A existncia de pontos de sela significa que h
possibilidade de uma soluo minimax, ou maximin, como fora previsto por Von Neumann e
Morgenstern (5). Sempre que houver mais de um ponto de sela, todos os resultados sero
iguais. No caso desses resultados serem intercambiveis, o jogo ter ento uma soluo no
estrito senso, como nos jogos de soma varivel. [Como exerccio, tente encontrar os pontos
de sela de Pedra, Papel e Tesoura, no texto anterior, e saiba porque ele no tem uma
soluo estrita.]
Estratgias Mistas
Embora a soluo maximin parea razovel para jogos de soma constante, quando
no h uma um ponto de sela ou a soma diferente de zero, ser necessrio fazer uma
mistura que diminua os riscos de perdas ou promova outro ponto de equilbrio que no pode
ser alcanado apenas como recurso de estratgias puras ou estritas - aquelas que so
listadas nas matrizes bsicas.
Quando os interesses no so totalmente opostos ou coincidentes, possvel achar
estratgias mistas que ofeream um melhor saldo para ambos jogadores, em equilbrio de
Nash. Na prxima matriz, figura 4, as circunstncias no so plenamente competitivas ou de
mera coordenao das aes. Os agentes devem buscar um consenso sobre qual dos
resultados mostrados eles se encotraro, a fim de evitar os piores resultados.
Coluna
Figura
4
Estratgias
Esquerda Direita
Alto 2, 1 0, 0
Linha
Baixo 0, 0 1, 2
primeira vista, uma rodada de comunicao prvia poderia solucionar o problema,
no fosse a tentao de um deles ameaar jogar sua estratgia favorita, cortando, em
seguida, a ligao entre os dois. Linha, por exemplo, caso falasse primeiro, afirmaria a
disposio de jogar "alto", e ponto final! Sem deixar Coluna outra opo alm de seguir
pela "esquerda", pois ganhar um seria melhor do que nada. Imaginar o inverso disso faria
com que Coluna dissesse "direita", obrigando Linha jogar "baixo". Tem-se, ento, a situao
interpretada por Luce e Raiffa como uma "Batalha dos Sexos", onde um casal teria de
decidir qual programa para a noite: ir ao bal ou assistir uma luta de boxe (6). A senhorita
Linha prefere ir ao Bal com o senhor Coluna, em primeiro lugar. Sua segunda preferncia
ir ao Boxe com ele. Ao contrrio, o senhor Coluna prefere esta ltima possibilidade antes de
tudo, sendo seu "plano B" ir ao Bal com ela.
Na Batalha dos Sexos, nenhuma estratgia pura garante uma soluo para o jogo.
Ainda que algum ameace seguir sua estratgia favorita, no raro a retaliao do outro
ocorre na escolha de sua prpria estratgia preferida, com intuito de preservar a reputao
de pessoa firme que no se curva a ameaas. S o recurso a uma mistura de suas
estratgias estritas permite encontrar um resultado que parea satisfatrio para ambos os
jogadores. O teorema minimax, ou maximin, ofereceu como soluo para essas
circunstncias a aplicao das estratgias disponveis segundo uma taxa de frequncia
determinada (7). A fim de obter-se a melhor mistura, que garanta, ao menos, o mais alto
ganho entre os piores, o mtodo simples para jogos 2 x 2, descrito por Rapoport (8) consiste
em encontrar a diferena entre as notaes das duas estratgias Alto e Baixo, para o
jogador da linha, fazendo depois a razo da segunda diferena em relao primeira. Na
figura 4, para descobrir sua mistura minimax, a Linha deve subtrair zero de um na estratgia
"Alto" e zero de dois na estratgia "Baixo", cuja razo em relao primeira produz 2:1, o
que leva a uma proporo de (2/3 Alto, 1/3 Baixo). Por sua vez, Coluna diminui zero de dois
e zero de um, esquerda e direita, gerando 1:2 e, em consequncia, (1/3 Esquerda, 2/3
Direita). Agora, ambos jogadores podem calcular o valor esperado para a situao em que
se encontram. Linha multiplica a proporo de Alto com a probabilidade da Coluna fornecer-
lhe dois ou zero, somando a proporo de Baixo e multiplicando as chances de obter zero
ou um, do seguinte modo:
v(l) = 2/3(1/3 2) + 2/3(2/3 0) + 1/3(1/3 0) + 1/3(2/3 1) =
= 2/3 2/3 + 1/3 2/3 =
= 4/9 + 2/9 = 6/9 =
= 2/3

E conclui que seu valor ser de 0.66 util (unidade padro da utilidade, na teoria dos
jogos; pural utiles). Menos do que o util certo que ganharia em Baixo-Direita. Fazendo as
contas de seu valor, Coluna chega concluso semelhamte, mas simtrica:
v(c) = 1/3(2/3 1) + 1/3(1/3 0) + 2/3(2/3 0) + 2/3(1/3 2) =
= 1/3 2/3 + 2/3 2/3 =
= 2/9 + 4/9 = 6/9 =
= 2/3
Por causa da simetria do jogo, as misturas de estratgias minimax ou maximin
garantem aos dois jogadores os mesmos resultados conjuntos (0.66, 0.66), nesta verso da
Batalha dos Sexos (9). O sucesso que a minimax oferece em jogos de soma zero, ao reduzir
ao mnimo as perdas de cada parte, nem sempre garantia de boa escolha em jogos de
soma variante. A Batalha dos Sexos no um jogo de soma constante e solues melhores
podem ser encontradas, como se ver quando os jogos falados forem analisados na
segunda unidade deste curso. Quando se trata de ganhar ou perder, a mistura minimax
pode vir a ser o nico conselho a sugerir, como na figura 5, montada por Rapoport (10).
Coluna
Figura
5
Estratgias
Esquerda Direita
Alto -1 5
Linha
Baixo 3 -5
Semelhante Batalha dos Sexos, aqui no h um ponto de sela que represente a
maximin das estratgias puras. A estratgia mista maximin da Linha chega ao valor de 5/7
util com a proporo (4/7 Alto, 3/7 Baixo), da mesma forma que mistura maximin da Coluna
(5/7 Esquerda, 2/7 Direita). Com isso, Rapoport conclui que seria desvantagem aos
jogadores fugir da aplicao das estratgias mistas, pois, a longo prazo, essa seria a melhor
probabilidade para as partes envolvidas nessas circunstncias e outra alternativa seria
desvantajosa. Inferncia que Morton Davis contestou em sua introduo no-tcnica
intitulada Teoria dos Jogos, de 1970. Por ser um jogo de soma zero, no haveria porque se
acreditar que o uso da mistura maximin seria desvantajosa ou vantajosa para ambos
oponentes, pois um ter necessariamente de ganhar ou perder ao realizar suas aes, o
que inviabilizaria por contradio a bem sucedida aplicao da estratgia mista pelas partes,
ao mesmo tempo. Optar por esta linha de ao seria atraente, graas suposta segurana
oferecida de obter aquele resultado. Porm, para Davis isso no passa de "uma questo de
gosto pessoal" pela segurana (11), uma vez que, ao buscarem outras estratgias,
jogadores audazes, amantes do risco tornariam imprevisvel qualquer resultado factual.
Apenas um vencer com certeza. S no se sabe quem!?
Em razo do teorema minimax, o jogo geral de duas-pessoas, soma-zero, tem boa
base terica. Mas, sendo jogo de informao perfeita, raramente surge na prtica. A
dificuldade est no requisito de o jogo ser soma-zero.
A presuno essencial sobre que se assenta a teoria a oposio de interesses de dois
jogadores. Na medida em que a presuno no seja vlida, a teoria ser irrelevante e
desorientadora. Frequentemente, a presuno parece estar satisfeita, mas, em realidade
no o est. (...) (DAVIS, M. D. Teoria dos Jogos, cap. 3, p. 57).

Em jogos cuja soma dos resultados diferente de zero, a estratgia mista maximin
(12) no a nica soluo existente, nem mesmo a melhor. Na Batalha dos Sexos, apesar
da comunicao gerar oportunidades de ameaas, em uma rodada prvia isolada, quando
se busca a coordenao, a troca indeterminada de mensagens poderia fornecer melhores
resultados que a estratgia maximin mista, ampliando o espao de resultados originais at a
fronteira de eficincia conhecida como timo de Pareto, na qual nenhum agente obter
melhor resultado sem diminuir os ganhos da outra parte, como sugeriram Luce e Raiffa, na
possibilidade de comunicao, as partes poderiam concordar em aceitar um mecanismo
equnime que permitisse a mesma escolha das estratgias "Alto-Esquerda" ou "Baixo-
Direita" na mesma proporo meio a meio. Com isso, cada um obteria 3/2 - somando os
ganhos (2, 1) e (1, 2), dividindo-os, depois, por dois, achando (3/2, 3/2) -, bem acima dos 2/3
anteriores.
Equilbrio de Nash
O emprego de estratgias mistas recomendvel sempre que as estratgias puras
no indicarem uma estratgia dominante, uma soluo em ponto de sela, ou em um ponto
de equilbrio. A noo de ponto de equilbrio, em termos da Teoria dos Jogos, foi
formalizada por John Nash como uma generalizao da soluo maximin para jogos no-
cooperativos de vrias pessoas e soma varivel, no se restringindo somente aos
cooperativos de duas pessoas e soma zero. O ponto de equilbrio, nas palavras de Nash,
o conjunto de resultados opostos que maximiza os ganhos de cada jogador em face da
melhor estratgia do outro (13). Nash mostrou que embora pudesse haver jogos em que as
estratgias puras no apontassem para ponto de equilbrio, o recurso mistura de
estratgia sempre produziria um novo ponto de equilbrio em jogos finitos.
Um equilbrio de Nash, ou ponto de equilbrio, portanto, uma combinao de
estratgias da qual nenhum jogador pode aumentar seu ganhos unilateralmente, ao mudar
de estratgia. Para localizar um ponto de equilbrio em uma matriz, existem alguns mtodos
prticos e simples. O jogador deve descobrir a clula na qual o ganho seja,
simultaneamente, o mximo da Linha nas devidas colunas e o da Coluna nas suas linhas.
Visualmente, isto pode ser feito com o recurso de setas ou de letras que marquem os
mximos da Linha (l) e da Coluna (c), sendo equilbrios de Nash as clulas que contenham
as marcas de ambos jogadores ou seja a convergncia das setas.
Na matriz da Batalha dos Sexos, descrita h pouco, os equilbrios surgem da seguinte
forma:
Coluna

Figura
4b
Estratgias
Esquerda Direita
Alto l 2, 1 c 0, 0 Linh
a
Baixo 0, 0
l 1, 2
c

Batalha dos Sexos

O encontro das estratgias (alto, esquerda) e (baixo, direita) indicam a existncia de
dois pontos de equilbrio que impedem a escolha de uma nica soluo usando s as
estratgias puras, motivo pelo qual a mistura de estratgias se faz necessria. Quando um
jogo apresenta apenas um ponto de equilbrio pela combinao de estratgias puras sinal
que houve o cruzamento de duas estratgias dominantes. Ou seja, estratgias que
dominam as outras estratgias de cada jogador, fornecendo o melhor ganho, independente
do que o outro faa. Assim, no modelo desenhado na figura 6, tambm conhecido como
"Dilema dos Prisioneiros", as estratgias "baixo" e "direita" superam as respectivas
estratgias "alto" e "esquerda", da Linha e da Coluna. Contudo, a dominncia e a perfeio
deste ponto de equilbrio espanta a todos que se defrontam com este quadro pela primeira
vez.
Coluna

Figura
6
Estratgias
Esquerda Direita
Alto 2, 2 0, 3 c Linh
a
Baixo l 3, 0
l 1, 1
c

Dilema dos Prisioneiros

A soluo que dois agentes instrumentalmente racionais acabam por encontrar nunca
a melhor para ambos, no contexto do Dilema dos Prisioneiros, pois o ponto de equilbrio
(1, 1) subtimo em relao a (2, 2), que poderiam obter se adotassem a estratgia
dominada. Porm, um agente racional, quando possui uma estratgia dominante, nunca
escolhe outra que no esta. Note que a combinao de estratgias dominantes conduz
sempre a resultados que so equilbrio de Nash, mas nem todo ponto de equilbrio
formado por pares dominantes, como mostrou a Batalha dos Sexos, onde h dois equilbrios
de Nash em estratgias puras que no so dominantes.
Todas essas tcnicas de solucionar um jogo, cooperativo ou no, esto apoiadas numa
concepo de racionalidade que, apesar da aparente preciso, geram resultados paradoxais
do ponto de vista filosfico, como no caso do Dilema dos Prisioneiros e nestes dois outros
apresentados por Mrio Henrique Simonsen (1935-1997) em sua inacabada introduo
Teoria dos Jogos.

Para atacar a fragilidade da suposio de racionalidade entre os participantes,
Simonsen montou uma matriz semelhante a da figura 7 (14).
Coluna

Figura
7
Estratgias
Esquerda Direita
Alto l 3, 3 c -3, 3 c Linh
a
Baixo 2, 2 c l 1, 1

Alto-esquerda constitui o nico equilbrio de Nash desta matriz, sendo esquerda a
estratgia dominante de Coluna. Tendo em mente, o pressuposto de racionalidade da teoria,
Linha no tem porque se preocupar em escolher a estratgia Alto, uma vez que a dominante
de Coluna lhe garante trs de ganho. Entretanto, Esquerda domina fracamente a direita,
pois se Linha escolher Alto, Coluna nada perderia mudando de dominncia para a direita,
amargando seu adversrio -3 de perda. Sem saber as reais intenes de Coluna, Linha
pode refletir que o melhor seria reduzir ao mnimo suas perdas seguindo a sua maximin
localizada em Baixo. Assim, Linha obteria um, pelo menos, e Coluna o seu pior resultado,
caso viesse a jogar Direita. Simonsen, ento, advertiu que poderia "ser extremamente
imprudente escolher estratgias conducentes a um tal equilbrio [de Nash] sem a garantia de
que todos os demais jogadores faam o mesmo" (15).
Alm do mais, os equilbrios de Nash podem estar em combinaes totalmente
opostas como neste segundo exemplo fornecido por Simonsen e que foi adaptado figura
8.
Coluna

Figura
8
Estratgias
Esquerda Direita
Alto -3, -3
l 2, -2
c
Linh
a
Baixo l -2, 2 c 1, 1

De novo, um problema de coordenao surge entre os participantes, mas agora ambos
preferem ganhar 2, fazendo com que o outro assumisse o prejuzo de -2. Contudo, se
jogarem suas estratgias favoritas acabariam pior do que no Dilema dos Prisioneiros,
obtendo o resultado mais baixo possvel (-3, -3). Para fugir deste destino, a nica soluo
seria adotar mais uma vez suas respectivas estratgias maximin, que evita o pior e neste
caso garante (1, 1) para as partes.
O apoio na racionalidade forte exige a aceitao de respostas que transformam o
agente estratgico em um homo conomicus caricatural, posto que pessoas que no
fossem to "racional" poderiam alcanar um patamar mais vantajoso do que as que agem de
modo estritamente racional e egosta, como o defendido pela teoria. Isto revela uma certa
ambiguidade na concepo de racionalidade defendida pelo equilbrio de Nash, que nem
sempre corresponde aos melhores resultados possveis. De fato, testes em laboratrios
provaram que a maioria das pessoas, formadas ou no em economia ou matemtica,
procuram solues que sustentem ganhos prximo a uma distribuio justa para todos
envolvidos.
Na complexidade do contexto social, onde vrios agentes racionais atuam no sentido
de maximizar suas utilidades, satisfazendo seus desejos, no se pode esperar
tranquilamente que uma "mo invisvel" acomode todos interesses atravs do encontro das
melhores escolhas em equilbrio. O Dilema dos Prisioneiros, entre outros, representa as
situaes nas quais a disputa entre agentes econmicos redunda em tragdia como a dos
comuns, esboada por Garrett Hardin (16). Solues, como as propostas por Nash, so
construdas com base em conhecimento a posteriori e no podem servir idealmente a priori
para determinar, em todas circunstncias, as decises racionais, seja l o que isto
signifique. Para evitar o pior, faz-se necessrio olhar com maior ateno a maneira pela qual
as pessoas deliberam em meio a influncias emocionais ou culturais. Uma observao que
valeu o Nobel a Daniel Kahneman e ser o foco do prximo ponto.
Notas
1. Veja SCHELLING, Th. C. The Strategy of Conflict, ap. C, p. 295.
2. LUCE, R. D. & RAIFFA, H. Games and Decisions, 5.9, p. 107.
3. NASH, J. "Non-Cooperative Games", p. 287.
4. Os detalhes tcnicos dos pontos de sela podem ser apreciados diretamente em VON
NEUMANN, J. & MORGENSTERN, O. Theory of Games and Economic Behavior, 13.4.1
a 3, pp. 93-5. Para uma explicao informal, veja RAPOPORT, A. Lutas, Jogos e Debates,
part. II, cap. VII, pp. 104 a 109.
5. Veja VON NEUMANN, J. & MORGENSTERN, O. Op. cit., 17.6, pp. 153-155.
6. Em LUCE, R. D. & RAIFFA, H. Op. cit., 5.3, pp. 90 e ss.
7. Veja RAPOPORT, A. Lutas, Jogos e Debates, cap. IX, pp. 122 e ss.
8. Em RAPOPORT, A. Op. cit., cap. IX, p. 123.
9. A rigor a verso original deste jogo, criado por Luce e Raiffa, proporciona os resultados
negativos (-1, -1) para as estratgias Alto-Direita e Baixo-Esquerda; enquanto David M.
Kreps constri sua matriz de um modo mais realista assim:
Coluna

Estratgias
Esquerda Direita
Alto 5, 4 1, 1
Linha
Baixo 0, 0 4, 5
Para explorar as consequncias destas mudanas, veja nota 6 e KREPS, D. M. Games
Theory and Economic Modelling, cap. 4, pp. 39 e ss.
10. Veja RAPOPORT, A. Idem, cap. IX, pp. 125 e ss.
11. DAVIS, M. Teoria dos Jogos, cap. 3, p. 56.
12. Em tempo, nos jogos de soma zero as estratgias maximin e minimax so equivalentes,
entretanto, nos de soma variante podem haver diferenas. Em todo caso, a mistura maximin
sempre corresponde proporo encontrada para as estratgias da Linha ou da Coluna
tendo em vista a diferena de seus respectivos resultados, enquanto a minimax calculada
em funo dos ganhos recprocos dos oponentes. Veja, por exemplo, LUCE, R. D. &
RAIFFA, H. Idem, 6.11, pp. 145 a 150.
13. Veja nota 3.
14. Para os prximos exemplos veja SIMONSEN, M.H. Teoria dos Jogos, 1.5, pp. 25-26.
15. SIMONSEN, M.H. Op.cit., p. 25.
16. Mencionado no texto anterior.

SEO I

A Irracionalidade do Agente Racional: Risco e incerteza; psicologia, biologia
evolutiva; o maximizador local e o global.
As diversas crticas recebidas pela Teoria dos Jogos, em sua forosa simplificao da
forma matemtica do trato social, concentraram-se principalmente na concepo de agente
racional adotada e a consequente construo artificial das situaes estudadas. Alguns
filsofos apontaram para insuficincia da viso econmica do mercado livre, onde as
relaes de troca sobressairiam a despeito da simpatia, do esprito de equipe e da confiana
necessrios ao convvio social (1). Outros atacaram a restrio da anlise aos contextos
competitivos que nem sempre surgem como tal no cotidiano, bem como as solues
insatisfatrias sugeridas aos jogadores na condio do Dilema dos Prisioneiros e outros
modelos abordados (2). Houve ainda alguns, como Jrgen Habermas, que consideraram a
adoo do ponto de vista das relaes de troca nas esferas pblicas - uma das aplicaes
do modelo de jogos - uma das fontes de patologias sociais que desequilibram a interao
das sociedades modernas, que deveriam ser apoiadas de forma justa na solidariedade, no
dinheiro e no poder administrativo (3).
Todas essas objees filosficas sucederam s observaes feitas, na primeira hora,
pelo economista francs Maurice F. Charles Allais, laureado com o Nobel de Economia de
1988. Allais combatia a excessiva formalizao matemtica que, na primeira metade do
sculo XX, teve seus principais marcos terico nas obras dos economistas italiano Vilfredo
Pareto (1848-1923) e estadunidense Paul Anthony Samuelson, prmio Nobel de 1970.
Chamava ateno, sobretudo, para o problema da subjetividade, deixado de lado pela
escola neoclssica em economia, que nos anos 1950, predominava nos Estados Unidos.
Para Allais, as consideraes sobre a cardinalidade das preferncias individuais, isto , a
observao da intensidade da preferncia de um sujeito por um determinado objeto,
independente do seu ordenamento numa escala sequencial de utilidade, da maior para a
menor, deveria ter um peso expressivo, a fim de explicar com mais naturalidade o
comportamento racional diante do risco ou incerteza.
Aos adeptos do formalismo metodolgico que dominou o incio da Teoria dos Jogos,
somente a relao ordinal de todas preferncias e suas combinaes possveis para cada
indivduo tornaria possvel a comparao e anlise da utilidade entre pessoas de gostos e
culturas diferentes (4).
Contudo, os paradoxos apontados pelos experimentos de Allais indicaram que tal
ordenamento no era suficiente para explicar a atitude dos agentes, ditos racionais, frente a
opes de sorteio [vide exemplo deste autor em "A Estrutura do Jogo"]. A avaliao
subjetiva das probabilidades entre duas loterias objetivamente semelhantes revelou a
dificuldade de se manter a transitividade das preferncias, um dos axiomas da teoria da
utilidade adotada pelos tericos dos jogos. Perdas e ganhos absolutos mostraram suas
influncias nas escolhas em arranjos diferentes que conduziam aos mesmos resultados.
Em geral, quanto maior fosse o ganho visualizado, maior era a averso ao risco, e,
como de frente ao espelho, quanto maior a perda, maior a busca do risco.

Efeitos dos Defeitos
Daniel Kahneman, com a colaborao de Amos Tversky, analisou diversos resultados
obtidos em cenrios diferentes, onde as pessoas eram submetidos a escolhas como nas
experincias de Allais e pde detectar os efeitos cuja existncia reflete a maneira pela qual
os agentes racionais deliberam antes de desempenharem uma linha de ao. Os
fenmenos observados na reao de estudantes de universidades israelenses e dos
Estados Unidos chocavam com alguns pilares da teoria da utilidade. Empiricamente,
constatou-se que as pessoas superestimavam resultados que so considerados certos - o
chamado efeito de certeza -, em face daqueles que para serem obtidos envolveriam o
clculo das probabilidades. Cerca de 82% de 72 estudantes entrevistados escolheram
(Loteria I)...
A. ganhar $2.400 certos,
enquanto os restantes 18% preferiam a loteria que pagava...
B.
$2.500, com probabilidade de 33%;
$2.400, com probabilidade de 66% e
nada com probabilidade de 1%.
apesar desta oferecer nove utiles acima da opo A.
Contudo, ao se depararem com outra situao (Loteria II) entre
A. a chance de 33% de ganhar $2.500
ou
B. $2.400 com probabilidade de 34%,
a maioria de 83% optou pelo sorteio "A" que era nove utiles acima da segunda loteria,
violando o axioma da substituio, como advertira Allais. Pelo axioma da substituio, se a
probabilidade de ganhar a mais em "A" preferida a de "B", deveria ser preservada a
mesma preferncia em outro quadro, onde a certeza de um ganho oferecido em "A" fosse
igualmente menor que a chance de obter o mesmo resultado anterior, agora em "B" (5).
O efeito da certeza foi observado em perspectivas que no preocupavam os agentes
com perdas ou resultados negativos. Os casos que envolviam prospectos negativos, por sua
vez, apresentavam outro fator virtualmente invertido em comparao ao de certeza,
chamado efeito de reflexo.

Como em um espelho, as respostas oferecidas pelos entrevistados refletiam uma
ordem reversa das preferncias para perdas, em contraste com as preferncias por ganhos.
Assim, entre 95 estudantes, 20% preferiram a loteria (Loteria III) cujo prmio era...
A. $4.000, com probabilidade de 80%,
ao passo que,
B. $3.000 garantidos
eram escolhidos pelos outros 80%. Situao completamente diferente da seleo feita
por 92% desses mesmos 95 que optaram depois pelo sorteio (Loteria IV) com...

A. perda de $4.000 a 80% de chance,
enquanto 8% aceitaram...
B. perder imediatamente $3.000.
Os ganhos positivos provocaram nos agentes averso ao risco, enquanto os quadros
de expectativas negativas estimulavam, ao contrrio, a busca ao risco. Nessas ocasies, os
mesmos "equvocos" provocados pelo efeito de certeza foram notados em ambos os
aspectos, positivo e negativo, com a busca pelo ganho seguro, mas de utilidade menor e
preferncia por resultados negativos incertos, embora de maior perspectiva, do que a perda
absoluta. Por conseguinte, o efeito de reflexo eliminou a averso pela incerteza nos
sorteios negativos, como consequncia paradoxal ao efeito de certeza, passando a
incrementar a averso por perdas e o desejo de ganhos imediatos (6).
A maneira pela qual os cenrios eram montados, seja com loterias de resultados
positivos ou negativos, gerou atribuies de valores diferentes pelos participantes aos
sorteios. Isso ficou ainda mais evidente quando se detectou o efeito de isolao em arranjos
feitos com resultados obtidos a partir de probabilidades equivalentes. Para facilitar a
escolha, com frequncia as pessoas deixavam de separar adequadamente os componentes
semelhantes e distintos, nas situaes propostas. Em decises que tinham de ser tomadas
em duas etapas sucessivas, como no seguinte exemplo (figura 1), onde havia a
possibilidade de nada ganhar imediatamente e 25% de passar ao segundo estgio, no qual
teria de escolher entre $4.000, com 80% de chance, ou obter $3.000 de uma vez, nas
escolhas feitas antes do jogo comear, 78% preferiram a ltima opo - dois porcento a
menos do que na Loteria III. Entretanto, quando defrontados com outra perspectiva, de
ganhar $4.000 com 20% de probabilidade ou $3.000 com 25% (Loteria VI - figura 2), a
primeira alternativa era selecionada por 65% dos entrevistados, apesar desta ser
equivalente a primeira alternativa da situao anterior (Loteria V), j que 1/4 de 80% seria a
taxa de 20% associada aos $4.000 daquela. De fato, os participantes interpretaram o jogo
de dois estgios, como o da Figura 1, na perspectiva da formulao padro da Loteria III e
no a da Figura 2, devido o enfoque isolado da deciso tomada no segundo estgio da
Loteria V (7).

As deliberaes feitas em mais de uma etapa levam em conta a correspondncia entre
as projees sem risco e a arriscada, a despeito da mudana objetiva das respectivas
probabilidades ou resultados, tendo em vista todo caminho a ser percorrido. Ou seja, a
sequncia de sorteios em estgio permitiria, na viso dos envolvidos, descartar as perdas
dos valores oferecidos antes, em uma nica perspectiva a partir do seu ponto de deciso,
como na formulao sequencial da figura 1, ao invs de duas situaes isoladas da figura 2,
na qual os resultados estavam vinculados a probabilidades de ganho, separadamente.

Tal modo de compreenso viola a hiptese de que a seleo de loterias deveria ser
determinada pela probabilidade final dos resultados, recando a escolha sempre pelo maior
ganho provvel. O isolamento das projees indicou que a certeza contingente de ganhos
fixos atrai as pessoas para este resultado, mesmo depois de uma sequncia de movimentos
na qual a sorte interviu, ao contrrio do que acontece em loterias com opes separadas,
mas com chances idnticas a de outro quadro que tenha sido posto frente do agente,
embora em moldura diferente.
Na Teoria das Perspectivas (Prospect Theory) que desenvolveram para explicar a
maneira pela qual os indivduos deliberam sob risco, Kahneman e Tversky atriburam muitas
das anomalias detectadas fase de "edio" das perspectivas, quando muitas operaes
que transformam os resultados e probabilidades so feitas - a saber: ordenao (coding)
dos ganhos e perdas; combinao das probabilidades de resultados idnticos reduzida a
uma s probabilidade; separao dos componentes sem risco dos incertos e cancelamento
dos elementos comuns de uma mesma oferta, em loterias com mais de um movimento.
Tudo em funo das projees oferecidas. Neste instante, as ofertas so editadas de
diversas maneiras, segundo o contexto em que surgem. Assim, pequenas diferenas so
eliminadas e componentes comuns cancelados por simplificaes, provocando as
inconsistncias observadas depois. Ganhos com probabilidades extremamente baixas so
descartados, amide, na fase de edio, enquanto as chances muito altas tornam os
resultados "certos".
Por outro lado, em um fenmeno atribudo a uma funo de pesagem (weighting
function), as pessoas preferem loterias que ofeream altos valores com baixa probabilidade
de ganhos, ao invs de valores pequenos e certos, como em $5.000 com 0,1% de chance,
em lugar de $5 garantidos. Embora, aceitem pagar estes mesmo $5 a se arriscarem ao
prejuzo de $5.000 com 0,1% de probabilidade. Alm disso, a diferena entre pequenos
montantes parece maior do que aquela variao de valores entre quantias maiores, como o
incremento que notado facilmente na passagem de 100 para 200 e quase ignorado na
subida de 1100 para 1200 (8).

Essas distores oriundas da fase de edio levam a simplificaes que so
orientadas pelo princpio de escolha da perspectiva de valor superior. Ao mostrar isso, a
Teoria das Perspectivas passou a ser considerada a tentativa mais precisa de descrever o
comportamento de agentes racionais em cenrios de risco ou incerteza. Pde-se, ento,
saber o porque das mudanas das preferncias pessoais nessas circunstncias precrias.
Notou-se tambm que a experincia prvia de cada um para situaes semelhantes
influenciam fortemente o momento de tomada de deciso. Pequenas mudanas na forma de
apresentao das alternativas perturbam as escolhas, ainda que os resultados finais se
mantenham os mesmos. A condio psicolgica dos agentes racionais, portanto, pde ser
incorporada pela Teoria dos Jogos como um de seus elementos cruciais, agora que seus
conceitos assumiam carter formal de trato matemtico. A probabilidade subjetiva e a
cardinalidade das preferncias voltavam a merecer uma maior ateno por parte dos
economistas e matemticos, no instante de projetar os modelos de jogos que se seguiram a
essas descobertas.
A Interpretao Cardinal de Harsanyi
A falta de consistncia das preferncias, empiricamente observadas, abalavam no s
o aspecto preditivo do modelo de racionalidade econmica, mas descartavam a
possibilidade da teoria ser considerada com algum valor normativo. Sobre esse ponto, John
Harsanyi argumentou que, em algumas condies motivacionais especficas, era possvel
defender a validade normativa da teoria da utilidade de Von Neumann e Morgenstern.
Ningum duvida da validade normativa da aritmtica, apesar da maioria das crianas
no poder resolver problemas aritmticos de qualquer complexidade sem treino especial
(HARSANYI, J.C. "Normative Validity and Meaning of von Neumann-Morgenstern Utilities",
p. 307).
Assim, o problema principal para sustentao da normatividade da funes de utilidade
assentava na necessidade dos agentes racionais passarem a tomar atitudes orientadas
adequadamente pelo resultado, ao invs de aterem-se exclusivamente utilidade do
processo. Nesta tica, as escolhas devem ser feitas com base apenas na avaliao da
possibilidade dos vrios resultados disponveis. Todo nervosismo do envolvimento com uma
atmosfera estimulante de aposta, bem como outras experincias psicolgicas deste tipo, por
outro lado, deveriam ser deixados fora do processo de deliberao. No entendimento de
Harsanyi, as atitudes orientadas pelo resultado devem ser guiadas somente por suas
utilidades resultantes que so assinaladas a cada loteria e por suas respectivas
probabilidades (9).
Deste modo, os axiomas da teoria que garantiriam a monotonicidade (a loteria
preferida ser aquela que for a de maior ou igual probabilidade de fornecer a alternativa
preferida) e a indiferena entre probabilidades equivalentes poderiam preencher os
requisitos da racionalidade normativa, embora no fossem adequados para pessoas
orientadas pela utilidade do processo (10). Nos termos de Harsanyi, pessoas orientadas
pelo processo assumem uma atitude intrnseca de gostar ou no gostar da situao da
aposta, dependendo da utilidade positiva ou negativa a ela associada, enquanto pessoas
orientadas pelo resultado tm uma atitude instrumental em relao s probabilidades
subjetivas vinculadas aos vrios possveis resultados, segundo o gosto pelos vrios ganhos
disponveis (11).

Para poder lidar com esses casos, preciso agora que a funo de utilidade seja
entendida como uma funo cardinal e no s ordinal. Isto porque, a cardinalidade permitiria
a comparao no s do nvel de utilidade entre os indivduos, mas tambm a utilidade de
diferenas entre loterias para o prprio agente, o que facilitaria a observao das
intensidades ou importncias atribudas por cada um a tais sorteios. Formalmente, algum
que prefira, por exemplo, A > B e C > D, quando defrontado s seguintes loterias:
L
1
= (A, 1/2; D, 1/2)
ou
L
2
= (B, 1/2; C, 1/2)
...preferir a L
1
com mais intensidade do que L
2
, caso prefira L'
2
= (A, 1/2; C, 1/2) mais
do que L''
2
= (B, 1/2; D, 1/2), indicando a intensidade e importncia dada pelo agente
relao A > B, quanto maior for a diferena entre A e B em comparao existente entre C
> D. Em outras palavras, qualquer loteria que "A" estivesse em jogo seria prefervel sobre
aquelas outras possveis em que estivesse ausente. Assim, a utilidade cardinal aferida
poderia conduzir, daqui utilidade dos resultados de quem adotasse corretamente uma
atitude instrumental frente aos riscos, na observao adequada dos valores em jogo,
enquanto que a atitude intrnseca limitaria o alcance das escolhas das pessoas que
gostassem ou no de apostas.
Dessa forma, Harsanyi chamou ateno para o fato de incluir uma interpretao
cardinal dos pagamentos nas anlises das escolhas sob incerteza, ao invs de uma
concentrao exclusiva com a relao ordinal dos ganhos.

A despeito de economistas e matemticos rigorosos atacarem a cardinalidade,
influenciando at mesmo a base teorica empregada pelo filsofo canadense David Gauthier
que em Morals by Agreement (Moral por Acordos, 1986) se ateve apenas concepo
ordinal dos ganhos e das preferncias. A importncia de observar os ganhos cardinais est
na possibilidade de se estabelecer estratgias mistas apoiadas em valores contnuos de
intensidade que podem variar em grau numa escala intervalar de resultados. O que no
vivel quando se toma s a ordem de valores e a posio dos resultados numa escala de
preferncias que no leva em conta o peso de cada preferncia, mas apenas que uma
prefervel a outra em um elenco ordenado de resultados, no importando o quo um valor
mais preferido do que outro (12).

A Irracionalidade Humana e a Racionalidade Fora da Espcie
Uma postura pela interpretao normativa da racionalidade da teoria da utilidade, como
a proposta por Harsanyi, deixa de lado crticas que poderiam ser feitas quanto ao carter
descritivo da teoria, pouco precisa ou incua para seres vivos, que nem sempre agem de
modo racional ou sequer possuem um aparato cognitivo desenvolvido para a realizao
desses clculos todos. Quem defende o valor normativo do modelo de jogos argumenta que,
embora os primeiros ancestrais humanos no tenham desenvolvido uma habilidade
especfica para realizao rpida dos clculos exigidos para adoo dos seus efetivos
interesses informados, posto que nunca teriam se defrontado com problemas que exigissem
um mtodo eficiente de escolha instintiva, nas condies atuais da complicada vida em
sociedade, sugere Harsanyi que o treinamento no uso de modelos matemticos poderia
"esclarecer substantivamente muitos problemas da tica" (13).

Certo que a formalizao matemtica implica numa capacidade racional que excede
a da maioria dos seres humanos, mesmo depois de solucionado o ltimo Teorema de
Fermat. Entretanto, isso no impede que organismos dos mais simples pudessem ser
interpretados como "agentes" dotados de aptido reativa suficiente para poderem seguir as
estratgias analisadas pela Teoria dos Jogos. Claro que para os casos dos seres no
humanos o conceito de racionalidade empregado sofreu profunda transformao, a ponto de
permitir a concepo de uma racionalidade mnima e intencionalidade capaz de incluir at
bactrias e vrus (14).
Para a Teoria dos Jogos, um jogador considerado racional se
est motivado a maximizar seu prprio ganho, ou seja sua utilidade,
sendo ainda hbil para calcular os resultados estocsticos
(probabilsticos) de cada ao. Quando bilogos evolucionistas
contemporneos passam a utilizar modelos retirados desta teoria, no
intuito de explicar o comportamento de determinadas espcies, esto
interpretando essa racionalidade instrumental, agora, como uma
capacidade de reunir informao e reagir em conformidade a esta. Ou
seja, uma habilidade computacional do trato da comunicao que
pode ocorrer mesmo no processamento de informao realizado por
seres vivos atravs de reao de meras substncias qumicas.
Pombos, falces, bactrias ou vrus presentes em modelos virtuais ou
em experimentos reais de laboratrios esto aptos a tomarem parte
de um Dilema dos Prisioneiros Iterado, que se repete por vrias vezes, graas a sua
capacidade computacional de trabalhar as informaes de entrada e reagirem com uma
resposta adequada (15).
Muitos bilogos, depois de John Maynard Smith ter estabelecido uma "teoria dos jogos
dinmicos evolucionrios" (o marco o livro Evolution and the Theory of Games de 1982),
passaram a aplicar os novos recursos de anlise matemtica em pesquisas sobre
linguagem, justia (fairness) e direito de propriedade que at ento ficavam restritos
especulao filosfica em suas diversas sub-reas. Pela teoria dos jogos evolucionrios, as
escolhas das aes seriam determinadas no pelo agente racional clssico, mas por
estratgias especficas, cujo sucesso implicava no nmero maior de descendentes na futura
gerao. A partir desta concepo, uma estratgia evolutivamente estvel (EEE, ou ESS, do
ingls evolutionarily stable strategy) poderia gerar condies de equilbrio nos casos em que
o indivduo portador dessa estratgia no conseguiria incrementar sua capacidade
reprodutiva, caso pudesse a trocar por outra estratgia ou nenhum mutante portador de
estratgia rival diferente fosse capaz de invadir a populao estabelecida, onde a primeira
estratgia prevalecesse (16).
Para uma estratgia ser considerada EEE, deve atender a duas condies quanto ao
equilbrio: seus resultados devem ser equivalentes aos pontos de equilbrios estritos - ou
seja, so as melhores respostas obtidas atravs de estratgias puras - e, por outra, a
condio de estabilidade tambm deve ser satisfeita, isto , as diferentes respostas s
melhores estratgias dos outros so correspondentes as melhores respostas do agente
(17). Por conseguinte, estendida a um grupo vivente, de acordo com Richard Dawkins, uma
EEE a estratgia inata adotada pela maioria da populao que no pode ser superada por
uma outra estratgia invasora (18). Da perspectiva evolutiva, no h necessidade de se
considerar tais estratgias conscientes, basta as compreender como "programas de
comportamento inconscientes estabelecidos pelos genes" (19). Uma concepo assim pode
abranger desde o vrus Influenza e bactrias Escherichia coli at os seres humanos (Homo
sapiens sapiens).
Desse modo, o sucesso da Teoria dos Jogos Evolucionrios permitiu explicar o
comportamento de insetos e vertebrados, sem apelar para uma hiptese de racionalidade
forte, cujos testes de campo abalavam a tradicional teoria esttica dos jogos. A partir do
instrumental estruturado na teoria dos jogos original, a biologia evolutiva conseguiu analisar
e prever as escolhas feitas por humanos dotados tambm desse tipo de racionalidade fraca
que busca em primeiro lugar garantir a sobrevivncia dos indivduos e promover sua
reproduo nas geraes futuras. As diferenas entre as espcies poderiam, a partir de
ento, ser discriminadas tendo em vista a diferenciao de estratgias adotadas por cada
grupo de genes que compem determinado organismo, variando desde os maximizadores
irrestritos aos "altrustas" maximizadores restritos.
Maximizador Local e o Global
Durante os dois milnios e meio que constituem a histria da filosofia, os filsofos se
ocuparam em definir os seres humanos como seres racionais, divergindo aqui e ali sobre o
grau e a categoria de raciocnio que este ente poderia exercer. Mas todos estavam de
acordo que a racionalidade era algo que distinguia a espcie humana dos outros animais.
Com a teoria dos jogos evolucionrios essa distino cai por terra, restando apenas o
refinamento das estratgias como diferenciao entre agentes maximizadores irrestritos
"egostas" e aqueles capazes de restringir suas aes imediatas em funo de um ganho
maior no futuro. A irracionalidade humana passa a ser considerada um componente real a
ser considerado, como nos outros seres vivos, que torna todos passveis de erros sem que
as fronteiras das espcies sejam uma barreira natural a definir quem quem
cognitivamente. Trata-se afinal de genes que disputam o direito de continuarem existindo e
se replicando por maior perodo de tempo possvel, abordo de "mquinas vivas".
E para isso, fazem uso dos mais diversos tipos de estratgias.
Estratgias rotuladas como do "trapaceiro" ou do "rancoroso" - nos termos utilizados
por Dawkins em O Gene Egosta (1976) - podem alcanar estabilidade em meio a uma
populao de seres que usem a estratgia do "tolo". Imagine, como Dawkins fez, que os
trapaceiros - seres que no cooperam nunca - invadam uma populao tola, que coopera
sempre, incondicionalmente. Qualquer que seja a quantidade de trapaceiros, desde que seja
maior que um, ir prosperar e se multiplicar, explorando o trabalho dos tolos, at a exausto
destes, sem nada oferecer em troca. Tal estratgia ser considerada evolucionariamente
estavel ainda que leve a populao de tolos extino, embora, em um territrio restrito, a
morte do ltimo tolo venha eliminar o prprio sustento dos trapaceiros, quando estes
dominarem todo lugar, impedindo que outros seres portadores de outras estratgias entrem
em cena.
Motivo pelo qual se considera a estratgia do trapaceiro imune invaso.
Diferente dos tolos, a estratgia "rancorosa", apesar de cooperar sempre que a outra
parte coopera, capaz de retaliar o adversrio, caso este no retribua com um ato de
cooperao, desertando. Em meio aos tolos, os rancorosos prosperam tanto como estes em
razo da cooperao mtua entre eles, passando mesmo despercebidos por um observador
externo. Contudo, ao contrrio dos tolos, os rancorosos so robustos o suficiente para
repelirem a invaso de trapaceiros, posto que reagem contra a desero destes, impedindo
que proliferem em seu meio. Num ambiente em que convivam as trs estratgias citadas, os
rancorosos conseguiro manter-se em nmero razovel, enquanto os trapaceiros levam os
tolos extino.
Apesar da baixa na quantidade inicial de indivduos, em funo da explorao inicial
sofrida, os rancorosos continuariam multiplicando-se, graas a cooperao mantida entre
eles. No instante em que sobressaissem to somente trapaceiros e rancorosos, os primeiros
passam a conhecer a decadncia e o gosto amargo da ingratido, ao passo que os
segundos comeam a recuperar suas perdas colaborando entre si e discriminando os
trapaceiros. Deixados a sua prpria sorte, os trapaceiros lutaro uns contra os outros at a
morte ou, se possvel, fugiro do local, que passa a ser dominado, afinal, pelos rancorosos
(20).
Pela teoria dos jogos evolucionrios, a caracterizao do agente racional independe de
sua configurao fsica ou ontolgica. O que est em jogo entre os seres vivos, racionais ou
no, a capacidade de seguir uma regra, por em prtica uma determinada estratgia que
pode ter sido herdada ou adquirida pela experincia. Esta noo de agncia aproxima-se
muito da concepo dennettiana de postura intencional para "sistemas que modulam
informaes e buscam objetivos" (21). Quanto mais simples esses sistemas, mais prximos
das macromolculas orgnicas aptas auto-replicao. Aumentando o grau de organizao
e complexidade, maiores so as chances desses sistemas intencionais poderem escolher
adequadamente as melhores alternativas disponveis.
Seres humanos, portanto, devido ao seu alto grau de complexidade orgnica,
diferenciam-se de outros viventes por sua capacidade de antever acontecimentos futuros,
com maior nitidez, ao invs de estarem presos apenas aos fenmenos presentes. Na
definio conveniente do socilogo noruegus Jon Elster, humanos podem ser considerados
como mquinas maximizadoras globais prontas a usarem estratgias indiretas. Em outras
palavras, so capazes de esperar por um momento mais favorvel, no futuro, para tomarem
decises corretas, ao invs de optarem imediatamente por um resultado vantajoso
momentneo. Ao contrrio das mquinas maximizadoras locais - os demais seres vivos -, os
humanos no teriam de esperar por uma mutao gentica aleatria para trocar de
estratgia.
Poderia perfeitamente escolher entre um elenco variado de linhas de ao cultivadas
por grupos sociais diversos no seio da espcie e armazenada em sua memria histrica,
alm de contar com aquelas embarcadas no seu cdigo gentico ao longo da evoluo. Por
conseguinte, uma caracterstica marcante da "racionalidade" humana est no trato
estratgico do cenrio em que se encontra, povoado por seres semelhantes que tambm
podem reagir em funo da avaliao das expectativas de ao dos demais atores
relevantes, tambm dotados de conhecimento comum. Ao passo que um comportamento
tipicamente paramtrico - como das outras espcies - adotaria a postura do indivduo como
sendo um nico agente apto a variar seu comportamento em um meio constante que, como
tal, serve de parmetro fixo para suas aes (22).
A teoria dos jogos evolucionrios chamou ateno para alguns aspectos vitais da
caracterizao dos agentes racionais.
Ao lado da teoria psicolgica das perspectivas, desenvolvida por Kahneman e Tversky,
traa um panorama realista da condio humana, ignorado historicamente pelos filsofos e
economistas. Juntas, essas teorias alertaram, sobretudo, para o fato de que humanos, como
qualquer ser vivo, esto irremediavelmente vinculados aos princpios biolgicos
fundamentais de sobrevivncia e reproduo. Alm disso, sustentou como vlida a postura
terica de um individualismo metodolgico que deve partir de suposies egostas, devido
s limitaes biolgicas e restries de recursos naturais, para s depois explicar o
comportamento "altrusta" e a cooperao em grupos sociais.
Por conta disso, a unio entre Biologia Evolutiva e o modelo de jogos trouxe um maior
poder descritivo teoria dos jogos original. O continente, antes habitado apenas por
inmeras variantes de Robison Cruso, tornou-se mais rico em diversidade de agentes
racionais. O sentido de racionalidade ganhou, ento uma verso mais precisa ao detectar as
imperfeies psicolgicas, cognitivas e morais dos sistemas intencionais. E a importncia da
aprendizagem ficou ainda mais clara para a espcie humana.
Notas
1. Veja HOLLIS, M. Trust Within Reason, cap. 8, p. 162 e MACINTYRE, A. C.Dependent
Rational Animals, cap. 9, pp. 114-118.
2. Veja BLACKBURN, S. Ruling Passions, cap. 6, pp. 161-198.
3. Veja HABERMAS, J. "Concepes de Modernidade", in Constelao Ps-Nacional, p.
195.
4. Veja SAMUELSON, P. A. Fundamentos da Anlise Econmica, p. 156.
5. Veja KAHNEMAN, D. & TVERSKY. A. "Prospect Theory", pp. 265 e 266.
6. Veja KAHNEMAN, D. & TVERSKY. A. Op. cit., pp. 268 e 269.
7. Veja KAHNEMAN, D. & TVERSKY. A. Idem, pp. 271 e 272.
8. Veja KAHNEMAN, D. & TVERSKY. A. Ibdem, pp. 274 e 281.
9. Veja HARSANYI, J. C. "Normative Validity and Meaning of von Neumann-Morgenstern
Utilities", p. 312.
10. Veja HARSANYI, J. C. Op.cit., idem.
11. Veja HARSANYI, J. C. Idem, p. 314.
12. Um exemplo de arbitragem - jogos com trs jogadores, sendo o terceiro um mediador
que no recebe nenhum ganho - adaptado de RAIFFA, H. El Arte y la Ciencia de la
Negociacin, III parte, cap. XVI, p. 240-242 esclarece como o peso que os indivduos
atribuem aos mesmos ganhos pode variar de intensidade entre eles. A negociao da
diviso de $100 entre ricos e pobres revela o poder de barganha que permite ao mais
poderoso arriscar mais do que o fraco na implementao de uma estratgia mista. A
averso ao risco conduz uma pessoa carente de bens primrios a aceitar valores menores
do que a mdia razovel de $50, quando se defrontam com um sorteio com a probabilidade
de 0,5 de ganhar os $100 ou nada. Nestas circunstncias, o pobre poderia contentar-se em
receber $20 seguros, enquanto o rico arriscar-se-ia, possivelmente, loteria, abrindo mo
de $80 certos. Do ponto de vista de um mediador imparcial que fosse responsvel pela
diviso do prmio entre os dois jogadores, seria injustificvel racionalmente proceder a uma
distribuio diferente de $50 para cada um, embora o ganho cardinal deste seja diferente
individualmente. Isto , para o pobre, metade de util, o que corresponderia na soluo sem
arbitragem ao ganho de $20. J para o rico seria o mesmo que $80, devido intensidade do
desejo de possuir o bem em disputa. O pobre precisa mais do dinheiro, e por isso qualquer
quantia seria bem vinda, mas o rico, que j tem muito, pode se dar ao luxo de arriscar a
ganhar mais, sem comprometer sua psicologia.
13. HARSANYI, J. C. "Game and Decision Theoretic Models in Ethics", p. 671.
14. Neste sentido, muito contribuiu o trabalho do filsofo Daniel C. Dennett com textos sobre
conscincia que foram lanados a partir de Brainstorms (1978) e que culminam com Tipos
de Mentes (1996).
15. Veja LEWIN, R. Complexidade, cap. 7, pp. 167-169.
16. Veja ROSS, D. "Game Theory", 6.
17. Veja HAMMERSTEIN, P. & SELTEN, R. "Game Theory and Evolutionary Biology", pp.
939-940.
18. Veja DAWKINS, R. O Gene Egosta, cap. 5, p. 94.
19. DAWKINS, R. Op. cit., cap. 10, p. 206.
20. Para os detalhes dessa bela fbula, veja DAWKINS, R. Idem, idem, pp. 206-208.
21. DENNETT, D. C. Tipos de Mentes, cap.1, p.31.
22. ELSTER, J. Ulises y las Sirenas, I, . 3 e 4, pp. 23-40.
Antes: Estratgias Dominantes,
Maximin, Mistas e Noo de Equilbrio
A seguir: Das Teorias da
Comunicao aos Jogos

Teoria Dos Jogos

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Teoria Dos Jogos

Hochgeladen von

Copyright:

Verfügbare Formate

TEORIA DOS JOGOS E DA COOPERAO PARA FILSOFOS

Das könnte Ihnen auch gefallen