Sie sind auf Seite 1von 38

Teoria dos Jogos grad (parte II)

Prof. Sergio Aquino

Na aula anterior discutimos como identificar uma situao de interao estratgica e como formaliz-la em um modelo da Teoria dos Jogos. Nessa aula vamos discutir as possveis formas de solues de jogos simultneos.

Veremos situaes em que poderemos aplicar o importante conceito de equilbrio de Nash, assim como jogos estritamente competitivos e estratgias mistas.

Tpico 1 - Eliminao de Estratgias Estritamente Dominadas

Este um mtodo simples para determinar o resultado de um jogo onde os agentes tomam suas decises de forma simultnea ou sem saber a deciso tomada pelo outro (jogos simultneos).

Considere o exemplo abaixo com dois jogadores, onde o Jogador 1 tem duas opes de aes (A ou B), e o Jogador 2 tem trs opes (C,
D ou E). Qual ser o resultado deste jogo?
Jogador 2 Jogador 1 C D E

A B

2,2 1,3

1,5 0,1

-1 , 3 1 , -2

A estratgia E para o Jogador 2 estritamente dominada em relao a estratgia D. O que isso significa? Para qualquer escolha do Jogador 1 (A ou B), a opo D (para o Jogador 2) gera sempre maiores recompensas que a opo E. Se o Jogador 1 escolher A, a recompensa para o Jogador 2 na escolha de D ser de 5 que maior que 3, que seria a recompensa no caso da escolha E. E se o Jogador 1 escolher B, a recompensa para o Jogador 2 na escolha de D ser de 1 que maior que -2, que seria sua recompensa no caso da escolha E. Portanto, para qualquer ao do outro jogador (Jogador 1), a opo por E vai ser sempre dominada em relao a escolha D para o Jogador 2.
6

Estratgia E dominada em relao a D do ponto de vista do jogador 2


5 maior que 3

1 maior que -2

Portanto, elimine a estratgia E para o jogador 2 o que reduz o tamanho do jogo e suas opes como mostrado abaixo;
Jogador 2 Jogador 1 C D

2 maior que 1

2,2
1 maior que 0

1,5

1,3

0,1

Note que, no jogo reduzido, a estratgia B estritamente dominada em relao opo A do ponto de vista do jogador 1
8

Portanto, elimine a estratgia B para o jogador 1. Assim jogo reduzido pode ser assim representado:
Jogador 2 Jogador 1 C D

2,2

1,5

2 menor que 5

Note que, no jogo reduzido, a estratgia C estritamente dominada em relao opo D do ponto de vista do jogador 2
9

Assim, C eliminada, gerando o seguinte jogo reduzido


Jogador 2 Jogador 1 D

1,5

Como a matriz de payoff possui apenas uma entrada, as estratgias remanescentes Jogador 2 joga A e jogador 2 joga D constitui o equilbrio do jogo, ou resultado do jogo. Trata-se do equilbrio em estratgias estritamente dominadas.

10

Uma vez que, nem todos os jogos apresentam estratgias estritamente dominadas, no possvel estabelecer um equilbrio com base em estratgias estritamente dominantes.

11

Portanto, em algumas situaes, exige-se um mtodo mais abrangente do que o mtodo de eliminao de estratgias estritamente dominadas para se estabelecer o melhor desfecho para o jogo. Este conceito chamado equilbrio de Nash que o tema do prximo Tpico desta Aula.

12

Tpico 2 - Equilbrio de Nash


Conceito: Na combinao de estratgias que constitui equilbrio de Nash, nenhum jogador tem incentivo para mudar de estratgia, de forma que a situao estvel.

13

Considere o seguinte jogo:


jogador B jogador A Esquerda Direita

Alto

2,3

0,1

Baixo

1,1

3,0

14

A opo alto/esquerda corresponde a um equilbrio de Nash, pois o jogador A no tem incentivo a mudar de estratgia (de alto para baixo, o que corresponde a trocar 2 por 1) e nem o jogador B quer trocar esquerda por direita (o que corresponde a trocar 3 por 1), quando fixamos as respostas dos outros jogadores.

15

A escolha conjunta baixo/esquerda no um equilbrio de Nash pois se dssemos a opo o Jogador A trocar sua opo a partir deste ponto (ou seja se o Jogador B continuar escolhendo esquerda) ele o faria pois teria uma recompensa maior (2 em vez de 1). Da mesma forma, o Jogador B mudaria de opo se escolha comeasse a partir da deciso conjunta esquerda/direita.

16

Passos para encontrar o equilbrio de Nash:

Indicar a estratgia que resulta na maior recompensa para o jogador que est situado nas linhas, para cada uma das estratgias escolhidas pelo jogador que se encontra nas colunas. Podemos fazer isso colocando a letra l no lado da recompensa, bem como, sublinhando ou circulando a recompensa obtida pelo jogador da linha.

17

Indicar a estratgia que resulta na maior recompensa para o jogador que est situado nas colunas, para cada uma das estratgias escolhidas pelo jogador que se encontra nas linhas. Podemos fazer isso colocando a letra c no lado da recompensa, bem como, sublinhando ou circulando a recompensa obtida pelo jogador da coluna.

18

Aps aplicarmos o mtodo de assinalar a melhor resposta do jogador nas linhas para cada estratgia do jogador nas colunas, bem como, assinalar a melhor resposta do jogador nas colunas para cada estratgia do jogador nas linhas, sempre que uma combinao de estratgias estiver assinalada simultaneamente, essa combinao de estratgias ser um Equilbrio de Nash.

19

Aplicao do mtodo

Vejamos agora se existe um equilbrio de Nash no jogo do comrcio internacional. Suponha dois pases, A e B, ambos exportando produtos agropecurios um para o outro. Tanto o pas A quanto o pas B tm apenas duas opes para tributar suas importaes: ou adotam tarifas baixas (5% sobre o valor do produto importado), ou adotam tarifas elevadas (40% sobre o valor do produto importado).

20

A forma estratgica da figura abaixo ilustra as recompensas de cada pas de acordo com as tarifas escolhidas, recompensas essas que podem ser entendidas como os ganhos ou perdas dos produtores A e B, em milhares de dlares:
Pas B Pas A Tarifa alta Tarifa baixa

Tarifa alta

800 , 800

2.300 , -700

Tarifa baixa

-700 , 2.300

1.700 , 1.700

21

Seguindo os passos anteriores podemos encontrar o equilbrio de Nash desse jogo, ou seja, - Assinalar (l) para a melhor resposta do jogador que se encontra na linha (Pas A) para cada escolha do jogador que se encontra na coluna (Pas B); - Assinalar (c) para a melhor resposta do jogador que se encontra na coluna (Pas B) para cada escolha do jogador que se encontra na linha (Pas A).

22

Assim,
Pas B Pas A Tarifa alta Tarifa baixa

Tarifa alta

(l)800 , 800(c)

(l)2.300 , -700

Tarifa baixa

-700 , 2.300(c)

1.700 , 1.700

Usando esse artifcio teremos um equilbrio de Nash sempre que na mesma clula houver um (c) e um (l). Esse resultado o mesmo obtido com a eliminao de estratgias estritamente dominadas (Tarifa alta, Tarifa alta). Mais especificamente, trata-se de um equilbrio de Nash
23

Caso em que existe mais do que um equilbrio de Nash

Pode acontecer que haja mais do que um equilbrio de Nash. O jogo a seguir representa uma situao de interao estratgica em que um fabricante de programas (Empresa X) tem de decidir se desenvolve ou no uma nova ferramenta em seu sistema operacional, e uma empresa que produz software antivrus (Empresa Y) tem de decidir, simultaneamente, se atualiza seu software para a nova ferramenta a ser introduzida no sistema operacional.

24

Suponha que um casal est decidindo onde ir se encontrar e qual ser o programa que faro para passar a noite. Ambos valorizam mais do que qualquer outra coisa passar juntos a noite, mas Ele (um jogador) prefere ir ao futebol a ir ao show de msica popular que acontece ao mesmo tempo da partida, enquanto Ela (outro jogador) prefere ir ao show de msica. O problema que ambos tm de tentar se encontrar em um desses eventos, sem poderem se comunicar.

25

A forma estratgica dessa interao dada na tabela a seguir.


ELA Fut Show Fut 1 ,2 -1,-1 ELE Show -1,-1 2,1

26

Supondo agora que o jogo seqencial como mostra a figura a seguir. Ou seja, Ela escolhe primeiro, e depois Ele decide o que fazer. Neste caso, qual seria o(s) equilbrio(s) de Nash? Explique.

27

28

Empresa Y Empresa X

Atualizar

No atualizar

Desenvolver

2,1

-1,-2

No desenvolver

0,-1

1,2

Assim, temos um equilbrio de Nash na combinao de estratgias (Desenvolver, Atualizar) e outro na combinao (No Desenvolver, No Atualizar).
29

30

Tpico 3 - Dilema dos Prisioneiros

Um resultado interessante da teoria dos jogos consiste em que a rivalidade pode levar a resultado final ineficiente (uma situao ruim para ambos os jogadores). O jogo que se costuma apresentar para mostrar esse resultado conhecido pelo nome de Dilema dos Prisioneiros.

31

O Dilema dos Prisioneiros clssico funciona da seguinte forma: dois suspeitos, A e B, so presos pela polcia. A polcia tem provas insuficientes para conden-los, mas, separando os prisioneiros, oferece a ambos o mesmo acordo: se um dos prisioneiros testemunhar contra o outro e o outro permanecer em silncio, o que colaborar sai livre e o cmplice silencioso cumpre 9 anos de sentena. Se ambos ficarem em silncio, a polcia s pode conden-los a 1 ano de cadeia cada um. Se ambos se acusarem um ao outro, cada um ser condenado a 6 anos de cadeia
32

Matriz do jogo
2 1 confessa no confessa

confessa

-6,-6

0,-9

no confessa

-9,0

-1,-1

33

Que jogadas provavelmente ocorrero neste jogo? Se 1 jogar no confessa ento a melhor resposta de 2 confessar. Se 1 jogar confessar ento a melhor resposta de 2 confessar. No importa o que 1 escolha: a melhor resposta de 2 ser sempre confessar. Confessar a estratgia dominante para 2. Similarmente, no importa o que 2 escolha: a melhor resposta de 1 ser sempre confessar. Confessar a estratgia dominante para 1 tambm. Ento o nico equilbrio de Nash para este jogo (confessa, confessa), muito embora (no confessa, no confessa) traga melhores recompensas para os dois jogadores. O nico equilbrio de Nash ineficiente (ruim).

34

Dado que nenhum deles pode ter a certeza da cooperao do outro, o resultado final ser que ambos iro optar por denunciar o colega. Assim, desconfiana mtua faz com que ambos acabem em uma situao ruim (ambos confessam) quando poderiam, se cooperassem, atingir situao melhor para os dois caso no confessassem.

35

O dilema dos prisioneiros se aplica a uma grande quantidade de fenmenos econmicos e polticos. Vejamos, por exemplo, o problema do controle de armamentos.

36

Interpretemos a estratgia confessa como instalar um novo mssil e a estratgia no confessa como no instalar. Observe que os ganhos so razoveis. Se meu oponente instalar seu mssil, eu certamente vou querer instalar o meu, embora a melhor estratgia para ambos seja entrar em acordo e no instal-los. Mas se no houver meio de chegar a um acordo, cada um termina por instalar seu mssil, e ambos pioram.

37

Outro bom exemplo o problema da burla no cartel, ou seja, duas empresas que fazem um acordo para produzir uma determinada quantidade de produto, porm o no cumprimento do acordo pode ser interessante. Para entender como isso acontece, agora interprete confessa como produzir mais do que sua quota e interprete no confessa como manter a quota original. Se voc acha que a outra empresa manter a quota dela, valer a pena voc produzir alm de sua prpria quota. E se voc acha que a outra empresa ir produzir mais que a quota dela, ento voc tambm pode exceder a sua! Essa dificuldade que as empresas enfrentam para se articular em um cartel , todavia, desejvel do ponto de vista da sociedade, pois a soluo do cartel ineficiente.

38

Das könnte Ihnen auch gefallen