Sie sind auf Seite 1von 38

Beispiele für Matrixspiele

Gefangenen-Dilemma

C

i = 2

D

i =

1

C

D

-1, -1

-100, 0

0, -100

C i = 2 D i = 1 C D -1, -1 -100, 0 0, -100

-20, -20

Spieltheorie I Manfred Nermuth Sommersemester 2004

D-Strategie dominiert

Es wäre irrational nicht zu gestehen (C), da D immer besser ist,

aber D ist Pareto-ineffizient individuell rationales Verhalten

muss nicht zu Pareto-Effizienz führen (gegen 1. Hauptsatz der

Wohlfahrtstheorie)

Chicken Game

i = 2

C D C 2, 4 3, 3 i = 1 D 1, 1 4, 2
C D
C 2, 4
3, 3
i = 1
D 1, 1
4, 2
Matching Pennies

keine Strategie dominiert, einmal C besser einmal D besser

i = 2 T top T B B bottom T 1, -1 -1, 1 i
i = 2
T
top
T B
B
bottom
T
1, -1
-1, 1
i = 1
B
-1, 1
1, -1
kein Gleichgewicht : wenn andere weiß, was ich tue, verliere ich
nur durch zufällige Wahl Gewinnmöglichkeit
Battle of the Sexes

sie

K B K 1, -1 -1, 1 er B -1, 1 1, -1 Beispiele für
K B
K
1, -1
-1, 1
er
B
-1, 1
1, -1
Beispiele für Differentialspiele

Lady in the Lake

1 1, -1 Beispiele für Differentialspiele Lady in the Lake Homicidal Chauffeur keine theoretische Möglichkeit ohne

Homicidal Chauffeur

keine theoretische Möglichkeit ohne weitere Informationen den

Ausgang zu bestimmen

um zu entkommen muss sie in einer Spirale gegen das Ufer

schwimmen und ab einem bestimmten Punkt gerade.

man muss im richtigen Augenblick zur Seite hüpfen. Das Auto kann

Punkt gerade. man muss im richtigen Augenblick zur Seite hüpfen. Das Auto kann nicht beliebig scharfe

nicht beliebig scharfe Kurven fahrenschwimmen und ab einem bestimmten Punkt gerade. man muss im richtigen Augenblick zur Seite hüpfen. Das

-

1 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

1. Spiele in strategischer Form

1.1. Beschreibung des Spiels

Ein n-Personenspiel

G

ist gegeben durch

(1)

die Menge der Spieler

I = {1, 2,

,

n}

(2)

und für jeden Spieler i I:

die Menge der möglichen Strategien für Spieler i

s i S i

Strategie von Spieler i

S i

s = (s 1 , s 2 , …, s n )

S

n

= ∏

i

=

1

S

i Strategiekombinationen / Strategieprofile

(3)

eine Auszahlungsfunktion (payoff function) u i von Spieler i:

u i : S R

s = (s 1 , …, s n ) # u i (s) = u i (s 1 , …, s n )

u i (s) = u i (s 1 , …, s n )

Auszahlung (Nutzen) von Spieler i, wenn die Strategiekombination

s = (s 1 ,

, s n ) gewählt/gespielt wird

G = {I, S 1 , …, S n , u 1 , …, u n } = {I, (S i ), (u i )}

Spiel in strategischer Form

ABLAUF: Spieler wählen Strategien gleichzeitig (i wählt ein s i S i ohne zu wissen, was die anderen

tun)

der gewählten Strategie s 1 ,

daher u i = u i (s 1 ,

Ergebnis (outcome) resultiert - Spieler haben Nutzen davon - dieser hängt letztlich von

, s n ab (weil die Strategie das Ergebnis determiniert) -

,

s n )

NOTATION (Spieler i hervorheben)

s -i = (s 1 , s 2 ,

schreibe s = (s i , s -1 )

, s i-1 , s i+1 , …, s n )

für

(s 1 ,

Strategienkombination der “anderen”

,

s

i ,

, s n )

S -i :=

n

S

j

j

=

1

i

j

= S 1 × S 2 × … × S i-1 × S i+1 ×

× S n

Summe aller möglichen Strategienkombinationen der „anderen“

s -i S -i

1.2.

Def.:

Dominante Strategie Seien s i ’, s i ’’ zwei mögliche Strategien von Spieler i.

Strategie s i ’ wird strikt dominiert von s i ’’, wenn s i ’’ immer besser ist für Spieler i als s i ’, egal was

die anderen tun, d.h. wenn gilt:

u i (s i ’, s -i ) < u i (s i ’’, s -i )

für alle s -i S -i

Ein rationaler Spieler wird nie eine strickt dominierte Strategie spielen.

- 2 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

Beispiel

i

= 1

 

L

i = 2 C

R

Gibbons: Fig. 1.1.1.

T

1, 0

1, 2

0, 1

B

0, 3

0, 1

8,

0

Notation:

I

= {1, 2}

S 1 = {T, B}

S 2 = {L, C, R}

S = S 1 × S 2 = {TL, TC, TR, BL, BC, BR}

s = (s 1 , s 2 ) = (T, L)

z.B.

s = (T, L)

s = (B, C)

u 1 (s) = u 1 (T, L) = 1

u 2 (s) = u 2 (T, L) = 0

u 1 (s) = u 1 (B, C) = 0

u 2 (s) = u 2 (B, C) = 1

i = 1

S -1 = S 2

(bei drei Spielern: S -1 = S 2 × S 3 )

i hat keine strikt dominierte Strategie

i R strikt dominiert durch C

= 1

= 2

eliminiere R

i = 2

L C R T 1, 0 1, 2 0, 1 B 0, 3 0, 1
L
C
R
T
1, 0
1, 2
0, 1
B
0, 3
0, 1
8, 0
i
= 2
L
C
R
T
1, 0
1, 2
0, 1
B
0, 3
0, 1
8, 0
L
i = 2
C
R
1, 0
1, 2
0, 1
0, 3
0, 1
8, 0

T

B

i = 1

danach:

i = 1

B strikt dominiert von T

eliminiere B

i = 1

danach:

i = 2

L strikt dominiert von C

eliminiere L

i

= 1

verbleibt: s* = (s 1 *, s 2 *) = (T, C)

Dieser Prozess heißt iterierte Elimination strikt dominierter Strategien.

Er kann, muss aber nicht zu einer eindeutigen Lösung führen.

L

C

R

T

0, 4

4, 0

5, 3

M

4, 0

0, 4

5, 3

B

3, 5

3, 5

6, 6

Gibbons: Fig. 1.1.4.

strikt dominierte Strategien

- 3 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

1.3. NASH-Gleichgewicht

Def.:

Sei

s

i

=

(s ,

1

,

s

i1

,

−+

s

i1

,

, s

n

)

S

i

eine Strategienkombination der “anderen”. Eine Strategie

s i S i von Spieler i heißt beste Antwort (best response/reply) von Spieler i auf

s

i

, wenn gilt:

u (s ', s

ii

i

)

s

u (s , s

ii

i

)

s

i

S

i

d.h. gegeben

s

i maximiert Spieler i seinen payoff durch Wahl von s i ’:

u (s ', s

ii

i

)

=

max u (s , s

s

i

S

i

ii

i

)

Achtung: die beste Antwort muss nicht eindeutig sein !!

Beispiel

i

= 1

T

B

L

i = 2 C

R

4, 7

-1, 7

0, 0

3, 2

0, 0

4, 1

sei i = 1,

sei i = 2,

s

s

1

2

= L

= T

=>

=>

beste Antwort von i = 1 auf

s

1

= L ist s 1 ’ = T

beste Antwort von i = 2 auf

s

2

= T ist s 2 ’ = L

oder s 2 ’ = C (nicht eindeutig)

def.:

r i (

z.B.

s

i

) := {s i S i | s i ist beste Antwort auf

r 1 (L) = {T}, r 2 (T) = {L, C}

s

i

}

beste-Antwort-Korrespondenz

falls die beste Antwort von Spieler i immer eindeutig ist, schreiben wir s i ’ = r i (

Funktion:

r i : S -i S i

s

i

) und nennen die

s -i # s i ’ = r i (

s

i

) die Reaktionsfunktion von Spieler i

Def.:

sei G = {I, (S i ), (u i )} ein n-Personenspiel in strategischer Form.

Eine Strategienkombination s* = (s 1 *,

NASH-Gleichgewicht des Spiels G, wenn gilt:

, s n *) S heißt nicht-kooperatives Gleichgewicht oder

für jeden Spieler i I ist s i * eine beste Antwort auf s -i *

d.h.

u i (s*) s u i (s i , s -1 *)

<=>

s i S i

s i * r i (s -i *)

Interpretation:

Gleichgewicht s’ ist stabil (self-enforcing) - kein Spieler hat einen Anreiz von seiner

Strategie s i * abzuweichen, solange die anderen bei s -i * bleiben

umgekehrt:

sei s’ = (s 1 ’,

,

s n ’) kein Gleichgewicht, d.h. mindestens ein Spieler i, dessen

Strategie s i ’ nicht beste Antwort auf s -i ’ ist. Dieser könnte sich verbessern durch

abweichen zu einer anderen Strategie s i ’’ mit u i (s i ’’, s -i ’) > u i (s’) i wird abweichen

s’ nicht stabil

andere Interpreation: NASH-Gleichgewicht als soziale „Konvention“

- 4 -

Beispiel

Spieltheorie I Manfred Nermuth Sommersemester 2004

Für jeden Spieler i und jede Strategie unterstreiche die beste Antwort

des Gegners. Wenn in einem Kästchen zwei Striche sind, ist es ein

NASH-Gleichgewicht

3 Probleme:

1. Ineffizienz (Bsp. Gefangenen-Dilemma)

2. nicht Eindeutigkeit (Bsp. Battle of the Sexes)

3. nicht Existenz (Bsp. Matching Pennies)

Fig. 1.1.4

L

C

R

T

0, 4

4, 0

5, 3

M

4, 0

0, 4

5, 3

B

3, 5

3, 5

6, 6

s* = (B, R)

1.4. Gemischte (mixed, randomized) Strategien

sei G gegeben

s i S i

reine / pure Strategie

Beispiel:

G = Mathing Pennies

i = 2

T B T 1, -1 -1, 1 i = 1 B -1, 1 1, -1
T
B
T
1, -1
-1, 1
i =
1
B
-1, 1
1, -1
(= Nullsummenspiel
zero sum ame)

I = {1, 2}

S 1 = {K, A} = S 2

S = S 1 × S 2 = {KK, KA, AK, AA}

u 1 (KK) = u 1 (AA) = 1

u 1 (KA) = u 2 (AK) = -1

u 2 (s) = -u 1 (s)

s S

hat kein Gleichgewicht in reinen Strategien

Führen gemischte Strategien ein. Spieler können reine Strategien mit bestimmten

Wahrscheinlichkeiten zufällig wählen.

Eine gemischte Strategie von Spieler i = 1 hat die Form:

σ 1 = (σ 1 (K), σ 1 (A)) , wo σ 1 (K) die Wahrscheinlichkeit ist, dass i = 1 K spielt

σ 1 (K) s 0

σ 1 (A) s 0

σ 1 (K) + σ 1 (A) = 1

σ 1 ist eine Wahrscheinlichkeitsverteilung auf S 1 = {K, A}

z.B.:

σ 1 =

σ 1 =

1

1

2

1

,

2

2

3

,

3

σ 1 = (0, 1)

⎠ ⎟

⎠ ⎟

analog: σ 2 (K) ist die Wahrscheinlichkeit, dass i = 2 K spielt

- 5 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

Allgemein: eine gemischte Strategie σ i von Spieler i ist eine Wahrscheinlichkeitsverteilung auf der

Menge S i seiner reinen Strategien

(jede reine Strategie s i kann auch als gemischte Strategie aufgefasst werden: spielt s i mit

Wahrscheinlichkeit 1)

es sei Σ i die Menge aller gemischten Strategien von Spieler i

sei eine Kombination von gemischten Strategien σ = (σ 1 , σ 2 ) gegeben, und die Spieler wählen ihre

reinen Strategien zufällig gemäß σ i unabhängig voneinander, dann gilt:

die reine Strategienkombination s = KK tritt mit der Wahrscheinlichkeit σ 1 (K) . σ 2 (K) ein

die reine Strategienkombination s = KA tritt mit der Wahrscheinlichkeit σ 1 (K) . σ 2 (A) ein

wenn s = KK eintritt, ist der payoff von i = 1: u 1 (KK) = 1

wenn s = KA eintritt, ist der payoff von i = 1: u 1 (KA) = -1

der erwartete payoff v 1 von Spieler 1 bei gemischter Strategienkombination σ = (σ 1 , σ 2 ) ist:

v 1 (σ) = v 1 (σ 1 , σ 2 ) =

u 1 (KK) . σ 1 (K) . σ 2 (K) +

+ u 1 (KA) . σ 1 (K) . σ 2 (A) +

+ u 1 (AK) . σ 1 (A) . σ 2 (K) +

+ u 1 (AA) . σ 1 (A) . σ 2 (A) =

=

u (s) . σ (s ) . σ

1

11

s

=

(s ,s

1

2

)

S

2

(s

2 )

analog: i = 2

z.B.: σ = (σ 1 , σ 2 ) ⎛ ⎞ 1 1 σ 1
z.B.:
σ = (σ 1 , σ 2 )
⎛ ⎞
1
1
σ 1 =
,
⎝ ⎜ 2
2
⎟ ⎠
σ 2 =
⎛ 1
1
,
⎝ ⎟ ⎠
2
2
z.B.:
σ = (σ 1 , σ 2 )

v 1 (σ) = 11

1 +

⋅⋅

44

(-1) +

1

(-1) +

1

4

4

σ 1 =

v 1 ( σ ) = 1 (σ) =

 
   

11 1 +

⋅⋅

(-1) +

2

(-1) +

2

66

6

6

σ 2 =

z.B.: σ = (σ 1 , σ 2 ) σ 1 = (1, 0) ⎛
z.B.:
σ = (σ 1 , σ 2 )
σ 1 = (1, 0)
1
1
σ 2 =
,
2
2
⎟ ⎠

v 1 (σ) =

 

1

1

1 +

⋅⋅

(-1) + 0

(-1) + 0

2

2

1 = 0

1 = 0

1 = 0

Ergebnis:

wenn i = 2 die gemischte Strategie mit σ 2 =

1

1 spielt, dann sind die reinen Strategien

2

,

2

s 1 = K und s 1 = A beide beste Antwort von Spieler 1 auf σ 2 und jede Mischung σ 1 von K

und A ist auch beste Antwort auf σ 2 .

- 6 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

Insbesondere ist σ 1 * =

1

1 beste Antwort auf σ 2 * =

2

,

2

1

1 . Nach einer

2

,

2

symmetrischen Überlegung ist auch σ 2 * =

1

1 beste Antwort auf σ 1 * =

2

,

2

1

1 . Das

2

,

2

Paar σ* = (σ 1 *, σ 2 *) heißt NASH-Gleichgewicht in gemischten Strategien vom Spiel G.

NOTATION:

sei Z eine endliche Menge

|Z| = #Z

Anzahl der Elemente von Z

def.: eine Wahrscheinlichkeitsverteilung p auf Z ist eine Funktion:

p:

Z R

z # p(z)

mit p(z) s 0

und

Z p(Z)

z

=

1

p(z)

(Z) Menge aller Wahrscheinlichkeitsverteilungen auf Z

ist die Wahrscheinlichkeit, dass z gewählt wird

|Z| = 2

Z = {z 1 , z 2 }

(Z) = {p = (p 1 , p 2 ) R 2 | p 1 s 0, p 2 s 0 und p 1 + p 2 = 1}

p i = p(z i )

p = (p 1 , p 2 )

p 2 1 = {(q, 1 - q | 0 c q c 1} ∆(Z)
p 2
1
= {(q, 1 - q | 0 c q c 1}
∆(Z)
p
2
p 1
0
p 1
1
|Z| = 3
Z = {z 1 , z 2 , z 3 }
p i = p(z i )
p = (p 1 , p 2 , p 3 )
3
∆(Z) = {p = (p 1 , p 2 , p 3 ) ∈ R 3 | p i s 0
i = 1, 2, 3 und
i = 1}
i
=
1 p
p 3 1 1 1 p 2 p 1
p
3
1
1 1
p 2
p 1
= 1, 2, 3 und ∑ i = 1} i = 1 p p 3 1

(Z)

(simplex)

Allgemein: (Z) ist kompakt und konvex im R n

- 7 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

sei

I = {1,

S i

G = {I, (S i ), (u i )}

,

n}

endliche Menge für alle i I

allgemeines endliches n-Personenspiel

def.:

Σ i = S i Menge der gemischten Strategien von i

σ i Σ i von der Form: σ i = (σ i (s i )) s i S i

σ i (s i ) s 0 Wahrscheinlichkeit, dass die reine Strategie s i gewählt wird

z.B.:

S i = {a, b, c}

σ i =

111

236

,

,

für s i = b :

σ i (b) = 1

3

σ = (σ 1 , , σ n ) Σ =

n

=

i

1

Σ

i n-tupel (=Liste von n Elementen) von gemischten Strategien

Wenn jeder Spieler i = 1,

Wahrscheinlichkeitsverteilung σ i wählt und die Spieler dies unabhängig voneinander tun, dann ist die

, n seine reine Strategie s i zufällig gemäß der

Wahrscheinlichkeit, dass eine bestimmte reine Strategienkombination s = (s 1 ,

, s n ) S =

n

S

i

=

1

i

gewählt wird, gegeben durch:

Prob(s) = σ 1 (s 1 ) . σ 2 (s 2 )

σ n (s n ) =

n

σ (s )

i

i

i

=

1

die erwartete Auszahlung von Spieler i bei σ ist gegeben durch:

v i (σ) = v i (σ 1 ,

, σ n ) =

u (s) Pr ob(s)

i

⋅=⋅∑

i

u (s)

s

S

s

S

v

i (σ 1 ,

, σ n ) =

v i ist eine Funktion:

(s ,

1

,s

n

)

S

u (s ,

i1

v i : Σ R

σ = (σ 1 ,

,

σ n ) # v i (σ)

,

s

n

)

n

=

j

1

σ (s )

j

j

n

=

j

1

σ (s )

j

j

def.: die gemischte Erweiterung G gem des ursprünglichen Spiels G, ist das folgende Spiel in

strategischer Form:

G gem = {I, (Σ i ), (v i )}

I alle Spieler

Σ i gemischte Strategien von i

v i

erwartete Auszahlung von i

- 8 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

Def.:

ein NASH-Gleichgewicht σ* = (σ 1 *,

,

σ n *) von G gem heißt ein Gleichgewicht in gemischten

Strategien von G.

Klar: σ* = (σ 1 *,

,

σ n *) Σ ist ein Gleichgewicht, wenn für i I gilt:

 

v i (σ*) s v i (σ i , σ -i *)

σ i Σ i

 

(= Abweichung zu einer anderen gemischten Strategie lohnt sich nicht)

 

Def.:

ein Spiel G = {I, (S i ), (u i )} heißt endlich, wenn die Spielermenge endlich ist (I = {1,

,

n} mit

n < ) und die Strategienmenge S i endlich ist für jeden Spieler i I.

THEOREM (NASH)

Jedes endliche Spiel hat mindestens ein Gleichgewicht - möglicherweise in gemischten Strategien.

G = {I, (S i ), (u i )}

sei σ* = (σ 1 *,

,

σ n *) ein Gleichgewicht

betrachte i = 1

S 1 = {s 1 a , s 1 b , s 1 c ,

,

s 1 l }

reine Strategien von i

σ 1 * = (σ 1 *(s 1 a ), σ 1 *(s 1 b ),

erwarteter payoff:

, σ 1 *(s 1 l )) wo σ 1 *(s 1 a ) s 0 die Wahrscheinlichkeit, dass s 1 a gewählt wird, ist

v 1 (σ*) = v 1 (σ 1 *, σ- 1 *) = σ 1 *(s 1 a ) . v 1 (s 1 a , σ- 1 *) + σ 1 *(s 1 b ) . v 1 (s 1 b , σ- 1 *) +

+ σ 1 *(s 1 l ) . v 1 (s 1 a , σ- 1 l)

sei σ* ein Gleichgewicht in gemischten Strategien:

wenn σ i *

(s ) > 0 (Spieler i spielt s S i mit positiver Wahrscheinlichkeit), dann ist diese Strategie

i

i

beste Antwort auf σ- 1 *; wenn mehrere reine Strategien

s , s i ∈ S i mit positiver Wahrscheinlichkeit i
s ,
s
i ∈ S i mit positiver Wahrscheinlichkeit
i

gespielt werden (d.h. σ i *

erwarteten payoff gegen σ- i * geben. Deswegen ist Spieler i dann auch bereit zu randomisieren.

(s ) > 0, σ i *

i

(s ) > 0), dann müssen sie alle den gleichen (maximalen)

i

s

i

i =

1

1

1

2

K

A

r

i = 2

K A 1, -1 -1, 1 -1, 1 1, -1
K
A
1, -1
-1, 1
-1, 1
1, -1

σ 1 (K) = r

σ 1 (A) = 1 - r

0 c r c 1

σ 2 (K) = q

σ 2 (A) = 1 - q

0 c q c 1

σ 2 (K) = q σ 2 (A) = 1 - q 0 c q c
σ 2 (K) = q σ 2 (A) = 1 - q 0 c q c

0

1

1

2

q

r = r 1 (q)

beste-Antwort-Korrespondenz von i = 1

r = r 2 (r)

beste-Antwort-Korrespondenz von i = 2

Gleichgewicht

- 9 -

G

gem

= {I, (Σ ), (v )}

i

i

konvexe

konvexe

kompakte

Menge

stetige Funktion

linear in σ i

quasi konkav in σ i

Spieltheorie I Manfred Nermuth Sommersemester 2004

2. Spiele in extensiver Form mit vollständiger (complete) Information bisher: Spiele in strategischer Form: Spieler agieren simultan

nun: explizite Zeitstruktur: Spieler agieren nicht notwendigerweise simultan

2.1. einfachster Fall

i I = {1, 2}

A i Menge der möglichen Aktionen (Züge) von Spieler i

zwei Spieler

Ablauf:

- Spieler i = 1 wählt eine Aktion a 1 A 1

- Spieler i = 2 beobachtet a 1 und wählt eine Aktion a 2 A 2

payoffs: u 1 (a 1 , a 2 ), u 2 (a 1 , a 2 ), u = (u 1 , u 2 )

Auszahlungsvektor

Beispiel:

A 1 = {T, M, B}

A 2 = {L, C, R} L i = 2 C R T L i
A 2 = {L, C, R}
L
i
= 2
C
R
T
L
i
= 2
C
i =
1
M
R
B
L
C
i = 2
R

„Spielbaum“

„game tree“

(5, 3)

(0, 8)

(4, 7)

(0, 0)

(1, -1 )

(100 , 7)

(3, 10)

(8, 11 )

(2, 0)

u

(T, L) = 5 u 2 (T, L) = 3

1

u 2 (B, R) = 0

Lösung durch Rückwärtsinduktion (backwards induction)

allg.: Menge der Aktionen von Spieler 2 hängt von a 1 ab

A 2 = A 2 (a 1 )

- 10 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

der Spielbaum muss nicht regelmäßig sein:

L i = 2 C R T L C i = 1 M i =
L
i = 2
C
R
T
L
C
i =
1
M i = 2
B
i = 2
noch allgemeiner: Spieler können öfter am Zug sein
L
(2, 0)
i
= 1
L
(1, 1)
R
i = 2
L
(0, 3)
R
i
= 1
R
(2, 0)
Allgemein:

n Spieler, jeder kann öfter ziehen

die extensive Form eines Spiels gibt an:

(dieses Spiel ist sofort aus: i = 1 geht nach links)

1. die Spieler

2.a. wann jeder Spieler am Zug ist 2.b. was er tun kann, wenn er am Zug ist (Menge der möglichen Züge) 2.c. was er weiß, wenn er am Zug ist (Informationsmenge)

3. Auszahlungen

(Spielbaum gibt alles an, außer 2.c.)

Das Spiel hat vollkommene (perfect) Information, wenn in 2.c. jeder Spieler immer die ganze Vorgeschichte kennt, d.h. die Züge aller Spieler die vorausgegangen sind.

Darstellung des Spielbaums - zunächst mit vollkommener Information


⎜ ⎝

i = 1 R 1 A1 L 1 i = 3 D3 R 3 i
i
= 1
R 1
A1
L 1
i = 3
D3
R 3
i = 2
i = 2
F2
B2
L 3
M 3
L 2
R 2
a 2
b 2
i = 2
i = 4
i =
1
E2
G4
C1
⎛−
⎜ ⎜
7 ⎞
0
1 ⎞
2
0
L
l 2
R 4
l 1
0 ⎟
r 2
4
r 1
m 2
10
⎜ ⎜
0
⎟ ⎟ ⎠
5
2
⎟ ⎟ ⎠
⎝ ⎜
0
⎟ ⎟ ⎠
0
2
0
0 ⎞
0 ⎞
2 ⎞
8 ⎞
0
0 ⎟
0
1 ⎟
9 ⎟
1 ⎟
1 ⎟
− 4
0 ⎟
0
3
0
⎜ ⎜
0
⎟ ⎟ ⎠
⎝ ⎜
1
8
0 ⎟ ⎟ ⎠
⎝ ⎜
0 ⎟ ⎟ ⎠
2
0
⎠ ⎟
⎝ ⎜
⎠ ⎟
− 1
5
0
⎟ ⎟ ⎠
⎝ ⎜
⎟ ⎟ ⎠
⎝ ⎜

- 11 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

Knoten (nodes):

Entscheidungsknoten: X

Enknoten: payoffs Zweige: die von einem Knoten ausgehenden Zweige, beschreiben die möglichen Züge

i Knoten, wo i am Zug ist

Def.:

Def.:

eine Strategie für Spieler i ist ein vollständiger Plan für das Spiel, d.h. die Strategie gibt für jeden Entscheidungsknoten X an, welchen Zug er wählt.

i

ein Teilspiel beginnt bei einem Knoten und enthält alles Folgende. (das ganze Spiel ist auch ein Teilspiel von sich selbst.)

Wenn jeder Spieler i eine Strategie (d.h. einen Plan) gewählt hat, ist der Pfad durch den Spielbaum eindeutig bestimmt sind die payoffs im ganzen Spiel (und auch in jedem Teilspiel) bestimmt.

z.B. s 1 = (R 1 , r 1 ) s 2 = (R 2
z.B.
s 1 = (R 1 , r 1 )
s 2 = (R 2 , m , b
s 3 = (M 3 )
s 4 = (L 4 )
S 1 = {R 1 r 1 , R l 1 , L 1 r 1 , L 1 l 1 }
1
2 )
2
u 1 (s 1 , s 2 , s 3 , s 4 ) = -7
s
u 2 (s 1 , s 2 , s 3 , s 4 ) = 2
u 3 (s 1 , s 2 , s 3 , s 4 ) = 10
u 4 (s 1 , s 2 , s 3 , s 4 ) = 5
Die Menge aller möglichen Strategien mit zugehörigen payoffs beschreibt ein Spiel in strategischer
Form, dieses heißt die Normalform des extensiven Spiels.
Def.:
ein NASH-Gleichgewicht eines Spiels in extensiver Form ist ein NASH-Gleichgewicht seiner
Normalform.
Beispiel: G 3
i
= 1
A.1
L 1
R 1
i = 2
i = 2
B.2
C.2
L 2
R 2
l 2
r 2
i
= 1
i
= 1
D.1
E.1
5 ⎞
7 ⎞
x 1
z 1
y 1
w 1
6 ⎠
8 ⎠
1 ⎞
3 ⎞
9 ⎞
11 ⎞
10 ⎠
2 ⎠
4 ⎠
12 ⎠

- 12 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

Strategien von i = 1:

A.1

L 1

R 1

D.1

x 1

y 1

E.1

z 1

w 1

S 1 = {L 1 x 1 z 1 , L 1 x 1 w 1 , L 1 y 1 z 1 , L 1 y 1 w 1 , R 1 x 1 z 1 , R 1 x 1 w 1 , R 1 y 1 z 1 , R 1 y 1 w 1 }

2 3 = 8 Strategien

Strategien von i = 2:

S 2 = {L 2 l 2 , L 2 r 2 , R 2 l 2 , R 2 r 2 }

Normalform von G 3 :

i = 1

i = 2

(u 1 , u 2 )

L

2 l 2

L

2 r 2

R

2 l 2

R

2 r 2

L

1 x 1 z 1

1, 2

1, 2

5, 6

5, 6

L

1 x 1 w 1

1, 2

1, 2

5, 6

5, 6

L

1 y 1 z 1

3, 4

3, 4

5, 6

5, 6

L

1 y 1 w 1

3, 4

3, 4

5, 6

5, 6

R

1 x 1 z 1

7, 8

9, 10

7, 8

9, 10

R

1 x 1 w 1

7, 8

11, 12 *

7, 8

11, 12 *

R

1 y 1 z 1

7, 8

9, 10

7, 8

9, 10

R

1 y 1 w 1

7, 8

11, 12 *

7, 8

11, 12 *

4 NASH-Gleichgewicht (NASH-Gleichgewichte nicht payoff, sondern Strategiekombination):

s* = (s 1 *, s 2 *) = (R 1 x 1 w 1 , L 2 r 2 )

s* = (s 1 *, s 2 *) = (R 1 y 1 x 1 , L 2 r 2 )

erzeugen alle selben Pfad Gleichgewichtspfad eindeutig

alle mit payoffs:

s* = (s 1 *, s 2 *) = (R 1 x 1 w 1
s* = (s 1 *, s 2 *) = (R 1 x 1 w 1 , R 2 r 2 )
u 1 (s*) = 11
s* = (s 1 *, s 2 *) = (R 1 y 1 w 1 , R 2 r 2 )
u 2 (s*) = 12
Beispiel: G 4
(0, 0)
l
i = 2
L
i =
1
B.2
r
A.1
(10, 8)
R
(5, 20)

Normalform von G 4 :

S 1 = {L, R}

S 2 = {l, r}

 

i = 2

l

r

i

= 1

L

0, 0

10, 8 **

   
 

R

5, 20 *

5, 20

2 Gleichgewicht:

s** = Lr

mit payoffs 10, 8

s* = Rl

mit payoffs 5, 20

- 13 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

was bedeutet s* = Rl? Spieler 2 „droht“ mit l bei B.2, aber die Drohung ist unglaubwürdig, weil es irrational wäre, daher ist es in extensiver form ein unbefriedigendes Gleichgewicht. R. SELTEN: solche Gleichgewichte eliminieren

Def.:

(R. SELTEN) ein NASH-Gleichgewicht eines extensiven Spiels heißt teilspiel-perfekt (subgame perfect), wenn die Strategien der Spieler auch in jedem Teilspiel ein NASH-Gleichgewicht bilden

G 4 : in dem Teilspiel , das bei B.2 beginnt, ist s 2 = l kein Gleichgewicht mehr einziges Gleichgewicht: s** = Lr

G 3 : s* = (s 1 *, s 2 *) = (R 1 x 1 w 1 , L 2 r 2 ) s* = (s 1 *, s 2 *) = (R 1 y 1 x 1 , L 2 r 2 ) s* = (s 1 *, s 2 *) = (R 1 x 1 w 1 , R 2 r 2 ) s* = (s 1 *, s 2 *) = (R 1 y 1 w 1 , R 2 r 2 )

nicht teilspiel-perfekt (L nicht Gleichgewicht ab B.2) nicht teilspiel-perfekt (x nicht Gleichgewicht ab D.1) nicht teilspiel-perfekt (L nicht Gleichgewicht ab B.2) ist teilspiel-perfekt!

SATZ (R. SELTEN) Jedes endliche extensive Spiel mit vollkommener Information hat mindestens 1 teilspiel-perfektes Gleichgewicht in reinen Strategien Beweis: backwards induction

i = 1 A.1 b a i = 2 Y.2 i = 2 x Z.2
i
= 1
A.1
b
a
i = 2
Y.2
i = 2
x
Z.2
w
z
y
i
= 1
D.1
i
= 1
C.1
E.1
i
= 1
g
h
i
= 1
B.1
e
f
c
i
j
d
3
4
i = 2
i = 2
W.2
i = 2
V.2
i = 2
U.2
i = 2
T.2
S.2
X.2
3
i = 2
3
v
u
t
s
r
q
p
o
n
m
l
k
0
1
1 ⎞
2 ⎞
2 ⎞
7 ⎞
1 ⎞
1 ⎞
0
2
10 ⎞
1
0
0
2
0
11 ⎠
1 ⎠
3 ⎠
4 ⎠
8 ⎠
1 ⎠
2 ⎠
4

S

S

1

2

A.1

B.1

C.1

D.1

E.1

z.B. s 1 = acfgj

a

c

e

g

i

b

d

f

h

j

Z.2

Y.2

X.2

W.2

V.2

U.2

T.2

S.2

z

x

v

t

r

p

n

l

y

w

u

s

q

o

m

k

- 14 -

NASH-Gleichgewicht:

s 1 * = bdehj

=> 2 NASH-Gleichgewichte:

Spieltheorie I Manfred Nermuth Sommersemester 2004

s 2 * = ywvsqonl s 2 * = ywusqonl

s* = (bdehj, ywvsqonl) s* = (bdehj, ywusqonl)

Beispiel: Tausendfüßler (centipede)

i = 1 w i = 2 i = 1 i = 2 i =
i =
1
w i = 2
i
= 1
i = 2
i
= 1
i = 2
w
w
w
w
w
30
A.1
B.2
C.1
D.2
E.1
F.2
29
a a
a
a
a
a
1
0
10
9
20
19
0
10
9
20
19
30
30 ⎞
i = 1 spielt gleich a, obwohl mit Kooperation
möglich gewesen wäre
29 ⎠

Extensive Spiele mit vollständiger (complete) aber unvollkommener (imperfect) Information

die extensive Form ist beschrieben durch:

1. die Spieler

2.a. wann jeder Spieler am Zug ist

2.b. was er tun kann, wenn er am Zug ist (Menge der möglichen Züge) 2.c. was er weiß, wenn er am Zug ist (Informationsmenge)

3. Auszahlungen

aber in 2.c., wenn ein Spieler am Zug ist, kennt er nicht unbedingt die ganze Vorgeschichte

Beispiel i I = {1, 2}

- = 1 wählt Aktion a 1 = L, M, oder R

- = 2 kann nur beobachten, ob R gewählt wurde oder nicht (d.h. wenn nicht, weiß er nur, dass

i

i

a 1 {L, M, R}

a 1 = L oder a

wenn a 1 = R, dann wählt i = 2: a 2 {T, C, B}

wenn a 1 {L, M}, dann wählt i = 2: a 2 {t, b}

1

= M)

- payoffs: u 1 (a 1 , a 2 ), u 2 (a 1 , a )

2

- 15 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

I 1 i = 1 A.1 L R M I 2 ’ I B.2 i
I
1
i
= 1
A.1
L
R
M
I
2 ’
I
B.2
i = 2
2 ’’
i = 2
C.2
D.2
t
b
t
b
T
C
B
10
0 ⎞
0
8 ⎞
0 ⎞
1 ⎞
⎛−
2 ⎞
0
10 ⎠
8
1 ⎠
0 ⎠
1 ⎠
7 ⎠

i = 1 kann die Knoten B.2 und C.2 nicht unterscheiden (verbunden durch

weiß er nur, ob er sich in I 2 ’ = {B.2, C.2} oder in I 2 ’’ = {D.2} befindet.

I 2 ’ und I 2 ’’ heißen Informationsmengen von Spieler 2 i = 2

). Wenn er am Zug ist,

allgemein: eine Informationsmenge I i von Spieler i ist eine Menge von Knoten, bei denen i am Zug ist,

und wenn das Spiel einen Knoten in I

bei welchem Knoten.

i erreicht, dann weiß i nur, dass er in I i ist, aber nicht

klar:

klar:

Def.:

bei allen Knoten einer Informationsmenge I

haben (sonst könnte er ja unterscheiden bei welchem Knoten er ist)

z.B.

i

muss i die selbe Menge A (I i ) möglicher Züge

i

A 2 (I 2 ’) = {t, b}

A 2 (I 2 ’’) = {T, M, B}

Jeder Knoten (außer Endknoten) liegt in genauer einer Informationsmenge irgendeines Spielers

ein Spiel hat unvollkommene (imperfect) Information, wenn mindestens eine Informationsmenge

eines Spielers mehr als einen Knoten enthält.

ein Spiel hat vollkommene (perfect) Information, wenn alle Informationsmengen aller Spieler

1-elementig sind. [singletons = Menge mit einem Element]

Beispiel: Fig. 2.4.4. I 1 i = 1 A.1 L R I 2 ’ i
Beispiel: Fig. 2.4.4.
I 1
i
= 1
A.1
L
R
I
2 ’
i = 2
I 2 ’’
i = 2
B.2
C.2
l
r
l’
r’
I
3 ’
I 3 ’’
D.3
i = 3
E.3
F.3
i = 3
G.3
a
b
a
b
a
b
c
d
1 ⎛⎞
3
⎛⎞
1
⎛⎞
2
⎛⎞
0
3
1
7
2 ⎟
2 ⎟
3
3 ⎟
0
3
0
4
2
0
0
0
0
3 ⎟ ⎠
1 ⎠ ⎟
⎠ ⎟
1 ⎟ ⎠
⎠ ⎟
⎟ ⎠
⎝ ⎜
⎟ ⎠

⎟ ⎠

- 16 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

Informationsmengen und Mengen möglicher Züge:

i = 1:

i I 2 ’ = {B.2}, I 2 ’’ = {C.2}

i I 3 ’ = {D.3, E.3, F.3}, I 3 ’’ = {G.3}

I 1 = {A.1}

A 1 (I 1 ) = {L, R}

= 2:

= 3:

A 2 (I 2 ’) = {l, r}, A 2 (I 2 ’’) = {l’, r’}

A 3 (I 3 ’) = {a, b}, A 3 (I 3 ’’) = {c, d}

Beachte: kann gleichzeitige Züge durch Informationsmengen darstellen

Def.:

z.B. Prisoner’s Dilemma

i

i = 2

C 2 D 2 C 1 -100, 0 -1, -1 = 1 D 0, -100
C 2
D 2
C 1 -100, 0
-1, -1
= 1
D
0, -100
-20, -20
1
I 1
i = 1
A.1
C
D
I
2
B.2
i
= 2
C.2
C
D
C
D
⎛− ⎞
1
⎛−
100
20 ⎞
0 ⎞
⎛−
− 1
0
− 20
− 100

I 1 = {A.1}

I

= {B.2, C.2}

2

eine (reine) Strategie für Spieler i ist ein vollständiger Plan, der für jede Informationsmenge von

Spieler i einen Zug vorsieht.

S

wenn jeder Spieler i eine Strategie s

die Endknoten (outcome), damit die payoffs determiniert.

i Menge aller solchen Pläne

i S i gewählt hat, ist der Pfad durch den Spielbaum, damit

=> u (s

i

1 ,

,

s

n )

i’s payoff bei Strategiekombinationen s = (s 1 ,

, s n ) S =

n

S

j

=

1

j

=> Normalform des Spiels (ist ein Spiel in strategischer Form): G = {I, (S ), (u )}

i

i

wissen: hat mindestens 1 NASH-Gleichgewicht in gemischten Strategien

Erinnerung: eine gemischte Strategie σ

i Δ(S i ) von Spieler i ist eine Wahrscheinlichkeitsverteilung

auf der Menge S

i seiner reinen Strategien

- 17 -

Spieltheorie I Manfred Nermuth Sommersemester 2004

Beispiel: Fig. 2.4.4. I 1 i = 1 A.1 L R I 2 ’ i
Beispiel: Fig. 2.4.4.
I 1
i
= 1
A.1
L
R
I
2 ’
i = 2
I 2 ’’
i = 2
B.2
C.2
l
r
l’
r’
I
3 ’
I 3 ’’
D.3
i = 3
E.3
F.3
i = 3
G.3
a
b
a
b
a
b
c
d
1 ⎞
3 ⎞
1 ⎞
2 ⎞
0
3
1 ⎞
7 ⎞
2 ⎟
0 ⎟
2 ⎟
0
3 ⎟
3
4
3 ⎟
2
1
0
0
3 ⎠ ⎟
1 ⎟ ⎠
⎠ ⎟
⎠ ⎟
⎠ ⎟
⎟ ⎠
0 ⎟ ⎠
0 ⎠ ⎟

reine Strategien der 3 Spieler:

s 1 gibt einen Zug bei I 1 = {A.1} an:

s 1 S 1 = {L, R}

s 2 gibt je einen Zug bei I 2 ’ und I 2 ’’ an:

z.B. s 2 = ll’,

s 3 gibt je einen Zug bei I