Jurgen Jerger, Spieltheorie

Spieltheorie
Skript zur Vorlesung im SS 2006

Prof. Dr. J urgen Jerger
Lehrstuhl f ur internationale und monetare

Okonomik
Institut f ur Volkswirtschaftslehre und

Okonometrie
Wirtschaftswissenschaftliche Fakult at
Universitat Regensburg
April 2006
ii
Inhaltsverzeichnis
1 Literaturhinweise 1
2 Einf uhrung: Elemente der Spieltheorie 3
2.1 Lernziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Was ist Spieltheorie? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2.1 Modellierung strategischer Interdependenz . . . . . . . . . . . . . . . . 4
2.2.2 Elemente eines Spiels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2.3 Anwendungsbereiche der Spieltheorie, oder: Warum das Paradies mit
dem S undenfall enden musste . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.4 Ein degeneriertes Beispiel: Ein-Personen-Spiel mit vollkommener In-
formation (Schatzsuche) . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 Klassikation verschiedener Arten von Spielen . . . . . . . . . . . . . . . . . . 11
2.3.1 Kooperative vs. nicht-kooperative Spiele . . . . . . . . . . . . . . . . . 11
2.3.2 Statische (strategic) vs. dynamische (extensive, sequential) Spiele 12
2.3.3 One-shot games vs. wiederholte Spiele . . . . . . . . . . . . . . . . . . 13
2.3.4 Nullsummenspiele vs. Spiele mit variablen Auszahlungssummen . . . . 13
2.3.5 Spiele mit vollkommener bzw. unvollkommener Information . . . . . . 14
2.3.6 Anwendung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.4 Nutzen und Erwartungsnutzen . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.4.1 Anforderungen an Nutzenfunktionen . . . . . . . . . . . . . . . . . . . 15
2.4.2 Bewertung von Risiko und Erwartungsnutzenfunktion . . . . . . . . . 17
2.5 Rationalitat der Akteure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.5.1 Das St. Petersburg Paradoxon . . . . . . . . . . . . . . . . . . . . . . 23
2.5.2 Das Allais-Paradoxon . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5.3 Beschrankte Rationalitat . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6 Alternative Darstellungen von Spielen . . . . . . . . . . . . . . . . . . . . . . 30
2.6.1 Extensive Form . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.6.2 Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.6.3 Koalitionsspiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.7 Losungskonzepte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.7.1 Elimination dominierter Strategien . . . . . . . . . . . . . . . . . . . . 34
2.7.2 Zermelos Theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.7.3 Nash-Gleichgewicht und Fokus-Punkte . . . . . . . . . . . . . . . . . . 37
2.7.4 Gemischte Strategien . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3 Nichtkooperative Spiele I: Statische Spiele mit ansonsten vollkommener
Information 41
3.1 Lernziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2 Information in Spielen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.1 Perfekte Information und common knowledge . . . . . . . . . . . . . . 43
3.2.2 Sicherheit, Vollstandigkeit und Symmetrie von Informationen . . . . . 44
3.3 Das Gefangenendilemma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
iii
iv INHALTSVERZEICHNIS
3.4 Gemischte Strategien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.5 Nash-Gleichgewichte mit (unendlich) vielen Strategien . . . . . . . . . . . . . 52
3.6 Existenz von Nash-Gleichgewichten . . . . . . . . . . . . . . . . . . . . . . . . 53
3.7 Weitere Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.7.1 Oligopol I: Das Cournot-Modell . . . . . . . . . . . . . . . . . . . . . . 55
3.7.2 Oligopol II: Das Bertrand-Modell . . . . . . . . . . . . . . . . . . . . . 57
3.7.3 Das Allmende-Problem . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.7.4 Geldpolitik I: Die Nash-Losung des Barro-Gordon-Modells . . . . . . . 60
4 Nichtkooperative Spiele II: Dynamische Spiele mit vollkommener Infor-
mation und wiederholte Spiele 65
4.1 Lernziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.2 R uckwartsinduktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.3 Teilspiele und teilspielperfekte Gleichgewichte . . . . . . . . . . . . . . . . . . 69
4.4 Wiederholte Spiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4.1 Begriiches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4.2 Endlich wiederholte Spiele I: Eindeutige Nash-Gleichgewichte auf den
einzelnen Stufen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.3 Endlich wiederholte Spiele II: Multiple Nash-Gleichgewichte auf den
einzelnen Stufen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.4.4 Unendlich oft wiederholte Spiele . . . . . . . . . . . . . . . . . . . . . 80
4.5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.5.1 Oligopol III: Die Stackelberg-Losung . . . . . . . . . . . . . . . . . . . 84
4.5.2 Geldpolitik II: Stackelberg-F uhrerschaft der Lohnsetzer im Barro-Gordon-
Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.5.3 Geldpolitik III: Reputation im Barro-Gordon-Modell . . . . . . . . . . 91
5 Nichtkooperative Spiele III: Dynamische Spiele bei unvollkommener In-
formation 95
5.1 Lernziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2 Modikation des Losungskonzepts bei dynamischen Spielen bei unvollkomme-
ner Information . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.2.1 Perfektes Bayesianisches Gleichgewicht . . . . . . . . . . . . . . . . . . 96
5.2.2 Andere Gleichgewichtskonzepte bei dynamischen Spielen mit unvoll-
kommener Information . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.3 Signalspiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.3.1 Problemstruktur und Losung . . . . . . . . . . . . . . . . . . . . . . . 101
5.3.2 Mogliche Gleichgewichte eines Signalspiels . . . . . . . . . . . . . . . . 103
5.4 Screening . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
5.4.1 Allgemeine Charakterisierung und Beispiele . . . . . . . . . . . . . . . 104
5.4.2 Screening auf dem Versicherungsmarkt . . . . . . . . . . . . . . . . . . 105
5.5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.5.1 Signalspiel auf dem Arbeitsmarkt (Spence 1973) . . . . . . . . . . . . 107
5.5.2 Geldpolitik IV: Das Barro-Gordon-Modell bei unbekannter Inations-
aversion der Zentralbank . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6 Verhandlungen 115
6.1 Lernziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.2 Methodische Vorbemerkung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.3 Nicht-kooperative Verhandlungen . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.3.1 Verteilungsspiel I: Endlicher Zeithorizont . . . . . . . . . . . . . . . . 118
6.3.2 Verteilungsspiel II: Unendlicher Zeithorizont, Rubinstein-Spiel . . . . . 119
6.3.3 Die Einbeziehung von Auenoptionen im Rubinstein-Spiel . . . . . . . 122
6.4 Kooperative Verhandlungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
INHALTSVERZEICHNIS v
6.4.1 Die Nash-Verhandlungslosung (Verteilungsspiel III) . . . . . . . . . . . 124
6.4.2 Eine unschone Eigenschaften der Nash-Verhandlungslosung: Glaubi-
gerverhandlungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.4.3 Die Kalai-Smorodinsky-Losung . . . . . . . . . . . . . . . . . . . . . . 127
6.5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
6.5.1 Lohnverhandlungen I: Verteilung von Renten in einem endlichen Spiel 130
6.5.2 Lohnverhandlungen II: Die Nash-Losung . . . . . . . . . . . . . . . . . 132
6.5.3 Wie funktionieren Ehen und WGs? Die Perspektive der kooperativen
Haushaltstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
7 Auktionen 141
7.1 Lernziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
7.2 Grundlegende Begrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
7.2.1 Wert und Bewertung einer Auktion . . . . . . . . . . . . . . . . . . . . 143
7.2.2 Auktionsformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
7.3

Aquivalenzeigenschaften von Auktionen . . . . . . . . . . . . . . . . . . . . . 147
7.4 Winners curse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
7.5 Erweiterungen und Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.5.1 Multi-Unit-Auktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.5.2 Komplementaritaten bei multi-object auctions . . . . . . . . . . . . . 152
7.5.3 Multi-object auctions ohne Komplementaritaten: Die Moglichkeit ei-
nes Zielkonikts zwischen Ezienz- und Einnahmenziel . . . . . . . . 152
7.5.4 Multi-object auctions und Bieterkollusion . . . . . . . . . . . . . . . . 153
7.5.5 Die Versteigerung der UMTS-Lizenzen . . . . . . . . . . . . . . . . . . 154
8 Koalitionsspiele 157
8.1 Lernziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
8.2 Grundlegende Begrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
8.2.1 Kooperative Mehrpersonenspiele ohne Koalitionsbildung . . . . . . . . 157
8.2.2 Koalitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
8.2.3 Transferierbarer Nutzen, die charakteristische Funktion und ein Beispiel159
8.2.4 Der Shapley-Shubik-Index . . . . . . . . . . . . . . . . . . . . . . . . . 163
8.3 Losungskonzepte f ur Koalitionsspiele . . . . . . . . . . . . . . . . . . . . . . . 166
8.3.1 Imputationsmenge eines Spiels . . . . . . . . . . . . . . . . . . . . . . 167
8.3.2 Der Kern eines Spiels . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
8.3.3 Der Shapley-Wert eines Spiels . . . . . . . . . . . . . . . . . . . . . . . 168
8.4 Weitere Bei-(Spiele) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
vi INHALTSVERZEICHNIS
Tabellenverzeichnis
2.1 Anwendung der Charakteristika auf drei Spiele . . . . . . . . . . . . . . . . . 15
2.2 Lotterie A und B, Teil 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 Lotterie C und D, Teil 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.4 Lotterie A und B, Teil 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5 Lotterie C und D, Teil 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.1 Battle of the sexes: Teilspielperfekte Nash-Gleichgewichte uber zwei Runden . 79
4.2 Der qualitative Einuss der dynamischen Struktur im Stackelberg-Duopol . . 85
7.1 Zahlungsbereitschaften dreier Bieter f ur jeweils drei Einheiten eines Gutes . . 152
7.2 Zahlungsbereitschaften von zwei Bietern (A und B) f ur zwei Produkte (1 und
2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
7.3 Auktionserlose f ur die UMTS-Lizenzen je Einwohner . . . . . . . . . . . . . . 155
8.1 Koalitionsmoglichkeiten bei 4 Spielern . . . . . . . . . . . . . . . . . . . . . . 159
8.2 Ein Drei-Personen-Spiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
8.3 Drei charakteristische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 161
8.4 Strategiewahl einer Zweier-Koalition unter Verwendung des Minimax-Kriteriums161
8.5 Strategiewahl von Einer- und Zweierkoalitionen bei defensivem Verhalten . . 162
8.6 Strategiewahl von Einer- und Zweierkoalitionen bei rationalen Drohungen . . 162
8.7 Wie machtig sind die einzelnen Fraktionen im Dt. Bundestag? . . . . . . . . . 163
8.8 Die Ermittlung des Shapley-Shubik-Index f ur die Fraktionen des Dt. Bundestags165
vii
viii TABELLENVERZEICHNIS
Abbildungsverzeichnis
2.1 Strategische Interdependenz in einem Tripol . . . . . . . . . . . . . . . . . . . 4
2.2 Ergebnisraum im Paradiesspiel . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3 Ergebnismatrix im Paradiesspiel . . . . . . . . . . . . . . . . . . . . . . . . 9
2.4 Spielbaum des Paradiesspiels . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5 Schatzsuche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.6 Der Spielbaum f ur Schatzsuche . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.7 Instrumentenrationalitat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.8 Auszahlungen f ur zwei Lotterien . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.9 Das Zustandspraferenz-Diagramm . . . . . . . . . . . . . . . . . . . . . . . . 18
2.10 Das Maximum-Kriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.11 Das Erwartungswert-Kriterium . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.12 Risikoaversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.13 Das Erwartungsnutzen-Kriterium bei Risikoaversion . . . . . . . . . . . . . . 22
2.14 Das St. Petersburg-Paradoxon . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.15 Battle of sexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.16 Die extensive Form von battle of sexes . . . . . . . . . . . . . . . . . . . . . . 32
2.17 Normalform von Gemeinsame Schatzsuche . . . . . . . . . . . . . . . . . . . . 33
2.18 Koalitionsform von Gemeinsame Schatzsuche . . . . . . . . . . . . . . . . . 33
2.19 Seeschlacht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.20 Das Dilemma des Samariters . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.1 Systematik der nichtkooperativen Spieltheorie . . . . . . . . . . . . . . . . . . 42
3.2 Die Informationsmengen bei battle of the sexes . . . . . . . . . . . . . . . . . 43
3.3 Die Normalform des Gefangenendilemmas . . . . . . . . . . . . . . . . . . . . 46
3.4 Nash-Gleichgewicht im Gefangenendilemma . . . . . . . . . . . . . . . . . . . 47
3.5 Arbeiter und Unternehmer im Gefangenendilemma . . . . . . . . . . . . . . . 48
3.6 Das Gefangenendilemma bei der Bereitstellung oentlicher G uter . . . . . . . 49
3.7 Die Normalform-Darstellung von matching pennies . . . . . . . . . . . . . . . 50
3.8 Die Reaktionsfunktionen der beiden Spieler in matching pennies . . . . . . . 51
3.9 Das Nash-Gleichgewicht in gemischten Strategien f ur matching pennies . . . . 52
3.10 Die Fixpunkteigenschaft der Reaktionsfunktion in einem 2-Personen-Spiel . . 54
3.11 Das Cournot-Duopolmodell . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.12 Das Allmende-Problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.13 Das Barro-Gordon-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.1 R uckwartsinduktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.2 R uckwartsinduktion bei battle of sexes . . . . . . . . . . . . . . . . . . . . . . 68
4.3 R uckwartsinduktion bei einem Kartenspiel . . . . . . . . . . . . . . . . . . . . 69
4.4 Das chain store paradoxon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.5 Die extensive Form des Marktzutrittspiels . . . . . . . . . . . . . . . . . . . . 71
4.6 Das Marktzutrittspiels und die Glaubw urdigkeit einer Drohung . . . . . . . . 72
4.7 Wiederholte Spiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
ix
x ABBILDUNGSVERZEICHNIS
4.8 2 Spieler, 2 Strategien, 2 Wiederholungen . . . . . . . . . . . . . . . . . . . . 74
4.9 Strategien bei 2x2x2 Spiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.10 Das wiederholte Marktzutrittspiel . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.11 Ergebnismatrix Battle of the sexes . . . . . . . . . . . . . . . . . . . . . . . 77
4.12 Battle of the sexes: Nash-Gleichgewichte in reinen und gemischen Strategien . 78
4.13 Gleichgewichte in Battle of the sexes . . . . . . . . . . . . . . . . . . . . . . 79
4.14 Normalform eines Gefangenendilemmas mit zusatzlichem Nash-Gleichgewicht 80
4.15 Auszahlungsmatrix eines Gefangenendilemmas . . . . . . . . . . . . . . . . . 82
4.16 Timing im Stackelberg-Duopol . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.17 Timing im Stackelberg-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.18 Qualitative Eigenschaften eines Stackelberg-Gleichgewichts . . . . . . . . . . 89
4.19 Qualitative Eigenschaften eines Nash-Gleichgewichts . . . . . . . . . . . . . . 90
5.1 Ein dynamisches Spiel mit unvollkommener Information . . . . . . . . . . . . 97
5.2 Ein dynamisches Spiel mit unvollkommener Information . . . . . . . . . . . . 99
5.3 Normalform des Teilspiels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.4 Struktur eines Signalspiels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.5 Screening auf dem Versicherungsmarkt . . . . . . . . . . . . . . . . . . . . . . 105
5.6 Screening auf dem Versicherungsmarkt bei zwei Vertragsoptionen . . . . . . . 106
5.7 Signalspiel auf dem Arbeitsmarkt . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.8 Timing im Modell von Vickers . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.1 Das Verteilungsspiel: splitting the pie . . . . . . . . . . . . . . . . . . . . . . . 117
6.2 Endliche sequentielle Verhandlung . . . . . . . . . . . . . . . . . . . . . . . . 118
6.3 Unendliche sequentielle Verhandlung: Das Rubinstein-Spiel . . . . . . . . . . 120
6.4 Losungen des Rubinstein-Spiels . . . . . . . . . . . . . . . . . . . . . . . . . . 122
6.5 Das Rubinstein-Spiels mit Auenoptionen . . . . . . . . . . . . . . . . . . . . 123
6.6 Ergebnisraum f ur das Rubinstein-Spiel mit Auenoptionen . . . . . . . . . . . 123
6.7 Das Rubinstein-Spiels mit Auenoptionen . . . . . . . . . . . . . . . . . . . . 126
6.8 Die Irrelevanz der Forderungshohe im Glaubigerspiel . . . . . . . . . . . . . . 127
6.9 Die Nicht-Monotonizitat der Nash-Losung . . . . . . . . . . . . . . . . . . . . 128
6.10 Die Kalai-Smorodinsky-Losung . . . . . . . . . . . . . . . . . . . . . . . . . . 129
6.11 Nash- und Kalai-Smorodinsky-Losung bei Glaubigerverhandlungen . . . . . . 130
6.12 Lohnverhandlungen zwischen Belegschaft und Management . . . . . . . . . . 131
6.13 Abwechselnd teilspielperfekte Forderungen in den Lohnverhandlungen . . . . 133
6.14 Timing im Zeuthen-Nash-Jackmann-Modell . . . . . . . . . . . . . . . . . . . 133
7.1 Vier Auktionsformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
7.2 The winners curse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.3 Die Besonderheit der UMTS-Auktion . . . . . . . . . . . . . . . . . . . . . . . 156
Kapitel 1
Literaturhinweise
Die Vorlesung folgt nicht stur einem bestimmten Lehrbuch - was die Existenzberechtigung
dieses Skripts ist. Dies ist deshalb der Fall, weil kein auf dem Markt verf ugbares Buch sowohl
eine fundierte Darstellung der methodischen Grundlagen der Spieltheorie als auch eine
Behandlung der (wirklich interessanten) Anwendungen dieser Methoden gibt.
Daher wird dem Einsteiger in dieses Fach aus den verf ugbaren Lehrb uchern der immen-
se Nutzen und die weitgehende Durchdringung des wirtschaftswissenschaftlichen Theorie-
geb audes durch diese Methode nicht wirklich deutlich. Im Gegensatz dazu versucht diese
Vorlesung, gerade auch spieltheoretische Anwendungen in der makrookonomischen
Theorie zu vermitteln. Dies entspricht nicht nur den komparativen Vorteilen des Verfas-
sers dieses Skripts, sondern soll dazu dienen, zu zeigen, wie die Entwicklung der Spieltheo-
rie die Art des Nachdenkens uber makrookonomische Phanomene verandert hat. Um so
viel vorwegzunehmen: Dieser Einuss spieltheoretischer Methoden war und ist immens. So
ist es beispielsweise schwer vorstellbar, dass sich ohne die Ergebnisse einer spieltheoretisch
fundierten Theorie der Geldpolitik die Zentralbanken rund um den Globus seit Mitte der
1980er Jahre eine deutlich starkere Orientierung am Ziel der Preisstabilitat zu eigen gemacht
h atten.

Ahnlich bedeutsame Impulse durch spieltheoretische Methoden erfuhr bspw. auch
die Arbeitsmarkttheorie. All diese Entwicklungen sind in den gangigen Lehrb uchern kaum
nachvollziehbar.
Dennoch seien die folgenden B ucher f ur die begleitende bzw. erganzende Lekt ure zu
dieser Veranstaltung empfohlen:
Avinash Dixit, Barry Nalebu: Thinking strategically. The Competitive Edge in Busi-
ness, Politics, and Everyday Life, New York: W.W. Norton, 1991.
Dieses Buch liegt auch als deutsche

Ubersetzung vor:
Avinash Dixit, Barry Nalebu: Spieltheorie f ur Einsteiger. Strategisches Know-how
f ur Gewinner, Stuttgart: Schaer-Poeschel-Verlag, 1997.
Das Buch bietet rein verbale Beschreibungen vieler (Bei-) Spiele und vermittelt einen
guten Eindruck in die Denkweise der Spieltheorie und von der Breite der Anwendbar-
keit dieser Ideen wobei allerdings nur wenig Anwendungen auf makrookonomische
Fragestellungen angesprochen werden. Weil jedoch jede formale Beschaftigung mit der
Methode gemieden wird, eignet sich das Buch nicht zur Nacharbeitung des Vorlesungs-
stos.
Manfred J. Holler, Gerhard Illing: Einf uhrung in die Spieltheorie, Heidelberg: Springer-
Verlag, 6. Auage, 2006.
Dieses Buch bietet eine gute, und teilweise sehr formale und nicht leicht verdaubare
Ubersicht uber die Spieltheorie. Vor allem die kooperative Spieltheorie ist hier recht
ausf uhrlich abgehandelt.
1
2 KAPITEL 1. LITERATURHINWEISE
Eric Rasmusen: Games and Information, Malden/MA: Blackwell, 3rd. ed., 2001.
Rasmusen bietet eine sehr gut lesbare und didaktisch auerst empfehlenswerte Einf uhrung
auf relativ hohem Niveau. Als eines der wenigen Lehrb ucher bietet Rasmusen auch ein
Kapitel zu Auktionen an. Es fehlt allerdings die Behandlung der kooperativen Spiel-
theorie.
Robert Gibbons: A Primer in Game Theory, Harlow: Pearson Education, 1992
Hier werden am ehesten die relevanten Anwendungen der Spieltheorie prasentiert.
Insgesamt eines der didaktisch besten B ucher zur nicht-kooperativen Spieltheorie. Ko-
operative Spieltheorie und die Verhandlungstheorie werden nicht behandelt.
Die Liste dieser Empfehlungen ist notwendigerweise selektiv und damit auch etwas
willk urlich. Gerade auf dem Markt f ur englischsprachige Lehrb ucher ndet sich eine groe
Zahl ausgezeichneter Texte zur Spieltheorie diesem Gebiet. Abgesehen vom gewahlten Ni-
veau der formalen Darstellung unterscheiden sich diese Texte insb. in der Auswahl der
Anwendungsbeispiele sowie in der Auswahl der Teile, die uber die Kapitel 2 bis 5 dieser
Vorlesung hinausgehen. Die grundlegenden Konzepte sind jedoch trotz einer bisweilen
nicht immer leicht zu entwirrenden Unterschiedlichkeit in der exakten Begrisverwendung
uber verschiedene Autoren hinweg weitgehend kanonisiert, womit verschiedene Lehrb ucher
durchaus gut gegeneinander substituierbar sind.
Kapitel 2
Einf uhrung: Elemente der
Spieltheorie
2.1 Lernziele
Ein Spiel gehort zu den Dingen, von denen bereits ein Kleinkind eine ziemlich konkrete
Vorstellung hat. Daher ist es vielleicht uberraschend, ausgerecht in einer relativ speziellen
Veranstaltung im Hauptstudium auf eine Veranstaltung mit dem Titel Spieltheorie zu sto-
en. In diesem einleitenden - allerdings recht umfanglichen - Kapitel geht es daher zunachst
um die Inhalte und die wesentlichen Begrie der Spieltheorie. Im Einzelnen soll Ihnen dieses
Kapitel Vorstellungen davon vermitteln,
welche Besonderheit die Spieltheorie relativ zu anderen Theoriezweigen aufweist, kon-
kret, dass es auf einer sehr allgemeinen Ebene immer um die Analyse strategischer
Interdependenz geht;
was genau die (formalen) Elemente eines Spiels sind;
dass die Anwendungsbereiche der formalen Spieltheorie nicht nur Fragestellungen
der Volkswirtschaftslehre betreen, sondern wesentlich weitergehend sind;
welche grundlegenden (und n utzlichen) Klassikationen von Spielen in der Literatur
vorgenommen werden;
was die nutzentheoretischen Grundlagen der Spieltheorie sind und dass es diese
uberhaupt braucht;
welchen Stellenwert das Rationalitatspostulat f ur die Akteure in der Spieltheorie
besitzt und inwiefern dieses Postulat eine n utzliche bzw. realitatsnahe Annahme
darstellt;
welche alternative (formale) Darstellungen von Spielen es gibt;
welche grundsatzlichen Losungsstrategien f ur ein Spiel (unter verschiedenen Vor-
aussetzungen) es gibt bzw. wie Losungen eines Spiels charakterisiert werden konnen.
2.2 Was ist Spieltheorie?
Game theory is concerned with the actions of decision makers who are conscious
that their actions aect each other.
(Rasmusen, 2001, p. 11)
3
4 KAPITEL 2. EINF
UHRUNG: ELEMENTE DER SPIELTHEORIE

Game theory is everywhere these days.
(Hargreaves Heap/Varoufakis, 1995, p. 1)
In diesem ersten Unterabschnitt wollen wir uns zunachst vor Augen f uhren, was Spiel-
theorie uberhaupt ist. Dazu betrachten wir zunachst in 2.2.1 das zentrale Element spiel-
theoretischer Situationen, das Vorliegen strategischer Interdependenz. Eine etwas formalere
Auistung der Elemente eines Spiels 2.2.2 schliet sich an, bevor in den Abschnitten 2.2.3
und 2.2.4 zwei (Bei-) Spiele analysiert werden.
2.2.1 Modellierung strategischer Interdependenz
Im volkswirtschaftlichen Grundstudium wird man fast ausschlielich mit zwei sehr speziellen
Annahmen uber Marktformen konfrontiert, namlich
der vollstandigen Konkurrenz
dem unilateralen Monopol (in aller Regel: Angebotsmonopol)
Obgleich diese Marktformen denkbar gegensatzlich sind, haben sie doch eines gemeinsam:
Das Angebotsverhalten der einzelnen Akteure kann relativ einfach modelliert werden, weil
Aspekte strategischer Interdependenz wegfallen:
Im Fall vollstandiger Konkurrenz sind es so viele Akteure, dass das Verhalten des Einzel-
nen f ur die jeweils anderen (annahmegema) keine Rolle spielt. Also wird jede(r) Einzelne
das Verhalten der anderen als Datum hinnehmen, das von ihm oder ihr nicht beeinussbar
ist. Insbesondere der Preis einer Ware ist f ur den Einzelnen Akteur ein Datum, da die von
ihm produzierbare Menge nur den sprichwortlichen Tropfen auf den heien Stein ausmacht
und daher den Marktpreis nicht zu beeinussen vermag. Daher spricht man auch von den
Anbietern bei vollstandiger Konkurrenz von Preisnehmern bzw. von Mengenanpassern.
Im Fall des Monopols ist das noch einfacher zu verstehen, da hier nur ein Akteur uber-
haupt auftritt. Dieser kann (gegeben die Nachfragefunktion f ur das entsprechende Produkt)
frei wahlen, insbesondere kann er auch den Preis nach Belieben (also gewinnmaximal) setzen.
Daher spricht man von einem Angebotsmonopolisten als einem Preissetzer.
In vielen Markten besteht aber eine Situation, in der eine noch uberschaubare Mehrzahl
von Anbietern auftritt. Da die Anbieter um die gleichen Nachfrager konkurrieren, wird ihr
Verhalten nicht nur von der Nachfrageseite (Lage und Steigung der Nachfragefunktion) und
der betrieblichen Kostenfunktion abhangen, sondern auch vom Verhalten der anderen
Anbieter. Da dies f ur alle Anbieter gilt, spricht man von einer Situation strategischer Inter-
dependenz: Das individuell optimale Verhalten hangt vom Verhalten der anderen Akteure
ab. Wenn sich eine solche Situation auf die Angebotsseite von Markten bezieht, spricht man
dabei von Oligopolen.
Abbildung 2.1 verdeutlicht dies f ur das Beispiel eines Tripols.
Anbieter1
Anbieter2 Anbieter3
Abbildung 2.1: Strategische Interdependenz in einem Tripol
Bei mehr als einem, aber nicht sehr vielen Anbietern hangt das Verhalten jeden Akteurs
vom Verhalten der jeweils anderen Akteure ab. Man spricht dabei von strategischer Inter-
dependenz.
Im Gegensatz zur Charakterisierung von Markten unter vollstandiger Konkurrenz oder
im Fall eines Angebotsmonopols, liefert die Analyse von Oligopolen keine eindeutigen
2.2. WAS IST SPIELTHEORIE? 5
Ergebnisse, da hier sehr viel darauf ankommt, exakt wie die strategische Interdependenz
aussieht. So macht es beispielsweise einen enormen Unterschied, ob die Oligopolisten mit
ihren jeweiligen Mengen (Mengenwettbewerb; Cournot-Losung), oder aber mit den Preisen
(Preiswettbewerb; Betrand-Losung) aufeinander reagieren. Wenn man nicht a priori eine
Vorstellung davon hat, welches Szenario realistischer ist, ist die einzige Aussage, die die Oli-
gopoltheorie treen kann, dass die Losung zwischen der Konkurrenz- und Monopollosung
liegt was nicht gerade eine sehr scharfe Aussage ist.
Wir werden diese Modellierungen in spateren Abschnitten der Vorlesung genau kennen
lernen, konnen aber hier bereits festhalten, dass die Analyse von Situationen mit strategi-
schen Interdependenzen haug keine eindeutige Losung hat, sondern dass solche Situationen
durchaus auch mehrere plausible Losungen aufweisen konnen.
Das Merkmal der strategischen Interdependenz kann auch benutzt werden, um sich zu
verdeutlichen, dass Spiele im umgangssprachlichen Wortsinn genau dieses auch oft bein-
halten. Beispiele daf ur sind:
Schach ( uber dessen Eigenschaften sogar eines der ersten Ergebnisse der Spieltheorie
formuliert wurde, namlich Zermelos Theorem, vgl. Abschnitt 2.7.2 auf Seite 36)
Monopoly (das falschlicherweise so heit, weil der ganze Spa daher r uhrt, dass es sich
um Oligopolsituationen handelt - nicht umsonst endet ja das Spiel spatestens dann,
wenn sich ein(e) Monopolist(in) herausgestellt hat)
Fuball (was hier genannt werden soll, um sofort den Punkt zu verdeutlichen, dass
eine noch so gewiefte und fachkundige Analyse aller Regeln und Ausgangsbedingungen
zwar zu einem fundierten Tip, nicht aber nicht zu notwendigerweise zur Prognose
des richtigen Ergebnisses f uhren muss)
Patience (Spiel gegen die Natur)
2.2.2 Elemente eines Spiels
Die Charakterisierung jedes Spiels kann letztlich auf die folgenden zentralen Elemente zur uck-
gef uhrt werden:
Die Menge der Spieler i I mit I = {1, 2, . . . , I}.
1
Als Spieler werden nur die aktiv
am Spiel beteiligten Akteure bezeichnet. Bisweilen nden sich auch Situationen, in
denen die Natur irgend eine Zufallsentscheidung trit (bspw. ob nach der Gr undung
eines Unternehmens gleich eine Rezession auftritt oder nicht). Man spricht in diesem
Zusammenhang dann auch von einem (oder mehreren) Pseudospielern.
Beispiele: Der am haugsten analysierte Fall ist ein 2-Personen-Spiel mit I = {1, 2},
wof ur Schach ein Beispiel ist. Bei der Analyse eines Tripols ist I = {1, 2, 3}. Die Natur
als Pseudospieler tritt in jedem Kartenspiel auf, da hier die Karten zufallig gemischt
werden. Daher werden Spiele wie beispielsweise Solitaire (I = {1}) auch als Spiele
gegen die Natur bezeichnet.
Die Strategiemengen (reine Strategien - das sind eindeutig denierte Aktionen im
Gegensatz zu zufalligen Kombinationen von reinen Strategien, die gemischte Strate-
gien genannt werden) S
i
, die jedem der Spieler zur Verf ugung stehen. Die Strategie
selbst (s
i
S
i
) - also die Wahl aus der Strategiemenge ist letztlich das Ergebnis
einer spieltheoretischen Analyse und speziziert, welche Aktion jeder Spieler zu jedem
Zeitpunkt vor dem Hintergrund seines Informationsstandes wahlt. Ein wichtiger Be-
standteil der Strategiemengen ist, welchen Zug man wann machen kann, d.h. ob der
1
Dass f ur die Menge und deren Groe - und damit deren letztes Element - das gleiche Symbol verwendet
werden ist eine haug benutzte Konvention und wird hier benutzt, solange dies nicht zu Konfusion Anlass
gibt.
6 KAPITEL 2. EINF

oder die andere(n) Spieler mit ihren Aktionen vor oder nach einer moglichen eigenen
Aktion ziehen d urfen.
Beispiele: Im Schach besteht die Strategiemenge aus den Regeln nach denen jede der
Figuren ziehen darf und aus der Tatsache, dass nach der Eronung durch Wei immer
abwechselnd gezogen werden muss. Bei der Cournot-Losung des Oligopol-Modells sind
dies die Ausbringungsmengen der einzelnen Unternehmen, bei der Betrand-Losung
die Preise. Hier sind die die Strategievariablen also stetig variierbar. Oft - und gleich
in Abschnitt 2.2.3 - betrachten wir aber auch Situationen, in denen die Strategieva-
riable dichotom ist, beispielsweise kann ein Markteintrittsspiel im einfachsten Fall
speziziert werden mit den Handlungsoptionen eintreten und nicht eintreten
Die Auszahlungsfunktionen (payo functions) u
i
(s) aller Spieler, die nat urlich
abhangen von den aus der Strategienmenge S
i
tatsachlich gewahlten Strategien al-
ler I Spieler s = {s
1
, s
2
, . . . , s
I
}.
Beispiele: Bei Schach gibt es einfach nur die Dreiteilung: Sieg, Niederlage, Remis.
Bei anderen Spielen kann das Remis sogar wegfallen. Haug ist einfach der Gewinn
(bei Oligopolmodellen) bzw. dessen Nutzen die relevante Auszahlungsfunktion.

Uber
die Anforderungen an die Auszahlungsfunktion werden wir uns noch in Abschnitt 2.4
naher unterhalten.
Schlielich ist der Informationsstand der Spieler von entscheidender Bedeutung.
Haug wird hier die Annahme getroen, dass alle Spieler jeweils alle der drei oben
genannten Merkmale des Spiels kennen (und dass alle wissen, dass alle alles wissen).
Allerdings wird haug ein Spiel gerade dadurch interessant, dass bestimmten Akteu-
ren bestimmte Informationen nicht vorliegen. Als Beispiele seien genannt: Lohnsetzer
kennen nicht das Ausma der Inationsaversion der Zentralbank; Arbeitgeber kennen
nicht die genaue Qualikation bzw. Leistungsfahigkeit eines Bewerbers. Abschnitt 5.4
auf Seite 104 nimmt diese Beispiele genauer unter die Lupe.
2.2.3 Anwendungsbereiche der Spieltheorie, oder: Warum das Pa-
radies mit dem S undenfall enden musste
Since God does not always get His way, He can properly be viewed as a parti-
cipant, or player, in a game
(Brams, 2003, p. 5)
Die Spieltheorie ist letztlich eine Analysemethode und als solche oen f ur Anwendungen
aus allen moglichen Bereichen. Daher kann die Spieltheorie auch als Hilfswissenschaft
anderer Disziplinen verstanden werden. Einzige Voraussetzung f ur die Anwendbarkeit der
Spieltheorie ist, dass die zu analysierende Situation eine strategische Interaktion von Spielern
betrachtet.
Einige Beispiele (die keineswegs eine abgeschlossene Liste darstellen) helfen dabei, den
Einsatzbereich der Spieltheorie abzuschatzen.
VWL: Modellierung der Interaktion von Geld- und Lohnpolitik, Analyse von (verschie-
denen Arten von) Lohnverhandlungen
BWL: Wahl von Marketingstrategien, Modellierung des Verhaltens bei Auktionen (und
damit auch design der Auktionen)
Politikwissenschaft: Parteienwettbewerb
Biologie: Wettbewerb innerhalb und zwischen verschiedenen Populationen um knappe
Ressourcen (Wasser, Nahrung, Nistplatze, . . . )
Militar: (Strategische) Kriegsf uhrung; Kalter Krieg
1
Religionswissenschaft: Die Bibel enthalt - wie alle interessanten B ucher - eine ganze
Reihe von Geschichten, die mehr oder weniger komplexe Entscheidungssituationen
beinhalten. Deren spieltheoretische Aufarbeitung ist Gegenstand des Buches von Ste-
ven J. Brams (2003) - und eine empfehlenswerte und spannende Lekt ure.
Als Verdeutlichung der universellen Einsetzbarkeit der Spieltheorie gehen wir zur uck zum
(biblischen) Beginn der Welt und analysieren die wahrscheinlich allgemein bekannte Situa-
tion, die zum S undenfall und zur Vertreibung aus dem Paradies f uhrte. Ein wenig Spiel-
theorie hilft zu verstehen, warum vor dem Hintergrund der biblisch belegten bzw. begr und-
baren Praferenzen der beteiligten Akteure letztlich gar nichts anderes als die Vertreibung
von Adam und Eva aus dem Paradies herauskommen konnte.
2
Gleichzeitig vermittelt das
Beispiel eine hilfreiche Anwendung der im letzten Abschnitt vorgenommenen allgemeinen
Charakterisierung eines Spiels.
Die Spieler:
Die Situation wird dargestellt als ein 2-Personenspiel zwischen Gott auf der einen Seite und
Adam und Eva auf der anderen Seite.
3
Die Strategienmengen:
Gott: Gott kann nat urlich alle Parameter frei wahlen. Bevor das hier zu analysierende
Spiel beginnt, hat er sich aber bereits entschieden, dass er einen Menschen mit freiem
Willen einer willenlosen Marionette vorzieht. Gegeben, dass also Adam und Eva uber
einen freien Willen verf ugen, kann Gott wahlen, ob er den beiden verbietet, die Frucht
vom Baum der Erkenntnis zu essen oder ob er dieses Verbot nicht ausspricht. Er
entschied sich bekanntermaen f ur das Verbot, denn vom Baum der Erkenntnis von
Gut und Bose darfst du nicht essen; denn sobald du davon isst, wirst du davon sterben
(Gen 2,17). Wir unterscheiden daher die beiden folgenden Moglichkeiten: verbieten
und nicht verbieten.
Adam und Eva: Unabhangig von dem Verbot, haben sie die Moglichkeit, vom Baum
der Erkenntnis zu essen oder nicht zu essen.
Durch die 2x2 Aktionsmoglichkeiten eronen sich vier denkbare Ergebniskonstellationen,
die in Abbildung 2.2 auf der nachsten Seite einfach mit romischen Zahlen durchnummeriert
werden.
Diesen vier denkbaren Ergebnissen m ussen nun noch Nutzenwerte der Akteure beige-
messen werden.
1
Die Spieltheorie wurde bereits sehr fr uh f ur militarische Zwecke eingesetzt, so hat auch einer der wichtig-
sten Spieltheoretiker - der Nobelpreistrager John Nash - f ur das amerikanische Militar gearbeitet. Auch einer
der drei Nobelpreistrager des Jahres 2005 - Thomas Schelling - bekam den Preis f ur die spieltheoretische
Durchdringung eines militarischen Problems, namlich des kalten Krieges.
2
Das Beispiel ist entnommen aus Brams (2003), ch. 2.
3
Nat urlich ist die Zusammenfassung von Adam und Eva eine Vereinfachung, die wir aber zunachst akzep-
tieren wollen. Selbstverst andlich ist auch die Interaktion zwischen Adam und Eva einer weiteren spieltheo-
retischen Analyse zuganglich und auch die Schlange kann mit einbezogen werden. F ur Details sei auf das
angegebene Buch von Brams hingewiesen. (Im

Ubrigen ist der Bibel zu entnehmen, dass sich Adam beim
Paradiesspiel recht passiv verhielt. Nachdem sich Eva von der Schlange hat verf uhren lassen und von der
verbotenen Frucht gegessen hatte, heit es in Gen 3,6 etwas lapidar: Sie gab auch ihrem Mann, der bei ihr
war, und auch er a.)
8 KAPITEL 2. EINF

AdamundEva
nichtessen essen
verbieten
Gott
nichtverbieten
I II
III IV
Abbildung 2.2: Ergebnisraum im Paradiesspiel
Jede denkbare Kombination von Aktionen der Spieler f uhrt zu einem moglichen Ergebnis
des Spiels. Bei 2x2 Aktionen sind dies vier Moglichkeiten.
Die Auszahlungfunktionen:
Uber Nutzenfunktionen berichtet die Bibel nur etwas zur uckhaltend, dennoch konnen wir
die folgenden Reihungen aufstellen:
Gott fande es am besten, wenn Adam und Eva nicht vom Baum der Erkenntnis essen,
ohne dass er dies verbieten und mit dem Ausschluss aus dem Paradies drohen m usste.
So w urde ihm die Drohung erspart bleiben und dennoch nach seinem Willen gehandelt
werden. Schon etwas weniger gut ist, wenn Adam und Eva zwar nicht essen, aber nur
deswegen, weil er gedroht hat.
1
Noch weniger zufrieden ware Gott, wenn er zwar das
Verbot ausspricht, Adam und Eva aber dennoch essen. Und das f ur Gott schlechteste
Resultat moge sein, dass er das Verbot nicht ausspricht und Adam und Eva vom Baum
der Erkenntnis essen.
2
F ur Gott gilt also, dass III I II IV. Wir konnen diesen
Situationen Auszahlungen (Nutzenwerte) in Hohe von 4, 3, 2 und 1 beilegen. F ur die
Losung des Spiels gen ugt es jedoch, wenn die die Auszahlungen als ordinale Reihung
verstanden wird, eine kardinale Interpretation ist nicht zwingend erforderlich.
Adam und Eva hingegen fanden es nat urlich am besten, wenn sie vom Baum der
Erkenntnis essen konnten ohne dabei gegen ein gottliches Verbot verstoen zu m ussen.
Das zweitbeste Resultat ware f ur sie, der Versuchung auch gegen ein gottliches Verbot
nachzugeben - Erkenntnis ist schlielich ein hohes Gut und verbotene Fr uchte waren
schon immer s u. Schlechter sind f ur Adam und Eva alle Situationen, die mit nicht
essen assoziiert sind. Wenn Gott das Verbot auferlegt, konnen sie sich wenigstens am
Wohlgefallen Gottes freuen, was die Situation f ur sie noch besser macht als wenn sie
ohne Verbot auf den Genuss der Frucht verzichten. F ur Adam und Eva gilt also IV
II I III. Auch hier konnen wir den Situationen (in der genannten Reihenfolge) die
Nutzenwerte 4, 3, 2 und 1 zuordnen.
Dies f uhrt zu der Ergebnismatrix in Abbildung 2.3 auf der nachsten Seite.
Ein genauer Blick auf die Ergebnismatrix zeigt, dass die Interessen genau entgegengesetzt
sind, wobei in allen Situationen die Auszahlungssummen gleich hoch sind. Eine solche
1
Diese Reihenfolge ist vielleicht nicht theologisch zwingend, dahinter steckt aber die Idee, dass Gott es
schatzen w urde, wenn die Menschen das gew unschte Verhalten aus vollig freien St ucken an den Tag legten.
2
Auch diese Reihenfolge ist nicht zwingend, aber zu rechtfertigen. Man kann sich vorstellen, dass Gott
im letzten Fall (Fall IV) es bereuen w urde, die Beschrankung nicht ausgesprochen zu haben und Adam und
Eva vollig ungewarnt ins Verderben rennen lie.
AdamundEva
nichtessen essen
verbieten
Gott
nichtverbieten
(3,2) (2,3)
(4,1) (1,4)
Abbildung 2.3: Ergebnismatrix im Paradiesspiel
Die erste Zahl gibt jeweils die Auszahlung f ur Gott, die zweite Zahl die Auszahlung f ur
Adam und Eva an.
Situation wird als Konstantsummenspiel bezeichnet.
1
Es ist zu beachten, dass daf ur die
Nutzenwerte der Spieler zwischen Situationen und Spielern numerisch verglichen werden
m ussen. Damit wird eine kardinale Messbarkeit von Nutzen unterstellt. F ur eine nur
ordinale Nutzenmessung kann man nicht von einem Konstantsummenspiel sprechen.
Informationsverteilung und Timing:
Als letztes Charakteristikum sind die Annahmen uber die Informationsverteilung und das
Timing der einzelnen Spielz uge zu benennen. Wir gehen hier von vollkommener Information
aller Ergebnisse und Konsequenzen bei allen Akteuren aus. Sowohl Gott als auch Adam und
Eva kennen also die Ergebnismatrix in Abbildung 2.3 und wissen, dass der jeweils andere sie
auch kennt. Bzgl. der Reihenfolge der Spielz uge wird angenommen, dass Gott zuerst zieht
und erst dann Adam und Eva ihre Entscheidung treen konnen.
Losung:
Die gerade genannte Timing-Annahme kann in einem so genannten Spielbaum (game tree)
zum Ausdruck gebracht werden. Dieser ist in Abbildung 2.4 auf der nachsten Seite zu sehen.
Mit Hilfe dieses Instruments konnen wir uns der Losung bereits gut nahern. Da Gott
zuerst zieht, muss sein Kalk ul als erstes verdeutlicht werden.
2
Daf ur ist jedoch entscheidend,
dass das Ergebnis auch davon abhangt, was Adam und Eva tun. Ein Blick auf den Entschei-
dungsbaum zeigt Gott, dass auf Stufe 2 Adam und Eva immer die Option essen wahlen
werden egal was Gott in Stufe 1 tut.
3
Die Ergebnisse I und III sind also aus dem Rennen,
es bleiben die Moglichkeiten II und IV. Gott sieht also, dass er sich die Auszahlungen 4 und
3 zwar nicht sichern kann, durch die Auferlegung der Beschrankung aber immerhin noch 2
(an Stelle von 1) erreichen kann. Also wird Gott in Stufe 1 die Aktion verbieten wahlen
und Adam und Eva in Stufe 2 die Aktion essen. Und genau so steht es nat urlich auch in
der Bibel.
Damit haben wir das erste Spiel aufgeschrieben und gelost, wobei hier die Situation so
gestaltet war, dass sich eine Losung eindeutig ableiten lie. Im Verlauf des Abschnitts 2.3
1
Durch geeignete Normierung der Auszahlungen konnte man das Spiel in ein so genanntes Nullsum-
menspiel umformen, was eine sehr wichtige Kategorie darstellt. Vgl. Abschnitt 2.3.3 auf Seite 13 zu diesem
Punkt. Zu beachten ist, dass daf ur ein kardinales Nutzenkonzept vorausgesetzt werden muss.
2
Diese Vorgehensweise wird als R uckwartsinduktion bezeichnet.
3
Man sollte sich daran erinnern, dass Gott in einer vorgelagerten Entscheidung sich bereits f ur die
Sch opfung von Menschen mit freiem Willen entschieden hat, dies also oensichtlich gegen uber willensfreien
Gesch opfen praferierte.
10 KAPITEL 2. EINF

v
e
r
b
i
e
t
e
n
n
i
c
h
t
v
e
r
b
i
e
t
e
n
n
ic
h
t
e
s
s
e
n
e
sse
n
I(3,2)
II(2,3)
III(4,1)
IV (1,4)
n
ic
h
t
e
s
s
e
n
e
sse
n
Gott A&E
Abbildung 2.4: Spielbaum des Paradiesspiels
Hier ist die Annahme sichtbar gemacht, dass Gott zeitlich bzw. logisch vor Adam und Eva
zieht.
wird dieses Paradiesspiel als Beispiel f ur die unterschiedlichen Merkmale von strategischen
Interaktionen (d.h. von Spielen) dienen.
2.2.4 Ein degeneriertes Beispiel: Ein-Personen-Spiel mit vollkom-
mener Information (Schatzsuche)
Um die Bestandteile eines Spiels noch klarer zu machen, wird in diesem Abschnitt ein
denkbar einfaches Spiel analysiert (vgl. Gardner 1995, ch. 1.3). Es gibt nur einen Spieler,
weshalb das Spiel degeneriert ist in dem Sinn, dass strategische Interaktionen keine Rolle
mehr spielen konnen.
1
Nennen wir diesen Spieler 1.
Weiterhin gibt es vollkommene Information, d.h. der Spieler kennt alle relevanten Umstande.
Das Spiel besteht darin, dass 1 ein Labyrinth betritt und
entweder im Labyrinth gegen eine Wand stot, womit das Spiel mit einer Auszahlung
von Null beendet ist (einfach umkehren ist also nicht zulassig),
oder am Ausgang des Labyrinths einen Schatz ndet, den er als Preis des Werts W
erhalt.
Nennen wird das Spiel daher Schatzsuche. Das (sehr ubersichtliche) Labyrinth ist in
der folgenden Abbildung 2.5 auf der nachsten Seite zu sehen.
Die Spielermenge ist damit einfach gegeben durch I = {1} Die Strategienmenge
ist wie folgt deniert: In Punkt a: S
1a
= {rechts gehen, links gehen} In Punkt b: S
1b
=
{rechts gehen, links gehen}
Die Auszahlungsfunktion f ur Spieler 1 ist
u
1
=
_
W f ur s
1a
= links gehen und s
1b
= rechts gehen
0 sonst
Wie schon f ur das Paradiesspiel konnen wir auch f ur Schatzsuche einen Spielbaum auf-
zeichnen. Dieser ist in Abbildung 2.6 auf der nachsten Seite gezeigt.
Die Punkte a und b in dem Baum bezeichnet man als Knoten; von diesen gehen die
Aste (oder Kanten) aus, die durch die Handlungsoptionen gegeben sind. Geht von einem
1
Wenn irgendwelche Informationsunvollkommenheiten f ur den einen Spieler bestehen, so spricht man von
einem Spiel gegen die Natur.
2.3. KLASSIFIKATION VERSCHIEDENER ARTEN VON SPIELEN 11
Eingang a
b
Abbildung 2.5: Schatzsuche
In den Punkten a und b ist jeweils die Entscheidung rechts oder links zu fallen. Am Ausgang
wartet der Preis.
l
i
n
k
s
r
e
c
h
t
s
l
i
n
k
s
r
e
c
h
ts
0
0
W
Abbildung 2.6: Der Spielbaum f ur Schatzsuche
Knoten kein Ast mehr nach rechts weiter, spricht man von einem Endknoten. Die Auszah-
lungsfunktion weist jedem Endknoten einen bestimmten Wert zu.
Man sieht auch hier die Losung sofort. Wenn Spieler 1 das Labyrinth kennt, wird er
nat urlich die Strategie {s
1a
, s
1b
} = {links gehen, rechts gehen} wahlen. Dies ist unter den
drei generell denkbaren Kombinationen die einzige mit einer positiven Auszahlung.
2.3 Klassikation verschiedener Arten von Spielen
Ein Blick in ein spieltheoretisches Lehrbuch kann leicht den Eindruck einer mehr oder we-
niger gut geordneten Sammlung verschiedener (Bei-) Spiele erwecken. Um diesem Eindruck
entgegenzuwirken, werden in diesem Abschnitt die f unf wichtigsten Charakteristika von Spie-
len vorgestellt. Ein konkretes Spiel ist dann immer charakterisiert durch eine Kombination
dieser Charakteristika. In den folgenden f unf Unterabschnitten werden diese Merkmale vor-
gestellt und kurz diskutiert, Abschnitt 2.3.6 auf Seite 14 klassiziert drei Spiele gema dieser
Kriterien.
2.3.1 Kooperative vs. nicht-kooperative Spiele
Die Spieltheorie besteht zum weitaus uberwiegend Teil aus der Analyse non-kooperativer Si-
tuationen. In diesen nicht-kooperativen Spielen wird angenommen, dass die Spieler
strikt gegeneinander spielen in dem Sinn, dass sie sich nicht f ur die Auszah-
lungen der anderen Spieler oder f ur eine Teilmenge dieser Auszahlungen in-
teressieren, sondern nur an den eigenen Auszahlungen ein Interesse nehmen.
Die Mitspieler sind also nur insoweit von Interesse, als deren Aktionen die eigenen Ziele
tangieren. Mit solchen Situationen werden wir uns auch in der Vorlesung im Wesentlichen
beschaftigen. Dies reektiert die Tatsache, dass die Theorie non-kooperativer Spiele deutlich
12 KAPITEL 2. EINF

besser ausgebaut ist als die Theorie kooperativer Spiele.
1
In Situationen mit strategischen Interaktionen ist es aber durchaus moglich, dass es
Kooperationen zwischen einzelnen Spielern gibt. Im Extremfall ist sogar eine Kooperati-
on aller Spieler miteinander denkbar, was dann wieder zu einem degenerierten Spiel (vgl.
Abschnitt 2.5 auf Seite 22) ohne (echte) strategische Interaktion f uhrt. Bei allseits koope-
rationsfreudigen Oligopolisten spricht man von einem Kartell, das sich wie ein Monopolist
verhalt. F ur solche Kartelle gibt es zahlreiche Beispiele, das bekannteste ist das

Olkartell der
OPEC. Das entscheidende Merkmal kooperativer Spiele ist die Moglichkeit, dass einzelne
Spieler bindende und glaubw urdige Verhaltensank undigungen (commitments)
machen konnen, die f ur ein kooperatives Gleichgewicht unerlasslich sind. Auf das Beispiel
der OPEC gem unzt heit dies, dass alle Teilnehmerlander sich auf eine Forderquote einlas-
sen und auf diese verpichten m ussen. Wenn diese Selbstverpichtungen nicht glaubw urdig
sind, bricht das kooperative Gleichgewicht zusammen - was bei Kartellen nicht gerade selten
auch in der Realitat der Fall ist. Der Grund daf ur liegt darin, dass ausgehend von einem
kooperativen Optimum fast immer Anreize f ur den Einzelnen gibt, sich anders zu verhal-
ten. Mit dieser

Uberlegung r uckt das Konzept der Glaubw urdigkeit in den Mittelpunkt des
Interesses.
Mit der Analyse der Moglichkeit, dass einzelne Spieler Koalitionen untereinander bilden
konnen, setzt sich die Theorie kooperativer Spiele auseinander, die wir in Kapitel 8 auf
Seite 157 kennen lernen werden.
Das Paradiesspiel aus Abschnitt 2.2.3 auf Seite 6 ist ein non-kooperatives Spiel, da
zwischen Gott sowie Adam und Eva keine Absprachen getroen werden. In dem Konstant-
summenspiel kann es auch insofern nicht zu Kooperation kommen, als das was den einen
Spieler besser stellt, den anderen immer um den gleichen Betrag schlechter stellt. Koope-
ration ist namlich nur dann zu erwarten, wenn sich daraus potentielle Vorteile f ur beide
ergeben konnen. In einem Konstantstummenspiel ist die per Konstruktion nicht der Fall. Im
Gegensatz dazu liegen f ur ein Kartell liegen die potentiellen Vorteile einer Kooperation auf
der Hand: Durch Kooperation lassen sich die Gewinn aller beteiligten Anbieter
relativ zu einer Situation ohne Kooperation steigern. Die in der Praxis bisweilen
sehr schwierig zu losende Frage ist dann nur noch die nach der Verteilung dieser Gewinne.
2.3.2 Statische (strategic) vs. dynamische (extensive, sequen-
tial) Spiele
Eine weitere wichtige Kategorisierung ist die zwischen statischen und dynamischen Spie-
len. In statischen Spielen
2
wahlen alle Spieler ihre Strategie simultan aus. Dies bedeutet
insbesondere, dass alle Spieler uber das Verhalten der jeweils anderen Spieler nur
Erwartungen bilden konnen, nicht aber deren Verhalten als gegeben und damit
unabhangig vom eigenen Verhalten annehmen konnen. Davon geht man beispiels-
weise in Modell des Cournotschen Duopols aus: Man unterstellt, dass ein jeder Duopolist
seinen Gewinn unter der Annahme maximiert, dass der jeweils andere Duopolist dies auch
tut. Die jeweiligen Produktionsmengen werden aber simultan bestimmt.
Im Gegensatz dazu weisen dynamische Spiele
3
eine vorgegebene zeitliche (oder
logische) Reihenfolge der Spielz uge auf.
1
In der Realitat ndet sich oft eine Mischung zwischen kooperativen und nicht-kooperativen Verhaltens-
weisen vor. In der Managementliteratur wurde daf ur bereits das Kunstwort co-opetion (als Synthese aus
co-operation und competition) geschaen.
2
Hier gibt es wie so oft in der Spieltheorie leider keine einheitliche Begrisverwendung in der Literatur.
Bspw. Osborne/Rubinstein (1994) bezeichnen die hier charakterisierten statischen Spiele als strategische
Spiele, in anderen Lehrb uchern wird auch von Spielen in Normalform gesprochen. Dies ist jeweils synonym
miteinander.
3
Auch hier gibt es zwei synonyme Bezeichnungsweisen: Osborne/Rubinstein (1994) sprechen von exten-
sive games, andere (z.B. Gardner 1995, part II) von sequential games.
2.3. KLASSIFIKATION VERSCHIEDENER ARTEN VON SPIELEN 13
So hat im Paradiesspiel Gott vor Adam und Eva gezogen, d.h. Adam und Eva konnten
die Entscheidung verbieten bereits als Datum in ihr Entscheidungskalk ul uber gehor-
chen und nicht gehorchen einieen lassen. Im Beispiel des Duopols spricht man hier von
der so genannten Stackelberg-Losung. Diese Losung postuliert, dass ein Duopolist (der
Stackelberg-F uhrer) seinen Gewinn maximiert unter der Annahme, dass der zweite Duo-
polist (Stackelberg-Folger) dies auch tut, dabei aber die Menge des ersten Duopolisten als
gegeben hinnimmt.
Wir werden im Verlauf der Vorlesung auch Beispiele (Geldpolitik I und Geldpolitik II)
aus der Makrookonomik kennen lernen, in denen die Implementierung einer zeitlichen Rei-
henfolge von Spielz ugen einen ganz entscheidenden Einuss auf das Ergebnis hat.
2.3.3 One-shot games vs. wiederholte Spiele
Unabhangig davon, ob in einer Spielrunde die Akteure simultan oder in einer wohlspezizier-
ten Reihenfolge ihre Spielz uge durchf uhren, kann das so beschriebene Spiel als einmaliges
Ereignis (one-shot game) betrachtet werden oder aber davon ausgegangen werden, dass
dieses Spiel oft (oder sogar unendlich oft) gespielt wird.
Die Losung des wiederholten Spiels muss dabei nicht notwendigerweise einer immer glei-
chen Abfolge der Losung des one-shot games entsprechen. (Ist dies der Fall, ware auch die
Unterscheidung gleich uber ussig.) Der Grund daf ur besteht darin, dass es bei wiederholten
Spielen moglich ist, dass die Spieler voneinander lernen und sich bestimmte Reaktionsmuster
signalisieren konnen. Es kann mithin zu einem Aufbau von Reputation kommen, was
in einem one-shot game nicht moglich ist. Auch die Idee, dass man sich bewusst aus strate-
gischen Erwagungen heraus Handlungsoptionen verbaut (tying ones hand oder burning
bridges) kann nur im Kontext wiederholter Spiele einen Sinn ergeben.
Beispiele:
Die Relevanz eines solchen Reputationsaufbaus liegt in ganz unterschiedlichen Bereichen
auf der Hand. Genannt sei die Beziehung zwischen Lieferanten und Kunden. Wenn
hier ein Lieferant den Kunden bei einer Transaktion nicht so weitgehend wie irgend moglich
ausquetscht, so ist dies nicht unbedingt reiner Altruismus, sondern kann als Reputations-
aufbau mit dem Ziel des Abschlusses lukrativer Geschafte auch in der Zukunft verstanden
werden. Allerdings besteht dieser Anreiz nur dann, wenn davon ausgegangen werden kann,
dass das Spiel zumindest potentiell ein wiederholtes Spiel ist.
Ein h ubsches Beispiel daf ur, dass analoge Situationen wiederholt oder auch one-shot
sein konnen, ist die Entscheidung uber das Geben von Trinkgeld bei einem Restau-
rantbesuch. Hier hat die Tatsache, ob man irgendwo regelmaig wiederkommt und einen
guten Service erhalten mochte, oder auf der Durchreise ist, und das Restaurant voraussicht-
lich nie wieder betritt, durchaus Einuss auf das Verhalten.
Auch in der Theorie der Geldpolitik kann der Aufbau von Reputation eine ganz zentrale
Rolle spielen. Wir werden in der Anwendung Geldpolitik III darauf zur uckkommen.
2.3.4 Nullsummenspiele vs. Spiele mit variablen Auszahlungssum-
men
Mit dem Paradiesspiel haben wir bereits ein Beispiel f ur ein Nullsummenspiel kennen
gelernt. Das entscheidende Merkmal f ur ein Nullsummenspiel ist das folgende: In einem
Nullsummenspiel addieren sich in allen denkbaren Endknoten die Auszahlun-
gen aller Spieler auf Null bzw. zu einem konstanten Wert.
1
Mit anderen Worten:
1
Im Paradiesspiel addieren sich die Auszahlungen jeweils auf 5. Zieht man von jeder Bewertung einfach die
Zahl 2,5 ab, so andert sich nichts an der ordinal denierten Wertschatzung der Entscheidungsalternativen.
Damit bleiben auch die Entscheidungen die gleichen. Die Auszahlungen der Spieler addieren sich aber in
14 KAPITEL 2. EINF

Des einen Verlust ist des (oder der) anderen Gewinn, es handelt sich also um ein reines
Verteilungsspiel. Die Darstellung von Nullsummenspielen in gangigen Lehrb uchern der
Spieltheorie ist relativ ausf uhrlich, was allerdings eher dogmengeschichtliche als materielle
Gr unde hat: Die Analyse von Nullsummenspielen war namlich in dem das Fach praktisch
begr undenden Buch von John von Neumann und Oskar Morgenstern (1944) sehr prominent
vielleicht auch deshalb, weil diese Spiele relativ einfach zu losen sind.
Gerade in okonomischen Kontexten geht es aber sehr viel hauger um variable sum
games
1
, d.h. nicht nur die individuellen, sondern auch die aggregierten Auszahlungen der
Akteure hangen davon ab, welche Strategiekombinationen gewahlt werden.
Beispiele f ur variable sum games:
Als Beispiel moge wieder das aus dem Grundstudium bekannte Duopolmodell dienen. Hier
ist die Summe der Gewinne bei Kooperation (Kartell) hoher als bei Nicht-Kooperation. Aber
auch bei Nicht-Kooperation, wenn also tatsachlich ein Zielkonikt zwischen den Duopolisten
besteht, ist der zusatzliche Gewinn des einen Anbieters nicht unbedingt identisch mit dem
dadurch verursachten zusatzlichen Verlust beim anderen Anbieter.
2.3.5 Spiele mit vollkommener bzw. unvollkommener Information
Eine weitere wichtige Kategorisierung von Spielen bezieht sich auf die Informationslage der
Spieler. Die weitestgehende Annahme uber die Verf ugbarkeit von Information ist, dass al-
le relevante Information allen Spielern zur Verf ugung steht. In Abschnitt 3.2 auf Seite 42
wird darauf noch detaillierter einzugehen sein. F ur den Moment soll etwas lose festgelegt
werden, dass man von einem Spiel mit vollkommener oder perfekter Information
spricht, wenn alle Spieler bei jeder Entscheidung genau wissen, in welcher Situation sie
sich benden, welche Entscheidungsalternativen zur Verf ugung stehen, ggf. wie das Spiel
weitergehen wird (bzw. kann), und welches die Auszahlungen in jedem Endknoten sind.
Prototypisches Beispiel daf ur ist Schach, aber auch das Paradiesspiel ist ein Spiel mit voll-
kommener Information, da Adam und Eva bei ihrer Entscheidung wissen, ob sie einem
gottlichen Verbot unterliegen und auch die Konsequenzen ihrer Entscheidungsalternativen
kennen. Fehlt irgendeinem Spieler an irgendeinem Punkt des Spiels ein Teil der Information,
so spricht man von Spielen mit unvollkommener Information. Statische Spiele weisen
per Konstruktion eine gewisse Informationsunvollkommenheit auf: Da die Entscheidungen
aller Spieler simultan gefallt werden, wei der einzelne Spieler nicht (mit Sicherheit), welche
Entscheidungen die anderen jeweils treen. In der Literatur wird oft uber dieses Merkmal
hinweggesehen und auch von statischen Spielen mit vollkommener Information gespro-
chen. Damit die Einschrankung klar erkennbar bleibt, wird hier bei statischen Spielen, die
keinen weiteren Informationsbeschrankungen unterliegen von statischen Spielen bei an-
sonsten vollkommener Information geredet. Deren Analyse ist Gegenstand von Kapitel 3.
2.3.6 Anwendung
Abschlieend sollen die f unf Charakteristika auf drei Spiele angewendet werden. Bereits
hier behandelt wurde das Paradiesspiel, aus dem Grundstudium sind auerdem auch ohne
genaue spieltheoretische Charakterisierung das Cournot-Duopolspiel sowie die Kartelllosung
bei einem Duopol bekannt.
jedem Endknoten zu Null.
1
Im Deutschen wird daf ur bisweilen der Begri Positivsummenspiel gebraucht. Allerdings ist dies insofern
eher irref uhrend, als es auf die Unterschiede der aggregierten Auszahlungen an verschiedenen Endknoten
ankommt und nicht auf die Frage, welches Vorzeichen diese haben. Daher der etwas sperrige Begri variable
Auszahlungssummen in der

Uberschrift.
2.4. NUTZEN UND ERWARTUNGSNUTZEN 15
Spiel kooperativ
vs. non-
kooperativ
statisch
vs.
dynamisch
one-shot
vs.
wiederholt
konstante
vs.
variable
Summen-
spiel
vollk. vs.
unvollk.
Infor-
mation
Paradies-
spiel
non-
kooperativ
dynamisch one-shot Nullsummen-
spiel
vollk.
Information
Cournot-
Duopol
non-
kooperativ
statisch one-shot (a) variable
Summen
ansonsten
vollk.
Information
(b)
Kartell kooperativ statisch one-shot (a) variable
Summen
ansonsten
vollk.
Information
(b)
Anmerkungen: (a) Einfache Lehrbuchdarstellungen analysieren ublicherweise ein one-
shot game. Gerade die Kartelllosung kann dadurch stabil werden, dass sich die ein-
zelnen Mitglieder in einem wiederholten Spiel eine Reputation daf ur aufbauen, sich
an die vereinbarten Quoten zu halten. Dies wird analysierbar im Kontext eines wie-
derholten Spiels. Gleiches gilt f ur die strategische Interaktion von Anbieter in einem
engen Markt ohne Kooperation. (b) Auch bez uglich des Informationsstands sind Va-
riationen denkbar, bspw. Unsicherheiten der Anbieter uber die Nachfrageverhaltnisse,
uber Kostenparameter etc..
Tabelle 2.1: Anwendung der Charakteristika auf drei Spiele
2.4 Nutzen und Erwartungsnutzen
Reason is, and ought only to be the slave of the passions, and can never pretend
to any other oce than to serve and obey them.
David Hume, Treatise on Human Nature
Aktionen im wirtschaftlichen Bereich oder auch dar uber hinaus konnen immer nur vor dem
Hintergrund von Zielfunktionen modelliert werden. Das ganze Programm der Wirtschafts-
wissenschaften kann verstanden werden als die Losung des zentralen Problems der Knapp-
heit von Ressourcen. Wie genau diese knappen Ressourcen eingesetzt werden sollen, hangt
nat urlich von den Praferenzen der Akteure ab.
Auch die Aktionen in Spielen sind getrieben von den Zielen der einzelnen Akteure (sowie
den Nebenbedingungen, die den Handlungsspielraum der Akteure denieren). Wir sprechen
hier allgemein von Nutzenfunktionen. Im Paradiesspiel hatten wir f ur die beiden Akteure
(Gott, Adam und Eva) ordinale Reihungen der moglichen Ergebnisse postuliert. Nat urlich
hangt die Losung des Spiels von diesen unterstellten Nutzenfunktionen ab.
Die Anforderungen, die an diese Nutzenfunktionen zu stellen sind, werden im ersten
Teilabschnitt 2.4.1 kurz beleuchtet. Daran schliet sich eine kurze Darstellung der Ber uck-
sichtigung von Risiko ein wichtiges Element in fast allen realen Spielen an.
2.4.1 Anforderungen an Nutzenfunktionen
Eine Nutzenfunktion bewertet alle moglichen Ergebnisse (eines Spiels) in einer konsistenten
Weise. Diese Bewertung ist eine notwendige Bedingung, damit sich ein Spieler (oder eine
Gruppe von Spielern) rational verhalten kann.

Uber die Rationalitatsannahme wird im
folgenden Abschnitt 2.5 noch einiges zu sagen sein, hier gen ugt es festzuhalten, dass damit
16 KAPITEL 2. EINF

Mittel Ziele
Abbildung 2.7: Instrumentennationalitat
Diese verlangt den ezienten Einsatz der vorhanden Mittel zur Erzielung des hochstmogli-
chen Zielerreichungsgrades.
eine Instrumentenrationalitat gemeint ist, d.h. der rationale Einsatz von verf ugbaren
Mitteln bei der Verfolgung klar denierter Ziele. (Diese Zielfunktionen konnen dann Ego-
ismus, Altruismus und Merkw urdigkeiten jeder Art enthalten.) Abbildung 2.7 macht das
einfache Denkmuster deutlich.
Folgende Anforderungen sind an die Praferenzen, d.h. an den Vergleich der durch die
Praferenzordnung zu bewertenden G uter bzw. G uterb undel zu stellen:
1. Reexivitat: F ur alle x
i
gilt, dass x
i
x
i
. Diese Eigenschaft verlangt also, dass jedes
zu bewertende Gut (oder G uterb undel) x
i
mindestens so viel wert ist wie es selbst und
impliziert nat urlich auch die intuitiv einsichtigere Eigenschaft x
i
x
i
.
2. Transitivitat: F ur alle x
i
, x
j
und x
k
, f ur die gilt, dass x
i
x
j
und dass x
j
x
k
muss
auch gelten, dass x
i
x
k
. Hierbei geht es um die logische Konsistenz von Praferenzen.
3. Vollstandigkeit: F ur alle denkbaren Alternativen x
i
und x
j
gilt entweder, dass x
i

x
j
oder dass x
i
x
j
. Mit dieser Anforderung wird sichergestellt, dass es keine durch
die Praferenzordnung nicht erfassten G uter(b undel) gibt.
4. Kontinuitat: F ur alle x
i
, x
j
und x
k
, f ur die gilt, dass x
i
x
j
x
k
muss es ein aus x
i
und x
k
zusammengesetztes Gut y geben, f ur das gilt, dass y x
j
, d.h. dass zwischen x
j
und y Indierenz besteht. Die Zusammensetzung von y kann dabei sowohl wortlich
genommen werden Teile der beiden G uter werden einfach kombiniert als auch im
Sinne einer Lotterie verstanden werden, die eines der beiden Teilg uter mit bestimmten
Wahrscheinlichkeiten liefert.
Die Eigenschaften (1) - (3) konstituieren eine wohldenierte Praferenzordnung aller Al-
ternativen bei dem Individuum. Wenn dar uber hinaus auch die Kontinuitatseigenschaft (4)
gilt, dann kann diese Praferenzordnung durch eine Nutzenfunktion U (x
i
) dargestellt wer-
den. Wenn es um die Praferenzen uber unsichere Zahlungen (also Lotterien
1
) geht, so wird
ein weiteres Axiom erforderlich:
5. Unabhangigkeit: x
i
, x
j
und x
k
seien drei Lotterien, und es gelte x
i
x
j
. Dann
muss f ur die folgenden zusammengesetzten Lotterien gelten, dass p x
i
+(1 p) x
k

p x
j
+(1p) x
k
0 p 1. Damit wird sichergestellt, dass die Praferenz zwischen x
i
und x
j
nicht vom Vorhandensein einer bestimmten Beimischung der dritten Lotterie
x
k
abhangt.
In vielen Situationen gen ugt es vollig, eine Vorstellung uber die Reihenfolge von Al-
ternativen zu haben. Dieses wird bezeichnet als ordinale Nutzenfunktion. Wenn jedoch
bspw. verschiedene Alternativen mit bestimmten Wahrscheinlichkeiten auftreten, oder Nut-
zenvergleiche zwischen Personen stattnden sollen (incl. der Bewertung des aggregierten
Nutzens mehrerer Personen in einem Koalitionsspiel), dann ist diese Information nicht hin-
reichend. Dazu ist es erforderlich, Vorstellungen uber eine kardinale Nutzenfunktion zu
haben, die Nutzenunterschiede zwischen verschiedenen Alternativen quantiziert. (Streng
genommen reicht eine kardinale Nutzenfunktion f ur eine interpersonelle Vergleichbarkeit
1
Formal ist eine Lotterie charakterisiert durch die moglichen Auszahlungen, denen jeweils Wahrschein-
lichkeiten zugeordnet sind.
Zustandder Welt
gut(g)
schlecht(b)
Lotterie A
LotterieB
1000
100
900 700
Abbildung 2.8: Auszahlungen f ur zwei Lotterien
Die Zahlen geben die Auszahlungen der Lotterien A und B im guten bzw. schlechten Zustand
der Welt an.
nicht aus, diese Vergleichbarkeit wird bisweilen einfach zusatzlich angenommen.) In vielen
(Bei-) Spielen auch in der Realitat geht es einfach um Geld, was zumindest auf den ersten
Blick eine unmittelbare Vergleichbarkeit auch zwischen Personen suggeriert. Man sollte sich
aber klar machen, dass dahinter das Werturteil steckt, dass ein Geldbetrag in den Handen
unterschiedlicher Personen gleich viel wert ist. Das trit selbstverstandlich f ur die Kauf-
kraft zu, nicht aber notwendigerweise f ur den Nutzen, den verschiedene Personen aus dieser
Kaufkraft ziehen konnen.
2.4.2 Bewertung von Risiko und Erwartungsnutzenfunktion
Risiko ist mit fast allen (realistischen) Spielen und okonomischen Situationen verbunden.
Bei dem Kauf eines Lotterieloses liegt es auf der Hand, nicht sicher absehbare Veranderungen
der konjunkturellen Situation, des Wechselkurses oder anderer Relativpreise sind andere
Beispiele (aus der Makrookonomik) f ur Risiken, die sich auf Auszahlungen in strategischen
Spielen und damit auf das Verhalten von Spielern auswirken konnen. Es liegt dabei vollig auf
der Hand und entspricht der Lebenserfahrung , dass verschiedene Personen die gleiche
riskante Situation unterschiedlich einschatzen, es also unterschiedliche Bewertungen
von Risiken gibt. Bereits ohne nahere Analyse konnen wir unterscheiden, ob eine Person
risikoavers,
risikofreudig oder
risikoneutral
ist. Wir konnen uns diese Unterscheidung anhand von zwei sehr einfachen Lotterien vor
Augen f uhren. Die Auszahlungen der beiden Lotterien sind in Abbildung 2.8 wiedergegeben.
Lotterie A ergibt im g unstigen Fall eine Auszahlung von 1000, im schlechten Zustand der
Welt aber nur eine Auszahlung von 100. Lotterie B ist im Vergleich mit Lotterie A deutlich
weniger sensitiv gegen uber dem Zustand der Welt. Intuitiv lasst sich daher sagen, dass
Lotterie B weniger riskant als Lotterie A ist.
1
Die beiden Lotterien lassen sich sehr anschaulich in Abbildung 2.9 auf der nachsten Seite
mit Hilfe des sog. Zustandspraferenz-Diagramm darstellen.
Entlang der horizontalen (vertikalen) Achse sind die Auszahlungen im guten (schlech-
ten) Zustand der Welt abgetragen.
2
Die 45-Linie ist der Ort aller Punkte, in denen sich
1
Man kann sich hier eine Situation ohne (Lotterie A) bzw. mit (Lotterie B) einer Versicherung vorstellen,
wobei die Versicherung auch im schlechten Zustand der Welt eine Auszahlung von 700 garantiert, daf ur aber
eine Pramie von 100 nimmt.
2
Die Idee ist keineswegs auf eine Situation mit nur zwei Zustanden der Welt beschrankt. Allgemein erfolgt
bei n denkbaren Zustanden die analoge Darstellung in einem n-dimensionalen Raum.
18 KAPITEL 2. EINF

45
1000
B
A 100
700
Auszahlungim
schlechten Zu-
stand der Welt
Auszahlungim
gutenZustand
der Welt
900
Sicherheits-
linie
Abbildung 2.9: Das Zustandspraferenz-Diagramm
Mit Hilfe dieser Grak lasst sich eine Lotterie als Punkt in einem n-dimensionalen Raum
darstellen, wobei n die Zahl der moglichen Umweltzustande bezeichnet. Im Beispiel ist n = 2.
die beiden Zustande der Welt nicht voneinander unterscheiden. Man spricht daher von der
sog. Sicherheitslinie. Beide Lotterien lassen sich einfach durch einen Punkt in diesem
Diagramm darstellen.
Die Frage ist jetzt die nach der Bewertung dieser Lotterien. Dies ist nicht objektiv
moglich, sondern eine Frage der subjektiven Einschatzung des oensichtlich un-
terschiedlichen Risikos, das in den beiden Lotterien steckt. Drei verschiedene Kriterien
werden haug herangezogen, die nachfolgend erlautert werden sollen. Diese sind
das Maximin-Kriterium,
der Erwartungswert der Lotterie, sowie
der Erwartungsnutzen der Lotterie.
Nach der Erlauterung dieser drei Konzepte werden noch zwei gangige Mae f ur die Messung
der Risikoneigung eingef uhrt.
Das Maximin-Kriterium
gibt die folgende Handlungsanweisung: Wahle diejenige Handlung, die im schlechtesten Fall
am besten ist. Man schaut also ausschlielich auf den worst case in diesem Fall also
die zweite Spalte in der Auszahlungstabelle in Abbildung 2.8 auf der vorherigen Seite und
optimiert dar uber, sucht also das maximale Minimum. Die Reihung der beiden Lotterien
gema des Maximin-Kriteriums ist damit klar: Es gilt, dass Lotterie B Lotterie A.
Allgemein lasst sich f ur beliebige Lotterien j L und Zustande der Welt i n mit den
L n Auszahlungen W
ij
das Maximin-Kriterium wie folgt darstellen: Der Wert einer Lotterie
j ist gegeben durch min
in
(W
ji
), die Auswahl der besten Lotterie gegeben durch die Losung
des Problems
max
jL
min
in
(W
ji
) . (2.1)
Wichtig bei diesem Kriterium ist, dass die Bewertung ganz oensichtlich ohne die
Ber ucksichtigung von Information, die man intuitiv als relevant erachten w urde,
zustande kommt. Konkret werden folgende Bestandteile einer Lotterie vernachlassigt:
alle Auszahlungen in anderen als dem schlechtesten Zustand;
45
1000
B
A
100
700
Auszahlungim
schlechten Zu-
stand der Welt
Auszahlungim
gutenZustand
der Welt
900
Abbildung 2.10: Das Maximin-Kriterium
Dieses Kriterium lasst sich darstellen mit Hilfe von L-formigen Indierenzkurven im Zu-
standspraferenz-Diagramm.
jegliche Wahrscheinlichkeiten, mit denen der gute oder schlechte Zustand eintritt.
Qua Konstruktion beinhaltet das Maximin-Kriterium den denkbar hochsten Grad an Pes-
simismus, weil eben unabhangig von der Wahrscheinlichkeit des Eintretens ausschlielich
der schlechteste Zustand in die Bewertung mit einiet.
Im Zustandspraferenz-Diagramm ist es moglich, das Maximin-Kriterium mit den aus dem
Grundstudium vertrauten Indierenzkurven darzustellen. Wie man sich leicht verdeutli-
chen kann, verlaufen diese L-formig durch die Punkte in Abbildung 2.9 auf der vorherigen
Seite, wobei der Knick auf der Sicherheitslinie liegt. Abbildung 2.10 zeigt diese Indierenz-
kurven. Je weiter eine Indierenzkurve vom Ursprung entfernt liegt, desto hoher ist das
damit assoziierte Nutzenniveau.
Der Erwartungswert einer Lotterie
ist gegeben durch die mit den Eintrittswahrscheinlichkeiten der verschiedenen Zu-
stande der Welt gewichteten Auszahlungen in diesen Zustanden. Man spricht dabei
auch von einem fairen Preis einer Lotterie. Die Wahrscheinlichkeit f ur das Eintreten des
schlechten Zustands der Welt sei p
b
, entsprechend ist die Gegenwahrscheinlichkeit f ur das
Eintreten des guten Zustands der Welt mit (1 p
b
) gegeben. Daher sind die Erwartungswerte
der Lotterien A und B durch E (A) = p
b
100 + (1 p
b
) 1000 und E (B) = p
b
700 +
(1 p
b
) 900 gegeben. Bezeichnen W
g
und W
b
allgemein die Auszahlungen einer Lotterie
in den beiden Zustanden, so ist der Erwartungswert einer Lotterie L konstant entlang einer
Linie im Zustandspraferenz-Diagramm mit der Steigung (1 p
b
)/p
b
.
1
Damit ist klar, dass im Gegensatz zum Maximin-Kriterium beim Erwartungswert alle
Zust ande der Welt und alle moglichen Auszahlungen eine Rolle spielen. Allgemein, d.h. f ur
beliebig viele (hier: n) Zustande der Welt ist der Erwartungswert einer Lotterie j gegeben
durch E (W
j
) =

in
p
ij
W
ij
mit

in
p
ij
= 1. Die Auswahl aus mehreren Lotterien ist die
L osung des Problems
Max
jL
E (W
j
) (2.2)
1
Der xe Erwartungswert sei E(L) =

C = p
b
W
b
+ (1 p
b
) W
g
. Auosen dieser Gleichung ergibt sofort
W
b
=

C
p
b
1p
b
p
b
W
g
. Damit ist
W
b
W
g
C
=
1p
b
p
b
.
20 KAPITEL 2. EINF

45
1000
B
A
100
700
Auszahlungim
schlechten Zu-
stand der Welt
Auszahlungim
gutenZustand
der Welt
900
Abbildung 2.11: Das Erwartungswert-Kriterium
Dieses Kriterium bezieht die Wahrscheinlichkeiten des Eintretens der beiden Zustande mit
ein.
Der Erwartungswert ist ein Bewertungskriterium, das man mit Risikoneutralitat as-
soziieren kann. Dabei interessiert nicht die mogliche Streuung der Auszahlungen uber die
diversen Zustande der Welt, sondern einzig die erwartete Auszahlung. Viele Entscheidungs-
situationen sind allerdings dadurch gekennzeichnet, dass es keine objektiven Wahrschein-
lichkeiten f ur den Eintritt diverser Zustande gibt.
1
In diesem Fall sind entweder subjektive
Wahrscheinlichkeiten (incl. Sensitivitatsanalysen) zu verwenden. Andernfalls ist das
Kriterium nicht anwendbar.
Abbildung 2.11 zeigt f ur die beiden Lotterien A und B die Linien mit jeweils identischem
Erwartungswert. F ur die Wahrscheinlichkeit, die zu den beiden durchgezogenen Linien mit
jeweils gleichen Erwartungswerten f uhrt, gilt wieder, dass die Lotterie B der Lotterie A
vorgezogen wird. Die durch A und B gehende gestrichelte Linie reprasentiert Eintrittswahr-
scheinlichkeiten der beiden Zustande, die den beiden Lotterien gerade den Erwartungswert
geben. Es ist f ur die Auszahlungen aus Abbildung 2.8 auf Seite 17 recht einfach zu berechnen,
welche Wahrscheinlichkeit f ur das Eintreten des guten Zustands der Welt daf ur notwendig
ist.
2
Das Erwartungsnutzen-Kriterium
als dritter Bewertungsmastab bewertet schlielich die Auszahlungen W
ij
einer Lotterie
j in einem Zustand i mit einer beliebigen Nutzenfunktion u(W
ij
). Eine Lotterie j weist
dann einen Erwartungsnutzen von u
e
j
E (u
j
) =

in
p
ij
u(W
ij
) auf. Die Wahl zwischen
verschiedenen Lotterien ist dann die Losung des Problems
max
jL
E (u
j
) . (2.3)
1
F ur das bekannte Lotto (6 aus 49) sind solche Wahrscheinlichkeiten problemlos anzugeben. Die Wahr-
scheinlichkeit, dass aus den 49 Kugeln eine bestimmte 6-er Kombination gezogen wird, ist gegeben durch
49
6
=
49!
6!(496)!
= 13983816.
2
F ur das Verstandnis des Konzepts ist es hilfreich zu zeigen, dass dieser Wert p
g
= (1 p
b
) = 6/7 0, 857
betragt.
Abbildung 2.12: Risikoaversion
Bei Vorliegen von Risikoaversion ist der Nutzen des (sicheren) Erwartungswertes der Aus-
zahlungen hoher als der Erwartungswert des Nutzens einer Lotterie mit dieser erwarteten
Auszahlung.
Die Erwartungsnutzenfunktion E (u
j
) wird auch haug als von Neumann-Morgenstern-
Nutzenfunktion bezeichnet.
1
(2.3) ist das allgemeinste der drei Kriterien, da verschiedene Risikoneigungen abgebildet
werden konnen, was nachfolgend kurz erlautert werden soll.
Als risikoavers bezeichnet man eine Bewertung, bei der ein sicheres Einkommen W einer
beliebigen Lotterie mit dem gleichen Erwartungswert vorgezogen wird. Abbildung 2.12 zeigt
einen solchen Fall.
Wiederum nehmen wir an, dass es zwei Zustande der Welt, b und g gebe. Die Auszahlun-
gen der Lotterie j sind in Abbildung 2.12 mit W
bj
bzw. W
gj
bezeichnet. Wenn beide Ereig-
nisse gleich wahrscheinlich sind, so ist der Erwartungswert E (W
j
) gerade das arithmetische
Mittel. Der damit assoziierte Nutzen ist mit u(E (W
j
)) bezeichnet. Dieses Nutzenniveau
w urde realisiert, wenn die erwartete Auszahlung sicher bezahlt w urde. Bei der Lotterie
ist dies jedoch nicht der Fall; vielmehr wird mit einer Wahrscheinlichkeit von jeweils 1/2
ein niedrigeres bzw. hoheres Nutzenniveau realisiert. Der Erwartungswert aus diesen beiden
Nutzenwerten ist in der Abbildung 2.12 mit E (u(W
j
)) bezeichnet. Durch die Kr ummung
der Nutzenfunktion u(W
j
) ist dieser Erwartungsnutzen niedriger als der Nutzen des gleich
hohen Erwartungswertes.
Aus Abbildung 2.12 geht sofort hervor, dass Risikoaversion verbunden ist mit der
Eigenschaft des sinkenden Grenznutzens der Auszahlungen.
2
Analog ist ein stei-
gender Grenznutzen mit Risikofreude verbunden, und ein konstanter Grenznutzen mit Risi-
koneutralitat. Sinkender Grenznutzen der Auszahlungen (also eine konkave Nutzenfunktion)
geht einher mit konvexen Indierenzkurven im Zustandspraferenz-Diagramm, das in Abbil-
1
Diese Bezeichnung ehrt die beiden Pioniere der Spieltheorie (und der Erwartungsnutzentheorie, die
ebenfalls in dem 1944 erschienenen Buch, das die Spieltheorie begr undete, entwickelt wurde), John von
Neumann und Oskar Morgenstern.
2
So wie die Nutzenfunktion in Abbildung 2.12 gezeichnet ist, sollte klar sein, dass u
(W
j
) > 0 und
u
(W
j
) < 0.
22 KAPITEL 2. EINF

45
1000
B
A
100
700
Auszahlungim
gutenZustand
der Welt
900
Abbildung 2.13: Das Erwartungsnutzen-Kriterium bei Risikoaversion
Das Erwartungsnutzen-Kriterium bezieht neben den Wahrscheinlichkeiten des Eintretens
der beiden Zustande auch eine subjektive Bewertung der Auszahlungen mit ein. Gezeigt ist
Fall der Risikoaversion.
dung 2.13 zu sehen ist.
Abschlieend werden nun noch zwei gangige Mae f ur die Beschreibung der Risikonei-
gung eingef uhrt. F ur eine gegebene Nutzenfunktion u(W) ist das Arrow-Pratt-Ma der
absoluten Risikoaversion deniert durch den Term
ARA =
u
(W)
u
(W)
, (2.4)
wahrend das Arrow-Pratt-Ma der relativen Risikoaversion deniert ist durch
RRA =
u
(W) W
u
(W)
. (2.5)
Beispiel:
F ur die Nutzenfunktion u(W) = W
sind diese Mae gegeben durch ARA = (1 ) W

1
und RRA = (1 ).
2.5 Rationalitat der Akteure
Rationalitat der Akteure vor dem Hintergrund wohlspezizierter Praferenzen ist eine zen-
trale Annahme in allen Bereichen der Wirtschaftswissenschaften. In diesem Abschnitt
1
wird
nun mit dem sog. St.-Petersburg-Paradoxon zunachst ein historisch sehr altes Beispiel
vorgestellt, in dem sehr deutlich wird, dass die Orientierung an Erwartungswerten bei Spie-
len nicht adaquat ist, sondern der Erwartungsnutzen das relevante Konzept sein muss,
wenn man tatsachliches Verhalten mit dem Rationalitatspostulat unter einen Hut bringen
mochte.
Daran schliet sich mit dem Allais-Paradoxon die Analyse einer Situation an, in der
tatsachlich beobachtbares und auf den ersten Blick ganz vern unftiges Verhalten einer
wie auch immer spezizierten Erwartungsnutzenfunktion widerspricht. Anders gesagt geht
1
Dieser Abschnitt st utzt sich auf die Darstellung in Hargreaves Heap/Varoufakis (1995), p. 13-14.
2.5. RATIONALIT
AT DER AKTEURE 23
Z
a
h
l
K
o
p
f
Z
a
h
l
K
o
p
f
Z
a
h
l
K
o
p
f
Z
a
h
l
K
o
p
f
etc.
1
2
4
8
0
0
0
0
Abbildung 2.14: Das St. Petersburg-Paradoxon
es hier um ein Verhalten, das nicht mit den im Abschnitt 2.4 auf Seite 15 vorgestellten
Axiomen der (Erwartungs) Nutzentheorie konsistent ist. Dieses Beispiel ist ein wichtiges
Argument letztlich gegen die ganze Methode der Wirtschaftswissenschaft - wobei
allerdings mit dem Hinweis auf mogliche Schwachen einer Methode noch keine Alternative
genannt ist, und schon gar keine bessere Alternative. Dennoch zeigt das Allais-Paradoxon,
dass die Rationalitatspramisse nicht vollig unangreifbar ist - jedenfalls dann, wenn Rationa-
litat hinlanglich eng gefasst wird, was noch zu erlautern sein wird.
Abschlieend erfolgen einige Bemerkungen zur Modellierung beschrankter Rationa-
litat - eine der Forschungsfronten der Spieltheorie bzw. der Wirtschaftstheorie uberhaupt.
2.5.1 Das St. Petersburg Paradoxon
Zu Beginn des 18. Jahrhunderts
1
formulierte der Schweizer Mathematiker Nikolaus Bernoulli
eine Lotterie mit einer bemerkenswerten Eigenschaft: Die Zahlungsbereitschaften potentiel-
ler Spieler weichen dramatisch von der objektiv berechenbaren erwarteten Auszahlung der
Lotterie ab. Eine Losung dieses scheinbaren Paradoxons bot Daniel Bernoulli, ein Cousin
von Nikolaus Bernoulli.
2
Das angebotene Spiel ist sehr einfach und kann wie folgt beschrieben werden:
Eine (faire) M unze wird wiederholt geworfen. Es wird zu Beginn vereinbart, wie oft
die M unze maximal geworfen wird. Dies ist eine Zahl I mit 1 I .
Taucht zum ersten Mal Kopf auf, so ist das Spiel beendet. Die Auszahlung betragt
in diesem Fall Null.
Taucht Zahl auf, so erhalt der Spieler vom Anbieter des Spiels (Veranstalter der
Lotterie) eine mit der Anzahl des sukzessiven Auftauchens von Zahl wachsende
Auszahlung. Diese beginnt bei 1e nach dem ersten Wurf von Zahl und verdoppelt
sich danach jeweils, betragt also 2e beim zweiten Mal, dann 4e, 8e etc.. Einmal
erhaltene Auszahlungen behalt der Spieler. Bei einer Wurolge ZZZK erhalt der
Spieler also 1e + 2e + 4e = 7e.
Das Spiel kann in dem Spielbaum der Abbildung 2.14 dargestellt werden. An jedem Knoten
ist die bei Erreichen jeweils fallige Auszahlung angegeben. Man beachte, dass an jedem
Endknoten nur die zusatzliche Auszahlung gleich Null ist, insgesamt das Spiel aber eine
Auszahlung in Hohe der Summe der Auszahlungen, die bei den passierten Knoten nach Wurf
von Zahl fallig werden, aufweist.
Zunachst ist nun der Erwartungswert des Spiels zu berechnen. Daf ur ist die Wahrschein-
lichkeit p (i), eine beliebige Zahl i von W urfen hintereinander Zahl zu werfen entscheidend.
1
Dieser Abschnitt basiert auf der Darstellung in Jerger (1992).
2
Die Losung von Daniel Bernoulli wurde wahrend eine Aufenthalts in St. Petersburg ausgearbeitet und
auch dort im Jahr 1738 veroentlicht - daher der Name des Paradoxons.
24 KAPITEL 2. EINF

Diese Wahrscheinlichkeit ist gegeben durch
p (i) =
1
2

1
2
. . .
1
2
. .
i Faktoren
=
1
2
i
(2.6)
Die Auszahlung W (i) f ur den Fall, dass i Mal hintereinander Zahl fallt ist gegeben durch
W (i) = 2
i1
(2.7)
Die erwartete Auszahlung E (W (I)) bei maximal I W urfen ist also gegeben durch
E (W (I)) =
I
i=1
p (i) W (i) =
I
i=1
1
2
i
2
i1
=
I
i=1
1
2
=
I
2
. (2.8)
Die erwartete Auszahlung wachst also proportional mit der maximalen Anzahl der W urfe.
Dies ist deshalb so, weil an jedem Punkt des Spiels, die Option, weiter zu spielen, einen
positiven Wert hat egal wie haug zuvor bereits Zahl erschien. Dadurch impliziert ist
aber auch, dass der Erwartungswert des Spiels bei einer ex ante unbegrenzten Zahl von
W urfen unendlich hoch ist. Selbst bei einer sehr begrenzten Maximalzahl von W urfen von
z.B. I = 100 waren aber die wenigsten Spieler bereit, f ur die Teilnahme 50e zu bezahlen.
Die relativ hohe Wahrscheinlichkeit mit keinem oder sehr geringen Gewinnen das Spiel
zu verlassen, f uhrt in aller Regel zu einer subjektiven Bewertung des Spiels unterhalb des
Erwartungswerts.
Die grundlegende Idee von Daniel Bernoulli, die eine Losung dieses Paradoxons ermoglicht,
liegt in der konzeptionellen Trennung von erwarteter Auszahlung und dessen Nut-
zen. In seinen eigenen Worten (der englischen

Ubersetzung) beschreibt er die Grundlage des
Paradoxons wie folgt:
Until now scientists have usually rested their hypothesis on the assumption that
all gains must be evaluated exclusively in terms of themselves, i.e., on the levels
of their intrinsic qualities, and that these gains will always produce a utility
directly proportionate to the gain.
Es bedarf daher einer Bewertung des Spiels in Kategorien des erwarteten Nutzens
- wie dies bereits als von Neumann-Morgenstern-Funktion eingef uhrt wurde. Anstelle des
Erwartungswertkriteriums ( 2.8) ist daher
E (u(W (I))) =
I
i=1
p (i) u(W (i)) =
I
i=1
1
2
i
u
_
2
i1
_
(2.9)
heranzuziehen. Daniel Bernoulli selbst schlug daf ur die folgende logarithmische Nutzenfunk-
tion vor:
u(W) = a ln (W) , (2.10)
wobei a eine positive Konstante ist.
1
Einsetzen von ( 2.10) in ( 2.9) liefert dann
E (u(W (I))) =
I
i=1
1
2
i
a ln
_
2
i1
_
= a
I
i=1
i 1
2
i
ln 2 = a ln 2
I
i=1
i 1
2
i
(2.11)
Die unendliche Reihe
I
i=1
i1
2
i
konvergiert gegen den Wert 1, d.h. lim
I
I
i=1
i1
2
i
= 1. Somit ist
also der Erwartungsnutzen des Spiels bei einer ex ante nicht begrenzten Zahl von W urfen
gegeben durch
E (u(W ())) = a ln 2. (2.12)
1
F ur alle qualitativen Eigenschaften der Nutzenfunktion ist es unerheblich, auf welche Basis sich die
Logarithmus-Operation bezieht hier wurde der nat urliche Logarithmus verwendet.
2.5. RATIONALIT
AT DER AKTEURE 25
Anstelle des Erwartungswerts von Unendlich f uhrt die Bewertung mit der Nutzenfunk-
tion ( 2.10 auf der vorherigen Seite) zu einer

Aquivalenz der Lotterie mit einem sicheren
Gewinn in Hohe von 2. In Experimenten, in denen Probanden dieses Spiel angeboten wurde,
war eine Zahlungsbereitschaft in der Regel zwischen 2 und 3e zu beobachten. Dies legt nahe,
dass die logarithmische Nutzenfunktion (2.10) eine oenbar realitatsnahe Spezikation ist.
(2.10) weist die f ur das Ergebnis eines endlichen Erwartungsnutzens einer Lotterie mit
unendlich hoher erwarteter Auszahlung zentrale Eigenschaft sinkenden Grenznutzens
und damit der Risikoaversion auf.
2.5.2 Das Allais-Paradoxon
Das Allais-Paradoxon - bezeichnet nach dem franzosischen

Okonomen Maurice Allais, der
v.a. f ur seine Arbeit aus dem Jahr 1953 spater den Nobelpreis erhielt - schildert eine Si-
tuation, in der beobachtbares Verhalten den Axiomen der Nutzentheorie widerspricht und
damit rationales Verhalten der Akteure oensichtlich nicht gegeben ist.
Nehmen Sie an, Sie hatten die Wahl zwischen folgenden Lotterien, wobei es f ur den
Vergleich egal ist, ob diese kostenlos sind, oder ob ein Los jeweils den gleichen Preis hat.
Lotterie A 2500 e mit einer Wahrscheinlichkeit von 33%
2400 e mit einer Wahrscheinlichkeit von 66%
Lotterie B 2400 e mit einer Wahrscheinlichkeit von 100% (degenerierte
Lotterie)
Tabelle 2.2: Lotterie A und B, Teil 1
Die Wahl ist nicht ganz oensichtlich, d.h. lasst oensichtlich Raum f ur unterschiedliche
Risikoeinstellungen. Das Maximin-Kriterium f uhrt nat urlich zu einer Praferenz von B uber
A, das Erwartungswertkriterium zu der umgekehrten Praferenz, da (f ur einen Preis des Loses
von Null) gilt, dass E (W
A
) = 2500 0, 33 + 2400 0, 66 + 0 0, 01 = 2409 > E (W
B
) = 2400.
Wenn die beiden Lotterien tatsachlich (in einem Experiment) angeboten werden, so ent-
scheiden sich viele f ur Lotterie B, d.h. die wenn auch kleine Wahrscheinlichkeit (1%), vollig
leer auszugehen, wird gerne vermieden, auch wenn man daf ur auf die Chance, 100 e mehr
zu gewinnen, verzichten muss. Anders gesagt: Viele Menschen sind hinreichend risikoavers,
um Lotterie B der Lotterie A vorzuziehen.
Nachdem eine Entscheidung zwischen den Lotterien A und B gefallen ist, gibt es nun
eine zweite Wahl zu treen, namlich zwischen den folgenden Lotterien C und D.
Lotterie C 2500 e mit einer Wahrscheinlichkeit von 33%
Lotterie D 2400 e mit einer Wahrscheinlichkeit von 34%
Tabelle 2.3: Lotterie C und D, Teil 1
Selbstverstandlich sind beide Lotterien schlechter als A und B, beide haben aber einen
positiven Erwartungswert.
1
Konkret gilt folgendes f ur die erwarteten Auszahlungen der bei-
den Lotterien: E (W
C
) = 2500 0, 33 = 825 > E (W
D
) = 2400 0, 34 = 816.
Hier wahlen nun viele Personen, die zuvor Lotterie B gewahlt haben, Lotterie C, d.h.
diejenige mit dem hoheren Erwartungswert. Die

Uberlegung dahinter mag wie folgt lauten:
1
Das Maximin-Kriterium f uhrt hier oensichtlich zu einer Indierenz.
26 KAPITEL 2. EINF

Am wahrscheinlichsten ist ohnehin, dass ich leer ausgehe. Ob nun die Gewinnchance 33%
oder 34% betragt, ist ohnehin fast das gleiche. Also entscheide ich mich f ur den hoheren
Gewinn, f ur den Fall, dass ich Gl uck habe.
F ur den gesunden Menschenverstand sind beide Entscheidungen nicht unplausibel,
jedenfalls begr undbar, und durchaus auch nicht inkonsistent miteinander. Jedenfalls ist nicht
oensichtlich, dass diese beiden Entscheidungen mit dem Postulat rationalen Ver-
haltens inkonsistent sind. Genau dies ist aber gema den Postulaten der Erwartungsnut-
zentheorie der Fall. Diese Inkonsistenz soll im Folgenden gezeigt werden.
Zu diesem Zweck werden die Lotterien A und B wie folgt dargestellt.
Lotterie A 2400 e mit einer Wahrscheinlichkeit von 66%
Lotterie B 2400 e mit einer Wahrscheinlichkeit von 66%
Tabelle 2.4: Lotterie A und B, Teil 2
Die beiden ersten Zeilen sind jeweils identisch, konnen also bei einem Nutzenvergleich
vernachlassigt werden. Die zuvor beschriebene Entscheidung zwischen Lotterie A und B
muss also darauf beruhen, dass
E (u(W
A
) u(W
B
)) = 0, 33 u(2500) + 0, 01 u(0) 0, 34 u(2400) < 0
0, 33 u(2500) + 0, 01 u(0) < 0, 34 u(2400) (2.13)
Nur wenn diese Beziehung gilt, wird ein rationaler Akteur Lotterie B der Lotterie A
vorziehen (B A).
Analog konnen Lotterien C und D leicht umgeschrieben werden in die folgende Form:
Lotterie C 2500 e mit einer Wahrscheinlichkeit von 33%
Lotterie B 2400 e mit einer Wahrscheinlichkeit von 34%
Tabelle 2.5: Lotterie C und D, Teil 2
Hier ist die jeweils letzte Linie identisch und kann also bei einem Vergleich weggelassen
werden. Eine Hoherschatzung von Lotterie C relativ zu Lotterie D bedingt also
E (u(W
C
) u(W
D
)) = 0, 33 u(2500) + 0, 01 u(0) 0, 34 u(2400) > 0
0, 33 u(2500) + 0, 01 u(0) > 0, 34 u(2400) (2.14)
Oensichtlich stehen ( 2.13) und ( 2.14) in diametralem Widerspruch zueinander. An-
ders gesagt: Ein rationales Individuum, der sich bei der Auswahl zwischen A und B f ur
B entscheidet, muss sich bei der Wahl zwischen C und D f ur D entscheiden. Die Tatsa-
che, dass dies in Experimenten nicht notwendigerweise so ist, ist ein Versto gegen die
Pramisse des Rationalverhaltens. Konkret verstot dieses Verhalten gegen das Axiom
der Reexivitat (vgl. Abschnitt 2.4.1 auf Seite 15): Wird 0, 33 u(2500) +0, 01 u(0) als Gut
x
1
und 0, 34 u(2400) als Gut x
2
deniert, gilt namlich sowohl x
1
x
2
als auch x
1
x
2
,
was oensichtlich gegen das Reexivitatsaxiom verstot.
Um dieses Ergebnis in Perspektive zu setzen, sind zwei Dinge von Bedeutung:
2.5. RATIONALIT
AT DER AKTEURE 27
Rationalitat ist daran gebunden, dass das Individuum, dessen Entscheidungen betrach-
tet werden, eine Situation vollig versteht bzw. es der M uhe f ur wert erachtet,
eine Situation vollig zu verstehen. Die Unterschiede zwischen jeweils zwei Lotterien
A und B bzw. C und D sind vielleicht schlicht zu gering oder die Entscheidung zu
kompliziert , um hier jeweils eine zwar mogliche, aber anstrengende genaue Bewer-
tung vorzunehmen. Es entspricht jedenfalls der Alltagserfahrung, dass Entscheidungen
zwischen zwei sehr engen Substituten oft zufallig, d.h. ohne genaueres Nachdenken
getroen werden. Ist dieses Nachdenken anstrengend und der damit verbundene Auf-
wand groer als die bei nicht zufalliger Entscheidung zu erwartende Nutzengewinn
so ist diese Unscharfe bereits wieder rational.
Der hier unterstellte Rationalitatsbegri postuliert, dass unterschiedliche Entschei-
dungssituationen mit der jeweils gleichen Praferenzordnung entschieden
werden. Dies ist zwar letztlich methodisch unumganglich, da man sonst jedes Verhal-
ten als mit Rationalverhalten kompatibel erklaren konnte. Allerdings ist es durchaus
denkbar, dass ein und das gleiche Individuum mit relativ geringen Betragen
in einem begrenzten Umfang risikofreudig agiert, wahrend das Verhalten
auf Risikoaversion schlieen lasst, wenn es um hohere Betrage geht. Anders
lasst sich beispielsweise nicht erklaren, dass viele Leute mehr oder regelmaig Lotto
spielen, was nur mit Risikofreude konsistent ist, eine sogar mehr als faire Lotterie aber
ablehnen w urden, wenn dabei im schlechtesten Fall z.B. ihr Eigenheim verloren gehen
konnte also Risikoaversion an den Tag legen.
2.5.3 Beschrankte Rationalitat
I have the impression that [. . . ] the attempts to model bounded rationality have
yet to nd the right track. It is dicult to pinpoint any economic work not based
on fully rational microeconomic behaviour that yields results as rich, deep, and
interesting as those achieved by standard models assuming full rationality.
(Ariel Rubinstein, 1998, p. 3)
Das Allais-Paradoxon ist eines von relativ vielen Beispielen, in denen in experimen-
tellen Situationen (experimental economics) Verhalten beobachtet werden konnte, das
nicht mit Rationalitat in Einklang gebracht werden kann. Von daher ist zunachst einmal
zu konzedieren, dass Rationalitat eine Arbeitsannahme ist, die keinen Anspruch auf
umfassende G ultigkeit f ur alle realen Situationen f ur sich in Anspruch nehmen kann. In
diesem Abschnitt gehen wir kurz und eher beispielhaft auf drei Eekte ein, die bei der
Modellierung beschrankter Rationalitat eine Rolle spielen: Begrenzte und unterschiedliche
Fahigkeiten von Spielern, Framing-Eekte und die Tendenz zur Vereinfachung von
Entscheidungsproblemen.
Kognitive und analytische Fahigkeiten
Das vielleicht wichtigste Beispiel f ur eingeschrankte Rationalitat ist die unterschiedliche
Fahigkeit von Spielern, die in Rede stehenden strategischen Situationen zu durch-
schauen (analytische Fahigkeiten) und die daf ur relevante Information zu erfassen
und zu verarbeiten (kognitive Fahigkeiten). Es gibt unterschiedlich geschickte Unterhand-
ler, obgleich die Regeln einer Verhandlung f ur alle die gleichen sein mogen. Ein noch frap-
pierenderes Beispiel daf ur ist Schach. Dies ist ein spieltheoretisch hochst langweiliges
Spiel, weil f ur beide Spieler die gleichen Regeln gelten, und diese Regeln allgemein bekannt
und dar uber hinaus noch recht einfach sind. Insoweit haben also alle, denen die wenigen
Regeln bekannt sind, eigentlich die gleiche Chance. Es sind unterschiedliche Fahigkei-
ten im Umgang mit diesen Regeln, die verschiedene Spieler charakterisiert. Dies gilt
nicht nur f ur die Unterscheidung guter und schlechter Spieler. Vielmehr sind bei den bereits
28 KAPITEL 2. EINF

(sehr) guten Spielern unterschiedliche (Spiel-) Charaktere und unterschiedlichen Tagesfor-
men Aspekte, die das Spiel erst wirklich interessant machen.
Man kann aus diesen

Uberlegungen folgern, dass es generell w unschenswert ware, eine
Spieltheorie zu formulieren, die diese Unterschiede zwischen den Spielern zu ber ucksichtigen
in der Lage ist. Dies ist zumindest derzeit praktisch nicht der Fall. Allenfalls einige grobe
Kategorien wie unterschiedliche Risikoneigungen der Spieler lassen sich gut in die Annahme
der unbeschrankt g ultigen Rationalitat einpassen.
Framing-Eekte
Irrationalitat bzw. beschrankte Rationalitat ist auch insoweit zu beobachten, als empirisch
unterschiedlich auf Situationen reagiert wird, die zwar logisch identisch sind, aber in der
genauen Formulierung gewisse Unterscheidungen aufweisen. Man spricht in diesem Zusam-
menhang von sog. framing eects. Das Allais-Paradoxon war ein Beispiel daf ur. Es kommt
dabei zu nicht mit der Annahme unbeschrankter Rationalitat zu vereinbarenden Ergebnis-
sen, wie das folgende Beispiel zeigt (Tversky/Kahnemann 1986). Wie schon beim Allais-
Paradoxon m ussen hier Individuen, deren Rationalitat hinterfragt wird, zwei mal zwischen
jeweils zwei Alternativen entscheiden.
Entscheidung 1: Den Probanden wird klar gemacht, dass eine Seuche ohne jede In-
tervention 600 Tote fordern w urde und sie sich f ur eines (und nur f ur eines) der beiden
Programme A und B entscheiden konnen. Diese hatten die folgenden Konsequenzen:
A 200 von den 600 Menschenleben werden gerettet.
B Mit einer Wahrscheinlichkeit von 1/3 werden alle 600 gerettet, mit einer Wahrschein-
lichkeit von 2/3 wird niemand gerettet.
Entscheidung 2: Die Durchf uhrung von einem von zwei Programmen C und D ist
unabdingbar notwendig und hatte die folgenden Auswirkungen;
C 400 Personen sterben.
D Mit einer Wahrscheinlichkeit von 1/3 wird niemand sterben, mit einer Wahrscheinlich-
keit von 2/3 werden 600 sterben.
Der Erwartungswert betragt in allen vier Situationen A, B, C und D 400 Tote und damit
200

Uberlebende. Damit kommt es nat urlich auf die Bewertung der Unsicherheit (Risiken
und Chancen) an, die in den Situationen B und D enthalten ist gegen uber der Sicherheit,
die die Situationen A und B auszeichnet.
Kurzes Nachdenken sollte verdeutlichen, dass A und C sowie B und D identisch sind. Es
sollte also erwartet werden, dass alle, die A gegen uber B praferieren, auch C gegen uber D
praferieren (und vice versa).
Dennoch wahlten in einem Laborexperiment 72% der Probanden in Entscheidung 1 das
Programm A aus und 78% in Entscheidung 2 das Programm D was wiederum einen klaren
Versto gegen das Rationalitatspostulat darstellt.
Eine mogliche Interpretation dieser empirischen Beobachtung besteht im Folgenden: Ent-
scheidung 1 ist positiv formuliert, d.h. es wird suggeriert, dass es bei den Programmen um
gewonnene Menschenleben geht. Hier entscheiden die Testpersonen oenbar mehrheitlich
risikoavers. Im Gegensatz dazu ist Entscheidung 2 negativ formuliert, d.h. es geht um Ver-
luste. In diesem Fall sind die gleichen Testpersonen, die zuvor risikoavers waren plotzlich
risikofreudig. Es kommt also bei tatsachlichen Entscheidungen nicht nur auf die objektiven
Charakteristika der Alternativen an, sondern auch auf deren Verpackung. Auch hier ware
eine entsprechend allgemeine (Spiel-) Theorie, die solche Phanomene ber ucksichtigen kann,
w unschenswert. Allerdings ist derzeit eine solche Formulierung nicht in Sicht.
2.5. RATIONALIT
AT DER AKTEURE 29
Vereinfachung von Entscheidungssituationen
In vielen Entscheidungssituationen werden nicht alle relevanten Alternativen wirklich ernst-
haft erwogen, sondern es erfolgt von vorneherein eine Beschrankung auf einige Alternativen,
die nach irgendeiner Regel praselektiert werden. Beispiele daf ur gibt es sehr viele: Man
geht in ein bestimmtes Restaurant, und ist damit auf die dort verf ugbare Speisenkarte be-
schrankt; man schaut sich nur einige wenige in Frage kommende Autos an, bevor man
sich zum Kauf entschliet; man schaut sich nur einige wenige Fakultaten an, bevor man sich
f ur einen bestimmten Studienort entscheidet.
Dieses Verhalten kann oensichtlich ebenfalls zu Verletzungen der Rationalitatsannahme
f uhren. Das folgende Beispiel soll dies illustrieren.
Ein (zugegebenermaen etwas beschranktes oder Beschrankung suchendes) Individuum
habe im Prinzip die Wahl zwischen drei Alternativen A, B und C und die Praferenzordnung
B A C, kann aber nie mehr als zwei Angebote geistig verarbeiten. In einer ersten
Entscheidung hat er die Wahl zwischen allen drei Alternativen, wird mit diesen aber in der
Reihenfolge ACB konfrontiert. Die beschrankten mentalen Fahigkeiten f uhren dazu, dass B
erst gar nicht wahrgenommen, die Person entscheidet sich f ur A, weil A C. In einer zwei-
ten Entscheidung stehen wirklich nur die Alternativen A und B zur Verf ugung, die weil
es nur zwei sind beide wahrgenommen werden. Dieses Mal entscheidet sich die Person f ur
B, weil B A. Die Beschrankung des Entscheidungsraums auf zwei Alternativen f uhrt also
zu einer anderen Entscheidung als in der Situation mit einem groeren Entscheidungsraum.
Dieses Verhalten ist irrational, da die Daumenregel Vergleiche nur die ersten beiden Alter-
nativen eine dem Rationalitatspostulat vollig entsprechende Handlungsweise nicht zulasst.
Nat urlich kann dieses Verhalten vollig rational sein, wenn die Wahrnehmung und der Ver-
gleich der verschiedenen Alternativen hinlanglich groe Kosten verursacht. Allerdings gibt
es in diesem Beispiel keinerlei Nutzen der Beschrankung was in der Realitat anders ist. Es
kann beispielsweise durchaus rational sein, sich auf den Vergleich weniger Alternativen zu
beschr anken, wenn die Evaluation zeitraubend oder schwierig und damit teuer ist. Jede(r)
hat wahrscheinlich schon einmal etwas gekauft, das es irgendwo vermutlich billiger gibt.
Die Vernachlassigung dieser Alternative(n) ist rational, wenn die Suchkosten die erwartete
Ersparnis ubersteigen.
Und nun?
Die kurze Diskussion zeigt, wie beschrankte Rationalitat in der Realitat ohne Zweifel eine
gewichtige Rolle spielen kann. Allerdings ist der theoretische Umgang mit beschrankt ratio-
nalem Verhalten derzeit bestenfalls rudimentar wie schon die Beispiele zeigen. Zumindest
bis heute gibt es daher schlicht keine brauchbare Alternative zum Rationalitats-
postulat. Daher wird dieses Postulat eine der zahlreichen Abstraktionen sein, die in den
Modellen auch dieser Veranstaltung benutzt werden. Allerdings ist diese Abstraktion auch
eine der n utzlichsten in den Wirtschaftswissenschaften. Fast alle Lehrb ucher der Spieltheorie
nehmen diese Annahme ubrigens als so selbstverstandlich hin, dass sie noch nicht einmal
thematisiert wird.
Bei weiterem Interesse an diesem Gegenstand seien folgende Leseempfehlungen gege-
ben: Eine recht ausf uhrliche philosophische Diskussion des Rationalitatsbegri im Kontext
der Spieltheorie bietet das erste Kapitel in Hargreaves Heap/Varoufakis (1995). Rubinstein
(1998), dem auch das Motto dieses Abschnitts entnommen ist, gibt einen durchaus noch
aktuellen

Uberblick uber Vorgehensweise und Probleme der Modellierung beschrankter Ra-
tionalitat.
30 KAPITEL 2. EINF

2.6 Alternative Darstellungen von Spielen
Nachdem nun anhand einiger Beispiele die Vorgehensweise der Spieltheorie gezeigt und de-
ren nutzentheoretischer Hintergrund erortert wurde, geht es in diesem und dem nachsten
Abschnitt um Darstellungen 2.6 und Losungsmethoden 2.7 von Spielen.
Bei den verschiedenen Darstellungsweisen geht es insb. um die genaue Informationsmen-
gen, die uber ein Spiel zur Verf ugung gestellt werden. Man unterscheidet hierbei
Extensive Form
Normalform
Koalitionsform
2.6.1 Extensive Form
Allgemeine Charakterisierung
Die extensive Form liefert die umfassendsten Information uber ein Spiel und dessen Verlauf.
Im Einzelnen gehoren dazu Informationen uber
a) die Menge der Spieler,
b) die Praferenzordnungen aller Spieler (haug nicht explizit, da einfach die Auszahlungen
gereiht werden),
c) die Reihenfolge aller Spielz uge,
d) die Informationsmenge, die jeder Spieler an jedem Punkt des Spiels hat,
e) alle Moglichkeiten, die jeder Spieler an jedem Punkt des Spiels hat (Strategiemenge),
f) die Auszahlungen, die jeder Spieler an allen denkbaren Endknoten erhalt.
Die Darstellung der extensiven Form erfolgt ublicherweise mit Hilfe eines Spielbaums,
der bereits f ur die Darstellung und Losung von Paradiesspiel und Schatzsuche eingef uhrt
wurde. Generell besteht ein Spielbaum aus Knoten (wobei Anfangs- und Endknoten oen-
sichtliche Besonderheiten aufweisen), die durch

Aste bzw. Kanten miteinander verbunden
sind.
Jeder Knoten eines Spielbaums ist deniert durch
a) die Geschichte des Spiels, d.h. der Weg vom Beginn des Spiels bis zu diesem Knoten
(im Anfangsknoten ist diese Informationsmenge leer);
b) die Angabe des Spielers, der einen Zug machen kann;
c) die Informationen, uber die dieser Spieler bei der Entscheidung uber diesen Zug dabei
verf ugt;
d) die alternativen Aktionen, die diesem Spieler zur Verf ugung stehen. Diese werden durch
die nach rechts weggehenden

Aste aus einem Knoten gekennzeichnet. In der graschen
Darstellung geht man dabei ublicherweise von einer endlichen Anzahl von Hand-
lungsalternativen in einem gegebenen Knoten aus (so wie das bspw. bei Schach der
Fall ist), was allerdings kein zwingendes Merkmal ist. In einem Modell, das den
Wettstreit verschiedener Unternehmen abbildet, kann in einem bestimmten Knoten
beispielsweise eine kontinuierlich variierbare Preis- oder Mengenentscheidung gefor-
dert sein;
2.6. ALTERNATIVE DARSTELLUNGEN VON SPIELEN 31
Petra
Boxkampf Ballett
Boxkampf
Peter
Ballett
(2,1) (0,0)
(0,0) (1,2)
Abbildung 2.15: Battle of the sexes
Die erste Zahl in den vier Eintragen in der Ergebnismatrix gibt jeweils die Auszahlung f ur
Peter, die zweite Zahl die Auszahlung f ur Petra an.
e) die Auszahlungen f ur alle Spieler, wenn es sich um Endknoten handelt; die Merkmale
b), c) und d) treen f ur Endknoten nicht zu.
Merkmal c), d.h. die Information, die einem Spieler zur Verf ugung steht wurde in den
bisherigen Beispielen nicht explizit ber ucksichtigt, da es sich um Spiele mit vollkommener
Information handelte. In einem Spielbaum wird unvollkommene Information dadurch zum
Ausdruck gebracht, dass Knoten umrahmt bzw. durch gestrichelte Linien verbun-
den sind, wenn der Spieler der am Zug ist, nicht wei, an welchem der Knoten
er sich bendet. Damit kann beispielsweise zum Ausdruck gebracht werden, dass f ur den
Spieler, der als zweiter zieht, der Zug des ersten Spielers nicht beobachtbar ist. Diese feh-
lende Information kann, muss aber nicht, zu einer anderen Losung des Spiels f uhren. Dieses
Merkmal wird anhand eines Beispiels naher erlautert.
Beispiel: Battle of the sexes
Peter und Petra sind befreundet und w urden gerne den Abend miteinander verbringen, ha-
ben aber keinerlei Moglichkeit, sich vorher zu koordinieren. Gl ucklicherweise gibt es in der
Stadt nur zwei Veranstaltungen, die in Frage kommen: Einen Boxkampf und einen Ballet-
tabend. Peter w urde am liebsten zum Boxkampf gehen, Petra zum Ballett.
1
Beide waren
aber sehr ungl ucklich und jeweils am schlechtesten dran, wenn sie sich verpassen w urden
es ware dann sogar beiden egal, in welcher Veranstaltung sie alleine sein m ussen.
Abbildung 2.15 zeigt die Auszahlungen bei allen vier denkbaren Konstellationen.
Die extensive Form dieses Spiels kann auf zwei aquivalente Arten dargestellt werden, die
in Abbildung 2.16 auf der nachsten Seite zu sehen sind. Die gestrichelten Ellipsen um die
jeweils zwei Knoten sind jeweils so zu lesen, dass die Person, die hier zu entscheiden hat
(Petra in Teil (a) und Peter in Teil (b)), nicht wei, an welchem Knoten sie sich bendet,
sondern dar uber allenfalls eine subjektive Wahrscheinlichkeitsvorstellung hat. Daher kann in
diesem Spiel alles passieren auch wenn die beiden Gleichgewichte mit den Auszahlungen
(0, 0) eindeutig inferior sind.
W are die Information f ur den Spieler, der als zweiten zieht, vorhanden, so andern sich
folgende Merkmal von battle of sexes:
Zum einen hatten die beiden Spielbaume in Abbildung 2.16 auf der nachsten Seite eine
jeweils eindeutige Losung.
1
Es gibt nat urlich Varianten des Spiels, die etwas weniger tradierte Vorstellungen von geschlechterspezi-
schen Praferenzunterschieden unterstellen (Bach oder Strawinsky). Die hier vorgestellte Variante ist die
Originalgeschichte von Luce/Raia 1957.
32 KAPITEL 2. EINF

B
o
x
k
.
B
a
l
l
e
t
t
B
o
x
k
.
B
a
lle
tt
B
o
x
k
.
B
a
lle
tt
Peter Petra
B
o
x
k
.
B
a
l
l
e
t
t
B
o
x
k
.
B
a
lle
tt
B
o
x
k
.
B
a
lle
tt
Petra Peter
(2,1)
(0,0)
(0,0)
(1,2)
(2,1)
(0,0)
(0,0)
(1,2)
(a) (b)
Abbildung 2.16: Die extensive Form der battle of sexes.
Zum anderen macht es bei vollkommener Information einen Unterschied, wer zuerst
zieht. Zieht Peter zuerst, ware die eindeutige Losung {Boxkampf, Boxkampf}, zieht Pe-
tra zuerst, so ist es {Ballett, Ballett}. Peter bzw. Petra hatten dann jeweils einen rst
mover advantage, der zu der von dem rst mover praferierten Losung f uhrt. Petra
(Peter) konnte das zu erzwingen versuchen, indem (sie) er am Vorabend (nat urlich
glaubw urdig) ank undigt, bereits zwei Karten f ur den Ballettabend (Boxkampf) zu
haben aber das ware dann ein anderes Spiel.
2.6.2 Normalform
In der Normalform eines Spiels werden bestimmte Informationen unterdr uckt, d.h. es ndet
gegen uber der extensiven Form eine Informationsreduktion statt.
Daraus folgt sofort, dass ein Spiel in extensiver Form eine eindeutige Normalform, ein
Spiel in Normalform aber keine eindeutige extensive Form aufweist.
Konkret beinhaltet die Normalform die folgenden Informationen:
a) die Menge der Spieler,
b) die Praferenzordnungen aller Spieler (wiederum haug nicht explizit, da einfach die
Auszahlungen gereiht werden),
c) alle Aktionsmoglichkeiten, die jeder Spieler hat (Strategiemenge),
d) die Auszahlungen, die jeder Spieler an allen denkbaren Endknoten erhalt.
Es fehlen also die Angaben uber die Informationen, die die Spieler bei ihren Z ugen haben
sowie ggf. uber die Reihenfolge der Z uge. Daher sind in der Auszahlungsmatrix in Ab-
bildung 2.15 auf der vorherigen Seite alle Angaben der Normalform von battle of sexes
enthalten. Wenn das Spiel wirklich simultan gespielt wird, gehen in der Normalform auch ei-
ne Informationen verloren: Es gibt in diesem Fall keine Reihenfolge der Z uge und die Spieler
haben jeweils keine Information uber das Verhalten der oder des Anderen.
2.6.3 Koalitionsspiele
Mit Koalitionsspielen werden wir uns erst an spaterer Stelle (Kapitel 8) befassen. Da in
der Literatur neben extensiver Form und Normalform zumeist gleich die Koalitionsform
als dritte Art der Darstellung eines Spiels eingef uhrt wird, wird diese hier ebenfalls kurz
erlautert. Wie der Begri bereits nahe legt, ist die Koalitionsform insbesondere geeignet,
kooperative Spiele darzustellen. Die Koalitionsform beinhaltet daher Angaben uber
a) die Spieler sowie
2.6. ALTERNATIVE DARSTELLUNGEN VON SPIELEN 33
Abbildung 2.17: Normalform von Gemeinsame Schatzsuche
Abbildung 2.18: Koalitionsform von Gemeinsame Schatzsuche.
b) die maximalen Auszahlungen, die jede denkbare Koalition von Spielern f ur sich
garantieren kann.
Als Beispiel kann hier das denkbar einfachste 2-Personen Spiel dienen, das als Parabel f ur
eine Verhandlung verstanden werden kann: Gemeinsame Schatzsuche.
1
Dieses Spiel funk-
tioniert genau wie in Abschnitt 2.2.4 auf Seite 10 beschrieben mit dem Unterschied, dass
nun 2 Personen den Weg nden m ussen und sie dann gemeinsam die Auszahlung W vor-
nden, die sie dann unter sich aufteilen konnen. Der einzig richtige Weg durch das Labyrinth
war {links, rechts}. Abbildung 2.17 zeigt die Normalform des Spiels, wobei hier zunachst
einfach angenommen wird, dass der Gewinn halftig aufgeteilt wird. Beide Spieler konnen
also auf sich allein gestellt, keine positive Auszahlung gewahrleisten. Wenn aber beide
und das ist dann eine Koalition den richtigen Weg zur ucklegen, konnen sie zusammen die
Auszahlung W sicherstellen.
In diesem einfachen Spiel kann die Koalitionsform in einer einfachen Grak zusammen-
gefasst werden, was in Abbildung 2.18 geschieht. Hier wird klar, dass ezienterweise jeder
Punkt auf der Linie zwischen (0, W) und (W, 0) realisiert werden kann. Der schraerte
Bereich unterhalb dieser Linie entspricht nicht-ezienten Aufteilungen.
1
Das Beispiel ist angelehnt an Gardner (1995), ch. 1.
34 KAPITEL 2. EINF

2.7 Losungskonzepte
Die Losung der bisherigen Spiele erfolgte mehr oder weniger entlang von Plausibilitats uberle-
gungen, die gerade auf die jeweilige Situation passten. In diesem Abschnitt werden Losungs-
konzepte von Spielen etwas genauer betrachtet. Diese Losungskonzepte sollen dazu dienen,
vorhersagen zu konnen, welche Strategien die Spieler in einer bestimmten Situation wahlen
werden. Ein haug gebrauchter Begri in diesem Zusammenhang ist derjenige des Gleich-
gewichts eines Spiels. Es ist n utzlich, diesen Begri zu denieren:
Denition: Ein Gleichgewicht eines Spiels ist eine Strategienkombination, die f ur al-
le I Spieler die jeweils beste Strategie darstellt. Diese werden notiert als s
= {s
1
, s
2
, . . . , s
I
}.
Mit dieser Denition ist allerdings weder gesagt, dass ein Gleichgewicht existiert, noch
dass dieses wenn es denn existiert eindeutig ist. Es leuchtet beispielsweise auch ohne
genauere formale Analyse ein, dass bei battle of the sexes gleich zwei Strategiekombina-
tionen, namlich s
A
= {Boxkampf,Boxkampf} und s
B
= {Ballett,Ballett}, ein Gleichgewicht
darstellen.
Ein Losungskonzept ist nun einfach eine Regel, die aus allen moglichen Strategiekom-
binationen, die sich aus den Strategiemengen der I Spieler ergeben, das gerade denierte
Gleichgewicht herausndet. In Abhangigkeit von der genauen Situation sind mehr oder we-
niger sophistizierte Regeln notwendig, um ein Gleichgewicht identizieren zu konnen.
Im ersten Unterabschnitt 2.7.1 befassen wir uns mit dem einfachsten Konzept, der Eli-
mination dominierter Strategien. Danach wird in 2.7.2 mit Zermelos Theorem die
Charakterisierung der Losung des Schachspiels gegeben. Es ist zwar wenig uberraschend,
da Schach nach wie vor als interessantes Spiel gilt nicht moglich, gleichgewichtige Stra-
tegien zu formulieren, dennoch lasst sich uber die Eigenschaften des Spiels etwas ablei-
ten. Im Anschluss daran wird das wohl wichtigste Konzept der Spieltheorie uberhaupt ein-
gef uhrt, das Nash-Gleichgewicht. Unterschiedliche Formen dieses Gleichgewichtskonzepts
sind entscheidend f ur das Aunden von Losungen f ur Spiele, die keine dominanten Stra-
tegien aufweisen. Wahrend in 2.7.3 dieses Konzept in einem Rahmen eingef uhrt wird, der
die Ermittlung einer Losung in einer reinen Strategie zulasst, wird in 2.7.4 die Idee eines
Nash-Gleichgewichts in gemischten Strategien erlautert.
2.7.1 Elimination dominierter Strategien
Es gibt Situationen auch wenn diese nicht sehr haug sein mogen in denen eine bestimmte
Verhaltensweise eindeutig schlechter oder eindeutig besser ist als alle anderen Optionen, egal
was die anderen Mitspieler tun. In diesem Fall ist das Losungskonzept denkbar einfach: Man
wahlt die Strategie, die unter allen Umstanden eindeutig die beste ist (dominante Strategie)
bzw. verwirft die Strategien, die unter allen Umstanden schlechter sind als realisierbare
Alternativen (dominierte Strategien).
Diese Idee wird in den beiden folgenden Denitionen prazisiert.
F ur einen Spieler i I ist eine Strategie s
i
eine strikt dominante Strategie, wenn
gilt, dass
u
i
(s
i
, s
i
) > u
i
(s
i
, s
i
) s
i
, s
i
= s
i
(2.15)
Alle s
i
= s
i
heien dann strikt dominierte Strategien.
Lesehilfe f ur Gleichung (2.15): u
i
() bezeichnet die Nutzenbewertung der Auszahlungen
der Strategiekombinationen, die in der Klammer stehen, s
i
bezeichnet eine beliebige Stra-
tegienkombination aller anderen Spieler (nicht von i), s
i
heit, dass die Ungleichung
f ur alle Strategiekombinationen der anderen Spieler gelten muss. s
i
= s
i
bezeichnet eine
beliebige Strategie des Spielers i, die nicht strikt dominiert ist.
Vollig analog kann eine schwach dominante Strategie deniert werden. F ur einen Spieler
i I ist eine Strategie s
i
eine schwach dominante Strategie, wenn gilt, dass
u
i
(s
i
, s
i
) u
i
(s
i
, s
i
) s
i
, s
i
= s
i
(2.16)
2.7. L
OSUNGSKONZEPTE 35
Abbildung 2.19: Seeschlacht
Das Spiel ist ein Nullsummenspiel, die Situation bedingt, dass Kenney nur gewinnen und
Imamura nur verlieren konnte, wenngleich unterschiedlich viel.
Alle s
i
= s
i
heien dann schwach dominierte Strategien. Man spricht von einemGleich-
gewicht in (strikt oder schwach) dominanten Strategien, wenn f ur alle Spieler (strikt
oder schwach) dominante Strategien gefunden werden konnen.
Dieses Losungskonzept kann auf ein Spiel auch wiederholt angewendet werden. Es
ist beispielsweise denkbar, dass es f ur einen Spieler keinerlei dominante bzw. dominierte
Strategien gibt, f ur einen anderen aber durchaus. Dann kann man dessen dominierte Strate-
gien eliminieren und ein neues Spiel betrachten, das nur noch aus den nicht eliminierten
Optionen besteht. Man spricht dabei von der Ermittlung eines Gleichgewichts in do-
minanten Strategien mittels Iteration. Ein Beispiel aus dem militarischen Bereich ist
geeignet, dieses Losungskonzept zu verdeutlichen.
Seeschlacht
Folgende Geschichte umschreibt die Situation. Im zweiten Weltkrieg hatte der japanische
General Imamura den Auftrag, Truppen per Schi nach Neuguinea zu transportieren. Dabei
hatte er die Wahl zwischen zwei verschiedenen Routen, einer k urzeren Nord-Route und
einer etwas langeren S udroute. Der amerikanische General Kenney hatte den Auftrag,
diesen Transport aus der Luft anzugreifen und moglichst stark zu dezimieren. Kenney wusste
um die beiden alternativen Routen, hatte aber keine Moglichkeit, genau zu wissen, welche
Imamura wahlen w urde. Kenney hatte aber die Option, die Flugzeuge loszuschicken und
wieder zur uckzurufen f ur den Fall, dass sie die Flotte der Japaner verfehlten. In diesem
Fall w urde aber Zeit verloren gehen, die man auf den eigentlichen Angri hatte verwenden
konnen. Da die Verluste der Japaner gleichzeitig auch Gewinne der Amerikaner sind, kann
die Situation als Nullsummenspiel dargestellt werden, das die in Abbildung 2.19 gezeigte
Normalform aufweist. Kenney hat oensichtlich keine dominante Strategie. Er w urde seine
Flugzeuge optimalerweise sofort dahin schicken wollen, wo sich Imamura mit seinen Schien
bendet.
Wenn Imamura w usste, dass Kenney nach S uden iegen lasst, w urde er die Nordroute
wahlen, wenn er aber w usste, dass Kenney seine Flugzeuge zur Nordroute schickt, ware er
indierent zwischen den beiden ihm zur Verf ugung stehenden Optionen.
Imamura hat also eine schwach dominante bzw. schwach dominierte Strategie: Entschei-
det er sich f ur Nordroute, so kann sein Verlust im schlechtesten Fall {Nord, Nord} genau so
hoch sein, wie im besten Fall bei einer Entscheidung f ur die S udroute. Also ist S ud f ur
Imamura eine schwach dominierte Strategie und kann eliminiert werden. Damit bleibt nur
noch die erste Spalte der Matrix in Abbildung 2.19 ubrig. Hier hat aber Kenney eine (sogar
strikt) dominante Strategie, namlich Nord. Also kann die untere Zeile eliminiert werden.
Damit ist {Nord, Nord} ein Gleichgewicht in dominanten Strategien, das mit dem Losungs-
36 KAPITEL 2. EINF

konzept der iterierten Elimination (schwach oder strikt) dominierter Strategien ermittelt
wurde. Diese Konstellation wurde dann auch in der Tat von den beiden Generalen realisiert.
In gleicher Weise kann auch die Losung von Paradiesspiel aus der Auszahlungsmatrix in
Abbildung 2.3 auf Seite 9 per iterierter Elimination dominierter Strategien ermittelt werden.
2.7.2 Zermelos Theorem
Eines der historisch ersten noch vor dem ersten Weltkrieg entwickelten spieltheoretischen
Ergebnisse bezieht sich auf Schach. Dieses Spiel ist insofern einfach als die Spielregeln leicht
zu formulieren sind und alle Spieler an jedem Entscheidungsknoten vollkommene Information
sowohl uber die Geschichte des Spiels haben als auch uber ihre jeweiligen Handlungsoptionen.
Wenn man ein hinreichend groes Papier (und Geduld) hatte, ware es prinzipiell moglich,
f ur Schach einen vollstandigen Spielbaum aufzuzeichnen.
1
Aufgrund dieser prinzipiellen
Moglichkeit lasst sich sagen, dass Schach ein endliches Spiel ist. An den Endknoten steht
immer ein von drei Auszahlungsvektoren, da entweder einer der beiden Spieler gewinnt
(und der andere dann verliert) oder ein Remis erzielt wird. Diese Auszahlungsvektoren f ur
die Spieler 1 und 2 seien mit oensichtlicher Bedeutung wie folgt benannt: (g, v), (r, r),
(v, g).
Damit sind die wichtigsten Elemente f ur den Beweis des folgenden Theorems genannt:
Zermelos Theorem: F ur Schach gilt, dass entweder a) Wei den Gewinn des Spiels
sicherstellen kann, oder b) Schwarz den Gewinn des Spiels sicherstellen kann, oder c) beide
Spieler ein Remis sicherstellen konnen.
Zu beachten ist jeweils das Wort sicherstellen. Es geht also nicht um die nat urlich
vollig triviale Behauptung, dass beim Schach irgendeiner gewinnt oder aber ein Remis her-
auskommt.
Mit diesem Ergebnis lasst sich kein Schachspiel gewinnen, es bedeutet aber, dass f ur
Schach im Prinzip ein Strategienpaar formuliert werden konnte, welches das Spiel deter-
ministisch macht und nur eine der drei genannten Moglichkeiten zulasst. Der Beweis von
Zermelos Theorem ist instruktiv und soll daher skizziert werden.
2
Zunachst wird das Theorem nicht f ur Schach bewiesen, sondern f ur ein neues Spiel, das
eine endliche Anzahl t von Z ugen hat. Nennen wir es t-Schach. Wenn Zermelos Theorem f ur
ein beliebiges t-Schach bewiesen werden kann, so gilt es auch f ur Schach. Der Grund daf ur
besteht darin, dass Schach wie t-Schach ein endliches Spiel ist. Untersuchen wir also gleich
den letzten, d.h. den t-ten Zug von t-Schach. Unabhangig davon, wer am Zug ist nennen
wir ihn Spieler 1 muss nun gelten, dass
entweder Spieler 1 einen Sieg erzwingen kann,
oder Spieler 2 gewinnt, egal wie Spieler 1 zieht,
oder Spieler 1 ein Remis erzwingen kann.
Schauen wir nun auf ein Spiel mit einem Zug weniger, also auf t 1-Schach, in dem
Spieler 2 den letzten Zug hat. Hier gibt es wieder drei Moglichkeiten:
entweder Spieler 2 kann den Sieg erzwingen,
oder Spieler 1 gewinnt, egal wie Spieler 2 zieht,
oder Spieler 2 ein Remis erzwingen kann.
1
Da zu Beginn des Spiels prinzipiell 20 Z uge moglich sind, sind beim dritten Zug (das ist der zweite Zug
von Wei) bereits 400 verschiedene Knoten zu ber ucksichtigen.
2
Die Beweisf uhrung ist angelehnt an Eichberger (1993), p. 11.
2.7. L
OSUNGSKONZEPTE 37
Im dritten Fall wird das Ergebnis bzgl. t-Schach relevant. Diesen Gedanken kann man
nun beliebig nach hinten fortsetzen. Da es nicht notwendig war, t in irgendeiner Weise zu
beschr anken, ist damit auch Zermeloss Theorem f ur Schach bewiesen.
Das Theorem zeigt zweierlei:
F ur Schach kann prinzipiell eine gleichgewichtige Strategienkombination ausge-
rechnet werden, auch wenn dies selbst mit den derzeitigen Rechenkapazitaten nicht
moglich ist. Auch der beste Schachcomputer ist nicht in der Lage, alle moglichen
Strategiekombinationen zu ber ucksichtigen auch wenn dies generell denkbar ist.
1
Auch wenn man das Gleichgewicht (d.h. die Losung) eines Spiels nicht explizit benen-
nen kann, ist es moglich, Aussagen uber dieses Gleichgewicht zu treen.
2.7.3 Nash-Gleichgewicht und Fokus-Punkte
In okonomischen (und auch anderen) Situationen ist die Existenz einer dominanten
Strategie eher die Ausnahme als die Regel. Z.B. in battle of the sexes haben we-
der Petra noch Peter eine dominante bzw. dominierte Strategie, in einem Oligopol kommt
es ebenfalls immer darauf an, was die Konkurrenz macht. Die Liste liee sich beliebig
verlangern.
Dennoch kann auch f ur sehr viele Spiele ohne Gleichgewicht in dominanten Strategi-
en eine plausible Losung angegeben werden, die auf dem Losungskonzept des sog. Nash-
Gleichgewichts beruht. Dieses Konzept wurde entwickelt von und ist benannt nach dem
Nobelpreistrager John Nash (1950a) einer der wichtigsten Figuren der Spieltheorie uber-
haupt.
Ein Nash-Gleichgewicht kann wie folgt charakterisiert werden:
Eine Strategienkombination s
= {s
1
, s
2
, . . . , s
I
} heit Nash-gleichgewichtig, wenn keiner
der I Spieler sich durch eine Abweichung von s
i
besser stellen kann, solange die anderen
Spieler bei s
i
bleiben.
Formal lasst sich dies wie folgt ausdr ucken:
i gilt, dass u
i
_
s
i
, s
i
_
u
i
_
s
i
, s
i
_
s
i
(2.17)
Ein Vergleich mit dem Losungskonzept dominanter Strategien macht klar, dass das Nash-
Gleichgewicht ein weniger anspruchsvolles Gleichgewichtskonzept ist in dem Sinn, dass ein
Spiel kein Gleichgewicht in dominanten Strategien haben kann, es aber dennoch ein Nash-
Gleichgewicht (oder auch mehrere) aufweist. Der Grund daf ur liegt darin, dass eine Strategie
nur dann dominant ist, wenn sie unabhangig von der Strategiewahl der/des Mitspie-
ler(s) optimal ist. Im Gegensatz dazu erfordert ein Nash-Gleichgewicht diese Optimalitat
einer Strategie nur bez uglich der Strategien der Mitspieler, die auch f ur diese optimal sind.
Daraus folgt, dass jedes Gleichgewicht in dominanten Strategien auch ein Nash-
Gleichgewicht ist. Mit anderen Worten: Die Menge aller Spiele mit einem Gleichgewicht
in dominanten Strategien ist eine echte Teilmenge der Spiele mit einem Nash-Gleichgewicht.
Zur Illustration greifen wir zunachst noch einmal auf Seeschlacht zur uck und gehen
alle denkbaren Kombinationen durch.
Wenn Imamura Nord wahlt, antwortet Kenney mit Nord.
Wenn Imamura S ud wahlt, antwortet Kenney mit S ud.
1
Daher ist die Fahigkeit von Computern, Schach zu spielen, ein denkbar schlechtes Beispiel f ur die
Behauptung, dass Computer intelligent in einem vern unftigen Sinn des Worts sein konnen. Intelligenz
hat etwas mit einer exiblen Beurteilung von und Reaktion auf eine Situation zu tun, die generell nicht
vollst andig vorhersehbar sein muss. Schach ist ein im Prinzip vollstandig vorhersehbares Spiel. Daher ist es
durchaus vorstellbar, dasss eine Tages ein Computer herausndet, welche der drei Alternativen des Zermelo-
Theorems zwingend ist.
38 KAPITEL 2. EINF

Wenn Kenney Nord wahlt, ist Imamura indierent zwischen Nord und S ud.
Wenn Kenney S ud wahlt, antwortet Imamura mit Nord.
Daher ist {Nord, Nord} ein Nash-Gleichgewicht. In diesem Beispiel ist es sogar das einzige
Nash-Gleichgewicht.
Anders verhalt sich die Situation in battle of the sexes.
Wenn Peter Boxkampf wahlt, antwortet Petra mit Boxkampf.
Wenn Peter Ballett wahlt, antwortet Petra mit Ballett.
Wenn Petra Boxkampf wahlt, antwortet Peter mit Boxkampf.
Wenn Petra Ballett wahlt, antwortet Peter mit Ballett.
Also sind in diesem Beispiel sowohl {Boxkampf, Boxkampf} als auch {Ballett, Ballett} Nash-
Gleichgewichte. Das hilft Petra und Peter nat urlich nicht weiter, denn sie wissen nun nach wie
vor nicht, wie sie sich verhalten sollen. Ohne weitere Strukturierung der Situation kann die
Spieltheorie den beiden auch nicht helfen, allerdings gibt es f ur die Auswahl zwischen jeweils
gleich plausiblen Nash-Gleichgewichten ein weiteres, wenn auch sehr unscharfes Konzept, den
sog. Fokus-Punkt. Dies ist ein Nash-Gleichgewicht, auf das sich aufgrund psychologischer
oder anderer Faktoren die Erwartungen konzentrieren. Zur Illustration soll uber die missliche
Situation von Petra und Peter weiter spekuliert werden: Angenommen, beide wissen, dass
der Boxkampf ein wirklich groes Ereignis ist, zu dem einige Tausend Zuschauer kommen, bei
dem es einigermaen laut und schummerig ist, mit anderen Worten: bei dem man sich leicht
verfehlen kann. Ganz anders beim Ballett: Schon vor Beginn ist im Grunde klar, dass jeder
zur Garderobe kommt und spatestens in der Pause trit man sich an der hell erleuchteten
Champagnerbar. Unter diesen Umstanden sollte klar sein, dass unter den beiden Nash-
Gleichgewichten {Ballett, Ballett} das plausiblere ist und sich somit als Fokus-Punkt
anbietet. Es braucht allerdings schon eine gewisse Kenntnis der Spieler voneinander und
hinsichtlich der Situation: Wie viel wei Peter uber die Sitten und Gebrauche beim Ballett
und was wei Petra uber Peters Wissen?
2.7.4 Gemischte Strategien
Auch in relativ einfachen Spielsituationen kann es vorkommen, dass es kein Nash-Gleichge-
wicht, wie es in Abschnitt 2.7.3 deniert wurde, gibt. Allerdings war dort das Nash-Gleich-
gewichtskonzept so formuliert, dass im Gleichgewicht eine bestimmte Strategie gespielt
werden musste.
Nun ist es denkbar, dass eine solche Losung nicht existiert, aber dennoch eine plausible
Losung gefunden werden kann, in der Spieler eine wahrscheinlichkeitsgewichtete Kombina-
tion der zur Verf ugung stehenden Strategien wahlen. Man spricht dann davon, dass die
Spieler eine gemischte Strategie verfolgen und dass von der Moglichkeit, das zwar kein
Nash-Gleichgewicht in reinen Strategien vorliegt, hingegen eines in gemischten Strategien.
Auch hier sei wieder ein Beispiel f ur die Illustration des Konzepts herangezogen, namlich
das Dilemma des Samariters.
1
Dieses Spiel illustriert wenn auch sehr holzschnittartig
- ein grundlegendes Problem der Sozialpolitik, die den Armen gerne helfen mochte.
Nehmen wir folgende nicht unrealistische Konstellation an: Der Staat mochte gerne
einem Armen helfen, aber nur, wenn der auch bereit ist, zu arbeiten. Arbeitet der Arme (zu
einem niedrigen Lohn bzw. in einem gemeinn utzigen Projekt), will der Staat dennoch helfen,
um ein nicht weiter zu begr undendes Gerechtigkeitsziel zu verfolgen. Der Arme mochte sich
durchaus gerne helfen lassen, zieht es in dem Fall aber vor, gar nicht zu arbeiten. Eine
denkbare Auszahlungsmatrix f ur dieses Spiel ist in Abbildung 2.20 auf der nachsten Seite
2.7. L
OSUNGSKONZEPTE 39
Abbildung 2.20: Das Dilemma des Samariters
Die erste Zahl gibt jeweils die Auszahlung f ur den Staat, die zweite f ur den Armen an.
zu sehen. Zunachst uberzeugen wir uns davon, dass es hier kein Nash-Gleichgewicht in
reinen Strategien gibt:
Spielt der Staat helfen, antwortet der Arme mit nicht arbeiten.
Spielt der Arme nicht arbeiten, antwortet der Staat mit nicht helfen.
Spielt der Staat nicht helfen, antwortet der Arme mit arbeiten.
Spielt der Arme arbeiten, antwortet der Staat mit helfen.
Es gibt also kein Strategienpaar, das die in Abschnitt 2.7.3 formulierten Anforderungen
an ein Nash-Gleichgewicht erf ullt.
Dennoch konnen wir etwas zu den gewahlten Strategien der beiden Spieler sagen, wenn
zugelassen wird, dass der Arme mit einer Wahrscheinlichkeit 0 < p
a
< 1 die Option ar-
beiten und der Staat mit einer Wahrscheinlichkeit 0 < p
h
< 1 die Option helfen wahlen
konnen. Nicht arbeiten und nicht helfen werden dann einfach mit den jeweiligen Gegen-
wahrscheinlichkeiten gewahlt.
In diesem Fall ist die erwartete Auszahlung des Staates E (W
S
) wie folgt gegeben:
E (W
S
) = p
h
[p
a
3 + (1 p
a
) (1)]+(1 p
h
)[p
a
(1) + (1 p
a
) 0] = p
h
(5p
a
1)p
a
(2.18)
Die erste Zeile folgt sofort, wenn man die mit den jeweiligen Wahrscheinlichkeiten gewich-
teten Auszahlungen f ur den Staat in den vier moglichen Zustanden aufschreibt, die zweite
Zeile folgt nach sehr einfachen Zusammenfassungen. Die Regierung kann nun versuchen, ihre
erwartete Auszahlung zu maximieren, d.h. sie optimiert E (W
S
) uber die Wahrscheinlichkeit,
Hilfe zu leisten, d.h. uber p
h
. Dies f uhrt zu
E (W
S
)
p
h
= 5p
a
1 = 0 p
a
= 0, 2 (2.19)
Die in 2.19 gefundene Losung ist insoweit merkw urdig als die Zielfunktion der Regie-
rung E (W
S
) uber deren Handlungsvariable p
h
optimiert wird, dann aber eine Losung f ur
die Handlungsvariable des Gegenspielers, d.h. des Armen p
a
herauskommt. Dies ist wie folgt
zu verstehen:
Es wird zunachst einmal postuliert, dass es ein noch zu identizierendes Gleich-
gewicht in gemischten Strategien gibt. Dieses Postulat erlaubt es zunachst einmal,
uberhaupt Wahrscheinlichkeiten f ur die eine oder andere Strategiewahl einzuf uhren
und dar uber zu optimieren.
1
Die Bezeichnung geht auf James Buchanan zur uck. Die Darstellung hier ist angelehnt an Rasmusen
(2001), p. 67-68.
40 KAPITEL 2. EINF

Aus
E(W
S
)
p
h
= 5p
a
1 wird folgende Fallunterscheidung deutlich: F ur p
a
< 0, 2 ist
E(W
S
)
p
h
< 0, d.h. die Regierung stellt sich am besten, wenn sie dem Armen nie hilft,
d.h. den niedrigstmoglichen Wert p
h
= 0 wahlt. Vollig analog ist f ur p
a
> 0, 2 die
Ableitung der Zielfunktion nach der Handlungsvariablen
E(W
S
)
p
h
> 0. In diesem Fall
wird also die Regierung immer den hochstmoglichen Wert p
h
= 1 wahlen.
Beide Falle sind oensichtlich nicht Teil eines Gleichgewichts in gemischten Strategien.
Anders gesagt: Die Regierung wird dann und nur dann eine gemischte Strategie spielen,
wenn der Arme p
a
= 0, 2 wahlt.
Damit gibt (2.19) nicht an, welches das optimale Verhalten des optimierenden Agenten
(hier: der Regierung) ist, wie dies ublicherweise bei einem Optimierungskalk ul der Fall
ist. Vielmehr zeigt (2.19), unter welcher Bedingung f ur das Verhalten des anderen
Spielers eine gemischte Strategie f ur die Regierung uberhaupt in Betracht kommt.
Vollig analog lasst sich die erwartete Auszahlung des Armen schreiben als
E (W
A
) = p
h
(p
a
2 + (1 p
a
) 3) + (1 p
h
) (p
a
1 + (1 p
a
) 0) = p
h
(2p
a
+ 3) +p
a
(2.20)
Eine Optimierung dieser Auszahlung uber p
a
liefert die folgende Bedingung erster Ord-
nung, die wie schon bei 2.19 ausf uhrlich erlautert eine Bedingung daf ur ist, dass der Arme
eine gemischte Strategie spielt:
E (W
A
)
p
a
= 2p
h
+ 1 = 0 p
h
= 0, 5 (2.21)
Auch hier sei die Logik der Optimalbedingung genauer erlautert: F ur p
h
> 0, 5 - wenn
also der Staat mit relativ hoher Wahrscheinlichkeit hilft - ist
E(W
A
)
p
a
< 0. Unter diesen
Umstanden wird der Arme sicher nicht arbeiten, d.h. seine optimale Wahl besteht in p
a
= 0.
Hilft der Staat mit einer Wahrscheinlichkeit von weniger als 0,5 wird der Arme hingegen
in jedem Fall arbeiten. p
h
= 0, 5 ist der einzige Wert, bei dem der Arme eine gemischte
Strategie in Erwagung zieht, weil er letztlich indierent zwischen den beiden Optionen ist.
Damit ist das Strategienpaar {helfen mit Wahrscheinlichkeit 0,5, arbeiten mit Wahr-
scheinlichkeit 0,2} ein Nash-Gleichgewicht in gemischten Strategien. Man beachte,
dass die Idee der wechselseitig optimalen Strategiewahl in der Denition aus Abschnitt 2.7.3
auf Seite 37 vollig erhalten bleibt.
Kapitel 3
Nichtkooperative Spiele I:
Statische Spiele mit ansonsten
vollkommener Information
3.1 Lernziele
Kapitel 2 versuchte einen

Uberblick uber die wichtigsten Elemente und Konzepte in der
Spieltheorie zu geben. Die folgenden drei Kapitel befassen sich nun detaillierter mit ver-
schiedenen nichtkooperativen Spielsituationen.
Eine Klassikation kann dabei aufgrund aller in Abschnitt 2.3 genannten Charakte-
ristika vorgenommen werden. Besonders hilfreich ist dabei jedoch zunachst die Trennung
zwischen statischen und dynamischen Spielen, d.h. zwischen Spielen, in denen die
beteiligten Spieler ihre Entscheidungen simultan fallen und solchen, in denen es eine vorge-
gebene logische Sequenz der einzelnen Entscheidungen gibt. Eine weitere n utzliche Kategori-
sierung betrit die unterstellte Informationslage der Akteure, d.h. die Trennung zwischen
Spielen mit vollkommener und unvollkommener Information. Bislang wurde voll-
kommene Information etwas lose so deniert, dass alle Spieler bei ihrer Entscheidung uber
alle relevanten Umstande Bescheid wissen. Bei statischen Spielen ist dies per denitionem
nicht der Fall, da bei simultanen Entscheidungen nicht klar ist, welche Entscheidungen von
den Mitspielern getroen werden; dar uber konnen allenfalls Erwartungen gebildet werden.
Im Gegensatz dazu wei man bspw. bei Schach uber alle vorhergehenden Z uge des Gegners
perfekt Bescheid. Daher ist in der Kapitel uberschrift von ansonsten vollkommener Infor-
mation die Rede. Haug wird dieser vielleicht etwas subtile Punkt auch in der Lehrbuchli-
teratur vernachlassigt, d.h. man spricht oft auch von statischen Spielen bei vollkommener
Information.
Abbildung 3.1 auf der nachsten Seite zeigt die sich aus den genannten Kategorisierungen
ergebenden Konstellationen der nicht-kooperativen Spieltheorie. In diesem Kapitel wird nun
zunachst der einfachste Fall behandelt, die Theorie statischer Spiele bei ansonsten vollkom-
mener Information.
Wie bereits eingef uhrt, bezieht sich das Adjektiv statisch auf die Eigenschaft, dass
die Spieler ihre Z uge simultan machen, d.h. es keine eindeutig xierte Reihenfolge gibt.
Dabei ist es nicht wirklich wichtig, ob bzw. dass die Z uge zeitgleich erfolgen, es ist ledig-
lich wichtig, dass die Spieler bei ihrer Entscheidung die Entscheidungen der Mitspieler noch
nicht kennen und diese allenfalls aus der Kenntnis des gesamten Spiels heraus antizipieren
konnen. Da somit die zeitliche Abfolge keine Rolle spielt, werden statische Spiele auch Nor-
malformspiele genannt, da die zusatzliche Information, die die extensive Form gegen uber
der Normalform beinhaltet, oensichtlich unerheblich ist.
41
42 KAPITEL 3. NICHTKOOPERATIVE SPIELE I
Abbildung 3.1: Systematik der nichtkooperativen Spieltheorie
Die konkreten Lernziele in diesem Kapitel sind die Folgenden:
Zunachst wird in Abschnitt 3.2 eine genauere Begriichkeit f ur die Charakteri-
sierung von Information in Spielen entwickelt, die dazu dient diverse Arten von
Informationsunvollkommenheiten zu unterscheiden.
Dann wird eine Klasse von Spielsituationen eingef uhrt, die als Gefangenendilemma
bekannt ist; hier wird insb. gezeigt, dass Rationalverhalten selbst in sehr ubersichtli-
chen Situationen zu inezienten Ergebnissen f uhren kann. Von besonderer Bedeutung
in diesem Abschnitt 3.3 auf Seite 46 ist die Erkenntnis, dass solche Situationen auch
im Kontext zahlreicher okonomischer Problemstellungen von groer Bedeutung sind.
Als nachstes wird in Abschnitt 3.4 auf Seite 49 gezeigt, wie eine strategische Interaktion
auch dann gelost werden kann, wenn keiner der Spieler eine dominante Strategie hat
und auch ein Nash-Gleichgewicht in einer der zur Verf ugung stehenden Strategien
nicht existiert. Wie bereits in Kapitel 2 eingef uhrt, kann es dann Nash-Gleichgewichte
in gemischten Strategien geben.
Viele Situationen lassen sich nicht in den bisher eingef uhrten sehr ubersichtlichen Nor-
malformen darstellen, da es oft sehr viele verschiedene Strategien geben kann; insb.
kann eine einzige Strategievariable stetig variiert werden was bereits unendlich viele
Strategien darstellt. Abschnitt 3.5 auf Seite 52 behandelt die Losung von Spielen
mit vielen Strategien.
Eher theoretischer Natur ist Abschnitt 3.6 auf Seite 53, in dem kurz auf die Bedin-
gungen eingegangen wird, unter denen eine Spielsituation uber ein Nash-Gleichgewicht
haben kann. Es geht hier also um die Existenz von Nash-Gleichgewichten.
Abschnitt 3.7 auf Seite 55 bietet schlielich vier verschiedene Anwendungen f ur die
Charakterisierung der Losung statischer Spiele ohne weitere Informations-
unvollkommenheiten. Hier wird bereits deutlich, wie gro das Anwendungsgebiet
der Spieltheorie ist. Aus der Markttheorie werden dabei zunachst die zwei klassischen
Oligopolmodelle (Cournot und Betrand) besprochen. Ein Klassiker der Finanzwis-
senschaft ist das Allmende-Problem und schlielich wird mit dem Barro-Gordon-
Modell eine sehr einfache Modellierung der Geldpolitik als Interaktion zwischen geld-
politischen Akteuren und dem privaten Sektor vorgestellt.
3.2 Information in Spielen
If half of strategic thinking is predicting what the other player will do, the other
half is guring out what he knows.
3.2. INFORMATION IN SPIELEN 43
B
o
x
k
.
B
a
l
l
e
t
t
B
o
x
k
.
B
a
lle
tt
B
o
x
k
.
B
a
lle
tt
Peter Petra
(2,1)
(0,0)
(0,0)
(1,2)
C
B
A
Abbildung 3.2: Die Informationsmengen bei battle of the sexes
(Rasmusen, 2001, p. 38)
In Abschnitt 2.6.1 auf Seite 30 wurde bereits die Unterscheidung von Spielen mit un-
vollkommener bzw. vollkommener Information kurz angesprochen. In diesem Abschnitt wird
dieser Aspekt weiter vertieft bzw. prazisiert.
1
3.2.1 Perfekte Information und common knowledge
In Abschnitt 1.5.1 lernten wir battle of the sexes kennen, in dem Peter und Petra bei ihrer
Entscheidung jeweils nicht wussten, was der/die jeweils andere tun w urde. In der Darstellung
der extensiven Form war dies darstellbar durch die Unsicherheit dar uber, an welchem Knoten
des Spiels man sich gerade bendet (vgl. Abbildung 2.16 auf Seite 32). Ebenfalls war klar,
dass das Ergebnis eines Spiels stark von dem jeweils unterstellten Informationsstand der
Spieler abhangt bzw. abhangen kann.
Diese Art der Informationsunvollkommenheit soll nun praziser gefasst werden durch die
folgende
Denition: Die Informationsmenge des Spielers i an einem bestimmten Punkt eines
Spiels besteht in der Menge aller Knoten, an denen sich der Spieler benden konnte, zwischen
denen er aber nicht unterscheiden kann.
Abbildung 3.2 macht dies anhand der Informationsmenge bei battle of the sexes klar.
Es gen ugt dabei, auf eine der Varianten in Abbildung 2.16 auf Seite 32 abzustellen.
Bei der Entscheidung von Petra in Stufe 2, kann sie nicht unterscheiden, ob sie sich
in Knoten B oder C bendet. Ihre Informationsmenge bei dieser Entscheidung ist also
gegeben durch {B, C}. Da in dieser Menge mehr als ein Element steht, spricht man von
unvollkommener Information. W usste sie Bescheid, d.h. hatte Peter vorher angerufen und
gesagt, ob er Ballett- oder Boxkampfkarten besorgt hat, ware die Informationsmenge von
Petra gegeben entweder durch {B} oder durch {C}.
Es klingt vielleicht etwas paradox, ist aber oensichtlich, dass die Information um so un-
vollkommener ist, je mehr Elemente in der Informationsmenge enthalten sind. Diese sprach-
liche Paradoxie wird vermieden, wenn man von den eingekreisten Knoten, die die Informa-
tionsmenge darstellen als Wolke spricht.
Mit dem Konzept der Informationsmenge konnen wir nun eine klare Denition eines
Spiels mit vollkommener bzw. unvollkommener Information geben:
Denition: In einem Spiel mit vollkommener Information (perfect informati-
on) bestehen alle Informationsmengen aus nur einem Element. Sobald eine Informations-
menge im Verlauf eines Spiels mehr als ein Element aufweist, spricht man von einem Spiel
mit unvollkommener Information (imperfect information).
1
Dieser Abschnitt basiert zu einem groen Teil auf Rasmusen 2001, ch. 2
Alle Informationsmengen bezieht sich dabei auf alle Entscheidungsknoten, in denen
sich jeder Spieler im Verlauf eines Spiels benden kann.
Das Konzept der Informationsmenge bezieht sich zwar auf den Wissensstand alle Spie-
ler, charakterisiert aber nur jeweils den Informationsstand eines Spielers. Damit ist noch
nichts dar uber ausgesagt, was jeweils ein Spieler uber den Informationsstand der
anderen Spieler wei.

Ublicherweise wird davon ausgegangen, dass jeder Spieler uber die
Informationsmengen der anderen Spieler informiert ist und dass alle wissen, dass dies jeder
wei. Hier schliet sich ein im Prinzip inniter Regress an, da man auch davon ausgehen
muss, dass alle wissen, dass alle wissen, dass jeder alles wei. . . .
Wenn dieses Merkmal vorliegt, spricht man von common knowledge (gemeinsames
Wissen). Es wird immer unterstellt, dass die Spielregeln eines Spiels common knowledge sind.
Desgleichen wird in fast allen Zweigen der Spieltheorie als common knowledge unterstellt,
dass sich alle Spieler rational verhalten.
3.2.2 Sicherheit, Vollstandigkeit und Symmetrie von Informationen
Die hochste Anforderung, die an die Informationsausstattung der Spieler gestellt werden
kann, ist die Eigenschaft der Vollkommenheit der Information, wie sie im letzten Abschnitt
deniert wurde. Unter dieser Annahme wei jeder Spieler bei seiner Entscheidung vollkom-
men Bescheid uber die Entscheidungssituation und die Konsequenzen der verschiedenen
Optionen. Unvollkommene Information kann jedoch noch weiter konkretisiert bzw. charak-
terisiert werden, was in der Literatur anhand von drei Begrispaaren geschieht.
Sicherheit vs. Unsicherheit
Denition: Ein Spiel ist ein Spiel mit Unsicherheit, wenn an mindestens einer Stelle
des Spiels die Natur als Pseudospieler einen Zug macht, nachdem ein Spieler seine Ent-
scheidung getroen hat. Ist dies an keiner Stelle des Spiels der Fall, spricht man von einem
Spiel mit Sicherheit.
Diese Kategorisierung bringt zum Ausdruck, dass es haug Situationen gibt, in denen
man sich f ur eine bestimmte Handlung entscheiden kann, deren Konsequenzen aber nicht
vollig absehbar sind. Beispiel: Die geldpolitischen Entscheidungstrager konnen uber den Zu-
stand einer Volkswirtschaft und die Reaktionen der sie interessierenden Groen auf eine
Zinsanderung durchaus genau Bescheid wissen. Insofern es aber nach der Setzung des geld-
politischen Aktionsparameters (Zins) zu einem Nachfrage- oder Angebotsschock kommt, ist
das makrookonomische Ergebnis von der Geldpolitik nicht exakt steuer- und vorhersehbar.
Hier liegt also eine Situation mit Unsicherheit vor.
Genau f ur diese Situation ist die Evaluation des erwarteten Ergebnisses mit Hilfe einer
Erwartungsnutzenfunktion (von Neumann-Morgenstern-Funktion) notwendig.
Vollstandigkeit vs. Unvollstandigkeit der Information
Denition: Unvollstandige Information in einem Spiel liegt vor, wenn die Natur
als Pseudospieler vor der ersten Entscheidung eines Spielers einen Zug macht und dieser
von mindestens einem Spieler nicht beobachtet werden kann.
Dies ist ein Spezialfall unvollkommener Information, da hier zu Beginn des Spiels
mindestens ein Spieler nicht wei, in welchem Knoten er sich bendet. Man kann daher
auch sagen, dass es sich um ein Spiel mit nicht vollstandig bekannter Ausgangslage
handelt. Um wieder das Beispiel der Geldpolitik zu bem uhen, ware dies der Fall, wenn die
Geldpolitik bei ihrer Zinsentscheidung nicht genau einschatzen kann, in welchem Zustand
sich die Volkswirtschaft bendet.
1
Ein Spiel kann durchaus vollstandige, aber nicht vollkom-
1
Dies ist schon allein deshalb eine sehr realistische Annahme, weil die relevanten makrookonomischen
Daten nur mit einer mehr oder weniger groen Zeitverzogerung gemessen werden konnen. Selbst wenn
3.2. INFORMATION IN SPIELEN 45
mene Information haben (aber nicht umgekehrt). Dies ist beispielsweise dann der Fall, wenn
an irgendeinem Punkt eines Spiels Spieler simultan ziehen m ussen. Dann wissen die Spieler
nicht, in welchem Knoten sie sich benden die Information ist also unvollkommen, es gibt
aber keine Unklarheit uber die Ausgangslage des Spiels die Information daher vollstandig.
Symmetrische vs. asymmetrische Informationen
Eine letzte Kategorisierung der vorliegenden Information bezieht sich auf deren Aufteilung
auf die Spieler.
Denition: In einem Spiel sind die Informationen symmetrisch verteilt, wenn
in jedem Knoten, an dem ein Spieler eine Entscheidung zu treen hat, dieser
mindestens die gleiche Informationsmenge hat, wie alle anderen Spieler auch.
Dar uber hinaus muss gewahrleistet sein, dass am Endknoten alle Spieler den gleichen In-
formationsstand haben. Andernfalls liegt ein Spiel mit asymmetrisch verteilter Information
vor.
Diese Unterscheidung ist in der Praxis sehr wichtig, da Informationsvorspr unge ein-
zelner Spieler plausiblerweise das Spielergebnis massiv beeinussen. Man spricht in diesem
Zusammenhang auch davon, dass einige Spieler private information haben.
Ein Beispiel f ur ein Spiel mit asymmetrischer Information ist der bekannte market for
lemons (Akerlof 1970). Hier geht es darum, dass uber gebrauchte Autos (die, wenn sie
schlecht sind, als lemons bezeichnet werden - was man im Deutschen als Montagsauto
ubersetzen kann) die Vorbesitzer systematisch besser informiert sind als potentielle Kaufer.
Da die potentiellen Kaufer dies nat urlich antizipieren, ist es moglich, dass dieser Markt
aufgrund dieser Informationsasymmetrie zusammenbricht.
Anwendungen
Die genannten Klassikationen bzgl. der Information in Spielen werden in einigen speziellen
Varianten von Poker angewendet, wobei es hier nicht auf die genauen Spielregeln, die spe-
zizieren, welches Blatt ein anderes schlagt, ankommt; diese werden als common knowledge
unterstellt. Vielmehr kommt es nur darauf, welche Charakteristika die vier folgenden Regeln
f ur die Austeilung der Karten mit sich bringen.
Alle Karten werden verdeckt gegeben, jeder Spieler sieht aber sein eigenes Blatt: Es
handelt sich dabei um ein Spiel mit unvollstandiger (und damit auch unvoll-
kommener) Information: Die Natur hat den jeweils anderen ein Blatt gegeben,
das man nicht kennt, vor dem ersten Zug wei man also nicht, an welchem Knoten
man steht jede nach Kenntnis des eigenen Blatts denkbare Kombination der anderen
Blatter ware ein unterschiedlicher Knoten in einer extensiven Form-Darstellung. Wei-
terhin ist die Information asymmetrisch verteilt, weil man bei der Entscheidung des
nachsten Spielzugs Dinge nicht wei, die ein Teil der Mitspieler wei. Und schlielich
ist es ein Spiel mit Sicherheit in dem oben genannte Sinn, weil an keiner Stelle -
nach dem initialen Ausgeben der Karten - die Natur mitspielt, also ein zufalliges
Ereignis auerhalb der Kontrolle der Spieler auftreten kann.
Alle Karten werden oen gegeben: In diesem Fall handelt es sich Spiel mit vollkom-
mener (und daher auch vollstandiger) und symmetrischer Information mit Si-
cherheit.
Alle Karten werden verdeckt gegeben, danach zeigt jeder Spieler die eigenen Karten
allen anderen Spielern, sieht aber seine eigenen nicht (Indian Poker): Mit den jeweils
gleichen Begr undungen wie in der zuerst genannten ublichen Variante handelt es sich
bereits erste Ergebnisse bspw. des BIP mit ca. einem Quartal Verzogerung vorliegen, unterliegen diese in
der Folge noch teilweise substantiellen Revisionen.
Moritz
Nichtgestehen Gestehen
Nichtgestehen
Max
Gestehen
(-1, -1) (-9,0)
(0, -9) (-6,-6)
Abbildung 3.3: Die Normalform des Gefangenendilemmas
dabei um ein Spiel mit unvollkommener, daher auch unvollstandiger, asymmetrischer
Information mit Sicherheit.
Die Karten werden oen gegeben, jeder Spieler setzt seinen Einsatz und erhalt danach
noch eine weitere Karte, die ebenfalls oen ausgegeben wird: In diesem Fall ist die
Information zwar vollkommen (und vollstandig), da man bei der Entscheidung exakt
wei, an welchem Knoten man steht und auch symmetrisch - da bei der Formulie-
rung der Wette jeder den gleichen Informationsstand hat, jedoch ist dies ein Spiel mit
Unsicherheit, weil die Natur vor dem Endknoten noch einen zufalligen Zug macht.
3.3 Das Gefangenendilemma
Das Gefangenendilemma ist ein prototypisches Beispiel f ur ein statisches Spiel. Es beschreibt
eine Situation, f ur die es unmittelbar einsichtige okonomische Parallelen gibt, d.h. Geschich-
ten, die eine isomorphe Struktur aufweisen. Die Originalversion, die auch f ur den Namen
verantwortlich ist, lautet wie folgt:
Zwei Gefangene, nennen wir sie Max und Moritz, werden eines schweren, gemeinsam
begangenen Verbrechens beschuldigt, f ur das es jedoch keinerlei gerichtsfeste Beweise gibt.
1
Hingegen gibt es gegen beide Gefangenen eindeutige Beweise f ur kleinere Vergehen (un-
erlaubter Waenbesitz o.a.). Wenn beide Gefangenen das schwere Verbrechen leugnen, so
werden sie - in dubio pro reo - mit einer geringen Strafe aufgrund dieser kleineren Vergehen
davon kommen. Wenn beide gestehen, so werden sie des schweren Verbrechens angeklagt,
aufgrund der Kooperationsbereitschaft, sagt der Staatsanwalt jedoch zu, nicht die Hochst-
strafe zu beantragen. Wenn einer gesteht - und damit den anderen mit belastet -, der andere
jedoch leugnet, so wird der Gestandige aufgrund der Kooperationsbereitschaft nach kurzer
Zeit auf freien Fu gesetzt (Kronzeuge), wahrend f ur den anderen, nunmehr ja Belasteten,
die Hochststrafe resultieren wird. Die Gefangenen haben keine Moglichkeit, direkt oder indi-
rekt, die Entscheidung uber gestehen oder nicht gestehen miteinander zu koordinieren.
Das genaue Ausma der Strafen in den verschiedenen Szenarien ist willk urlich, wichtig
ist nur, dass die beschriebene Rangfolge eingehalten wird. Die Hochststrafe moge 9 Monate
betragen, bei beiderseitigem Gestandnis werden 6 Monate fallig, die Strafe f ur das kleine
Vergehen betragt 1 Monat, der Kronzeuge moge sofort freikommen.
Damit lasst sich die folgende Normalform des Spiels in Abbildung 3.3 aufschreiben: Eine
kurze

Uberlegung zeigt, dass Gestehen sowohl f ur Max als auch f ur Moritz eine strikt domi-
nante Strategie darstellt. Aufgrund der Symmetrie der Situationen gen ugt es, die

Uberlegung
einfach f ur M anzustellen. M uberlegt sich das Folgende. Wenn der andere gesteht, stelle
ich mich durch gestehen besser (-6 gegen uber -9). Wenn der andere aber nicht gesteht,
1
Ob die Gefangenen - oder einer von ihnen - wirklich schuldig sind, ist f ur das Spiel vollig ohne Belang.
3.3. DAS GEFANGENENDILEMMA 47
StrafefrMax
S
t
r
a
f
e
f
r
M
o
r
i
t
z
Nash-GG
Pareto-effiziente
Lsung
Abbildung 3.4: Das Nash-Gleichgewicht im Gefangenendilemma ist nicht Pareto-ezienz.
so stelle ich mich durch gestehen auch besser (0 gegen uber -1). Also ist gestehen eine
strikt dominante Strategie f ur beide Spieler, es kommt also zu einem Gleichgewicht bei dem
Strategienpaar {gestehen, gestehen} und zu einer gleichgewichtigen Auszahlung von (-6,
-6).
Abbildung 3.4 zeigt den Auszahlungsraum grasch. Folgende Aspekte sind hier der
Erwahnung wert - und konnen anhand der Abbildung 3.4 leicht nachvollzogen werden:
{gestehen, gestehen} ist ein Gleichgewicht in dominanten Strategien und damit auch
ein Nash-Gleichgewicht.
Das Nash-Gleichgewicht ist nicht Pareto-ezient, d.h. es gibt ein Strategienpaar, das
beide Spieler besser stellt, namlich {nicht gestehen, nicht gestehen}.
Das Pareto-eziente Gleichgewicht konnte erreicht werden, wenn beide Spieler jeweils
glaubw urdige und bindende Vereinbarungen treen konnten. Dann lage eine koopera-
tive Spielsituation vor. Dies ist eine sehr wichtige Erkenntnis, besagt sie doch, dass
bei Vorliegen strategischer Information individuelle Rationalitat zu einem kollektiv
inezienten Ergebnis f uhrt bzw. f uhren kann.
Letzteres kann wie folgt verallgemeinert werden: Das Nash-Gleichgewicht in einem
nicht-kooperativen Spiel ist im allgemeinen nicht Pareto-ezient.
Im speziellen Zusammenhang des Spiels ist auch folgendes wichtig: Eine Kronzeugen-
regelung dient jedenfalls in dieser einfachen Form nicht der Wahrheitsndung, sondern
schat vollig unabhangig von Schuld oder Unschuld Anreize f ur strategisches Verhal-
ten. Als Gesetzgeber bzw. Jurist sollte man also die Aussagen von Kronzeugen mit
besonderer Vorsicht genieen und sich der Entscheidungssituation - eben des Dilem-
mas - der Person sehr bewusst sein. Genau so ist aber klar, dass eine Kommunikation
und Kooperation zwischen den Gefangenen im Interesse der Wahrheitsndung unter-
bunden werden muss, da sich sonst bei Mangel an Beweisen das (f ur Max und Mo-
ritz!!) Pareto-eziente Gleichgewicht durchsetzen w urde - ebenfalls unabhangig von
der tatsachlichen Schuld.
Unternehmer
Nettsein Fiessein
Gutarbeiten
Arbeiter
Schlampen
(10,10) (0,20)
(20,0) (5,5)
Abbildung 3.5: Arbeiter und Unternehmer im Gefangenendilemma
Okonomische Beispiele f ur Gefangenendilemmata

Die Spielsituation des Gefangenendilemmas kann sehr gut auf okonomische Zusammenhange
angewandt werden, da es hier haug um Situationen geht, in denen Kooperation f ur den
einzelnen etwas kostet, und deshalb nicht zustande kommt, wahrend alle Beteiligten genau
davon protieren w urden, wenn es zu dieser f ur den einzelnen kostentrachtigen Kooperation
kame. Vier Beispiele sollen die Bedeutung dieses Szenarios illustrieren.
Beispiel 1: Motivation am Arbeitsplatz
Max und Moritz aus Abbildung 3.3 auf Seite 46 seien nun ersetzt durch Arbeiternehmer
und Unternehmer. Der Arbeitnehmer habe die Strategien gut arbeiten und schlam-
pen, der Unternehmer die Strategie nett sein (was alle moglichen monetaren und nicht-
monetaren Dinge beinhalten kann) und es sein. Bei guter Arbeit teilt sich der nette
Unternehmer den Ertrag mit dem Arbeiter, wenn er es ist, so kann er den ganzen Ertrag
an sich reien. Ist der Unternehmer hingegen nett obwohl der Arbeiter schlampt, geht die
komplette Auszahlung an den gut behandelten, aber unangestrengten Arbeiter. Schlampt
der Arbeiter in einer esen Unternehmung, so stellen sich beide schlechter als bei guter
Arbeit in nettem Klima, konnen sich aber nicht gegenseitig ubervorteilen. Die so beschrie-
bene Struktur ist in Abbildung 3.5 zu sehen. Es ist leicht zu sehen, dass schlampen und
es sein strikt dominante Strategien sind, mithin ein Nash-Gleichgewicht darstellen, dieses
jedoch inezient ist. Alle Arten von Leistungsentlohnungen (Akkordlohn, Bonuszahlun-
gen, . . . ) sind letztlich Versuche, das eziente Gleichgewicht durchzusetzen. Spater werden
wird auch sehen, dass es moglich ist, die Inezienz des Gefangenendilemmas dadurch zu
umgehen, dass das Spiel wiederholt gespielt wird und damit die Akteure im Hinblick auf
zuk unftige Ertrage Anreize haben konnen, sich eine Reputation zur Kooperationsbe-
reitschaft zu erwerben. In einem statischen one-shot game ist aber das Nash-Gleichgewicht
im Allgemeinen nicht Pareto-ezient.
Beispiel 2: Oligopol
Ein weiteres Beispiel ist die typische Oligopolsituation, in der ein (kooperatives) Kartell
hohere gemeinsame Gewinne erzielen kann als bei Wettbewerb, obwohl jeder einzelne von
einer isolierten Abweichung von den Kartellregeln protieren konnte. Diese Situation wird
uns noch in verschiedenen Varianten beschaftigen.
Beispiel 3:

Oentliche G uter
Ein ganz typisches okonomisches Problem ist die Bereitstellung oentlicher G uter. Aufgrund
der Eigenschaft der Nichtrivalitat im Konsum lohnt es sich f ur jeden einzelnen, sich vor
3.4. GEMISCHTE STRATEGIEN 49
BrgerB
Beteiligen Nichtbeteiligen
Beteiligen
Brger A
Nichtbeteiligen
(25,25) (-50,100)
(100,-50) (0,0)
Abbildung 3.6: Das Gefangenendilemma bei der Bereitstellung oentlicher G uter
einer Beteiligung an der Finanzierung zu dr ucken, und sich stattdessen als Trittbrettfahrer
zu betatigen. Nehmen wir an, die Zahlungsbereitschaft von zwei B urgern f ur ein Projekt,
dessen Kosten sich auf 150 e belaufen, betragt jeweils 100 e. Damit ist klar, dass keiner
allein das Projekt angeht, aber bei einer gemeinsamen Finanzierung jeder im Umfang von
(100 150/2) = 25 protiert. Wenn sie sich nun f ur eine Beteiligung bzw. Nicht-Beteiligung
(= Trittbrettfahren) an dem Projekt entscheiden m ussen, ist die folgende Auszahlungsmatrix
relevant, die wiederum die Struktur eines Gefangenendilemmas aufweist:
Beispiel 4: Werbung
Werbung hat in heftig umkampften Markten sehr haug den Eekt, dass es die Nachfrage
zu der beworbenen Marke lenkt, nicht aber unbedingt die Gesamtnachfrage in diesem
Markt (z.B. nach Zigaretten) dramatisch beeinusst. Da Werbung teuer ist, ware es also f ur
Wettbewerber in diesem Markt vorteilhaft, ein Werbememorandum zu beschlieen und sich
den Markt einfach friedlich zu teilen. Nat urlich entsteht dadurch f ur den einzelnen Wettbe-
werber ein Anreiz durch ein kleines bisschen Werbung die Nachfrage weitgehend an sich zu
binden. Da alle Wettbewerber diesen Anreiz haben, werden alle Werbung betreiben wollen,
obgleich diese f ur die Branche insgesamt wenig hilfreich ist. Vor diesem Hintergrund lasst
sich beispielsweise verstehen, warum die US-Tabakrmen bereits 1971 einem Verbot
der TV-Werbung zustimmten, wenn auch f ur die Zusicherung trotz der damals ins Be-
wusstsein ger uckten Gesundheitsschaden, keine Schadensersatzprozesse unter Bundesrecht
f uhren zu m ussen
1
. Da die USA ein groer und weitgehend in sich abgeschlossener Markt
sind, wussten die Firmen, dass eine gesetzliche Beschrankung f ur alle letztlich protabel sein
w urde. Das gesetzliche Werbeverbot stellte damit sicher, dass das eziente Gleichgewicht
erreicht wurde wobei hier Gesundheitserwagungen keinerlei Rolle spielen (m ussen).
3.4 Gemischte Strategien
In Abschnitt 2.7.4 auf Seite 38 bei der Diskussion verschiedener Losungskonzepte von Spie-
len hatten wir bereits einen Fall kennen gelernt (Dilemma des Samariters), in dem kein
Nash-Gleichgewicht in reinen Strategien gefunden werden konnte, aber dennoch eines in
gemischten Strategien zu begr unden war. In diesem Abschnitt werden wir dieses Losungs-
konzept eines statischen Spiels noch etwas genauer betrachten. Dazu dient zunachst die
folgende
Denition: In einem Normalformspiel mit I Spielern, die die Strategienmengen S
i
=
{s
i1
, s
i2
, . . . , s
iK
} , i = 1, . . . I haben, wird eine gemischte Strategiedurch die Wahrschein-
1
Die Prozesse, die dennoch zu milliardenschweren Entschadigungszahlungen f uhrten, wurden alle auf der
Eben der einzelnen Bundesstaaten gef uhrt.
Spieler2
Kopf Zahl
Kopf
Spieler1
Zahl
(1,-1) (-1,1)
(-1,1) (1,-1)
Abbildung 3.7: Die Normalform-Darstellung von matching pennies
lichkeitsverteilung p
i
= {p
i1
, p
i2
, . . . , p
iK
} beschrieben, wobei gelten muss, dass 0 p
ik
1
und
K
k=1
p
ik
= 1.
Bislang haben wir zumeist Spiele mit I = K = 2 betrachtet, d.h. mit zwei Spielern,
die jeweils zwei alternative Strategien wahlen konnten. Weiterhin ist zu beachten, dass eine
reine Strategie letztlich ein Spezialfall einer gemischten Strategie ist, da hier einfach eine
bestimmte Strategie die Wahrscheinlichkeitsmasse 1 und alle anderen Strategien damit die
Wahrscheinlichkeitsmasse 0 zugeordnet bekommen.
F ur eine grasche Losung eines Spiels mit einer gemischten Strategie eignet sich ein noch
einfacheres Szenario als das Dilemma eines Samariters, namlich ein Spiel namens Matching
Pennies. Die Regel ist sehr einfach: Zwei Spieler mit je einer M unze legen simultan die M unze
auf den Tisch. Stimmen die Seiten uberein, d.h. liegt (Kopf, Kopf) oder (Zahl, Zahl) auf
dem Tisch erhalt Spieler 1 beide M unzen, liegt (Kopf, Zahl) oder (Zahl, Kopf) auf dem
Tisch gehen beide M unzen an Spieler 2.
Damit ergibt sich folgende in Abbildung 3.7 zu sehende Normalform:
Man kann sich rasch davon uberzeugen, dass es bei diesem Spiel kein Nash-Gleichgewicht
in reinen Strategien gibt und nat urlich auch keine dominierte Strategie. Dennoch ist fast
schon intuitiv klar, dass jeder Spieler jede der beiden Strategien mit der Wahrscheinlichkeit
1/2 spielen wird, und dies ein Nash-Gleichgewicht in gemischten Strategien darstellt.
Im Folgenden soll dies formal gezeigt werden, wobei wir f ur die Notation lediglich die
Wahrscheinlichkeiten einf uhren m ussen, mit denen die Spieler 1 und 2 Kopf wahlen. In
Ubereinstimmung mit der allgemeinen Denition seien diese p

1
und p
2
genannt. (Die dop-
pelte Indizierung kann hier entfallen, da jeder Spieler nur zwei Strategien hat, und die
Wahrscheinlichkeit, dass Spieler 1 bzw. Spieler 2 Zahl wahlen daher mit 1p
1
bzw. 1p
2
bezeichnet werden konnen.)
Die Auszahlung f ur Spieler 1 ergibt sich in Abhangigkeit von den Wahrscheinlichkeiten
p
1
und p
2
als
1
E (u
1
) = p
1
p
2
p
1
(1 p
2
) (1 p
1
) p
2
+(1 p
1
) (1 p
2
) = p
1
(4p
2
2) +(1 2p
2
) (3.1)
Angenommen, Spieler 1 w usste, dass p
2
> 1/2. In diesem Fall ist der erste Klammerterm
(4p
2
2) oensichtlich positiv, die erwartete Auszahlung ist also eine steigende Funktion
von p
1
. Das Beste, was Spieler 1 tun kann, ist also p
1
= 1 zu spielen. Die gleiche Logik f uhrt
f ur p
2
< 1/2 zu dem Schluss, die erwartete Auszahlung eine sinkende Funktion von p
1
ist
und daher p
1
= 0 die optimale Reaktion ist. F ur p
2
= 1/2 ist hingegen E (u
1
) = 0; in dieser
1
Die erste Zeile geht einfach die vier moglichen Felder durch und gewichtet die Auszahlungen mit den
jeweiligen Wahrscheinlichkeiten, die zweite Zeile ergibt sich aus der ersten nach Ausmultiplizieren und Zu-
sammenfassen der Terme
3.4. GEMISCHTE STRATEGIEN 51
Situation ist es vollig egal, welche Wahrscheinlichkeitsverteilung Spieler 1 wahlt. Damit ist
Spieler 1 f ur p
2
= 1/2 also indierent bzgl. des zu wahlenden Wert von p
1
. Formal:
p
1
=
_
_
_
0 f ur 0 p
2
< 1/2
(0, 1) f ur p
2
= 1/2
1 f ur 1/2 < p
2
1
(3.2)
Diese Funktion ist im linken Teil von Abbildung 3.8 gestrichelt eingezeichnet und fasst als
Reaktionsfunktion des Spielers 1 dessen Optimalverhalten als Funktion des Verhaltens
des anderen Spielers zusammenfassen.
1
Vollig analog dazu lasst sich auch eine Reaktionsfunktion des Spielers 2 ableiten, indem
man analog zu (3.1) die erwartete Auszahlung E (u
2
) berechnet und die optimale Strategie
f ur p
2
in Abhangigkeit von p
1
identiziert.
Die erwartete Auszahlung f ur Spieler 2 betragt dabei
E (u
2
) = p
2
(2 4p
1
) (1 2p
1
) , (3.3)
die Reaktionsfunktion ist gegeben durch
p
2
=
_
_
_
1 f ur 0 < p
1
< 1/2
(0, 1) f ur p
1
= 1/2
0 f ur 1/2 < p
1
< 1
(3.4)
Diese Reaktionsfunktion ist im rechten Teil der Abbildung 3.8 zu sehen.
1/2
2
p
1
p
1
1
1/2
1
p
2
p
1
1
? ?
1 2
p p
? ?
2 1
p p
(a) (b)
Abbildung 3.8: Die Reaktionsfunktionen der beiden Spieler in matching pennies
In Abbildung 3.9 auf der nachsten Seite sind die beiden Reaktionsfunktionen zusammen-
gefasst, wobei die Reaktionsfunktion des Spielers 2 nun blau eingezeichnet ist. Zu beachten
ist, dass der Quadrant in Abbildung 3.8 b) entsprechend zu drehen ist, um in der gleichen
Ebene wie Abbildung 3.8 a) dargestellt werden zu konnen.
Es ist sofort zu sehen, dass die beiden Reaktionsfunktionen einen eindeutigen Schnitt-
punkt bei (p
1
, p
2
) =
_
1
2
,
1
2
_
aufweisen. Dies ist das eindeutige Nash-Gleichgewicht in ge-
mischten Strategien bei Matching Pennies.
Man kann das Konzept des Nash-Gleichgewichts bei gemischten Strategien leicht auf den
Fall ubertragen, dass die Spieler mehr als jeweils zwei reine Strategien haben. Allge-
mein muss f ur die Wahrscheinlichkeitsverteilungen p
1
und p
2
(die hier wieder Vektoren sind,
1
Genau genommen ist die Reaktionsfunktion in diesem Fall keine mathematische saubere Funktion, da
hier dem Argument 1/2 mehrere (hier sogar: unendlich viele) Funktionswerte zugeordnet sind. Man spricht
dann allgemeiner von einer Korrespondenz, was hier jedoch ignoriert werden soll.
1/2
2
p
1
p
1
1
? ?
2 1
p p
? ?
1 2
p p
1/2
Abbildung 3.9: Das Nash-Gleichgewicht in gemischten Strategien f ur matching pennies
wahrend sie bei Matching Pennies nur jeweils Skalare waren) in einem Nash-Gleichgewicht
bei gemischten Strategien gelten, dass
u
1
(p
1
, p
2
) u
1
(p
1
, p
2
) p
1
(3.5)
und
u
2
(p
1
, p
2
) u
2
(p
1
, p
2
) p
2
, (3.6)
wobei p
i
, i = 1, 2 die Wahrscheinlichkeitsverteilungen im Nash-Gleichgewicht bezeichnen. In
Worten: p
i
, i = 1, 2 m ussen jeweils wechselseitig optimale Antworten (best responses)
auf die Strategie des Mitspielers sein.
3.5 Nash-Gleichgewichte mit (unendlich) vielen Strate-
gien
Abgesehen von der gerade gemachten Verallgemeinerung des Nash-Konzepts bei gemischten
Strategien gingen fast alle bisherigen Beispiele davon aus, dass die Strategienmenge jedes
Spielers aus nur zwei Alternativen besteht. Dieser Trick hielt die Matrix der Normalform
einigermaen ubersichtlich. Wenn z.B. zwei Spieler jeweils 20 Strategiealternativen hatten, so
ware die Normalform eine 20x20-Matrix also nichts, was man sich wirklich hinzuschreiben
w unscht.
Gerade im Kontext okonomischer Fragestellungen sind jedoch Strategiemengen oft nicht
einmal endlich, da die Strategievariable in vielen Situationen plausiblerweise stetig variiert
werden und damit unendlich viele Auspragungen annehmen kann. Dies gilt beispielsweise
f ur Preise, Mengen, Werbeausgaben, Bonuszahlungen, usw. was alles denkbare Strategie-
variablen in entsprechend formulierten Spielen sind.
In solchen Situationen ist die Matrixdarstellung der Normalform nat urlich kein besonders
hilfreiches Instrument. Allerdings kann man mit etwas Algebra diese Situationen leicht in
den Gri bekommen, was nun ohne R uckgri auf eine konkrete story kurz gezeigt werden
soll. In den Anwendungen des Abschnitts 3.7 auf Seite 55 werden dann Beispiele folgen, in
denen das gezeigte Prinzip angewandt wird. Wieder beschranken wir uns zunachst auf ein
2-Personenspiel. Hier lasst sich allgemein sagen, dass die Auszahlungsfunktion der beiden
Spieler eine Funktion der gewahlten Strategien beider Spieler sind, dass also
u
1
= u
1
(s
1
, s
2
) , (3.7)
3.6. EXISTENZ VON NASH-GLEICHGEWICHTEN 53
wobei s
1
und s
2
, d.h. die Strategievariable(n) der beiden Spieler nun als stetig variierbar
angenommen werden. Analog ist
u
2
= u
2
(s
1
, s
2
) . (3.8)
Die Auszahlungsfunktionen m ussen als zweifach stetig dierenzierbar und konkav in den
beiden Strategievariablen angenommen werden. Dann ist die optimale Strategiewahl des
Spielers 1 charakterisiert durch
u
1
()
s
1
= 0 s
1
(s
2
, ...) (3.9)
Analog wahlt Spieler 2 seine Strategie gema
u
2
()
s
2
= 0 s
2
(s
1
, ...) (3.10)
Die Funktionen in der jeweils zweiten Zeile der Gleichungen (3.9) und (3.10) sind die
Reaktionsfunktionen der Spieler analog zu den Reaktionsfunktionen bei Matching
Pennies, wobei dort allerdings konkret gleichgewichtige Wahrscheinlichkeitsverteilungen er-
mittelt wurden, es hier aber ganz allgemein um die Auspragung einer beliebigen Strategie-
variablen geht.
Die Gleichungen (3.9) und (3.10) stellen nun ein 2-Gleichungssystem in den beiden Un-
bekannten s
1
und s
2
dar, das sich mit den ublichen Regeln der Algebra auosen lasst. In
dieser allgemeinen Form ist es nat urlich durchaus denkbar, dass es mehrere Losungen des
Gleichungssystems gibt in diesem Fall gibt es dann eben mehrere Nash-Gleichgewichte.
Man spricht dann davon, dass das Spiel durch multiple Gleichgewichte gekennzeichnet
ist.
Es leuchtet unmittelbar ein, dass das gezeigte Losungsprinzip auch auf Viel-Personen-
Spiele mit I Spielern ausgedehnt werden kann. In dem Fall gibt es eben I Reaktionsfunktio-
nen der Gestalt
u
i
()
s
i
= 0 s
i
(s
i
, ...) i = 1, ..., I (3.11)
und damit ein I-dimensionales Gleichungssystem zur Berechnung der I gleichgewichtigen
Strategien.
3.6 Existenz von Nash-Gleichgewichten
Die in Abschnitt 3.5 auf der vorherigen Seite geschilderte Methode zur Berechnung von
Nash-Gleichgewichten ist deutlich allgemeiner als die zuvor angestellten

Uberlegungen zur
Identikation eines Nash-Gleichgewichts. Allerdings stellt zunachst nichts sicher, dass es ein
Nash-Gleichgewicht tatsachlich gibt. Daher wird in diesem Abschnitt kurz gezeigt, unter
welchen Umstanden die Existenz eines Nash-Gleichgewichts gesichert ist.
Zunachst sei das Ergebnis vorweggenommen in dem folgenden
Theorem (Existenz von Nash-Gleichgewichten): In einem Spiel mit I Personen
und begrenztem Strategienraum S
i
f ur alle Spieler i = 1, ..., I sowie in der jeweils eigenen
Strategie zweifach stetig dierenzierbaren und konkaven Auszahlungsfunktionen u
i
(s
i
, ...)
existiert immer ein Nash-Gleichgewicht.
Folgende Anmerkungen zu diesem Theorem sind angebracht:
Der begrenzte Strategienraum schliet nicht aus, dass die Strategievariablen stetig
variiert werden kann, verlangt aber, dass es f ur die Auspragung der Strategievariablen
endliche Ober- und Untergrenzen gibt.
Das Theorem macht keinerlei Aussage dazu, ob unter den genannten Bedingungen ein
eindeutiges Nash-Gleichgewicht existiert.
Das Theorem sagt nichts uber die Existenz von Nash-Gleichgewichten, wenn die Aus-
zahlungsfunktion nicht konkav in der Strategievariablen ist und wenn der Strategien-
raum unbegrenzt ist. Ein ganzer Zweig der Spieltheorie ist damit beschaftigt, immer
feinere Existenzbeweise f ur Nash-Gleichgewichte unter etwas weniger stringenten Be-
dingungen zu formulieren. Da diese Ergebnisse allerdings wenig anwendungsbezogen
sind, werden wir uns damit nicht weiter befassen.
Das Theorem gilt auch f ur Gleichgewichte in gemischten Strategien, wobei hier auf
die Details der Anforderungen an Strategienraum und Auszahlungsfunktion f ur den
Existenzbeweis verzichtet werden soll.
Um das Theorem (f ur das Beispiel eines 2-Personen-Spiels) zu beweisen, machen wir uns
zunachst klar, dass durch die Optimalitatsbedingungen u
1
/s
1
= 0 und u
2
/s
2
= 0 die
beiden Reaktionsfunktionen deniert sind, die nun mit r
1
(s
2
) und r
2
(s
1
) bezeichnet werden.
Es ist hier explizit nur darauf abgestellt, dass die Strategie des anderen die eigene optimale
Strategie beeinusst; andere Einussgroen auf die Reaktionsfunktionen sind moglich, hier
aber nicht weiter interessant.
Die beiden Reaktionsfunktionen konnen nun in einer Vektorfunktion r zusammengefasst
werden:
r = [r
1
(s
2
) , r
2
(s
1
)] = r (s) mit s = [s
1
, s
2
] (3.12)
Das Nash-Gleichgewicht s
= [s
1
, s
2
] ist nun dadurch deniert, dass s
1
= r
1
(s
2
) und
s
2
= r
2
(s
1
). In Vektorschreibweise lasst sich dies zusammenfassen als
s
= r (s
) . (3.13)
Die Funktion r bildet also das Argument auf sich selbst ab. Einen solchen Punkt bezeich-
net man als Fixpunkt einer Funktion. Nun ware noch zu zeigen, dass die Funktion r (s)
unter den getroenen Annahmen einen Fixpunkt aufweist. Hierbei hilft uns das folgende
Fixpunkttheorem: Wenn r (s) eine kontinuierliche Funktion auf einem begrenzten In-
tervall ist, dann weist r (s) eine Fixpunkt auf, f ur den gilt, dass s = r (s) .
Geometrisch bedeutet das Fixpunkttheorem, dass sich die Funktionen r
1
(s
2
) und r
2
(s
1
)
in mindestens einem Punkt schneiden m ussen. Das Fixpunkttheorem selbst soll hier nicht
bewiesen werden; vielmehr soll mit Hilfe der Abbildung 3.10 anhand zweier fallender Reak-
tionsfunktionen die Idee eines Fixpunktes grasch verdeutlicht werden.
2
s
1
s
? ?
2 1
s s
? ?
1 2
s s
1
s
2
s
? ?
2 1
s s
? ?
1 2
s s
*
s
? ?
*
s r
r
Abbildung 3.10: Die Fixpunkteigenschaft der Reaktionsfunktionen in einem 2-Personen-Spiel
3.7. WEITERE ANWENDUNGEN 55
3.7 Weitere Anwendungen
In diesem Abschnitt werden nun einige konkrete okonomische Beispiele f ur statische Spiele
mit vollstandiger Information erortert.
3.7.1 Oligopol I: Das Cournot-Modell
Ein Oligopol ist ein Markt mit wenigen Anbietern; diese haben somit Marktmacht, die je-
doch durch die Existenz der Konkurrenten eingeschrankt wird. Es wird hier der Fall eines
homogenen Duopols besprochen, d.h. es moge nur zwei Anbieter geben was f ur die
Analyse der strategischen Interaktion zwischen diesen Anbietern vollig ausreicht. Diese pro-
duzieren ein Gut, das aus der Sicht der (atomistischen) Konsumenten vollig gleichwertig
ist.
Die Duopolisten produzieren die Mengen x
1
und x
2
eines Gutes. Die produzierte Menge
ist die relevante Strategievariable.
1
Die gemeinsam produzierte Menge ist gegeben durch
x x
1
+x
2
. Die Nachfragekurve ist aufgrund der Homogenitat der Produkte ausschlielich
von der Summe der beiden Produkte abhangig und durch
x = D(p) (3.14)
gegeben, wobei p der Marktpreis des Gutes ist. Die inverse Nachfrage ist dann gegeben
durch
p = D
1
(x) . (3.15)
Die Kostenfunktionen der beiden Anbieter sind durch C
1
(x
1
) und C
2
(x
2
) gegeben, die
Gewinnfunktionen sind daher
1
= p (x) x
1
C
1
(x
1
) (3.16)
und
2
= p (x) x
2
C
2
(x
2
) (3.17)
Die Reaktionsfunktionen ergeben sich nun durch Maximierung von (3.16) bzw. (3.17) uber
die jeweiligen Produktionsmengen x
1
und x
2
.
Die denkbar einfachste Spezikation ist eine lineare (inverse) Nachfragefunktion der Ge-
stalt
p = a bx, a, b > 0 (3.18)
sowie die Annahme identischer und konstanter Grenzkosten in Hohe von c, wobei ange-
nommen werden muss, dass c < a.
In diesem Fall konkretisiert sich (3.19) zu
1
= [a b (x
1
+x
2
)] x
1
cx
1
= (a c) x
1
bx
1
x
2
bx
2
1
(3.19)
und
2
= [a b (x
1
+x
2
)] x
2
cx
2
(3.20)
Maximierung von
1
uber x
1
f uhrt zu
1
x
1
= (a c) bx
2
2bx
1
= 0 x
1
=
a c
2b

1
2
x
2
(3.21)
1
Es ware logisch vielleicht konsistenter, diese weiterhin mit s zu bezeichnen. Lange Gewohnung spricht
aber f ur die hier gewahlte Notation.
Diese Gleichung ist die Reaktionsfunktion des Anbieters 1. Vollig analog ergibt sich die
Reaktionsfunktion des Anbieters 2 als
x
2
=
a c
2b

1
2
x
1
x
1
=
a c
b
2x
2
(3.22)
Die zweite Schreibweise dient nur dazu, (3.21) und (3.22) in ein Diagramm einzuzeichnen,
was in Abbildung 3.11 geschieht.
2
x
1
x
Cournot-Nash-GG
RFdes2
RFdes1
Abbildung 3.11: Das Cournot-Duopolmodell
Das Nash-Gleichgewicht liegt im Schnittpunkt der beiden Reaktionsfunktionen und ist
in diesem Fall eindeutig. Die Bezeichnung Cournot-Nash-Gleichgewicht ehrt sowohl den
franzosischen

Okonomen Auguste Cournot
1
, der bereits im 19. Jhd. die hier vorgef uhrte
klassische Oligopollosung entwickelte und damit das Nash-Gleichgewichtskonzept gut
120 Jahre vor dessen allgemeiner Charakterisierung durch John Nash benutzte.
2
Die gezeigte Konstruktion des Nash-Gleichgewichts setzt voraus, dass beide Anbieter ih-
re gewinnmaximale Menge wahlen, dabei aber nicht wissen, wie viel der andere produziert,
sondern nur davon ausgehen, dass der jeweils andere ebenfalls die f ur ihn gewinnmaximie-
rende Menge anbieten wird. Wir werden in dem Kapitel uber dynamische Spiele sehen, wie
sich die Situation andert, wenn sich ein Anbieter auf irgendeine spezische Menge ex ante
festlegen kann.
Die jeweiligen optimalen Mengen erhalt man durch die Losung des Gleichungssystems
(3.21) und (3.22). Es ergibt sich
x
1
= x
2
=
1
3
(a c)
b
(3.23)
und damit die Marktmenge
x
=
2
3
(a c)
b
(3.24)
sowie durch Einsetzen von (3.24 in (3.18) der Marktpreis
p
=
1
3
(a + 2c) > c (3.25)
Die behauptete Relation in (3.25) folgt aus der Annahme c < a, die notwendig ist f ur
eine positive Menge.
1
Vgl. Cournot (1838)
2
John Nash erhielt f ur seine bahnbrechenden Arbeiten zur Spieltheorie zusammen mit R. Selten und J.
Harsanyi den Nobelpreis f ur Wirtschaftswissenschaften.
Ein kurzer Vergleich mit der Losung bei einer Vielzahl von Anbietern (vollstandige Kon-
kurrenz) ist hilfreich. Bei vollstandiger Konkurrenz f uhrt die Gewinnmaximierung zu einem
Verhalten der einzelnen Anbieter, das daf ur sorgt, dass der Marktpreis gleich den Grenzko-
sten entspricht, bei konstanten und identischen Grenzkosten gilt also im Marktgleichgewicht
bei vollkommener Konkurrenz p = c. Die zu diesem Preis nachgefragte Menge (und auch
bereitgestellte) Menge betragt x = (a c)/b wie ein Blick auf die Nachfragefunktion (3.18)
sofort zeigt. Damit beschranken die Duopolisten die Menge relativ zur Konkurrenzlosung
auch ohne explizite Absprache.
1
3.7.2 Oligopol II: Das Bertrand-Modell
Das gerade vorgestellte Cournot-Modell f ur das Verhalten von Oligopolisten ist nicht die
einzige denkbare und plausible Beschreibung der Situation weniger Akteure auf der Ange-
botsseite eines Marktes. Schon sehr fr uh hat J. Bertrand (1883) darauf aufmerksam gemacht,
dass eine relativ einfache Modikation des Cournot-Modells gravierende Konsequenzen nach
sich zieht. Wenn namlich unterstellt wird, dass die Unternehmer nicht die Produktionsmen-
ge, sondern den Absatzpreis als strategische Variable heranziehen, andern sich die
Ergebnisse stark was auch Konsequenzen f ur die wohlfahrtstheoretische Beurteilung von
Oligopolen hat und damit f ur die angemessene Wettbewerbspolitik.
Nehmen wir der Einfachheit halber wieder ein homogenes Duopol an.
2
Diese Annahme
stellt sicher, dass bei irgendwelchen Preisunterschieden die Nachfrage vollstandig zu dem
billigeren Anbieter umschwenkt. F ur den Duopolisten 1 ergibt sich damit bei konstanten
Grenzkosten in Hohe von c und in Abwesenheit von Fixkosten die folgende Gewinnfunktion
1
(p
1
, p
2
) =
_
_
_
(p
1
c) x(p
1
) p
1
< p
2
(p
1
c) x(p
1
)/2 p
1
= p
2
0 p
1
> p
2
(3.26)
F ur den zweiten Anbieter ergibt sich eine vollig analoge Funktion.
In diesem einfachen Fall kann das Spiel uber die Technik der Elimination dominierter
Strategien gelost werden auch wenn die Strategievariable stetig variiert werden kann.
Angenommen, Anbieter 1 verlangt einen Preis p
1
f ur den gilt, dass p
2
> p
1
> c. Dann
ist klar, dass er den ganzen Markt an sich reien kann und einen positiven Prot macht.
Dies kann aber oensichtlich kein Gleichgewicht sein, da Anbieter 2 sich besser stellt durch
die Anpassung von p
2
auf bzw. leicht unter die Hohe von p
1
. Anbieter 2 hat f ur p
1
> c eine
strikt dominante Strategie, namlich seinen Preis unter p
1
zu senken. Genau das gleiche gilt
f ur Anbieter 1 f ur den Fall, dass p
2
> c. Dieses Argument ist also solange richtig bis gilt,
dass p
1
= p
2
= c, d.h. bis zu dem Punkt, in dem die Preise gleich den Grenzkosten sind.
Bertrand-Wettbewerb in einem homogenen Duopolmarkt sorgt also f ur das gleiche Ergebnis
wie die Marktform der vollstandigen Konkurrenz.
Wie beim Cournot-Modell des Duopols konnten sich auch hier die beiden Anbieter durch
Kooperation besser stellen. Bei vollstandiger Kooperation konnten sich beide Anbieter
genau wie beim Cournot-Duopol den Monopolgewinn teilen. In diesem Fall w urde der
Unterschied zwischen Preis- und Mengenwettbewerb verschwinden.
Die Gegen uberstellung von Cournot- und Bertrand-Modell des Duopols ist nicht nur per
se f ur die Analyse von Markten bei unvollstandiger Konkurrenz interessant. Eine wichtige
und allgemeinere Botschaft ist hier auch, dass es bei der Formulierung einer Spielsituation
sehr auf die Details, in diesem Fall auf die exakte Spezikation der gewahlten Strategie-
parameter ankommt.
1
Es ist eine gute und sehr einfache

Ubung, zu uberlegen, wie die gemeinsame Gewinnmaximierung aus-
sieht. In diesem Fall geht man davon aus, dass die beiden Duopolisten ubereinkommen, die Gewinnsumme
maximieren.
2
Gibbons (1992), p. 21 f. bietet eine Darstellung von Bertrand-Wettbewerb in einem heterogenen Duopol.
3.7.3 Das Allmende-Problem
Ein klassisches Problem der Finanzwissenschaft ist die Analyse der Bereitstellung und Nut-
zung sog. oentlicher G uter. Diese zeichnen sich dadurch aus, dass ein Einzelner nicht von
deren Benutzung ausgeschlossen werden kann sich also gerne als Trittbrettfahrer betatigt.
Damit w urde der Marktmechanismus nicht oder nur unzulanglich f ur die Bereit-
stellung solcher G uter Sorge tragen. Umgekehrt gilt, dass ein vorhandenes oentliches
Gut tendenziell der

Ubernutzung unterliegt, da bzw. wenn der Einzelne f ur dessen Nut-
zung nicht oder nicht gen ugend zur Kasse gebeten wird. In diese wenn auch etwas grobe
Schablone lassen sich fast alle umweltpolitischen Probleme legen.
In diesem Abschnitt wird eine klassische Formulierung des Problems oentlicher G uter
analysiert, das auf Hardin (1968) zur uckgehende Beispiel der tragedy of the commons
(Allmende-Problem). Damit wird gleichzeitig auch ein Spiel gezeigt, in dem eine beliebig
groe Zahl von Spielern simultan spielt.
Die Story geht wie folgt: In einem Dorf gibt es I Bauern, die jeweils s
i
Ziegen halten. s
i
ist dabei die Strategievariable f ur die Bauern. Insgesamt gibt es in dem Dorf also Z =
I
i=1
s
i
Ziegen. Da die Dorfwiese (common) nur begrenzt Platz und Futter bietet, ist klar, dass der
Wert (Milchleistung, . . . ) einer einzelnen Ziege davon abhangt, wie viele Ziegen
es insgesamt gibt. Dieser Wert sei mit u(Z) bezeichnet, wobei eine Indizierung dieser
Auszahlungsfunktion mit dem Index i f ur die einzelnen Spieler unterbleibt, da die Funktion
als f ur alle identisch unterstellt wird. Plausiblerweise weist diese Funktion die folgenden
Eigenschaften auf:
u
(Z) < 0; u
(Z) < 0, (3.27)

da mit jeder zusatzlichen Ziege der Wert jeder bereits vorhandenen Ziege sinkt und dieser
Eekt an Bedeutung zunimmt, wenn die Ziegenpopulation steigt.
Jede Ziege kostet in der Anschaung auerdem einen konstanten Betrag von c. Dann ist
die Zielfunktion eines reprasentativen Ziegenbauers gegeben durch
i
= s
i
u(Z) c s
i
, (3.28)
Die I Bedingungen erster Ordnung sind dann gegeben durch
i
s
i
= u(Z) +s
i
u
(Z) c = 0 (3.29)
Damit diese Gleichungen ein Nash-Gleichgewicht darstellen, m ussen sie gelten f ur Z =
I
i=1
s
i
= Z
, wobei Z
die Gesamtzahl der Ziegen im Nash-Gleichgewicht bezeichnet.

Damit muss (3.29) f ur ein Nash-Gleichgewicht wie folgt geschrieben werden:
u(Z
) +s
i
u
(Z
) c = 0 (3.30)
Die I Gleichungen (3.30) konnen nun aufsummiert werden uber alle I Bauern, was zu
der Schreibweise I u(Z
) +Z
(Z
) I c = 0 f uhrt, die durch I dividiert werden kann

und damit zu folgendem Ergebnis f uhrt
u(Z
) +
Z
I
u
(Z
) c = 0. (3.31)
Der zweite Term in der Gleichung bildet den Anreiz zur

Ubernutzung der Allmende
ab. Bei der Entscheidung, ob eine zusatzliche Ziege gekauft werden soll, stellt jeder Bauer
namlich nur einen kleinen Teil der zusatzlichen Abwertung des Weidelandes in Rechnung und
zwar proportional zur Anzahl seiner eigenen (und eben nicht aller) Ziegen. (Bei Symmetrie
betragt die Anzahl der Ziegen pro Bauer genau Z
/I.)
Man sieht den Punkt noch deutlicher, wenn ein wohlmeinender Diktator (oder eine
funktionierende Bauerngenossenschaft) das Problem der Nutzung der Allmende lost. Dessen
Zielfunktion
D
ist oensichtlich gegeben durch
D
= Z u(Z) Z c, (3.32)
wobei bereits hier auallen sollte, dass die Anzahl der Bauern keine Rolle spielt was
aus Sicht des wohlmeinenden Diktators ja auch plausibel ist. Genauso sollte es namlich f ur
die eziente Losung des Allmende-Problems auch sein, da eben die Zahl der Ziegen und
nicht die der Bauern f ur die Nutzenfunktion u() relevant ist.
Die Bedingung erster Ordnung f ur die Optimierung von (3.32) lautet
D
Z
= u(Z
D
) +Z
D
u
(Z
D
) c = 0, (3.33)
wobei Z
D
den Optimalwert des wohlmeinenden Diktators bezeichnet. (3.33) wird als auch
zentrale Losung bezeichnet, wahrend (3.31) die dezentrale Losung charakterisiert.
Auch ohne weitere Spezikation der Funktion u uber die Eigenschaften 3.27 hinaus, sollte
sofort klar sein, dass
Z
D
< Z
I > 1 (3.34)
Formal kann man das wie folgt sehen: Angenommen, es gelte Z
= Z
D
. Dann macht ein
Blick auf (3.31) und (3.33) sofort klar, dass dies nur f ur I = 1 erf ullt ist, f ur alle I > 1 also
nicht gelten kann. Weiterhin sei angenommen, dass Z
< Z
D
. Dann ware u(Z
) > u(Z
D
),
d.h. der erste Summand in (3.31) ist groer als in (3.33). Weiterhin ware dann Z
/I < Z
D
und u
(Z
D
) < u
(Z
) < 0, d.h. der negative zweite Summand ist betragsmaig kleiner in

(3.33) als in (3.31). Damit ware also u(Z
) +
Z
I
u
(Z
) > u(Z
D
) + Z
D
u
(Z
D
), was nicht
sein darf, da die linke und rechte Seite dieser Relation oensichtlich nicht verschieden sein
d urfen.
Die Intuition hinter dem Ergebnis der

Ubernutzung ist recht einfach: Jeder einzelne Bau-
er stellt bei der Entscheidung uber eine zusatzliche Ziege im Einklang mit individueller
Rationalitat nur die negativen Folgen f ur seine schon vorhandenen Ziegen in Rechnung
und nicht die gleichen Folgen f ur die anderen. Er internalisiert also nicht die gesamten Grenz-
kosten seiner Aktivitat. Der wohlmeinende Diktator ber ucksichtigt hingegen alle Kosten und
kommt somit zu einer kollektiv optimalen Nutzung.
Dies lasst sich auf eine etwas andere Weise sehen, wenn wir die Entscheidung uber eine
zusatzliche (marginale) Ziege bei einem Niveau von Z =

Z anschauen. Der zusatzliche Ertrag
dieser Ziege ist dann u
_
Z
_
, egal ob sie von einem einzelnen Bauern oder einem Diktator
angeschat wird. Die Kosten, die dabei in Rechnung gestellt werden, sind jedoch
c
Z
I
u
Z
_
. .
<0
. .
>0
(3.35)
im Kalk ul eines Bauern und
c

Zu
Z
_
. .
<0
. .
>0
(3.36)
im Kalk ul des Diktators. Oensichtlich sind also die tatsachlich in Rechnung gestellten
Grenzkosten bei dem Bauern geringer als beim Diktator, was zur

Ubernutzung f uhren muss.
Die Parallelitat dieser Situation zu vielen anderen Aktivitaten mit negativen Externalitaten
insb. im Bereich der Umweltverschmutzung sollte auf der Hand liegen.
Abbildung 3.12 auf der nachsten Seite fasst die alle Bestandteile der zentralen bzw.
dezentralen Losung zusammen und sollte keines weiteren Kommentars mehr bed urfen.
Abbildung 3.12: Das Allmende-Problem: Zentrale vs. dezentrale Losung.
3.7.4 Geldpolitik I: Die Nash-Losung des Barro-Gordon-Modells
Die bisherigen spieltheoretischen Anwendungen waren ausnahmslos dem Spektrum mikrooko-
nomischer Fragestellungen entnommen. Allerdings hat die Spieltheorie auch weithin Anwen-
dungen f ur genuin makrookonomische Probleme gefunden. Eines der vielleicht wichtigsten
Anwendungsgebiete war und ist dabei die Theorie der Geldpolitik. Hier wird mit spieltheo-
retischen Methoden untersucht, wie die strategische Interaktion zwischen der Geldpolitik
auf der einen Seite und dem privaten Sektor auf der anderen Seite von den Anreizen der
Akteure und insb. der Geldpolitik abhangt.
Ein sehr wichtiges Ergebnis, das zur uckgeht auf das Papier von Barro/Gordon (1983),
besagt, dass die Geldpolitik bei einer zusatzlichen Fixierung auf reale Ziele (also Beschafti-
gungsgrad, realer Output oder ahnlichem) zu einer unerw unscht hohen Ination neigt, ohne
letztlich an der Beschaftigungssituation irgendetwas zu andern. Daraus folgt auf der politi-
schen Ebene dann die W unschbarkeit einer von der Regierung unabhangigen Geldpolitik
wie wir sie mit der Europaischen Zentralbank auch tatsachlich haben.
1
In diesem Abschnitt wird nun ein sehr einfaches Grundmodell vorgestellt, das die Idee von
Barro/Gordon (1983) auf die denkbar einfachste Weise zusammenfasst. In spateren Kapiteln
1
Der wesentliche analytische Kern dass namlich ex ante optimale Politiken ex post nicht mehr op-
timal und damit zeitinkonsistent sein konnen wurde jedoch schon etwas zuvor in einem Aufsatz von
Kydland/Prescott (1977) erarbeitet. Es war nicht nur, aber vor allem dieser Aufsatz, der diesen beiden
Okonomen den Nobelpreis 2004 eintrug.

wird dieses Grundmodell verfeinert und modiziert werden, um zusatzliche Aspekte dieser
Interaktion (wiederholtes Spiel, Unsicherheit, . . . ) mit einzubeziehen.
Die Darstellung geht dabei davon aus, dass die Zentralbank auf Weisung der jeweiligen
Regierung agiert, d.h. keine eigenstandigen Ziele verfolgt.
Die Regierung (Zentralbank) setzt ihr geldpolitisches Instrumentarium so ein, dass ihre
Nutzenfunktion
u
G
=
2
(y y)
2
(3.37)
maximiert wird.
1
bezeichnet dabei die Inationsrate, y den Output und y den Zieloutput
der Regierung, der beispielsweise konsistent ist mit Vollbeschaftigung.
Abweichungen der Inationsrate von einem Zielwert von Null und Abweichungen von dem
Outputziel gehen jeweils negativ und mit steigendem Grenzleid in die Nutzenfunktion ein.
Der Parameter reektiert die Bedeutung des Inationsziels relativ zum Outputziel. Eine
Zentralbank, die sich ausschlielich der Inationsbekampfung widmet (ination nutter)
kann durch charakterisiert werden.
Es ist etwas bequemer und in der Literatur ublich anstelle der Nutzenfunktion (3.37)
die folgende Verlustfunktion zu postulieren:
L
G
= u
G
=
2
+ (y y)
2
(3.38)
Nat urlich sind die Maximierung von (3.37) und die Minimierung (3.38) vollig aquivalent.
Das Umfeld der Geldpolitik kann in der denkbar k urzesten Weise durch die Phillipskurve
beschrieben werden:
y = y
N
+ (
e
) (3.39)
e
ist die vom privaten Sektor erwartete Inationsrate. y
N
bezeichnet das nat urliche
Outputniveau. Aufgrund von Unvollkommenheiten auf Arbeits- und G utermarkten kann
das y
N
geringer sein als der mit Vollbeschaftigung kompatible Zieloutput der Regierung y.
Dieser Gedanke kann formalisiert werden durch die Beziehung
y = y
N
, (3.40)
wobei der Parameter > 1 als Ma f ur die genannten Marktunvollkommenheiten dienen
kann.
Der zweite Spieler in diesem Modell ist der private Sektor. Hier konnte nun eine ausf uhr-
liche Modellierung erfolgen, die z.B. Strukturaspekte von Lohnverhandlungen beinhaltet,
hier soll es jedoch gen ugen, dem privaten Sektor einfach zu unterstellen, dass er nicht syste-
matischen Erwartungsirrt umern unterliegen will, sondern seine Erwartungen in Kenntnis
der Zielfunktion (3.38) und dem Modell der

Okonomie (3.39) so bildet, dass sie auch
erf ullt werden. Dieses Verhalten lasst sich also einfach zusammenfassen als
=
e
, (3.41)
was der Hypothese Rationaler Erwartungsbildung entspricht.
Damit sind die Zielfunktionen der Akteure und das Modell beschrieben. Die beiden
Spieler sind die Regierung und der private Sektor, die Zielfunktion der Regierung ist (3.38),
die Zielfunktion der privaten Sektors ist in diesem Modell zwar nicht explizit gemacht,
dessen Verhalten aber in (3.41) zusammengefasst. Die Strategievariable der Regierung ist
die Inationsrate, diejenige des privaten Sektors ist die Inationserwartung. Damit liegt ein
Spiel vor, dessen Nash-Gleichgewicht nun bestimmt werden kann.
Der erste Schritt dazu besteht in der Ermittlung der Reaktionsfunktion (
e
, . . .) der
Geldpolitik.
1
Haug wird auch eine Verlustfunktion der Gestalt u
G
postuliert, die dann nat urlich zu minimieren ist.
Selbstverst andlich andert dies nichts am Ergebnis der Analyse.
Dazu muss die Zielfunktion (3.38) in eine Form gebracht werden, in der auer exogenen
Konstanten nur noch die beiden Strategievariablen und
e
enthalten sind. Dazu wird mit
Hilfe von (3.39) y aus (3.38) eliminiert. Weiterhin wird mit (3.40) y eliminiert. Dies f uhrt zu
L
G
=
2
+
_
(1 ) y
N
+ (
e
)
_
2
(3.42)
Minimierung dieser Funktion uber ergibt
L
G
= 2 + 2
_
(1 ) y
N
+ (
e
)
_
= 0, (3.43)
woraus sich sofort die Reaktionsfunktion der Regierung als
=

+
2
_
e
+ ( 1) y
N
_
(3.44)
errechnet.
Zu beachten ist, dass f ur > 1 die optimale Reaktion der Regierung auf Inationser-
wartungen in Hohe von Null die Setzung einer positiven Inationsrate ist. Diese Reaktions-
funktion ist in Abbildung 3.13 auf der nachsten Seite als durchgezogene Linie zu sehen.
Die Reaktionsfunktion des privaten Sektors ist aufgrund der extrem sparsamen Modellie-
rung einfach durch Gleichung (3.41) gegeben und in Abbildung 3.13 auf der nachsten Seite
als Winkelhalbierende zu sehen.
Das Nash-Gleichgewicht f ur die Inationsrate errechnet sich durch Einsetzen von (3.41)
in (3.44) und lautet
=
( 1)
y
N
. (3.45)
Das dazugehorige Outputniveau ergibt sich durch Einsetzen von (3.41) in die Phillipskurve
(3.39) als
y = y
N
. (3.46)
Damit liegt wieder ein Beispiel vor, in dem ein Nash-Gleichgewicht eine oenkundig inezi-
ente Losung darstellt, da f ur =
e
= 0 das gleiche Outputniveau d.h. y
N
erreicht werden
konnte und die gesellschaftliche Wohlfahrt gema (3.37) hoher ware. Der Losung (3.46) ist
zu entnehmen, dass f ur das in (3.40) zum Ausdruck kommende uberambitionierte Output-
ziel aufgrund von Marktunvollkommenheiten nur eine Zentralbank dieses eziente Ergebnis
erzielt, die sich ausschlielich dem Inationsziel verpichtet f uhlt, die also so handelt, als
ob . Dies erklart die weltweite Tendenz zu Zentralbankverfassungen, in denen genau
diese Zielvorgabe gemacht wird und ein Eingreifen der gewahlten Regierung nicht oder nur
sehr schwer moglich ist.
Abbildung 3.13 auf der nachsten Seite zeigt die Reaktionsfunktionen und das Nash-
Gleichgewicht dieses Spiels.
Abbildung 3.13: Das Barro-Gordon-Modell
Kapitel 4
Nichtkooperative Spiele II:
Dynamische Spiele mit
vollkommener Information und
wiederholte Spiele
4.1 Lernziele
In diesem Kapitel werden Spielsituationen analysiert, in denen die Spieler zeitlich bzw.
logisch nacheinander ihre Entscheidungen treen (dynamisches Spiel) und dabei genau die
Geschichte des Spiels kennen, d.h. bei jeder Entscheidung wissen, an welchem Knoten eines
Spielbaums sie sich benden (vollkommene Information). Die Struktur solcher Spiele kann
nur durch die extensive Form adaquat zum Ausdruck gebracht werden; in der Normalform
ist diese Information nicht mehr enthalten. Deshalb werden dynamische Spiele auch als
extensive form games bezeichnet. Das erste zentrale Anliegen dieses Kapitels besteht in
der Analyse und Anwendung dieser Klasse von Spielen.
Dazu wird in Abschnitt 4.2 auf der nachsten Seite das Losungskonzept der sog. R uckwart-
sinduktion eingef uhrt. Dabei handelt es sich um ein Losungskonzept, bei dem die rationalen
Spielz uge (zeitlich und/oder logisch) von hinten nach vorne identiziert werden. Durch diese
sequentielle Vorgehensweise wird ein Spiel letztlich in verschiedene Teilspiele zerlegt. Dieses
Konzept und die Anforderung an eine Losung f ur ein aus mehreren Teilspielen bestehendes
Spiel die Eigenschaft der Teilspielperfektheit sind Gegenstand des Abschnitts 4.3 auf
Seite 69.
Eine ganz andere Dimension der zeitlichen Gliederung von Spielen ist die Moglichkeit,
dass ein und dasselbe Spiel egal ob es dynamischer oder statischer Natur ist wiederholt
gespielt wird. Bei sehr vielen Interaktionen auf wirtschaftlichem Gebiet, aber auch auerhalb
dieses Bereichs, sind Wiederholungen von gleichen Situationen ein ganz wesentliches Merk-
mal. Daher widmet sich Abschnitt 4.4 auf Seite 72 der Theorie wiederholter Spiele. Es
wird sich dabei zeigen, dass es von groer Bedeutung f ur die Losung des wiederholten Spiels
ist, ob die Situation von vorneherein nur eine wohldenierte und endliche Zahl von Wieder-
holungen vorsieht, oder ob dies nicht der Fall ist und eine jedenfalls potentiell unendliche
Zahl von Wiederholungen stattnden kann.
Abschnitt 4.5 auf Seite 84 befasst sich dann mit einigen Anwendungen dynamischer
und wiederholter Spiele. Dabei geht es zunachst um die Dynamisierung des Cournot-
Duopolmodells aus Abschnitt 3.7.1 auf Seite 55; hier wird unterstellt, dass die beiden Spieler
ihre Mengen in einer bestimmten Reihenfolge, also zeitlich bzw. logisch nacheinander setzen.
65
66 KAPITEL 4. NICHTKOOPERATIVE SPIELE II
Die zweite Anwendung betrit zwei Modikationen des Barro-Gordon-Modells, dessen ein-
fachste, d.h. statische Version auch bereits im zweiten Abschnitt behandelt wurde. Zum einen
wird die Struktur des privaten Sektors etwas reicher modelliert und ebenfalls eine zeitliche
Struktur postuliert, was zu dramatischen

Anderungen des Ergebnisses relativ zur Model-
lierung des Abschnitts 3.7.4 auf Seite 60 f uhrt. Schlielich wird die Theorie wiederholter
Spiele auf die Barro-Gordon-Struktur angewandt.
4.2 R uckwartsinduktion
Life can only be understood backwards, but it must be lived forwards. (Soren
Kierkegaard, zitiert nach Rasmusen, 2001, p. 110)
Im einfachsten Fall eines dynamischen Spiels mit vollstandiger Information treen zwei
Spieler nacheinander ihre Entscheidungen. Nennen wir diese Spieler 1 und 2. Da keinerlei
Informationsdezite in diesem Spiel vorliegen, kann Spieler 1 das Verhalten von Spieler 2
perfekt antizipieren; da der payo f ur Spieler 1 von dem Verhalten des Spielers 2 abhangt,
wird er dies selbstverstandlich in Rechnung stellen. Diese

Uberlegung etabliert das Prinzip
bzw. das Losungskonzept der R uckwartsinduktion.
1
Dieses Losungskonzept identi-
ziert die Wahl einer gleichgewichtigen Strategienkombination dadurch, dass eine dynamische
Situation von hinten nach vorne durchdacht wird.
Zumindest in einer sehr ubersichtlichen Situation ist dieses Prinzip so einleuchtend, dass
auch ohne nahere Begr undung dessen Anwendung fast zwingend erscheint. So wurde im Pa-
radiesspiel bereits das Prinzip der R uckwartsinduktion angewandt, indem zuerst die (logisch
zweite) Entscheidung von Adam und Eva uber essen bzw. nicht essen analysiert wurde
und erst danach die (logisch erste) Entscheidung von Gott uber verbieten bzw. nicht ver-
bieten. Selbstverstandlich hat die Idee der R uckwartsinduktion in einem statischen Spiel
keinerlei Bedeutung, da hier die Struktur des Spiels keine Reihenfolge etabliert.
Die Darstellung der vollstandigen Struktur eines dynamischen Spiels erfolgt mit Hilfe
der bereits bekannten extensiven Form. Eine oft benutzte Alternative dazu ist die Zeitlinie
(oder Zeitpfad) eines Spiels. Diese veranschaulicht die logische Reihenfolge sowohl von
Spielz ugen als auch ggf. exogener Ereignisse, die in Spielen mit Unsicherheit v.a.
die Realisation ex ante unbekannter Schocks darstellen. Abbildung 4.1 auf der nachsten
Seite zeigt die Zeitlinien f ur das Paradiesspiel aus Kapitel 2 sowie f ur eine Modikation des
Oligopolspiels aus Abschnitt 3.7.1 auf Seite 55, in dem die beiden Anbieter nicht simultan,
sondern nacheinander ihre Mengen setzen. Diese Situation wird in den Anwendungen zu
diesem Kapitel naher erlautert werden. In Teil (b) der Abbildung 4.1 auf der nachsten
Seite wird auerdem noch ein stochastischer Nachfrageschock in das Spiel eingef uhrt (es
handelt sich also um ein in diesem Kapitel nicht untersuchtes Spiel unter Unsicherheit). Ein
solcher Schock verandert die Entscheidung der beiden Anbieter insoweit, als diese bei ihrer
Entscheidung nicht genau uber die Lage der Nachfragekurve Bescheid wissen.
Die Idee der R uckwartsinduktion lasst sich in dem oben eingef uhrten Rahmen mit zwei
Spielern, die nacheinander Entscheidungen treen und je eine stetig variierbare Strategieva-
riable haben, wie folgt beschreiben. Der zuletzt ziehende Spieler 2 lost das Problem
max
s
2
u
2
(s
2
|s
1
) . (4.1)
Die Schreibweise in (4.1) bringt zum Ausdruck, dass dies bereits f ur eine gegebene und
beobachtbare Auspragung der Strategievariable des Spielers 1 erfolgt. Generell, d.h. f ur eine
beliebige Auspragung von s
1
kann die Losung von (4.1) als Reaktionsfunktion geschrieben
werden:
1
In der dynamischen Optimierungsrechnung beschreibt das sog. Bellman-Prinzip ein analoges Vorgehen
von hinten nach vorne.
4.2. R
UCKW
ARTSINDUKTION 67
Gottentscheidet
v oder nv
A+Eentscheiden
e oder ne
Duopolist 1
setztMenge
Duopolist 2
setztMenge
(a)
(b)
Nachfrage-
schock
Preise,
Gewinne
Zeit
Zeit
Abbildung 4.1: R uckwartsinduktion
Zeitlinien sind gerade bei dynamischen Spielen mit stetig variierbaren Strategien eine n utz-
liche Alternative zur extensiven Form. (a) zeigt die Zeitlinie des Paradiesspiels, (b) ein
Stackelberg-Duopol-Spiel mit stochastischer Nachfrage.
u
2
(s
2
|s
1
)
s
2
= 0 s
2
= r
2
(s
1
) . (4.2)
Spieler 1 kennt sowohl das Problem seines Gegenspielers (4.1) als auch dessen Losung
(4.2); daher kann das Problem von Spieler 1 geschrieben werden als
max
s
1
u
1
(s
1
, s
2
) = max
s
1
u
1
(s
1
, r
2
(s
1
)) (4.3)
Die Losung dieses Problems ist gegeben durch
u
1
s
1
= 0 (4.4)
und wird mit s
1
bezeichnet. Das Strategienpaar (s
1
, s
2
) ist das Ergebnis der R uckwart-
sinduktion.
Folgende Bemerkungen zu dieser Losungsprozedur sind hilfreich:
Viele okonomische Situationen lassen sich in die zugegebenermaen abstrakt klin-
gende Schablone hintereinander folgender Entscheidungen von zwei oder mehr Ak-
teuren pressen. Darunter fallen die Stackelberg-Losung eines oligopolistisch struktu-
rierten Marktes, die Entscheidungen von Gewerkschaften und Firmen uber Lohne und
Beschaftigung und viele andere mehr.
(4.2) und (4.4) unterscheiden sich von der Nash-Losung des statischen Spiels (3.9) und
(3.10) dadurch, dass Spieler 1 bei seiner Losung die Reaktionsfunktion des Spielers 2
bereits in Rechnung stellt. Diese Modikation kann die Natur der Losung dramatisch
andern, d.h. das Nash-Gleichgewicht des dynamischen Spiels kann (muss aber
nicht) ein vollig anderes sein als bei simultanen Entscheidungen.
Wenn ein statisches Spiel mehrere Nash-Gleichgewichte aufweist, kann eine dynamische
Struktur bei der Selektion zwischen diesen Gleichgewichten helfen. R uckwart-
sinduktion kann also als eine feinere Methode zur Vorhersage der Losung des Spiels
verstanden werden. Durch die Einf uhrung der dynamischen Struktur konnen bestimm-
te Nash-Gleichgewichte des statischen Spiels uberleben, andere hingegen nicht.
Eine wichtige Eigenschaft der Losung durch R uckwartsinduktion ist die Tatsache,
dass diese keine unglaubw urdigen Drohungen erlaubt. Anders gesagt: Die ein-
zige glaubw urdige Reaktion des Spielers 2 ist gegeben durch seine Reaktionsfunktion
(4.2); nur diese ist konsistent damit, dass Spieler 2 Rationalverhalten an den Tag legt.
Glaubw urdigkeit ist in der Tat ein ganz zentrales Element in dynamischen Spielen.
Es ist wohl eine der wichtigsten Errungenschaften der Spieltheorie, f ur Fragen der
Glaubw urdigkeit einen stringenten Analyserahmen anbieten zu konnen.
F ur eine denkbar einfache Illustration der beiden letzten Punkt konnen wir wieder
Battle of the Sexes heranziehen. Die extensive Form dieses Spiels wurde bereits in Abbil-
dung 2.16 auf Seite 32 eingef uhrt, wobei dort zwei aquivalente Darstellungen f ur das statische
Spiel gegeben werden konnten. Die beiden Teile von Abbildung 4.2 geben nun eine zeitli-
che Struktur vor und lassen Peter bzw. Petra zuerst entscheiden, wobei der jeweils andere
die zuerst getroene Entscheidung kennt. Es leuchtet sofort ein, dass hier die jeweils fett
gedruckten Strategiekombinationen ein Gleichgewicht darstellen.
B
o
x
k
.
B
a
l
l
e
t
t
B
o
x
k
.
B
a
lle
tt
B
o
x
k
.
B
a
lle
tt
Peter Petra
B
o
x
k
.
B
a
l
l
e
t
t
B
o
x
k
.
B
a
lle
tt
B
o
x
k
.
B
a
lle
tt
Petra Peter
(2,1)
(0,0)
(0,0)
(1,2)
(2,1)
(0,0)
(0,0)
(1,2)
(a) (b)
Abbildung 4.2: R uckwartsinduktion bei battle of sexes
Durch die Annahme einer zeitlichen Struktur kann in Battle of the Sexes (jeweils) ein ein-
deutiges Ergebnis durch R uckwartsinduktion ermittelt werden.
Abbildung 4.2 eignet sich auch, um die Idee der Glaubw urdigkeit einer Ank undigung
zu verdeutlichen. Angenommen, die zeitliche Struktur sein durch Abbildung 4.2 (a) gege-
ben. Petra konnte bei dieser Sequenz versucht sein, damit zu drohen, unabhangig von
Peters Entscheidung ins Ballett zu gehen nat urlich in der Honung, dass deshalb auch
Peter sich in der ersten Stufe daf ur entscheidet. Sollte Peter die Drohung glauben? Die Ant-
wort lautet eindeutig nein, da sich Petra nach Peters Entscheidung f ur Boxkampf selbst
schaden w urde, wenn sie die Ank undigung in die Tat umsetzt. Petra Drohung ware also
unglaubw urdig und ist somit irrelevant.
Zum Schluss dieses Abschnitts wird noch eine weitere Illustration f ur das Losungskonzept
der R uckwartsinduktion eingef uhrt. Nennen wir dieses Spiel
Der Letzte wird der Erste sein
Zwei Personen sitzen vor einem Stapel mit 10 Karten und d urfen nacheinander abheben.
Die Regel ist, dass jeder Spieler entweder eine oder zwei Karten aufnehmen muss. Gewonnen
hat derjenige Spieler, der die letzte Karte nimmt. Spieler 1 hat das Recht, zuerst zu ziehen.
Auch hier kann die Losung vom Ende des Spiels her gedacht werden: Spieler 1 hat den
sicheren Sieg in der Tasche, wenn er es schat, dass Spieler 2 vor einem Stapel mit 3 Karten
sitzt dann kann dieser eine oder zwei Karten nehmen, was Spieler 1 dann den Sieg sichert.
Abbildung 4.3(a) zeigt die Logik des Arguments. Um diese Situation herzustellen, muss
Spieler 1 sicherstellen, dass Spieler 2 einmal vor einem Stapel mit 6 Karten sitzt die
Logik sollte nunmehr klar sein und ist in Teil (b) von Abbildung 4.3 zu sehen. Treibt man
dieses Spiel noch eine Stufe weiter, so ist klar, dass Spieler 1 versuchen sollte, Spieler 2 vor
einen Stapel mit 9 Karten zu setzen was er problemlos tun kann, indem er zuerst eine
Karte nimmt. Dies ist f ur Spieler 1 Teil einer dominanten Strategie. Danach besteht
4.3. TEILSPIELE UND TEILSPIELPERFEKTE GLEICHGEWICHTE 69
die dominante Strategie darin, immer 2 (1) Karte(n) zu nehmen, wenn Spieler 2 zuvor 1 (2)
Karte(n) genommen hat. Mit dieser Strategie kann Spieler 1 den Sieg sicherstellen.
1
2
2
1
Sp 2 Sp 1
Sieg
Niederlage
Sieg
3
K
a
r
t
e
n
Erg.fr Sp 1
1
2
1
2
1
2
Sp 2 Sp 1
5
4
6
K
a
r
t
e
n
4
3
3
2
Restkarten
(a) (b)
Abbildung 4.3: R uckwartsinduktion bei einem Kartenspiel
(a) Sitzt Spieler 2 vor drei Karten, kann Spieler 1 eine Sieg sicherstellen; (b) Sitzt Spieler 2
vor 6 Karten, kann Spieler 1 eine Situation mit 3 Karten erzwingen.
4.3 Teilspiele und teilspielperfekte Gleichgewichte
Der Schl ussel zur Identikation einer dominanten Strategie in dem gerade analysierten Spiel
ist die Abbildung 4.3(a). Hier werden verschiedene Konstellationen f ur die beiden letzten
Z uge des gesamten Spiels angeschaut, d.h. es handelt sich um ein Teilspiel (subgame). Diese
M oglichkeit der Zerlegung eines Spiels in mehrere Teilspiele steht im Zentrum einer wichti-
gen Verfeinerung der Idee von Nash-Gleichgewichten, wie sie in Abschnitt 2.7.3 auf
Seite 37 eingef uhrt wurde, namlich des Konzepts eines teilspielperfekten Gleichge-
wichts.
1
Um diese zu verstehen, muss zunachst ein Teilspiel deniert werden.
Denition: Ein Teilspiel ist ein Teil eines dynamischen Spiels mit den folgenden Ei-
genschaften: (a) das Teilspiel muss an einem Knoten beginnen, der f ur alle Spieler eine
vollstandige Informationsmenge ist; (b) das Teilspiel muss an Endknoten enden, die f ur alle
Spieler eine Auszahlung angeben.
Anforderung (a) legt fest, dass ein Teilspiel einen klar denierten Beginn haben muss, und
jeder Spieler mit Sicherheit wei, dass es auch in diesem Punkt beginnt. Petras Entscheidung
in Abbildung 4.2 auf der vorherigen Seite (a) ist also ein Teilspiel, da sie Peters Entscheidung
kennt; die gleiche Entscheidung ohne diese Kenntnis (wie in Abbildung 3.2 auf Seite 43
illustriert) ist hingegen kein Teilspiel. Anforderung (b) impliziert, dass Abbildung 4.3 (a) ein
Teilspiel ist, Abbildung 4.3 (b) jedoch nicht; allerdings konnte an die vier Knoten am rechten
Ende von Abbildung 4.3 (b) der Rest der Geschichte (die in zwei Knoten Abbildung 4.3 (a)
entspricht) angehangt werden, was dann wieder zu einem Teilspiel f uhren w urde. Man kann
sich anhand obiger Denition leicht verdeutlichen, dass jedes Spiel mit vollkommener
Information Teilspiele aufweisen muss. Auerdem gilt, dass ein statisches Spiel (in
dem die Spieler gleichzeitig ziehen) kein anderes Teilspiel aufweist als das Spiel
selbst.
Ein ber uhmt gewordenes Beispiel aus der Industrieokonomik, das so genannte chain
store paradoxon bzw. Marktzutrittsspiel, soll diese Idee illustrieren.
2
Es geht hierbei
um die Frage, ob der Inhaber einer marktbeherrschenden Stellung sich gegen die Etablierung
1
Vor allem f ur die Entwicklung dieser Idee erhielt Reinhard Selten im Jahr 1994 den Nobelpreis f ur
Okonomie. Formuliert wurde die Idee in Selten (1965) in einem deutschsprachigen Aufsatz. Durch das Papier
von Selten (1975) in englischer Sprache wurde die Idee allerdings erst international wirklich zur Kenntnis
genommen.
2
Was genau an diesem Spiel paradox ist, wird sich erst im Kontext eines wiederholten Spiels Ab-
schnitt 4.4.2 auf Seite 74 erschlieen.
von Konkurrenz zur Wehr setzen w urde und damit, ob man davon ausgehen sollte, dass es
uberhaupt zu Markteintritten kommt. Die Theorie dynamischer Spiele gibt hier zwar nicht
eine eindeutige Antwort, liefert aber das analytische Ger ust.
1
Folgende Geschichte liegt dem
Spiel zugrunde: Ein Warenhauskonzern beherrscht einen oder mehrere lokale Markte. Auf
einem solchen lokalen Markt kann sich nun ein potentieller Newcomer uberlegen, ob er den
Warenhauskonzern herausfordert und ebenfalls als Anbieter auf den Plan tritt. Entscheidet
er sich f ur einen Markteintritt, so kann der Warenhauskonzern diesen mit einer aggressiven
Strategie (z.B. durch einen Preiskampf `a la Bertrand-Duopol-Modell; vgl. Abschnitt 3.7.2
auf Seite 57 zu bekampfen versuchen oder aber die bisherige Monopolrente mit dem neuen
Konkurrenten teilen, ihn also dulden. Die moglichen Auszahlungen ergeben sich wie folgt:
Die Monopolrente betrage 100, die Marktzutrittskosten f ur den Newcomer 10 Geldeinhei-
ten, im Fall von Duldung wird angenommen, dass der Monopolgewinn gleich zwischen
den beiden Spielern geteilt werden kann, wobei der Newcomer daraus allerdings noch die
Marktzutrittskosten zu bestreiten hat.
Abbildung 4.4 zeigt die Normalform dieses Spiels.
Konzern
dulden bekmpfen
eintreten
Newcomer
nichteintreten
(40,50) (-10,0)
(0,100) (0,100)
Abbildung 4.4: Das chain store paradoxon
Die Normalform des Marktzutrittsspiels weist zwei Nash-Gleichgewichte auf.
Die ublichen

Uberlegungen zum Nashgleichgewicht in der Normalform (d.h. ohne die
Ber ucksichtigung der dynamischen Struktur) weisen hier sowohl {eintreten, dulden} als auch
{nicht eintreten, bekampfen} als Nash-Gleichgewichte im Sinne wechselseitig bester Ant-
worten aus. Allerdings leuchtet es ein, dass das zweite dieser Gleichgewichte nicht besonders
plausibel ist und dies gleich aus zwei Gr unden:
Der erste Grund ist fast trivial: Was sollte der Konzern bekampfen, wenn der Newco-
mer sich gegen den Markteintritt entscheidet? Im Grunde ist diese Situation gar nicht
deniert was in der Normalform dadurch zum Ausdruck kommt, dass die Auszah-
lungen in der unteren Zeile identisch sind.
Wichtiger ist der zweite Grund: Bekampfen ist f ur den Konzern unter keinen
Umstanden eine glaubw urdige Strategie. Denn wenn sich der Newcomer zum
Markteintritt entschlossen hat, schadet sich der Konzern nur selbst verhalt sich
also irrational. Wenn also sowohl Rationalverhalten als auch vollkommene Information
vorausgesetzt werden konnen, so ist die Drohung mit Bekampfen nicht glaubw urdig
und kann daher ignoriert werden.
Die extensive Form in Abbildung 4.5 auf der nachsten Seite bringt diesen Punkt besser
zum Ausdruck.
Die Entscheidung des Konzerns auf der zweiten Stufe abgegrenzt durch das Rechteck
ist ein Teilspiel, das eine klare Losung aufweist: Die Duldung des Newcomers ist die rationale
1
Diese Klasse von Spiele wurde ebenfalls von Reinhard Selten (1978) analysiert.
4.3. TEILSPIELE UND TEILSPIELPERFEKTE GLEICHGEWICHTE 71
e
i
n
t
r
e
t
e
n
n
i
c
h
t
e
i
n
t
r
e
t
e
n
New-
comer
d
u
l
d
e
n
b
e
k
m
p
f
e
n
Warenhaus-
konzern
(40,50)
(-10,0)
(0,100)
Abbildung 4.5: Die extensive Form des Marktzutrittspiels
In dieser Form lasst sich die Zerlegung in Teilspiele gut darstellen.
Wahl f ur den Konzern, ist also die Losung des in Abbildung 4.5 auf der nachsten Seite durch
das Rechteck abgegrenzten Teilspiels. Man spricht dabei von einem teilspielperfekten
(Nash-) Gleichgewicht (subgame equilibrium oder subgame perfect Nash equilibrium).
Diese Verfeinerung des Nash-Gleichgewichts-Konzepts soll nun allgemein deniert werden:
Denition: Eine Strategienkombination ist ein teilspielperfektes Gleichgewicht, wenn
diese (a) ein Nash-Gleichwicht f ur das gesamte dynamische Spiel ist und (b) ein Nash-
Gleichgewicht f ur jedes Teilspiel ist.
Daher ist die Kombination {nicht eintreten, bekampfen} zwar ein Nash-Gleichgewicht,
nicht aber ein teilspielperfektes Nash-Gleichgewicht, da nach dem ausbleibenden
Eintritt des Newcomers auf der zweiten Stufe des Spiels bekampfen nicht optimal ist.
Das Losungskonzept des teilspielperfekten Gleichgewichts f uhrt hier also zu einer hilfreichen
Reduktion der Zahl der plausiblen Gleichgewichte.
Dieses Ergebnis darf nat urlich nicht so interpretiert werden, dass es niemals zu einem
Preiskrieg kommen kann; mindestens drei Klassen von Situationen sind vorstellbar, in denen
dies doch passieren kann.
Die einfachste Moglichkeit ist die, dass einfach andere Auszahlungen vorliegen und
der Konzern eine einfachere Bekampfungsstrategie hat oder aber schlicht per se Nutzen
daraus zieht ( uber den Gewinn hinaus), einen Konkurrenten aus dem Feld geschlagen zu
haben. Abbildung 4.6 auf der nachsten Seite zeigt eine solche Situation sowohl in Normal-
form als auch in extensiver Form. Mit den dort angenommenen Auszahlungen ist {nicht
eintreten; bekampfen} das einzige Nash-Gleichgewicht. Es ist auch das einzige teilspielper-
fekte Nash-Gleichgewicht, weil alle moglichen Losungen des umrahmten Teilspiels f ur den
Newcomer schlechter waren als die genannte Losung.
1
In diesem Fall ist also die Andro-
hung einer Bekampfung des Newcomers durch den Konzern glaubw urdig, weil
Bekampfung dem wohlverstandenen Interesse des Konzerns und damit Rationalverhalten
entspricht. Daraus kann die Lehre gezogen werden, dass es f ur einen potentiellen Newco-
mer von groter Wichtigkeit ist, welche Gewinneinbuen er einem im Markt bendlichen
Unternehmen zuf ugen kann und uber welche Bekampfungsstrategien dieses verf ugt.
Die zweite Moglichkeit, Bekampfung von Markteintritt zu erklaren beruht darauf, dass
die Situation in des Marktzutrittsspiels nicht als one-shot game verstanden wird, sondern
potentiell wiederholt gespielt wird. Es leuchtet intuitiv ein, dass in diesem Fall ein im
Markt bereits agierender Akteur ein Interesse haben kann, Kampfbereitschaft zu signalisie-
ren und dieses auch falls notwendig unter Beweis zu stellen. Es konnte also zum Aufbau
von Reputation kommen. Diese Dinge werden im nachsten Abschnitt, der sich mit der
1
Nur zur

Ubung des Jargons: {eintreten, bekampfen} ist ein Nash-Gleichgewicht des eingerahmten Teil-
spiels. Es ist aber kein teilspielperfektes Gleichgewicht, weil es kein Nash-Gleichgewicht des gesamten Spiels
ist.
e
i
n
t
r
e
t
e
n
n
i
c
h
t
e
i
n
t
r
e
t
e
n
New-
comer
d
u
l
d
e
n
b
e
k
m
p
f
e
n
Warenhaus-
konzern
(40,50)
(-10,60)
(0,100)
Konzern
dulden bekmpfen
eintreten
Newcomer
nichteintreten
(40,50) (-10,60)
(0,100) (0,100)
Abbildung 4.6: Das Marktzutrittspiels und die Glaubw urdigkeit einer Drohung
Hier ist nicht eintreten, bekampfen das einzige Nash-Gleichgewicht; dieses weist auch die
Eigenschaft der Teilspielperfektheit auf.
Theorie wiederholter Spiele befasst, naher behandelt.
Die dritte Moglichkeit besteht schlielich darin, dass sich die Akteure uber Auszah-
lungen und/oder Verhalten des Gegenspielers nicht vollig sicher sind. Im Kontext
des Marktzutrittsspiels bedeutet dies, dass der Newcomer eine von Null verschiedene Wahr-
scheinlichkeit wahrnimmt, dass der Konzern quasi aus Versehen doch die (f ur ihn nach wie
vor unvorteilhafte) Strategie bekampfen wahlt. In diesem Umfeld sind andere Gleichge-
wichte als das hier beschriebene vorstellbar. Aufgrund der Unsicherheit bei der Entscheidung
spricht man von trembling hand equilibria.
1
Damit sind wir in einer Situation mit un-
vollkommener Information, wie sie im nachsten Kapitel analysiert wird.
4.4 Wiederholte Spiele
4.4.1 Begriiches
Das Marktzutrittsspiel ist nur ein (fast) beliebig herausgegrienes Beispiel f ur die Moglich-
keit, dass ein Spiel wiederholt gespielt werden kann. In der Tat werden die meisten Spiele
wiederholt gespielt: Ein potentieller Newcomer kann einen Markteintritt immer wieder in
Erwagung ziehen, Oligopolisten konnen mehr oder weniger haug neue Mengen oder Preise
1
Die Metapher der zitternden Hand bringt gut die Idee zum Ausdruck, dass die Entscheidung in einem
vollig deterministischen Rahmen zwar klar und eindeutig ist, man aber trotz dieser Klarheit nie vollig sicher
sein kann, dass Akteure von der optimalen Strategie abweichen.
4.4. WIEDERHOLTE SPIELE 73
setzen, Lohne konnen nach dem Ende der Laufzeit eines Tarifvertrags neu ausgehandelt wer-
den. Daher ist es nahe liegend, sich mit der Theorie wiederholter Spiele zu befassen.
Dabei soll zunachst auf einen taxonomischen Punkt eingegangen werden, da dieser Punkt
bisweilen auch in der Lehrbuchliteratur etwas untergeht: Sowohl statische als auch dy-
namische Spiele konnen als wiederholte Spiele gespielt werden. Abbildung 4.7 zeigt
in Teil (a) eine Zeitlinie f ur ein wiederholtes statisches Cournot-Oligopolspiel, wahrend (b)
ein wiederholtes dynamisches Stackelberg-Oligopolspiel zeigt. Ein anderes Beispiel f ur ein
wiederholtes statisches Spiel ist das wiederholte Gefangenen-Dilemma.
Beide Duopolisten
entscheidenber
jeweiligeMenge
Duopolist 1
setztMenge
Duopolist 2
setztMenge
(a)
(b)
Zeit
Zeit
Duopolist 1
setztMenge
Duopolist 2
setztMenge
1.Runde 2.Runde
Beide Duopolisten
entscheidenber
jeweiligeMenge
1.Runde 2.Runde
Abbildung 4.7: Wiederholte Spiele
Die Beispiele zeigen (a) ein wiederholtes statisches Spiel und (b) ein wiederholtes dynami-
sches Spiel.
Auf der Zeitachse ist dar uber hinaus angedeutet, dass die Spiele keineswegs nur zwei
Mal gespielt werden m ussen. In diesem Zusammenhang ist es von besonderer Bedeutung die
Unterscheidung zwischen endlich oft oder unendlich oft wiederholten Spielen.
Die folgenden Unterabschnitte befassen sich jeweils mit diesen Kategorien.
Zu klaren ist in einem wiederholten Spiel der Begri der Strategie. Jeder Spieler kann
ja nun bei jeder Wiederholung moglicherweise eine andere Wahl treen und wird diese Wahl
im Allgemeinen auch auf die Ergebnisse zuvor gespielter Runden konditionieren wollen. An-
genommen, ein one-shot game ndet statt zwischen 2 Spielern (1 und 2), die in jeder Stufe
jeweils zwei reine Strategien (A und B) haben. Diese Situation ist in Abbildung 4.8 zu sehen.
Bei zwei gespielten Runden ergeben sich bereits 16 verschiedene denkbare Strategiekombi-
nationen in reinen Strategien.
Allgemein ergeben sich bei I Spielern, deren Strategiemengen S
i
= {S
1
, S
2
, . . . , S
N
}
jeweils N Elemente aufweisen N
I
mogliche Ergebnisse im one-shot game und dementspre-
chend
_
N
I
_
W
Moglichkeiten nach W Wiederholungen dieses one-shot game. Im Beispiel der
Abbildung 4.8 auf der nachsten Seite ist I = N = W = 2 und somit
_
N
I
_
W
= 16
Eine Strategie S
i
f ur einen Spieler i in einem wiederholten Spiel speziziert
nun f ur jede Stufe eine Entscheidung, wobei ab Runde 2 die Entscheidungen konditional auf
alle denkbaren Geschichten des Spiels vor der jeweiligen Stufe sind. In dem Spiel aus
Abbildung 4.8 auf der nachsten Seite (2x2x2-Spiel) soll die Anzahl der moglichen Strategien
f ur einen Spieler verdeutlicht werden: In Stufe 1 gibt es 2 Moglichkeiten f ur Spieler 1 (wahle
A oder B). In Stufe 2 gibt es 4 denkbare Geschichten des Spiels und somit (2
2
)
2
= 16
verschiedene Moglichkeiten der Entscheidung f ur A oder B.
1
Multipliziert man nun noch
1
Hierf ur wird das folgende Ergebnis aus der Kombinatorik gebraucht: Wenn aus N Objekten (das sind
hier die reinen Strategien) Gruppen mit K Elementen gebildet werden und beliebige Wiederholungen und
Permutationen der Elemente moglich sind, so gibt es N
K
Moglichkeiten.
Spieler2
S
p
i
e
l
e
r
1
A ab
Bcd
A B
Runde2
Runde1
S
p
i
e
l
e
r
1
A **
B**
A B
S
p
i
e
l
e
r
1
A **
B**
A B
S
p
i
e
l
e
r
1
A **
B**
A B
S
p
i
e
l
e
r
1
A **
B**
A B
Abbildung 4.8: 2 Spieler, 2 Strategien, 2 Wiederholungen
Ein uber zwei Runden wiederholtes Spiel mit zwei Spielern, die Strategiemengen mit je zwei
reinen Strategien haben, weist 16 denkbare Ergebnisse in reinen Strategien auf.
diese 16 Moglichkeiten mit den beiden Moglichkeiten des anderen Spielers in Stufe 1, so
ergeben sich 32 denkbare Strategien.
Allgemein gibt es f ur einen Spieler in Stufe 1 N Wahlmoglichkeiten. Da in Stufe 2 das
Spiel N
I
Vorgeschichten haben kann, gibt es auf dieser Stufe (N)
N
I
Wahlmoglichkeiten,
insg. also N
_
(N)
N
I
_
Strategien. In einem nur einmal wiederholten Spiel mit drei Spie-
lern mit je drei reinen Strategien gibt es somit f ur jeden Spieler 59049 Strategien! Diese
sind allerdings teilweise beobachtungsaquivalent, wie die folgenden

Uberlegungen zum
2x2x2-Spiel zeigen. F ur diesen Fall sind in Abbildung 4.9 auf der nachsten Seite alle denk-
baren 32 Strategien f ur Spieler 1 aufgelistet.
Fett gedruckt sind Optionen, die in der zweiten Stufe wirklich zur Verf ugung stehen, da
beispielsweise bei Strategie 1 die ja voraussetzt, dass in Runde 1 Spieler 1 die Option A
wahlte die beiden letzten Konditionierungen (B,A) und (B,B) nicht zutreen. Daraus folgt
auch, dass beispielsweise die Strategien 1, 9, 10 und 11 beobachtungsaquivalent sind.
Einige der Strategien in Abbildung 4.9 auf der nachsten Seite haben besondere Eigen-
schaften und entsprechende Bezeichnungen:
Die Strategien 1 und 18 sind unkonditionale Strategien, da hier auf beiden Stufen
A (bzw. B) gespielt wird, wobei auf der zweiten Stufe die Geschichte des Spiels keinerlei
Rolle spielt.
Strategien 2 und 17 sind Rotationsstrategien, da in der zweiten Runde ebenfalls in
allen denkbaren Konstellationen die jeweils andere Wahl erfolgt.
Strategie 13 ist eine Triggerstrategie; hier spielt Spieler 1 A in der ersten Runde
und behalt dies dann und nur dann bei, wenn auch Spieler 2 in der ersten Runde die
gleiche Wahl getroen hat. Strategie 29 ist die Triggerstrategie f ur B.
4.4.2 Endlich wiederholte Spiele I: Eindeutige Nash-Gleichgewichte
auf den einzelnen Stufen
In diesem Abschnitt wird gezeigt, dass die Analyse endlich oft wiederholter Spiele
keine besondere Herausforderung darstellt, wenn auf den einzelnen Stufen des
Strategie Zug des
Spielers 1 in
der 1. Runde
Zug des Spielers 1 in der 2. Runde konditional auf
die vier mglichen Ergebnisse in der 1. Runde
(A, A) (A, B) (B, A) (B, B)
1 A A A A A
2 A B B B B
3 A A B B B
4 A B A B B
5 A B B A B
6 A B B B A
7 A B A A A
8 A A B A A
9 A A A B A
10 A A A A B
11 A A A B B
12 A B B A A
13 A A B A B
14 A B A B A
15 A A B B A
16 A B A A B
17 B A A A A
18 B B B B B
19 B A B B B
20 B B A B B
21 B B B A B
22 B B B B A
23 B B A A A
24 B A B A A
25 B A A B A
26 B A A A B
27 B A A B B
28 B B B A A
29 B A B A B
30 B B A B A
31 B A B B A
32 B B A A B
Abbildung 4.9: Strategien in einem 2x2x2 Spiel
Spiels ein eindeutiges Nash-Gleichgewicht vorliegt. In diesem Fall ergibt sich als Er-
gebnis einfach das eindeutige (bei dynamischen Spielen: teilspielperfekte) Nash-Gleichgewicht
auf jeder Stufe des Spiels.
Trotz der scheinbaren Banalitat des Ergebnisses ist dies keineswegs trivial. Wenn bei-
spielsweise das chain store paradox aus den Abbildungen 4.4 auf Seite 70 bzw. 4.5 auf
Seite 71 nicht auf einem Markt, sondern (zeitlich gestaelt) auf einer beliebigen Zahl von n
M arkten gespielt wird, konnte man sich intuitiv durchaus vorstellen, dass der Konzern den
Newcomer mit groerer Vehemenz bekampft als wenn dies auf nur einem Markt passiert. Die
Logik scheint klar zu sein: Wenn der Konzern auf dem ersten Markt kampft, hatte er eine
Reputation f ur die anderen n 1 Markte aufgebaut, die sehr n utzlich ware. Diese Intuition
ist aber falsch, wie gleich gezeigt wird.
Abbildung 4.10 auf der nachsten Seite zeigt diese Situation:
Die Struktur kann nun wie bei der Analyse eines dynamischen one-shot games mit
Hilfe der Methode der R uckwartsinduktion analysiert werden. Beginnen wir also in
Runde (oder Periode) n: Unabhangig von der Vorgeschichte und damit von der
eventuell aufgebauten Reputation f ur die entschlossene Bekampfung von Marktzutritt durch
den Konzern ist das Ergebnis in der letzten Periode vollig eindeutig. Da es nach dieser
Newcomer:
e.oder n.e.
Konzern:
d.oderb.
Zeit
1.Runde
Newcomer:
e.oder n.e.
Konzern:
d.oderb.
n-te Runde
Abbildung 4.10: Das wiederholte Marktzutrittsspiel.
Runde keine weiteren Wiederholungen mehr gibt, liegt hier ein one-shot game vor, dessen
eindeutiges Gleichgewicht dann wie beschrieben bei {eintreten, dulden} ist. Da das Spiel
in Runde der letzten, d.h. n-ten Runde ein Teilspiel ist, nennt man dieses Ergebnis auch
teilspielperfektes Gleichgewicht.
Runde (oder Periode) n 1: Der Konzern wei, dass ihm egal welche Reputation
f ur die Folgeperiode n nichts mehr nutzen wird, da sie dort ohnehin vollig unglaubw urdig
ist. Also bestehen in Runde n 1 keine Anreize mehr, diese Reputation aufzubauen. Das
Ergebnis ist somit wieder das Gleichgewicht des one-shot game {eintreten, dulden}. Da auch
die beiden Spiele in Runde n 1 und n zusammen ein Teilspiel sind, nennt man die Losung
f ur beide Runden wieder ein teilspielperfektes Gleichgewicht.
Alle weitere Perioden: Da nun festgestellt wurde, dass in Periode n, und deshalb auch
in Periode n1 das Gleichgewicht eines one-shot games resultiert, besteht nat urlich auch in
Periode n 2 keine Veranlassung f ur den Konzern eine notwendigerweise unglaubw urdige
Reputation f ur die Bekampfung eines Marktzutritts aufzubauen. Dieses Argument kann
nun immer weiter nach vorne gedacht werden bis zur ersten Runde des endlich wiederholten
Spiels.
Dieses Ergebnis verdient es, allgemein festgehalten zu werden in dem folgenden
Theorem: Das eindeutige teilspielperfekte Gleichgewicht eines n Mal wiederholten (dy-
namischen) one-shot games, das ein eindeutiges (teilspielperfektes) Nash-Gleichgewicht auf-
weist, ist die n-fache Wiederholung des (teilspielperfekten) Nash-Gleichgewichts des one-shot
games. (Der Beweis dieses Theorems wurde durch die obigen

Uberlegungen erbracht.)
Die Formulierung dieses Theorems stellt nicht ausschlielich auf dynamische one-shot
games ab, wie das im Beispiel des Markteintrittsspiels der Fall ist, sondern gilt auch f ur
statische one-shot games wie beispielsweise das Gefangenendilemma.
1
Daher bezieht sich
das Attribut teilspielperfekt im Kontext eines dynamischen one-shot games auf zwei un-
terschiedliche Dinge, deren Unterscheidung zu der etwas sperrigen Formulierung des obigen
Theorems f uhrt: Zum einen auf die Losung des one-shot games und zum anderen auf
die Abfolge dieser Losungen durch die Wiederholungen des Spiels.
Mit diesem Ergebnis kann nun auch das Paradoxe am chain store paradoxon klar
identiziert werden: Obgleich die Intuition zumindest bei haugen Wiederholungen des
Marktzutrittsspiels nahe legt, dass eine Reputation f ur die Bekampfung von Newcomern
aufgebaut wird oder dass die Neigung, Reputation aufzubauen, zumindest von der Anzahl
der Wiederholungen abhangt , ist dies im Kontext eines endlich oft wiederholten Spiels
nicht begr undbar. Vielmehr gibt es in diesem Rahmen (paradoxerweise) keine glaubw urdige
Moglichkeit f ur den bereits im Markt agierenden Anbieter, eine entsprechende Reputation
aufzubauen.
Zu beachten ist, dass dieses Ergebnis unabhangig von jeder Art der Diskontierung ist.
Der Grund daf ur ist sehr einfach: Auch wenn eine Auszahlung in Runde n aus heutiger Sicht
1
In dem Spiel aus Abschnitt 3.3 auf Seite 46 (vgl. Abbildung 3.3 auf Seite 46) werden Max und Moritz in
der letzten Periode gestehen, da eine Reputation spater nichts mehr wert ist. Per R uckwartsinduktion folgt
daraus wieder, dass {gestehen, gestehen} in jeder Stufe des endlich wiederholten Spiels gewahlt wird, dies
also das einzige teilspielperfekte Nash-Gleichgewicht darstellt. Mit anderen Worten: Eine endliche Zahl von
Wiederholungen ist nicht in der Lage, die beiden Delinquenten aus dem Gefangenendilemma zu befreien.
mit einem Diskontfaktor (1 +)
n
( ist dabei die Zeitpraferenzrate) zu bewerten ist, so
andert dies nichts an der Reihenfolge der Auszahlungen in jeder Runde.
4.4.3 Endlich wiederholte Spiele II: Multiple Nash-Gleichgewichte
auf den einzelnen Stufen
Das gerade behandelte Theorem in Abschnitt 4.4.2 auf Seite 74 setzt voraus, dass das one-
shot game ein eindeutiges Nash-Gleichgewicht aufweist was beim Marktzutrittsspiel der
Fall ist. Allerdings gibt es viele Situationen, in denen dies nicht der Fall ist. Zur Illustra-
tion kann wieder Battle of the Sexes herangezogen werden allerdings in der statischen
Version, da nur hier zwei Nash-Gleichgewichte in reinen Strategien vorhanden sind. Auer-
dem gibt es ein Nash-Gleichgewicht in gemischten Strategien. Die Auszahlungsmatrix aus
Abbildung 2.15 auf Seite 31 ist in Abbildung 4.11 noch einmal zu sehen.
Petra
Boxkampf Ballett
Boxkampf
Peter
Ballett
(2,1) (0,0)
(0,0) (1,2)
Abbildung 4.11: Ergebnismatrix in Battle of the sexes
Wenn p
1
bzw. p
2
die Wahrscheinlichkeiten bezeichnen, mit denen Peter bzw. Petra zum
Boxkampf gehen, so ergeben sich die erwarteten Auszahlungen u f ur Peter und Petra wie
folgt:
E
_
u
Peter
_
= p
1
[p
2
2 + (1 p
2
) 0] + (1 p
1
) [p
2
0 + (1 p
2
) 1]
= 3p
1
p
2
p
1
p
2
+ 1
(4.5)
E
_
u
Petra
_
= p
2
[p
2
1 + (1 p
2
) 0] + (1 p
2
) [p
1
0 + (1 p
2
) 2]
= 3p
1
p
2
2 (p
1
+p
2
) + 2
(4.6)
Peters Reaktionsfunktion p
1
(p
2
) lasst sich ableiten, wenn man sich vor Augen halt, wie
eine marginale Variation von p
1
auf seinen Erwartungsnutzen wirkt:
E
_
u
Peter
_
p
1
= 3p
2
1
_
_
_
> 0 f ur p
2
> 1/3 setze p
1
= 1
= 0 f ur p
2
= 1/3 p
1
(0, 1)
< 0 f ur p
2
< 1/3 setze p
1
= 0
(4.7)
Analog ergibt sich f ur Petra
E
_
u
Petra
_
p
2
= 3p
1
2
_
_
_
> 0 f ur p
1
> 2/3 setze p
2
= 1
= 0 f ur p
1
= 2/3 p
2
(0, 1)
< 0 f ur p
1
< 2/3 setze p
2
= 0
(4.8)
Abbildung 4.12 auf der nachsten Seite zeigt die Reaktionsfunktionen 4.7 und 4.8 in einem
Quadranten.
Wird dieses Spiel zwei Mal gespielt, sind mehrere teilspielperfekte Strategiekombinatio-
nen denkbar. Zunachst wird die Kombination der folgenden
Abbildung 4.12: Battle of the sexes: Nash-Gleichgewichte in reinen und gemischen Strategien
Rotationsstrategien
betrachtet. Peter und Petra: Gehe zum Boxkampf in Spiel 1 und ins Ballett in Spiel 2,
egal was in Spiel 1 herauskam. Wenn beide dieser Strategie folgen, ist die erwartete
durchschnittliche Auszahlung f ur beide (2 + 1)/2 = 3/2.
1
Die beiden Strategienkombi-
nationen sind ein teilspielperfektes Nash-Gleichgewicht, weil in beiden Teilspielen ein Nash-
Gleichgewicht erzielt wurde. Selbstverstandlich trit dies auch zu f ur die umgekehrte Ro-
tationsstrategie, dass beide zunachst in das Ballett gehen und in Spiel 2 zum Boxkampf.
Ebenfalls eine Abfolge von Nash-Gleichgewichten.
Unkonditionalen Strategien
Peter und Petra: Gehe sowohl in Spiel 1 als auch in Spiel 2 zum Boxkampf sowie Peter und
Petra: Gehe sowohl in Spiel 1 als auch in Spiel 2 zum Ballett. Die erwarteten Auszahlungen
sind hier (2, 1) bzw. (1, 2). Ferner konnen Peter und Petra in beiden Spielen die
Gemischten Strategien
spielen, namlich Peter: Gehe in beiden Spielen mit der Wahrscheinlichkeit 2/3 zum Box-
kampf und mit der Wahrscheinlichkeit 1/3 zum Ballett. Petra: Gehe in beiden Spielen
mit der Wahrscheinlichkeit 1/3 zum Boxkampf und mit der Wahrscheinlichkeit 2/3 zum
Ballett. Die erwarteten Auszahlungen sind hier f ur beide 2/3.
Die Beispiele machen das Prinzip deutlich: In einem endlich wiederholten Spiel mit
multiplen one-shot Nash-Gleichgewichten sind alle denkbaren Abfolgen dieser Gleichgewichte
ein teilspielperfektes Nash-Gleichgewicht.
Die drei one-shot Gleichgewichte seien wie folgt bezeichnet: {Boxkampf, Boxkampf} = ,
{Ballett, Ballett} = und {Mix, Mix} = . Dann gibt es in zwei Runden 3
2
= 9 teilspiel-
perfekte Nash-Gleichgewichte, die in Abbildung 4.1 auf der nachsten Seite aufgelistet sind.
In der untersten Zeile sind die erwarteten durchschnittlichen Auszahlungen dieser Kombina-
tionen f ur Petra und Peter enthalten. Allgemein gibt es in einem W mal wiederholten Spiel
mit G one-shot Gleichgewichten G
W
teilspielperfekte Gleichgewichtspfade dieser Art.
Die Vektoren der durchschnittlichen Auszahlungen sind in Abbildung 4.13 auf der nachsten
Seite dargestellt. Die Flache der moglichen Punkte, die sich durch verschiedene Linearkom-
binationen der Ergebnisvektoren f ur zwei Spielrunden ergeben, ist blau eingefarbt und zeigt
die mogliche Losungsmenge f ur eine beliebig hohe Zahl von Wiederholungen.
1
Die Verwendung durchschnittlicher Auszahlungen (anstelle von Auszahlungssummen) ist f ur das Argu-
ment in keiner Weise zwingend, erleichtert aber den unmittelbaren Vergleich der Strategien in der Darstellung
des one-shot game.
1 2 3 4 5 6 7 8 9
Spiel
1

Spiel
2

Ergebnis
Peter 2 1 2/3 3/2 4/3 3/2 5/6 4/3 5/6
Petra 1 2 2/3 3/2 5/6 3/2 4/3 5/6 4/3
Tabelle 4.1: Battle of the sexes: Teilspielperfekte Nash-Gleichgewichte uber zwei Runden
Abbildung 4.13: Ergebnisvektoren f ur teilspielperfekte Nash-Gleichgewichte in Battle of the
Sexes.
Damit konnen wir das folgende Ergebnis festhalten:
Folk Theorem f ur endlich wiederholte 2-Personen Spiele: Angenommen, ein one-
shot game habe einen gleichgewichtigen Auszahlungsvektor, der einen Vektor mit minimalen
Auszahlungen m f ur alle Spieler dominiert. Dann sind im Limit f ur sehr hauge Wie-
derholungen alle individuell rationalen und moglichen Auszahlungen als durchschnittliche
Auszahlungen eines teilspielperfekten Gleichgewichts moglich.
Dieses Ergebnis heit Folk-Theorem, weil es (zusammen mit einem analogen Ergebnis
f ur unendlich oft wiederholte Spiele) unter Spieltheoretikern (also den game theory folks)
lange bekannt war, bevor es bewiesen wurde. Ein rigoroser Beweis und auch eine Erweiterung
auf Spiele mit mehr als zwei Personen nden sich in Benoit/Krishna (1985).
Gerade war die Rede von teilspielperfekten Gleichgewichtspfaden dieser Art von Gleich-
gewichten. Dies impliziert nat urlich, dass es noch eine andere Art von Gleichgewichten geben
kann. In der Tat kann man zeigen, dass in einem wiederholten Spiel mit multiplen one-shot
Gleichgewichten eine in einem one-shot game nicht gleichgewichtige Strategienkombination
Teil einer teilspielperfekten Abfolge von Strategiekombinationen werden kann wobei die
Betonung hier auf kann liegt. Zur Illustration sei das 2-Personen-Spiel mit drei reinen
Strategien in Abbildung 4.14 auf der nachsten Seite betrachtet.
1
1
Dieses Beispiel ist entnommen aus Gibbons (1992), S. 85.
Abbildung 4.14: Normalform eines Gefangenendilemmas mit zusatzlichem Nash-
Gleichgewicht.
Eine kurze Pr ufung des Optimalverhaltens beider Spieler macht klar, dass es in diesem
Spiel zwei Nash-Gleichgewichte in reinen Strategien gibt, namlich {A
1
, A
2
} und {C
1
, C
2
}.
Man beachte, dass das Spiel ohne die Strategien C ein Gefangenendilemma abbildet, dessen
eziente Losung (4, 4) in einem endlich oft wiederholten Spiel kein teilspielperfektes Nash-
Gleichgewicht sein kann. Wenn das Spiel jedoch zwei Mal gespielt wird, so ist die folgende
Trigger-Strategie
ein teilspielperfektes Nash-Gleichgewicht: Spieler 1 und Spieler 2: Spiele Strategie C
i
, i = 1, 2
in Runde 2, wenn in Runde 1 {B
1
, B
2
} gespielt wurde und A
i
in allen anderen Fallen.
Wenn beide Spieler von dieser Strategie ausgehen, ist (4, 4) in Runde 1 rationalisier-
bar und damit teilspielperfekt, auch wenn es kein Nash-Gleichgewicht des zugrunde liegen-
den one-shot game ist. Der Unterschied zum einfachen Gefangenendilemma besteht darin,
dass ein weiteres Nash-Gleichgewicht zur Verf ugung steht, und es daher eine glaubw urdi-
ge Alternative zum inezienten Nash-Gleichgewicht {A
1
, A
2
} gibt. Deshalb ist auch die
genannte Trigger-Strategie als ganzes glaubw urdig, wahrend in einem reinen Gefangenen-
dilemma die (bedingte) Ank undigung einer Abweichung vom einzigen Nash-Gleichgewicht
nicht glaubw urdig ist.
Nat urlich lassen sich auch andere teilspielperfekte Gleichgewichte nden, so dass die
Theorie nur auf eine Moglichkeit, nicht aber auf eine eindeutige Losung des Spiels hinweist.
Zusammenfassend lasst sich festhalten, dass bei endlich wiederholten Spielen mit mehr
als einem Nash-Gleichgewicht des one-shot game das Losungskonzept des teilspielper-
fekten Nash-Gleichgewichts nicht sehr trennscharf ist, sondern schon in relativ ein-
fachen Situationen eine Vielzahl von Gleichgewichten zulasst. Da es kein enger gefasstes
und dennoch plausibles Losungskonzept gibt, kann die Spieltheorie in aller Regel also den
Moglichkeitenraum f ur gleichgewichtige Losungen nur einschranken, reicht aber nicht aus,
um eine konkrete Antwort geben zu konnen. Immerhin ist es ja auch ein keineswegs triviales
Ergebnis, dass es unterschiedliche rationalisierbare und teilspielperfekte Strategiekombina-
tionen geben kann.
4.4.4 Unendlich oft wiederholte Spiele
Intuitiv leuchtet es wenig ein, dass es einen Unterschied machen soll, ob eine Situation
endlich, aber beliebig oft wiederholt wird, oder ob man von einer unendlichen Zahl von
Wiederholungen ausgeht. Auf der theoretischen Ebene ist dieser Unterschied jedoch von
groer Bedeutung. Die Intuition f ur die Relevanz dieses Unterschieds besteht darin, dass
bei unendlicher Wiederholung die Logik der R uckwartsinduktion, wie sie f ur
die Ermittlung des teilspielperfekten Nash-Gleichgewichts benutzt wurde, nicht
mehr angewendet werden kann. Es gibt einfach keine letzte Runde, f ur die sich ein
Reputationsaufbau nicht mehr lohnt und daher unglaubw urdig ist.
F ur die Darstellung der Theorie unendlich wiederholter Spiele wird zunachst das Konzept
der Diskontierung zuk unftiger Ertrage und einer durchschnittlichen Auszahlung in
einem unendlich wiederholten Spiel eingef uhrt. Danach wird das Folk-Theorem f ur
unendlich wiederholte Spiele genannt und schlielich mit Hilfe des unendlich wiederholten
Gefangenendilemmas illustriert.
Diskontierung, ungewisses Spielende und durchschnittliche Auszahlungen
Der f ur unendlich wiederholte Spiele entscheidende Zusammenbruch der R uckwartsindukti-
on macht bereits deutlich, dass diese Situation durchaus realistisch sein kann. Denn vielfach
kann man zwar nicht davon ausgehen, dass sich eine Situation buchstablich unendlich oft
wiederholt. Es gen ugt f ur den Zusammenbruch der Logik der R uckwartsinduktion jedoch,
wenn unbekannt ist, welches die letzte Runde sein wird, das Spiel also zu jedem Ent-
scheidungszeitpunkt noch weiter gehen konnte. Insofern d urfte diese Situation oft
eine sehr viel n utzlichere Approximation an die Realitat sein als ein sehr haug, aber end-
lich wiederholtes Spiel.
1
Dieser Punkt kann etwas praziser gefasst werden: Ein moglicherweise unendlich wie-
derholtes, dennoch faktisch endliches Spiel, kann so verstanden werden, dass jede
gegebene Wiederholung mit einer exogenen Wahrscheinlichkeit p die letzte war ein ent-
sprechender Zufallsgenerator verk undet nach jeder Runde die Entscheidung. In der nachsten
Periode t +1 wird daher die dann zu erwartende Auszahlung u
t+1
nur mit der Wahrschein-
lichkeit 1p realisiert. Abgezinst auf die aktuelle Periode t mit der Zeitpraferenzrate , ist der
erwartete Gegenwartswert dieser Auszahlung daher (1 p) u
t+1
mit 1/(1 +) < 1.
F ur ein potentiell unendlich oft wiederholtes Spiel kann der Gegenwartswert der Auszahlun-
gen ab Periode t daher geschrieben werden als
u
t
+ (1 p) u
t+1
+ (1 p)
2
2
u
t+2
+... =
i=0
(1 p)
i
i
u
t+i
(4.9)
bzw. f ur (1 p) =
1p
1+
u
t
+ (1 p) u
t+1
+ (1 p)
2
2
u
t+2
+... =
i=0
i
u
t+i
(4.10)
Damit ist gezeigt, dass ein unsicherer Endzeitpunkt einfach durch eine starkere Dis-
kontierung der zuk unftigen Auszahlungen abgebildet werden kann. Diese Situation ist also
konzeptionell naher an einem unendlich wiederholten Spiel als an einem endlich oft wieder-
holten Spiel.
Die Berechnung der unendlichen Summe in 4.9 kann in konkreten Anwendungen durchaus
aufw andig sein. Ein einfacher Spezialfall liegt aber vor, wenn die zuk unftigen Auszahlungen
gleich bleiben, d.h. f ur u
t
= u t. In diesem Fall ist der Gegenwartswert des unendlichen
Auszahlungsstroms gegeben durch
u
i=0
i
= u
_
1 + +
2
+...
_
=
u
1
(4.11)
Die letzte Schreibweise in 4.11 verwendet die Summenformel f ur eine unendliche geome-
trische Reihe.
1
Ariel Rubinstein weist darauf hin, dass die Modellierungsentscheidung zwischen endlich und unendlich
oft wiederholtem Spiel nicht so sehr die tatsachliche Situation reektieren sollte als vielmehr die Wahrneh-
mung der Spieler. Selbst bei einer ex ante auf nur 20 Wiederholungen begrenzten Spielsituation ist es in
Experimenten oft beobachtbar, dass Probanden zu Beginn die letzten Perioden kaum wirklich ber ucksichti-
gen sich also so verhalten, als ob eine unendlich oft wiederholte Spielsituation vorl age. Vgl. hierzu (und
zur Interpretation die abgedruckte Diskussion zwischen den beiden Autoren) in Osborne/Rubinstein (1994),
p. 134-136.
Um eine Vergleichbarkeit des Auszahlungsstroms eines unendlich wiederholten Spiels mit
den zugrunde liegenden one-shot games herzustellen, ist es sinnvoll, eine durchschnittliche
Auszahlung zu denieren. Mit Hilfe der beiden letzten Gleichungen ist dies sehr einfach
moglich. Da der Gegenwartswert einer im zeitvariablen Auszahlungsreihe gegeben ist durch
i=0
i
u
t+i
und derjenige einer konstanten Auszahlung in Hohe von u durch u/(1 ), muss
gelten, dass
u = (1 )
i=0
i
u
t+i
. (4.12)
Das Folk-Theorem f ur unendlich wiederholte Spiele
Nach diesen Vorbemerkungen kann nun die f ur unendlich wiederholte Spiele geltende Version
des Folk-Theorems aufgeschrieben werden.
Wenn der Diskontfaktor inlanglich nahe bei Eins und die Wahrscheinlichkeit p, dass
das Spiel in der nachsten Periode endet, hinlanglich nahe bei Null liegen, dann gilt:
a) Jede Kombination Nash-gleichgewichtiger Auszahlungsvektoren des zugrunde liegen-
den one-shot games kann in einem unendlich wiederholten Spiel als durchschnittliche
Auszahlung eines teilspielperfekten Nash-Gleichgewichts resultieren.
b) Dar uber hinaus konnen durch das Spielen von Triggerstrategien alle moglichen Aus-
zahlungsvektoren als durchschnittliche Auszahlungen eines teilspielperfekten Gleichge-
wichts resultieren, die den minimalen Auszahlungsvektor m ubersteigen. Insbesondere
konnen eziente Auszahlungsvektoren teilspielperfekte Nash-Gleichgewichte sein.
Anstelle eines allgemeinen Beweises wird gleich ein Beispiel die Logik des Folk-Theorems
verdeutlichen. Gegen uber dem Folk-Theorem f ur endlich wiederholte Spiele ist vor allem
zu beachten, dass durch die Tatsache der unendlichen Wiederholung f ur eine Vielzahl von
moglichen teilspielperfekten Losungen nicht mehr eine Multiplizitat von Gleichgewichten
im zugrunde liegenden one-shot game notwendig ist. Damit wird die Vorhersagekraft des
Losungskonzepts des teilspielperfekten Gleichgewichts noch geringer als im Fall endlich oft
wiederholter Spiele. Wahrend dort wenigstens im Fall eindeutiger Nash-Gleichgewichte im
one-shot game noch ein eindeutiges teilspielperfektes Gleichgewicht resultierte, ist dies bei
unendlich wiederholten Spielen nicht mehr der Fall.
Gleichgewichte beim unendlich wiederholten Gefangenendilemma
Eine einfache und sehr n utzliche Illustration f ur das Folk-Theorem ist die Analyse des unend-
lich wiederholten Gefangenendilemmas. Da hier die negativen Auszahlungen des Beispiels
in Abbildung 3.3 auf Seite 46 didaktisch eher hinderlich sind, wird nachfolgend die folgende
(aus Abbildung 4.14 auf Seite 80 ubernommene) Auszahlungsmatrix zugrunde gelegt.
Abbildung 4.15: Auszahlungsmatrix eines Gefangenendilemmas
Selbstverstandlich ist die unendliche Abfolge des (inezienten) Nash-Gleichgewichts {A
1
, A
2
}
ein teilspielperfektes Gleichgewicht, und somit auch im Rahmen eines unendlich wiederhol-
ten Spiels eine moglich Losung.
Allerdings kann auch die eziente, aber nicht Nash-gleichgewichtige Strategienkombi-
nation {B
1
, B
2
} ein teilspielperfektes Gleichgewicht sein, wie im Folgenden gezeigt wird.
Angenommen, beide Spieler verhalten sich gema der
Trigger-Strategie (grim strategy): Spiele B
i
in der ersten Runde. Spiele B
i
in allen
spateren Runden, wenn der (die) andere(n) Spieler B
i
in allen vorangegangenen Runden
spielte(n). Andernfalls spiele A
i
in allen folgenden Runden.
Diese Strategie nennt man grim strategy, da hier eine grausame bzw. unbeugsame
Bestrafung des (der) anderen Spieler erfolgt, wenn diese(r) einmal nicht die eziente koope-
rative Strategie spielte(n). Man kann sich nun vor Augen f uhren, unter welchen Umstanden,
die grim strategy die eziente Strategienkombination unterst utzt.
Wenn die Strategie funktionieren w urde, so ware die Auszahlung in jeder Periode bei
4, was dann nat urlich die durchschnittliche Auszahlung des unendlich wiederholten Spiels
ware. Wenn uberhaupt ein Abweichen sinnvoll ist, dann gleich zu Beginn des Spiels. Der
Grund daf ur ist einfach: Mehr als ein Mal kann ein Spieler den hoheren payo (5 anstelle
von 4) unter der grim strategy ohnehin nicht realisieren, und dieser hat gleich zu Beginn den
hochsten Gegenwartswert. Die Auszahlungsreihe betragt dann zunachst 5, danach 1 f ur alle
weiteren Runden. Unter Beachtung von (4.12) ist der Gegenwartswert der durchschnittlichen
Auszahlung in diesem Fall gegeben durch
(1 )
_
5 + 1 +
2
1 +
3
1 +...
= (1 )
_
4 + 1 + +
2
+
3
+...
= (1 )
_
4 +
1
1
_
= 4 4 + 1
= 5 4
(4.13)
Dieser Durchschnittswert der Auszahlungsreihe bei non-kooperativem Verhal-
ten ist weniger wert als die durchschnittliche Auszahlung bei kooperativem Verhal-
ten, wenn
4 > 5 4 >
1
4
. (4.14)
Wenn diese Bedingung erf ullt ist, so ist die kooperative Strategienkombination ein teilspiel-
perfektes Nash-Gleichgewicht. (4.14) konkretisiert f ur das vorliegende Beispiel die bei der
Formulierung des Folk-Theorems gestellte Anforderung bzgl. der Diskontrate, die hinlang-
lich nahe bei Eins liegen muss. Nat urlich ist f ur eine gegebene Zeitpraferenzrate und Wahr-
scheinlichkeit der Beendigung des Spiels Kooperation umso eher ein Gleichgewicht, je hoher
der Kooperationsgewinn der konkreten Situation ist und je niedriger der einmalige Gewinn
bei Abweichung vom kooperativen Gleichgewicht ist.
Die skizzierte grim strategy ist eine zwar mogliche Verhaltensweise, nicht aber notwen-
digerweise sehr plausibel, da die Bestrafung auf ewig nach einer schlechten Erfahrung
keinerlei Moglichkeit oen lasst, zur kooperativen Losung zur uckzukehren und die ware ja
auch f ur den einmal Betrogenen prinzipiell w unschenswert.
Eine mildere Form ware die folgende
Trigger-Strategie (tit for tat
1
): Spiele B
i
in der ersten Runde. Spiele B
i
in allen
spateren Runden, wenn der (die) andere(n) Spieler B
i
in der vorangegangenen Runde
spielte(n). Andernfalls spiele A
i
.
Es leuchtet sofort ein, dass in diesem Fall ebenfalls Kooperation ein teilspielperfektes
Gleichgewicht sein kann. Dar uber hinaus ist tit for tat unter der Bedingung 4.14 beobach-
tungsaquivalent mit der grim strategy.
1
Die sinngemae deutsche

Ubersetzung davon ist Wie Du mir, so ich Dir.
4.5 Anwendungen
4.5.1 Oligopol III: Die Stackelberg-Losung
In diesem Abschnitt wird noch einmal das homogene Duopolmodell aus Abschnitt 3.7.1 auf
Seite 55 aufgegrien. Wahrend dort ein statisches Spiel zwischen den beiden Duopolisten
modelliert wurde, wird nun jedoch eine sequentielle Struktur angenommen und damit
ein dynamisches Spiel betrachtet. Die beiden Duopolisten spielen jeweils nur eine Runde,
so dass es sich um ein dynamisches one-shot game handelt. Das unterstellte Timing ist
in Abbildung 4.16 zu sehen.
Abbildung 4.16: Timing im Stackelberg-Duopol.
Diese zeitliche Struktur impliziert eine gegen uber dem statischen Spiel deutlich ande-
re Losung, die in der Literatur (zu Ehren des

Okonomen Heinrich von Stackelberg) als
Stackelberg-Losung eines homogenen Duopols bezeichnet wird.
Duopolist 1 ist in Abbildung 4.16 in der Position eines Stackelberg-F uhrers, Duopolist in
der eines Stackelberg-Folgers. Letzterer nimmt die von Duopolist 1 gesetzte Menge als exo-
genes Datum hin und optimiert unter dieser Restriktion. Der Stackelberg-F uhrer antizipiert
diese Verhaltensweise des Stackelberg-Folgers.
Der Einfachheit halber werden wie bereits in Abschnitt 3.7.1 auf Seite 55 die linea-
re Nachfragefunktion 3.18 sowie identische und konstante Grenzkosten angenommen. Die
Losung erfolgt nun entlang des Zeitstrahls in Abbildung 4.16 per R uckwartsinduktion.
Die Gewinnfunktion des Duopolisten 2 ist durch Gleichung (3.20) gegeben, die hier der
besseren

Ubersichtlichkeit wegen noch einmal aufgeschrieben werden soll:
2
= [a b (x
1
+x
2
)] x
2
cx
2
(4.15)
Diese Funktion wird uber x
2
optimiert, wobei die Menge des Konkurrenten als Datum
betrachtet wird. Dies f uhrt zu der bereits als Gleichung (3.22) abgeleiteten Reaktionsfunktion
x
2
=
a c
2b

1
2
x
1
. (4.16)
Diese Verhaltensweise des Stackelberg-Folgers wird nun durch den Stackelberg-F uhrer in
Rechnung gestellt. Seine Gewinnfunktion ist dementsprechend gegeben durch
1
= [a b (x
1
+x
2
)] x
1
cx
1
. (4.17)
Einsetzen von (4.16) in (4.17) f uhrt zu
1
=
a c
2
x
1
b
2
x
2
1
(4.18)
In dieser Schreibweise hangt der Gewinn des Stackelberg-F uhrers nur noch von dessen
Handlungsvariable x
1
sowie exogenen Parametern ab, wobei jedoch die Verhaltensweise des
Konkurrenten ber ucksichtigt ist.
Optimierung von (4.18) f uhrt zu
1
x
1
= 0 x
1
=
a c
2b
(4.19)
4.5. ANWENDUNGEN 85
x
1
x
2
x
1
+x
2
p
1

2

1
+
2

Tabelle 4.2: Der qualitative Einuss der dynamischen Struktur im Stackelberg-Duopol
Anbieter 1 ist Stackelberg-F uhrer, Anbieter ist Stackelberg-Folger. Die Pfeile geben die
Veranderung der Groe relativ zur Cournot-Losung an.
Ein Vergleich mit der Cournot-Losung (3.23) zeigt, dass der Stackelberg-F uhrer eine
groere Menge herstellt als in einer statischen Spielsituation. Setzt man das Ergebnis (4.19)
in die Reaktionsfunktion (4.16) des Stackelberg-Folgers ein, so ergibt sich dessen optimale
Menge als
x
2
=
a c
4b
, (4.20)
was weniger ist als die Menge in einem Cournot-Duopol. Das ist auch genau der Grund f ur
die Verhaltensweise des Stackelberg-Folgers: Da dieser wei, dass der Stackelberg-Folger eine
negativ geneigte Reaktionsfunktion hat, kann er seine Menge gegen uber der Cournot-Losung
erhohen. Die Mengen sind also strategische Substitute in diesem Modell.
Die Addition der Marktmengen liefert
x
= x
1
+x
2
=
3 (a c)
4b
, (4.21)
was mehr ist als die Marktmenge in der Cournot-Losung (3.24). Entlang einer negativ ge-
neigten Nachfragefunktion muss der Preis niedriger sein.
Daraus lasst sich auch sofort etwas zum Einuss der dynamischen Spielstruktur auf die
Gewinne der beiden Konkurrenten sagen: Insgesamt sinkt die Gewinnsumme, da schon in
der Cournot-Losung eine hohere als die Monopolmenge produziert wird, man sich also auf
dem fallenden Ast der Gewinnfunktion bewegt und sich entlang dieses Astes durch eine
weitere Ausweitung der Menge weiter nach unten bewegt. Allerdings ist die Inzidenz auf
die Gewinne sehr unterschiedlich: Der Stackelberg-F uhrer gewinnt gegen uber der Cournot-
L osung, da er ja diese auch durchsetzen konnte der Stackelberg-Folger wird ja immer einen
Punkt auf seiner Reaktionsfunktion wahlen , dieses aber nicht tut. Damit ist klar, dass sein
Gewinn steigen muss. Nimmt man die Resultate f ur den Gewinn des Stackelberg-F uhrers
und f ur die Gewinnsumme zusammen, so folgt, dass der Gewinn f ur den Stackelberg-Folger
eindeutig sinken muss.
Tabelle 4.2 fasst die qualitativen Ergebnisse zusammen.
4.5.2 Geldpolitik II: Stackelberg-F uhrerschaft der Lohnsetzer im
Barro-Gordon-Modell
In diesem und dem nachsten Abschnitt werfen wir einen genaueren Blick auf das Barro-
Gordon-Modell zur Analyse der Geldpolitik, das wir in seiner Grundstruktur bereits in
Abschnitt 3.7.4 auf Seite 60 kennen gelernt hatten.
Zunachst geht es um die Konsequenzen einer dynamischen Struktur des Spiels
zwischen privatem Sektor und geldpolitischen Akteuren und insbesondere um
die Implikationen und die W unschbarkeit einer mehr oder weniger an der Bekampfung von
Ination ausgerichteten Geldpolitik.
1
1
Alle

Uberlegungen hier beziehen sich nur auf Gleichgewichtsphanomene, d.h. nicht auf die Frage, inwie-
fern die Geldpolitik konjunkturelle Schwankungen ausgleichen kann oder sollte. Dieser Aspekt der in der
geldpolitischen Literatur sehr prominent ist w urde sich zwar mehr oder weniger problemlos ber ucksichtigen
lassen, andert aber nichts Wesentliches an der hier zu analysierenden Interaktion.
In Abschnitt 3.7.4 auf Seite 60 war der private Sektor dabei sehr rudimentar dadurch
abgebildet, dass dieser systematisch falsche Inationserwartungen vermeiden wollte. Hier
wird nun dem privaten Sektor etwas mehr Struktur gegeben.
1
Konkret wird unterstellt,
dass neben der Geldpolitik die Lohnpolitik der zweite zentrale Spieler auf der
makrookonomischen Ebene ist. Diese setzt den Nominallohn. Der logarithmierte Wert des
Nominallohns wird im Folgenden mit w bezeichnet.
Das makrookonomische Ergebnis hangt dann sowohl vom Verhalten der Geldpolitik,
die die Inationsrate weiterhin direkt bestimmen kann, als auch von der Lohnpolitik ab.
Weiterhin wird angenommen, dass die Lohnsetzer zeitlich bzw. logisch vor der Geldpolitik
ihre Entscheidung xieren konnen und damit in der Position eines Stackelberg-F uhrers
sind. Entsprechend agiert die Geldpolitik als Stackelberg-Folger. Abbildung 4.17 zeigt diese
zeitliche Abfolge.
Abbildung 4.17: Timing im Stackelberg-Modell des Spiels zwischen Lohn- und Geldpolitik.
Auf der dritten Stufe in Abbildung 4.17 ist keine eigentliche Entscheidung zu treen;
hier werden vielmehr die Konsequenzen der vorangegangenen Entscheidungen der Akteure
f ur die interessierenden Variablen berechnet und angegeben. Im vorliegenden Fall ist dies
einfach die Hohe der Arbeitslosenquote u, die als proportional zum (Logarithmus des) Re-
allohn(s) w p angenommen wird:
2
u = w p (4.22)
Okonomisch steckt dahinter letztlich eine fallende Arbeitsnachfragekurve; dass die Ela-
stizitat hier auf den Wert 1 normiert wird, ist f ur die folgende Argumentation unwichtig,
d.h. erleichtert nur die Notation des Modells.
Die Nutzenfunktionen der Akteure sind wie folgt beschrieben. Die Geldpolitik minimiert
die Verlustfunktion
L
G
= u
2
+p
2
mit 0. (4.23)
Diese Nutzenfunktion ist vollig isomorph zu (3.37); es wurde lediglich als Ma f ur den
Auslastungsgrad der Volkswirtschaft anstelle der Abweichung von Output und Zieloutput
die Arbeitslosenquote verwendet und deren Zielwert auf Null normiert. ist ein Ma f ur
das relative Gewicht von Inationsziel bzw. realem Ziel. = 0 bildet die Situation einer
Zentralbank ab, die sich uberhaupt nicht um Ination k ummert, sondern sich ausschlielich
dem Outputziel verpichtet sieht.
Die Lohnsetzer weisen eine ahnliche Nutzen- bzw. Verlustfunktion auf, namlich
L
W
= u
2
+p
2
2(w p) mit , 0. (4.24)
Auch diese Gruppe ist an einer niedrigen Arbeitslosenquote interessiert. F ur > 0 lasst
sich auch eine Inationsaversion der Lohnsetzer einfangen, der Parameter bildet dar uber
1
Die Modellierung st utzt sich auf Jerger (2002a) und Jerger (2002b).
2
In einem one-shot game, wie es hier vorliegt, konnen wir p sowohl f ur den Log des Preisniveaus als
auch f ur die Inationsrate verwenden. Dies folgt aus der Tatsache, dass
t
= p
t
p
t1
. Bei Normierung des
(exogenen) Preisniveaus der Vorperiode auf P
t1
= 1 p
t1
= 0 folgt daraus, dass
t
= p
t
. P bezeichnet
dabei das nicht logarithmierte Preisniveau. Die Zeitindizierung fallt in der Darstellung im Text weg, da diese
in einem one-shot-Kontext nicht von Bedeutung ist.
4.5. ANWENDUNGEN 87
hinaus ein Reallohnziel ab; da die Lohnsetzer plausiblerweise an einem hohen Reallohn
interessiert sind, geht dieser negativ in die Verlustfunktion ein.
Wieder wird die Methode der R uckwartsinduktion angewandt, d.h. zunachst wird das
Kalk ul der Zentralbank betrachtet.
Einsetzen von (4.22) in (4.23) liefert die Schreibweise
L
G
= (w p)
2
+p
2
, (4.25)
deren Minimierung uber p das folgende Resultat liefert:
L
G
p
= 2 (w p) + 2p = 0 p =
w
1 +
(4.26)
Diese Gleichung kann als geldpolitische Reaktionsfunktion aufgefasst werden. Ei-
ne ausschlielich auf das reale Ziel xierte Geldpolitik ( = 0) wird einfach p = w setzen
und damit gema (4.22) immer u = 0, d.h. Vollbeschaftigung erreichen konnen. Hingegen
wird ein ination nutter ( ) uberhaupt nicht auf ein hoheres Niveau der Nomi-
nallohne reagieren, damit das Inationsziel (p = 0) in jedem Fall erreicht wird.
1
Algebraisch
ausgedr uckt:
lim
p
w
= 0. (4.27)
Der nachste Schritt besteht nun in der Ermittlung des optimalen Verhaltens der Lohn-
setzer. Hierzu ist das Verhalten der Geldpolitik (4.26) sowie die die Bestimmungsgleichung
f ur u (4.22) in die Verlustfunktion der Lohnsetzer (4.24) einzusetzen. Dies f uhrt zu
L
W
=
_
w
1 +
_
2
+
_
w
1 +
_
2
2
w
1 +
.
2
(4.28)
Minimierung dieser Verlustfunktion uber w liefert
L
W
w
= 2
_
w
1 +
_

1 +
+2
_
w
1 +
_
1
1 +
2

1 +
= 0 w =
(1 +)
+
2
(4.29)
Gleichung (4.29) gibt den Nominallohn in Kategorien der Praferenzparameter der Ak-
teure an, ist also keine Reaktionsfunktion, sondern bereits die Schlussgleichung f ur die-
se Variable. Einsetzen von (4.29) in die geldpolitische Reaktionsfunktion (4.26) liefert die
L osung des Modells f ur die Inationsrate
p =

+
2
. (4.30)
Die Losung f ur die Arbeitslosenquote ergibt sich als
u =

2
+
2
(4.31)
Halten wir zunachst die folgenden Ergebnisse fest:
Je hoher das Gewicht des Reallohns in der Verlustfunktion der Lohnsetzer ist, desto
hoher sind sowohl Ination als auch Arbeitslosenquote im Stackelberg-Gleichgewicht
des Modells:
p
4.30
=

+
2
> 0 und
u
4.30
=

2
+
2
> 0
1
Nicht reagieren bezieht sich hier auf die angenommene Handlungsvariable p. Wird nicht p, sondern ein
Zins oder Geldmengenaggregat als Handlungsparameter aufgefasst, so liegt es auf der Hand, dass durchaus
eine Reaktion erfolgt und sogar eine denkbar extreme: Jeder inationare Druck, der von noch so hohen
Nominallohnabschl ussen kommt wird durch eine Politik des leaning against the wind in ihren Inations-
wirkungen bekampft.
2
Dabei wird die aus 4.26 folgende Tatsache benutzt, dass w p =
w
1+
.
Weisen auch die Lohnsetzer ein gewisses Ma an Inationsaversion auf ( > 0), so
wirkt dies sowohl auf die Inationsrate als auch auf die Arbeitslosenquote senkend.
Anders gesagt: Agieren die Lohnsetzer ohne R ucksicht auf die Inationsrate, so f uhrt
dies zu einem gesamtwirtschaftlich eindeutig schlechteren Gleichgewicht.
1
Die zwei zentralen Implikationen des Modells sind jedoch die Folgenden: Zum einen ist
die gleichgewichtige Arbeitslosenquote umso groer, je konservativer die Zentralbank ist:
u
4.31
=
_
1
+
2
_
2
_
2
_
2
+
_
2
2
_
= 2
_
1
+
2
_
2
> 0 (4.32)
Dies ist insofern ein sehr wichtiges Resultat, als eine systematisch weniger inationsaverse
Geldpolitik in diesem Modell tatsachlich zu einer Reduktion der Arbeitslosenquote f uhrt. In
diesem Sinn liegt eine jenseits des konjunkturellen Horizonts relevante Nichtneutralitat der
Geldpolitik vor, die in dem Modell des Abschnitts 3.7.4 auf Seite 60 nicht enthalten war.
Es wird gleich gezeigt werden, dass dieser qualitative Unterschied auf das Zusammenwirken
zweier wesentlicher Modikationen beruht, der dynamischen (Stackelberg-) Struktur des
Spiels einerseits und der Eigenschaft der Inationsaversion von Lohnsetzern andererseits.
Die Bedeutung der Inationsaversion der Lohnsetzer kann unmittelbar aus 4.32 abgelesen
werden. Es gilt namlich, dass
u
4.31 =0
= 0. (4.33)
Zum anderen kann man zeigen, dass die Inationsrate eine im Allgemeinen nicht-monotone
Funktion der Zentralbankkonservativitat ist es also einen Bereich gibt, in dem eine starkere
Inationsaversion der geldpolitischen Akteure zu weniger bzw. zu mehr Ination im Gleich-
gewicht f uhrt. Dieser Punkt soll zunachst formal gezeigt werden. Aus (4.30) lasst sich sofort
ableiten, dass
p
4.30
=
_
1
+
2
_
2
_

2
_
_
_
_
> 0 f ur
2
<
= 0 f ur
2
=
< 0 f ur
2
>
(4.34)
In Prosa: Ausgehend von einer sehr populistischen Zentralbank (kleines ) wird durch
die Etablierung einer starker am Inationsziel interessierten Geldpolitik die gleichgewichtige
Inationsrate paradoxerweise erhoht!
Insbesondere gilt, dass sowohl eine ultrapopulistische Zentralbank ( = 0) als auch eine
ultrakonservative Zentralbank ( ) f ur eine Inationsrate von Null sorgen:
lim
0
p = lim
p = lim
2
= 0. (4.35)
Bei der Berechnung des Limes f ur in (4.35) wurde die Regel von De LHopital
verwendet.
Abbildung 4.18 auf der nachsten Seite zeigt die qualitativen Eigenschaften der Losung
mit Hilfe einer numerischen Simulation. Entlang der horizontalen Achse wird der Grad der
Zentralbankkonservativitat variiert, wobei die Variation von zwischen Null und Unendlich
durch die Denition der Hilfsvariabeln = 1/(1 + ) auf den Bereich zwischen Null und 1
abgebildet wird.
Man sieht, dass das makrookonomisch beste Resultat (p = u = 0) durch eine ultrapo-
pulistische Zentralbank herbeigef uhrt wird. Die Intuition hinter diesem Ergebnis lautet wie
1
Das ist stringent zu zeigen, wenn die gesellschaftliche Verlustfunktion L
G
durch Einsetzen der Mo-
dellosung (4.30) und (4.31) als Funktion aller Praferenzparameter berechnet wird. Tut man dies, so ergibt
sich, dass
L
G
< 0, d.h. der gesellschaftliche Verlust ist um so geringer, je hoher die Sensibilitat der Lohn-
setzer f ur die Inationsrate ist.
4.5. ANWENDUNGEN 89
p
u
? ? ?
0 ? ?
ZunehmendeKonservativitt
derGeldpolitik
Abbildung 4.18: Die qualitativen Eigenschaften eines Stackelberg-Gleichgewichts bei inati-
onsaversen Lohnsetzern.
folgt: Wenn die Geldpolitik sich ausschlielich auf das reale Ziel konzentriert, kann sie dies
aufgrund ihrer Position als Stackelberg-Folger immer tun: Was immer an Nominallohnen
in der ersten Stufe gesetzt wurde, muss nur und kann auch durch eine entsprechende
Ination real unschadlich gemacht werden. Da die Lohnsetzer dieses Verhalten nat urlich
antizipieren ist ihnen im Grunde klar, dass sie keinerlei Einuss auf alle realen Variablen
haben, konkret: auf Arbeitslosenquote und Reallohn. F ur = 0 gilt diese Machtlosigkeit
bzgl. der realen Variablen unabhangig von der Intensitat des Reallohnziels . Wenn nun die
Lohnsetzer auch nur einen geringen Grad an Inationsaversion mitbringen, so sehen sie in
der ersten Stufe, dass sie im Prinzip nur Einuss auf die Inationsrate haben. Ihr Ratio-
nalit atskalk ul diktiert ihnen dann sich ausschlielich auf dieses Ziel zu konzentrieren und
damit der Zentralbank in der zweiten Stufe Bedingungen zu bescheren, die es ihr erlaubt,
das reale Ziel ohne inationare Nebenwirkungen zu erreichen.
1
Diese Logik macht auch klar,
warum und wie die hier unterstellte sequentielle Struktur des Spiels von Bedeutung ist.
Das Ergebnis ist denkbar weit entfernt vom Resultat des Modells in Abschnitt 3.7.4 auf
Seite 60. Dort wurde ja gezeigt, dass die Zentralbank in einem Gleichgewicht mit Rationalen
Erwartungen keinerlei Einuss auf die realen Variablen hat und daher so konservativ wie
moglich sein sollte.
Die Bedeutung der sequentiellen Struktur wird genauer herausgestellt, indem nun dieses
Ergebnis innerhalb des extrem einfachen Modellrahmens in diesem Abschnitt reproduziert
wird. D.h. im Rest dieses Abschnitts wird noch das Nash-Gleichgewicht des statischen
Spiels berechnet.
Die geldpolitische Reaktionsfunktion (4.26) kann dabei einfach ubernommen werden,
das lohnpolitische Verhalten muss aber neu abgebildet werden; die Lohnsetzer wissen ja
in einem statischen Kontext, dass die geldpolitischen Akteure nicht von einem spezischen
Wert von w ausgehen, sondern allgemein nur von lohnpolitischem Optimalverhalten. Die zu
optimierende Verlustfunktion der Lohnsetzer muss also in einer Form geschrieben werden,
die noch konditional auf p ist. Einsetzen von (4.22) in (4.24) liefert
L
W
= (w p)
2
+p
2
2(w p) , (4.36)
1
Formal: Aus (4.29) folgt, dass w|
=0
= 0.
woraus sich sofort die lohnpolitische Reaktionsfunktion wie folgt ableiten lasst.
L
W
w
= 2 (w p) 2 = 0 w = p + (4.37)
Einsetzen von (4.37) in (4.26) liefert die gleichgewichtige Inationsrate als
p =

(4.38)
(4.37) und (4.26) determinieren gema (4.22) die Arbeitslosenquote im Gleichgewicht als
u = . (4.39)
Die Inationsrate (4.38) ist in diesem Szenario eine monotone Funktion der Konservati-
vitat der Zentralbank, wahrend die Geldpolitik nun die realen Variablen nicht beeinusst.
Vielmehr ist die Arbeitslosenquote im Gleichgewicht proportional zur Gewichtung des Re-
allohnziels in der Zielfunktion der Lohnsetzer.
Abbildung 4.19 zeigt die qualitativen Eigenschaften der Nash-Losung des statischen
Spiels wieder in einer numerischen Simulation. Alle Parameter sind dabei genau so gewahlt
wie f ur die Simulation des sequentiellen Spiels in Abbildung 4.18 auf der vorherigen Seite.
p
u
? ? ?
0 ? ?
ZunehmendeKonservativitt
derGeldpolitik
Abbildung 4.19: Die qualitativen Eigenschaften eines Nash-Gleichgewichts im statischen
Spiel zwischen Lohnsetzern und Geldpolitik.
Nat urlich resultiert nun wieder die normative Implikation, dass sich die Geldpolitik
moglichst konservativ verhalten sollte, d.h. einen ausschlielichen Fokus auf das Inationsziel
legen sollte.
Eine wichtige Lehre aus dem Vergleich des sequentiellen und statischen Spiels in diesem
Abschnitt ist vor allem, dass die Unterschiedlichkeit der Losungen in beiden Szenarien von
der genauen Spezikation des Modells abhangt. So waren in dem Modell dieses Abschnitts die
Ergebnisse im statischen und dynamischen Spiel identisch, wenn es keine Inationsaversion
der Lohnsetzer gabe (d.h. f ur = 0).
1
1
In der Tat wird in dem Lehrbuch von Gibbons (1992) das traditionelle Barro-Gordon-Modell (vgl.
Abschnitt 3.7.4 auf Seite 60 explizit als dynamisches Spiel prasentiert.
4.5. ANWENDUNGEN 91
4.5.3 Geldpolitik III: Reputation im Barro-Gordon-Modell
In diesem Abschnitt werden nun die Unterschiede zwischen statischem und dynamischem
Spiel wieder in den Hintergrund geschoben und die Frage nach der Moglichkeit eines Re-
putationsaufbaus der geldpolitischen Akteure gestellt. Dabei wird die Modellstruktur des
Abschnitts 3.7.4 auf Seite 60 wieder unterstellt, d.h. die geldpolitische Zielfunktion ist wie-
der durch
L
G
= u
G
=
2
+ (y y)
2
(4.40)
gegeben, die Phillipskurve y = y
N
+ (
e
) ist das Modell der

Okonomie, wobei
die Beziehung zwischen dem inationsstabilen Outputniveau y
N
und dem Zielniveau der
Geldpolitik y gegeben ist durch y = y
N
mit > 1.
Unter der Annahme Rationaler Erwartungsbildung =
e
resultieren im Nash-Gleichgewicht
die Inationsrate
=
( 1)
y
N
(4.41)
und das Outputniveau
y = y
N
. (4.42)
Wie bereits diskutiert, weist diese Losung eine Inezienz in Form einer unerw unscht
hohen Inationsrate auf, die im Gleichgewicht nicht in der Lage ist, das Niveau der realen
Aktivitat zu steigern. Es ware daher vorstellbar, dass sich die Geldpolitik in dieser Situation
eine Reputation aufbauen mochte, die Inationsrate bei Null zu halten. Wenn dies auch von
den Privaten erwartet wird, so andert sich nichts am Outputniveau 4.42, die Inationsrate
ginge jedoch auf Null zur uck. Reputationsaufbau ware also eine denkbare Losung des Zei-
tinkonsistenzproblems der Geldpolitik. Allerdings hatte in dieser Situation die Geldpolitik
einen Anreiz, eine hohere Inationsrate zu kreieren was ja genau der Kern des Zeitinkonsi-
stenzproblems ist. Nachfolgend wird nun zunachst der Fall eines endlich wiederholten Spiels
betrachtet, danach die Situation bei unendlicher Wiederholung.
Endlich wiederholte Interaktion
Wenn das oben noch einmal kurz beschriebene one-shot game aus Abschnitt 3.7.4 auf Sei-
te 60 f ur eine vorgegebene Zahl von T Perioden gespielt wird, so lasst sich die teilspielper-
fekte Abfolge der gleichgewichtigen Losungen der T Teilspiele durch R uckwartsinduktion
ermitteln.
Das Teilspiel in Periode T besteht nur noch aus dem one-shot game in dieser Periode.
Die Anreize der Akteure hangen dabei in keiner Weise von der Geschichte des Spiels ab
womit klar ist, dass hier kein Weg an der inezienten Losung (4.41) und (4.42) vorbei f uhrt.
Anders gesagt: Die Zentralbank w urde bei Inationserwartungen in Hohe von
e
T
= 0 eine
Inationsrate
T
>
e
T
= 0 wahlen. Daher ist
e
T
= 0 kein Gleichgewicht, da der private
Sektor den Anreiz der Zentralbank und somit die zeitkonsistenten Inationserwartungen
bildet. In Periode T ergibt sich also
T
=
(1)
y
N
und y
T
= y
N
.
In Periode T 1 besteht das Teilspiel aus den Stufenspielen der Perioden T und T 1.
Damit ist klar, dass in T eine in T 1 evtl. aufzubauende Reputation nichts n utzt, da
sich auch bei
T1
= 0 an der im letzten Absatz geschilderten Logik nichts andert. Ein
Reputationsaufbau ist somit unglaubw urdig und unterbleibt deswegen. Das Ergebnis besteht
ist also auch hier
T1
=
(1)
y
N
und y
T1
= y
N
.
In Periode T2 ist die Logik nun vollig parallel zu der in T1, d.h. ein Reputationsaufbau
ist unn utz, ergo unglaubw urdig und unterbleibt daher. Die Logik andert sich nat urlich auch
nicht f ur noch groer Teilspiele, die weiter zur uckreichen.
Damit ist gezeigt, dass ein Reputationsaufbau in einer endlich wiederholten Spielsituation
nicht auftritt. Dies ist eine Anwendung des Theorems in Abschnitt 4.4.2 auf Seite 74, das
ja behauptete, dass sich ein eindeutiges Nash-Gleichgewicht in einem one-shot game bei
endlicher Wiederholung dieser Situation einfach perpetuiert.
Unendlich wiederholte Interaktion
Auch sehr stabile Institutionen leben nicht unendlich lange, dennoch ist gerade in der Geld-
politik die Unterscheidung zwischen endlichem und unendlichem Zeithorizont von groer
Bedeutung. Denn in einer zunachst einmal nat urlichen Situation, in der Geldpolitik von
einer gewahlten Regierung betrieben wird, wechselt diese jedenfalls potentiell nach Ab-
lauf einer Legislaturperiode. Diese dauern typischerweise ca. 4-5 Jahre und bieten damit eine
wirklich begrenzte zeitliche Perspektive, die mit der Logik eines endlich wiederholten Spiels
gut abgebildet ist. Eine nicht von der Regierung abhangige Zentralbank bzw. eine Zentral-
bank, die f ur die Mitglieder der Erntscheidungsgremien langere Amtszeiten vorsieht, kann
dagegen schon eher eine Kontinuitat gewahrleisten, die durch ein unendlich wiederholtes
Spiel besser abgebildet ist.
Nachfolgend wird nun gezeigt, dass die folgende Triggerstrategie f ur die Bildung der
Inationswartungen des privaten Sektors unter bestimmten Umstanden ein ezientes teil-
spielperfektes Gleichgewicht unterst utzen kann:
Triggerstrategie: Setze in Periode 1 die Inationserwartungen auf
e
1
= 0. Setze danach
f ur alle t > 1 die Inationserwartungen gema
e
t
=
_
0 f ur
ti
= 0, i 1
(1)
y
N
f ur max
i
ti
> 0, i 1
(4.43)
In Worten: Der private Sektor gibt der Zentralbank einmal einen Vertrauensvorschuss,
der aber sofort und f ur alle Zeiten aufgebraucht ist, wenn dieses Vertrauen einmal missbraucht
werden sollte.
1
Die Notation f ur den Rest des Arguments kann sehr einfach gehalten werden, da es
gen ugt, drei Nutzenniveaus der geldpolitischen Zielfunktion (4.40) zu unterscheiden. Es ist
hier auch wieder bequemer, anstelle der Verlustgroen L
G
von Nutzengroen u
G
zu sprechen.
Dieses Nutzenniveau kann als Funktion der beiden Handlungsparameter und
e
aufgefasst
werden, d.h.
u
G
(,
e
) (4.44)
Dabei konnen die Inationsrate und auch die Inationserwartungen das Niveau des Nash-
Gleichgewichts im one-shot game (4.41) annehmen, das hier mit
N
bezeichnet werden soll
oder aber das eziente Niveau von Null.
Die drei relevanten Konstellationen sind die folgenden:
u
U
G
= u
G
_
N
, 0
_
ist das Nutzenniveau, das die Zentralbank erreicht, wenn sie eine
erfolgreiche

Uberraschungsination herbeif uhrt, d.h. den privaten Sektor tauscht. Dies
ist vor dem Hintergrund der Triggerstrategie (4.43) genau ein Mal moglich.
u
N
G
= u
G
_
N
,
N
_
ist assoziiert mit der Situation, in der der private Sektor das Ver-
trauen in die Zentralbank verloren hat und damit das one-shot game Nash-Gleichgewicht
resultiert.
1
Daher ist (4.43) eine grim strategy. Die gleiche Analyse lasst sich auch hier f ur etwas weniger rigorose
Bestrafungsstrategien, wie z.B. tit for tat durchf uhren. Es andert sich dadurch nichts an der Logik der
Analyse, wohl aber an der genauen Bedingung, unter der das eziente Gleichgewicht des one-shot games die
Eigenschaft der Teilspielperfektheit aufweist. Es leuchtet ein, dass Teilspielperfektheit umso eher gegeben
ist, je harter die Bestrafungsstrategie ist; der Grund daf ur ist der, dass Bestrafung als Abschreckung dient
und diese naturgema umso eher wirkt, je bedrohlicher sie ist.
4.5. ANWENDUNGEN 93
u
E
G
= u
G
(0, 0) wird realisiert, solange der private Sektor an die Reputation der Geld-
politik, die eziente Inationsrate von Null zu wahlen, glaubt und diese Erwartungen
auch erf ullt werden.
Die Analyse im zweiten Kapitel machte deutlich, dass die folgende Reihenfolge gelten
muss:
u
U
G
> u
E
G
> u
N
G
.
1
(4.45)
Betrachten wir nun das Optimalverhalten der Zentralbank unter der oben genannten
Triggerstrategie. Zwei Optionen stehen im Prinzip zur Verf ugung: Zum einen kann die Zen-
tralbank die eziente Losung unterst utzen, d.h. der Versuch zur

Uberraschungsination
widerstehen und eine unendliche Folge der Nutzenniveaus u
E
G
generieren:
u
E
G
_
1 + +
2
+. . .
_
=
u
E
G
1
(4.46)
Der Durchschnittswert dieser Zahlungsreihe ist gema der Denition (4.12) gegeben
durch
(1 ) u
E
G
1
= u
E
G
(4.47)
Zum anderen kann die Zentralbank aber auch zu irgendeinem Zeitpunkt eine

Uberra-
schungsination durchf uhren. Bei dieser einfachen Struktur ist klar, dass dieser Anreiz bei
auch nur marginaler Diskontierung gleich in der ersten Periode besteht. Dementsprechend
ware der Nutzenstrom gegeben durch
u
U
G
+u
N
G
_
+
2
+. . .
_
(4.48)
Der durchschnittliche Wert dieses Zahlungsstroms ist
(1 )
_
u
U
G
+u
N
G
_
+
2
+. . .
_
= (1 )
_
u
U
G
u
N
G
+u
N
G
_
1 + +
2
+. . .
_
(1 )
_
u
U
G
u
N
G
+
u
N
G
1
_
= (1 )
_
u
U
G
+
u
N
G
1
_
= (1 ) u
U
G
+u
N
G
(4.49)
Die durchschnittliche Auszahlung (4.49) muss nun verglichen werden mit (4.47). Dar-
aus lasst sich ableiten, dass die Herbeif uhrung von

Uberraschungsination und damit ein
analoges Ergebnis wie beim endlich wiederholten Spiel das einzige teilspielperfekte Gleich-
gewicht ist, wenn
(1 ) u
U
G
+u
N
G
> u
E
G
u
U
G
>
u
E
G
u
N
G
1
(4.50)
Da u
U
G
> u
E
G
ist dies prinzipiell f ur einen hinreichend kleinen Wert von moglich. Dieser
Schwellenwert errechnet sich aus (4.50) als
=
u
U
G
u
E
G
u
U
G
u
N
G
. (4.51)
Damit ist gezeigt, dass Reputationsaufbau im Kontext eines unendlich wiederholten
Spiels gelingen kann, wenn die Diskontrate hinlanglich niedrig ist ( also hinlanglich nahe bei
Eins liegt) sowie der Nutzen aus der

Uberraschungsination relativ zum Nutzendierential
zwischen ezientem Gleichgewicht und dem Nash-Gleichgewicht des one-shot game nicht zu
gro wird.
1
Es ware eine nahe liegende

Ubung, den algebraischen Beweis dieser Behauptung durch die Evaluation
dieser Situationen mit Hilfe der Verlustfunktion (4.40) anzutreten.
Kapitel 5
Nichtkooperative Spiele III:
Dynamische Spiele bei
unvollkommener Information
5.1 Lernziele
Unvollkommene Information und insbesondere auch asymmetrisch verteilte Information ist
ein sehr gangiges Merkmal okonomischer Situationen. Ein Verkaufer kennt die Qualitat
seines Produktes besser als der Kaufer, ein Arbeitnehmer seine tatsachliche Qualikation
besser als ein prospektiver Arbeitgeber. Beispiele dieser Art lassen sich zuhauf nden.
Das Ziel dieses Kapitels ist es, das bisherige Instrumentarium der spieltheoretischen
Analyse auf diese Situationen abzustimmen. Dies erfordert vor allem eine Verfeinerung der
bisher verwendeten Losungskonzepte. Dieser Aufgabe widmet sich der erste Abschnitt 5.2 auf
der nachsten Seite. Hier wird insbesondere das Konzept des perfekten bayesianischen
Gleichgewichts beschrieben und begr undet.
Im Anschluss daran werden in den Abschnitten 5.3 auf Seite 101 und 5.4 auf Seite 104
zwei ganz bestimmte Klassen von dynamischen Spielen mit unvollkommener Information
naher untersucht. Zunachst geht es um sog. Signalspiele. In diesen Spielen gibt ein gut
informierter Spieler ein Signal, das der schlechter informierte Spieler empfangen kann und
auf das er seine Entscheidung im Allgemeinen konditionieren wird. Obgleich diese Charak-
terisierung zugegebenermaen reichlich abstrakt klingt, gibt es viele okonomische Beispiele,
die in dieses Muster sehr gut passen. Als nachstes werden dann Screening-Spiele etwas
genauer unter die Lupe genommen. In diesen muss der schlechter informierte Spieler den
ersten Zug machen, der besser informierte Spieler kann reagieren. Letzterer kann durch sein
Wissen also keine Signale senden, sondern wird durch den Spielablauf abgeschirmt.
1
Wie auch in den beiden vorangegangenen Kapiteln werden Anwendungen des Modell-
rahmens das Kapitel in Abschnitt 5.5 auf Seite 107 beschlieen.
1
So erklart sich auch die englische Bezeichnung: Aus Sicht des ersten, schlecht informierten Spielers wird
durch die Reihenfolge der Z uge ein screen vor dem gut informierten Spieler aufgebaut.
95
96 KAPITEL 5. NICHTKOOPERATIVE SPIELE III
5.2 Modikation des Losungskonzepts bei dynamischen
Spielen bei unvollkommener Information
5.2.1 Perfektes Bayesianisches Gleichgewicht
Auch die Theorie nichtkooperativer Spiele bei unvollkommener Information versucht letzt-
lich, eine Vorhersage uber das Ergebnis einer Spielsituation zu machen, wobei sie sich eines
bestimmten Losungskonzepts bedienen muss. Die bisher verwendeten Losungskonzepte wa-
ren
das Nash-Gleichgewicht, das Verwendung fand bei der Theorie statischer Spiele mit
vollkommener Information (vgl. Kapitel 3) und
das teilspielperfekte Gleichgewicht, das sich f ur die Analyse dynamischer Spiele
gut eignet.
Eine Voraussetzung f ur die Anwendung des Losungskonzepts des teilspielperfekten Gleich-
gewichts ist die Identizierbarkeit entsprechender Teilspiele, f ur die dann ein Nash-Gleichge-
wicht angegeben werden kann. Ein Teilspiel kann jedoch nur dann identiziert werden, wenn
es bei einer einwertigen Informationsmenge startet. Spiele mit unvollkommener Information
bieten diese Moglichkeit per Konstruktion nicht oder nur eingeschrankt, da sie Situationen
beinhalten, in denen ein Spieler nicht wei, an welchem Knoten einer extensiven Form er
sich bendet. Daher ist das Konzept des teilspielperfekten Gleichgewichts in dyna-
mischen Situationen mit unvollkommener Information nicht mehr anwendbar.
Ein abstraktes (Bei-) Spiel (vgl. Gibbons 1992, p. 175 .) soll dieses Problem verdeutlichen.
In Abbildung 5.1 auf der nachsten Seite ist sowohl die extensive als auch die Normalform
eines Spiels mit zwei Spielern zu sehen. Spieler 2 kann hier zwar unterscheiden, ob Spieler 1
im ersten Zug R
1
oder eine der beiden anderen Strategien wahlte, zwischen L
1
und M
1
kann
Spieler 2 jedoch nicht unterscheiden. Schon nur ein theoretisch unbewaneter Blick auf die
Auszahlungen zeigt aber, dass Spieler 2 in dieser Situation L
2
wahlen wird. Oensichtlich
kann er sich damit in beiden Situationen eine bessere Auszahlung sichern 1 gegen uber 0,
wenn Spieler 1 L
1
wahlte und 2 gegen uber 1, wenn Spieler 1 M
1
wahlte. Spieler 1 kann
diese

Uberlegung antizipieren die Auszahlungen sind ja bekannt und wird sich dann in
der Tat f ur L
1
entscheiden, da er hier eine Auszahlung von 2 erhalt, was groer ist als die
Auszahlung von 0 bei Wahl von M
1
und die Auszahlung von 1 bei Wahl von R
1
. Damit
ist das Spiel intuitiv gelost. Die mehr oder weniger implizit verwendeten Anforderungen
werden nachfolgend explizit gemacht werden m ussen.
Zunachst soll aber kurz diskutiert werden, dass bzw. warum die beiden o.g. bis-
herigen Losungskonzepte in der Situation der Abbildung 5.1 auf der nachsten
Seite nicht adaquat sind: Ein Blick auf die Normalform des Spiels zeigt, dass das Spiel
zwei Nash-Gleichgewichte, namlich (L
1
, L
2
) und (R
1
, R
2
) aufweist. Damit ist das Konzept
des Nash-Gleichgewichts nicht in der Lage, das unplausible Gleichgewicht (R
1
, R
2
) auszu-
schlieen. Das gleiche trit auch zu f ur das Konzept des teilspielperfekten Gleichgewichts
zu, da aufgrund der eingef uhrten Informationsunvollkommenheit das einzige Teilspiel in Ab-
bildung 5.1(a) das Spiel selbst ist. Damit sind (L
1
, L
2
) und (R
1
, R
2
) trivialerweise auch
teilspielperfekte Gleichgewichte.
Diese Probleme und die oben diskutierte plausible Losung des Spiels f uhrt zu folgenden
Eigenschaften, die f ur das zu entwickelnde Losungskonzept eine Rolle spielen:
Zum einen erfordert die Losung, dass ein Spieler an einer nicht einwertigen Informati-
onsmenge eine Vorstellung uber die Wahrscheinlichkeitsverteilung der Kno-
ten in der Informationsmenge entwickelt im Spiel der Abbildung 5.1 muss
Spieler 2 also eine Vorstellung dar uber haben, mit welcher Wahrscheinlichkeit, er sich
im linken oder rechten Knoten bendet, Spieler 1 also L
1
oder M
1
wahlte. Diese Vor-
stellung uber die Wahrscheinlichkeitsverteilung nennt man belief.
5.2. MODIFIKATION DES L
OSUNGSKONZEPTS 97
Abbildung 5.1: Ein dynamisches Spiel mit unvollkommener Information
(a) in extensiver Form, (b) in Normalform.
F ur gegebene beliefs der Spieler muss an die gleichgewichtigen Strategien der Spieler
die Anforderung sequentieller Rationalitat gestellt werden.
Wenn also Spieler 2 davon ausgeht, dass Spieler 1 in der ersten Stufe L
1
wahlte (d.h.
sein belief ist gegeben durch p (L
1
) = 1), so muss Spieler 1 die Aktion L
2
wahlen, da
u
2
( L
2
| L
1
) = 1 > u
2
( R
2
| L
1
) = 0. Wenn aus welchem Grund auch immer Spieler 2 mit
Sicherheit davon ausgeht, dass p (L
1
) = 0, so dass Spieler 1 die Aktion M
1
wahlte, resultiert
im Beispiel die gleiche Aktion, da u
2
( L
2
| M
1
) = 2 > u
2
( R
2
| M
1
) = 1. Man kann hier zeigen,
dass L
2
generell f ur jeden belief uber die Wahl des Spielers 1 optimal ist, da
E ( u
2
| R
2
, p) = p u
2
( R
2
| L
1
) + (1 p) u
2
( R
2
| M
1
) = p 0 + (1 p) 1 = 1 p <
E ( u
2
| L
2
, p) = p u
2
( L
2
| L
1
) + (1 p) u
2
( L
2
| M
1
) = p 1 + (1 p) 2 = 2 p
.
(5.1)
Damit ist bereits das unplausible Nash-Gleichgewicht ausgeschlossen, da Spieler 2 f ur
irgendeinen belief niemals R
2
wahlen wird.
Bislang wurde noch nichts uber das Zustandekommen der beliefs selbst gesagt. Hier
wird nun die folgende Anforderung gestellt, dass die beliefs der Spieler gema der
Bayesianischen Regel gebildet werden. Dies gilt f ur Informationsmengen, die mit einer
positiven Wahrscheinlichkeit erreicht werden (man spricht dann von Informationsmengen
auf dem Gleichgewichtspfad) und auch f ur solche jenseits des Gleichgewichtspfades, wann
immer dies moglich ist.
Was sagt nun die Bayesianische Regel? Es geht dabei immer um die Bildung einer be-
dingten Wahrscheinlichkeit, d.h. der Wahrscheinlichkeit, dass ein Ereignis A eintritt,
gegeben, dass ein zweites, allgemeineres Ereignis B beobachtet wird. Dann gilt f ur die be-
dingte Wahrscheinlichkeit
p ( A| B) =
p (A B)
p (B)
. (5.2)
Ein Beispiel hilft, die Formel zu verstehen: Angenommen, es ist die Wahrscheinlichkeit
gesucht, dass bei einem W urfel die Zahl 3 aufscheint (Ereignis A), gegeben, dass eine un-
gerade Zahl gew urfelt wurde (Ereignis B). Nun ist klar, dass bei einem fairen W urfel die
unkonditionale Wahrscheinlichkeit f ur die Zahl 3 durch p(A) = 1/6 gegeben ist. Da dies eine
ungerade Zahl ist kann A nur zusammen mit B auftreten, d.h. es gilt p(A B) = 1/6. Die
Wahrscheinlichkeit f ur ein ungerade Zahl ist nat urlich p(B) = 1/2, so dass
p(A|B) =
p(A B)
p(B)
=
1/6
1/2
=
1
3
, (5.3)
wie man in diesem einfachen Beispiel wohl auch ohne die Bayesianische Regel herausgefunden
hatte.
Im Beispiel von Abbildung 5.1 auf der vorherigen Seite kann (5.2) wie folgt angewandt
werden. Wenn bekannt ist, dass Spieler 1 mit den Wahrscheinlichkeiten q, r und 1 q r
die Aktionen L
1
, M
1
bzw. R
1
wahlt, dann bildet Spieler 2 seinen belief uber q, wenn er
beobachten konnte, dass R
1
nicht gewahlt wurde, gema
p(L
1
|{L
1
, M
1
}) =
p(L
1
{L
1
, M
1
})
p({L
1
, M
1
})
=
q
q +r
. (5.4)
In dem einfachen Fall von Abbildung 5.1 auf der vorherigen Seite, wei Spieler 2 sogar,
dass p(M
1
) = r = 0, so dass q = 1. Dies wei Spieler 2 deshalb, weil Spieler 1 durchschaut,
dass Spieler 2 in jedem Fall L
2
wahlen wird und sich daher durch die die Wahl von L
1
am
besten stellen kann.
Damit kann nun die folgende Denition formuliert werden: Ein perfektes Bayesia-
nisches Gleichgewicht ist eine Kombination von Strategien und beliefs, f ur die gilt, dass
die Strategien f ur gegebene beliefs der Anforderung sequentieller Rationalitat entspre-
chen;
die beliefs mit Hilfe der Bayesianischen Regel abgeleitet sind, falls diese Regel anwend-
bar ist.
Ein wichtiges Merkmal der Denition eines perfekten Bayesianischen Gleichgewichts
ist die Tatsache, dass sowohl Strategien als auch Beliefs f ur die Denition des
Losungskonzepts herangezogen werden. Die Konsistenz dieser beiden Dinge ist es, was
die Plausibilitat dieses Losungskonzepts ausmacht. Die Idee, Beliefs in die Denition eines
Losungskonzepts mit aufzunehmen geht zur uck auf den Beitrag von Kreps/Wilson (1982).
Die nachste Illustration (ebenfalls aus Gibbons 1992, p. 180 f. entnommen) zeigt die
Interaktion dieser beiden Dinge.
Gegeben sei das 3-Personen-Spiel in Abbildung 5.2 auf der nachsten Seite, das ein echtes
Teilspiel aufweist, welches bei der Entscheidung des Spielers 2 beginnt.
Die Normalform des Teilspiels, das bei der Entscheidung von 2 beginnt, ist in Abbil-
dung 5.3 auf der nachsten Seite angegeben. Die Auszahlungen f ur Spieler 1 sind hier jeweils
einfach durch einen Strich markiert, um zu verdeutlichen, dass diese f ur das Teilspiel zwi-
schen den Spielern 2 und 3 keine Rolle spielen. Man kann sofort erkennen, dass (L, R
) ein
Nash-Gleichgewicht dieses Spiels ist.
Da auch Spieler 1 keinen Anlass hat, durch Wahl von A das Spiel vorzeitig zu beenden, ist
oensichtlich ein perfektes bayesianisches Gleichgewicht gegeben durch (D, L, R
, q = 1).
Wir konnen nun uberlegen, ob auch (A, L, L
, q = 0) ein perfektes bayesianisches Gleich-

gewicht ist. Zunachst ist festzuhalten, dass es ein Nash-Gleichgewicht in dem Sinne ist, dass
5.2. MODIFIKATION DES L
OSUNGSKONZEPTS 99
L R
L R
(1,2,1) (3,3,3) (0,1,2) (0,1,1)
1
3
2
D A
(q) (1-q)
(2,0,0)
L R
Abbildung 5.2: Ein dynamisches Spiel mit unvollkommener Information
Es gibt hier mehrere Nash-Gleichgewichte, aber nur ein perfekt bayesianisches Gleichgewicht.
Spieler3
L R
Spieler2
L
R
(-,2,1)(-,3,3)
(-,0,2)(-,1,1)
Abbildung 5.3: Normalform des Teilspiels zwischen Spieler 2 und 3 in Abbildung 5.2.
kein Spieler einen Anreiz hat, von der Strategie abzuweichen. F ur q = 0 wird Spieler 1 nicht
von A abweichen. Spieler 2 stellt sich durch L immer mindestens genau so gut wie durch R
und f ur q = 0 wird sich auch Spieler 3 durch L
immer besser stellen als durch R
. Dennoch
ist nat urlich etwas faul an diesem Gleichgewicht und zwar die Tatsache, dass eine gleich-
gewichtige Losung die Strategie L f ur Spieler 2 vorschreibt und gleichzeitig q = 0 als belief
f ur Spieler 3. D.h. der belief von Spieler 3 und die gleichgewichtige Strategie f ur Spieler 2
sind f ur (A, L, L
, q = 0) nicht miteinander konsistent.

Ubrigens betrit die Wahrschein-
lichkeit q eine Informationsmenge abseits des Gleichgewichtspfads, da dieser Punkt ja nie
erreicht wird, wenn Spieler 1 die Aktion A wahlt. Der belief q = 0 kann also nicht mit der
Bayesianischen Regel abgeleitet worden sein.
5.2.2 Andere Gleichgewichtskonzepte bei dynamischen Spielen mit
unvollkommener Information
In der Literatur werden auch andere Losungskonzepte f ur dynamische Spiele mit unvoll-
kommener Information benutzt. Diese Unterscheidung beruht darauf, dass das Konzept des
Perfekten Bayesianischen Gleichgewichts zwar am einfachsten zu handhaben ist, jedoch erst
relativ spat in die Literatur eingef uhrt wurde.
1
Zumindest f ur den Schwierigkeitsgrad dieser
Vorlesung sind die inhaltlichen Unterschiede zwischen den Konzepten letztlich unerheblich,
so dass hier keine ausf uhrliche Diskussion erfolgen soll. Vielmehr dient dieser kleine Ab-
schnitt nur dem vielleicht besseren Verstandnis weiterf uhrender Literatur.
2
Trembling hand perfekte Gleichgewichte
Diese Idee wurde von Selten (1975) also vor der Idee des perfekten Bayesianischen Gleich-
gewichts in die Literatur eingef uhrt. Dieses Losungskonzept verlangt von den einzelnen
Aktionen, die Bestandteil einer gleichgewichtigen Losung sind, dass diese auch dann opti-
mal bleiben, wenn es eine geringe Wahrscheinlichkeit daf ur gibt, dass die Gegenspieler nicht
die Aktionen der gleichgewichtigen Strategie spielen. Diese geringe Wahrscheinlichkeit f ur
letztlich irrationales Verhalten kann so paraphrasiert werden, dass die Spieler durchaus wis-
sen, was die optimale Verhaltensweise ist, bei der Entscheidung jedoch etwas zittern, d.h.
Unsicherheit in die Situation hineintragen. Dadurch wird in einem dynamischen Spiel je-
de Informationsmenge mit einer von Null verschiedenen Wahrscheinlichkeit erreicht. Indem
man dann das Zittern gegen Null gehen lasst (mathematisch gesprochen: den Limes einer
gemischten Strategie betrachtet, die mit einer gegen Null gehenden Wahrscheinlichkeit alle
Informationsmengen erreicht), werden dann die uberlebenden Strategien identiziert. Sel-
ten (1975) konnte zeigen, dass diese Art von Gleichgewicht in allen endlichen Spielen (also
Spielen mit einer endlichen Zahl von Spielern, Strategien und Z ugen) existiert.
Sequentielle Gleichgewichte
Der bereits erwahnte Artikel von Kreps/Wilson (1982) deniert keine perfekten bayesiani-
schen Gleichgewichte, sondern sequentielle Gleichgewichte. F ur die meisten Anwendungen
sind die beiden Konzepte identisch, wobei allerdings sequentielle Gleichgewichte unter be-
stimmten Umstanden das anspruchsvollere Losungskonzept darstellen. Der Unterschied be-
steht darin, dass in Spielen mit diskreten Strategievariablen das Konzept des sequentiellen
Gleichgewichts zusatzlich zu den Anforderungen des perfekten bayesianischen Gleichgewichts
verlangt, dass die beliefs und Strategien der Grenzwert einer Folge von rationalen beliefs und
vollstandig gemischten Strategien sind.
3
Das ist insofern n utzlich, als durch die Einf uhrung
vollstandig gemischter Strategien das Erreichen jeder Informationsmenge eine von Null ver-
schiedene Wahrscheinlichkeit aufweist. Dies wiederum ermoglicht die Anwendung der Baye-
sianischen Regel auch abseits des Gleichgewichtspfads. Dies ist aber eine Technikalitat, die
hier nicht weiter vertieft werden wird.
Die Einf uhrung des Limes einer Folge vollstandig gemischter Strategien hat den gleichen
Zweck wie das Zittern bei dem Konzept der trembling hand perfekten Gleichgewichte. Bei
vollstandig gemischten Strategien wird ja auch jede Informationsmenge, d.h. auch diejeni-
gen jenseits des Gleichgewichtspfads, mit einer von Null verschiedenen Wahrscheinlichkeit
erreicht. Daher ist es auch nicht uberraschend, dass Kreps/Wilson (1982) zeigen konnten,
dass alle endlichen Spiele sequentielle Gleichgewichte aufweisen.
1
Dies erfolgte in dem Aufsatz von Fudenberg/Tirole (1991a).
2
Zur vertieften Diskussion der Gleichgewichtskonzepte f ur dynamische Spiele mit unvollkommener Infor-
mation eignet sich daf ur insb. das Lehrbuch der Autoren, die das Perfekte Bayesianische Gleichgewicht in
die Literatur einf uhrten, d.h. Fudenberg/Tirole (1991b), ch. 8.
3
Bei vollstandig gemischten Strategien tritt jede Aktion mit einer von Null verschiedenen Wahrschein-
lichkeit auf.
5.3. SIGNALSPIELE 101
5.3 Signalspiele
5.3.1 Problemstruktur und Losung
Eine wichtige Untergruppe dynamischer Spiele mit unvollkommener Information sind sog.
Signalspiele. Diese Klasse von Spielen hat als gemeinsamen Nenner eine bestimmte Art
der Informationsasymmetrie. Konkret geht es darum, dass in einem Signalspiel der bes-
ser informierte Spieler den ersten Zug macht, und der weniger gut informierte
Spieler danach seine Entscheidung fallt. Der zweite Spieler kann zwar die Entscheidung
des besser informierten ersten Spielers beobachten, nicht aber irgendwelche Merkmale, die
im Prinzip von Interesse sind, jedoch f ur den zweiten Spieler unbeobachtbar bleiben. Diese
Struktur bringt es mit sich, dass der gut informierte Spieler 1 durch seine allseits beobacht-
bare Entscheidung ein Signal f ur Spieler 2 setzen kann. Spieler 1 daher oft als Sender,
Spieler 2 als Empfanger bezeichnet.
Einige Beispiele mogen dazu dienen, die N utzlichkeit und das groe Anwendungsspek-
trum dieser Struktur zu erkennen:
IPO: Eine Unternehmung beschliet, Eigenkapital an der Borse zu akquirieren und
kennt (plausiblerweise) ihre Situation besser als die potentiellen Investoren. Daher wird
das Unternehmen als Sender Signale an die Investoren zu schicken, die diese zu einem
Verhalten veranlassen, das der Unternehmung zum Vorteil gereicht. Auf der anderen
Seite werden die Investoren als Signalempfanger nat urlich genau zu beurteilen haben,
inwiefern sie den Signalen Glauben schenken.
1
Werbung: Wenn Produkteigenschaften f ur den Kaufer als Signalempfanger nicht be-
obachtbar sind, kann das Unternehmen als Sender versuchen, den Empfanger davon
zu uberzeugen, dass es sich um ein hochwertiges Produkt handelt. Dies kann bspw.
dadurch geschehen, dass der Sender sehr viel Geld in eine per se vollig nutzlose Werbe-
aktion steckt, die nur signalisiert: Wir sind so uberzeugt von der f ur die Konsumenten
vor dem Kauf nicht direkt beobachtbaren Qualitat unseres Produkts, dass wir jede
Menge daf ur verschwenden.
Signalspiel auf dem Arbeitsmarkt: Ein Arbeitnehmer kann seine Fahigkeiten (Be-
lastbarkeit, Sozialkompetenz etc.) gut einschatzen, der Arbeitgeber kann diese Fahig-
keiten in aller Regel jedoch nur schwer beobachten. Er muss sich stattdessen auf ein
gut beobachtbares Signal eines Bewerbers um eine Vakanz verlassen. Dies kann bspw.
ein Universitatsdiplom sein. Dieses muss per se gar nichts uber die Qualikation des
Bewerbers aussagen, kann aber dennoch als Signal f ur ganz andere Fahigkeiten dienen.
Geldpolitik: Wenn die Zentralbank eine nicht beobachtbare Inationsaversion hat,
so kann sie in einem Spiel uber zwei oder mehr Perioden dem privaten Sektor als
Signalempfanger etwas uber ihre wahren Praferenzen signalisieren. Das nahe liegende
Instrument daf ur ist die Inationsrate in der ersten bzw. in den ersten Periode(n).
Die beiden letzten Szenarien werden im letzten Abschnitt dieses Kapitels genauer ana-
lysiert werden.
Zunachst gehen wir auf allgemeiner Ebene auf das Signalspiel ein. Abbildung 5.4 auf
der nachsten Seite zeigt die Struktur mit zwei moglichen Auspragungen
2
eines den Sender
betreenden Merkmals, d.h. den Typ des Senders. F ur die gerade genannten Beispiele f ur
Signalspiele waren dies ein(e):
1
Dass z.B. nach dem Einbruch der Borsen 2000/01 kaum mehr IPOs stattfanden, beruht darauf, dass es
den Unternehmen kaum mehr moglich war, glaubw urdige Signale an die Investoren zu senden, dass hier ein
gesundes, protables Unternehmen um Eigenkapital wirbt.
2
Nat urlich konnen Signalspiele auch mit mehr als zwei Auspragungen f ur den Typ des Senders formuliert
werden. Die hier gemachte Beschrankung erfolgt aus Gr unden der moglichst einfachen Darstellung.
protables oder nicht protables Unternehmen;
gutes oder schlechtes Produkt;
produktiver oder nicht-produktiver Arbeiter;
Taube oder Falke.
Danach setzt der Sender ein wiederum binares Signal oder message ab, was den Empfanger
zu einer ebenfalls binaren Entscheidung oder Aktion veranlasst (investieren oder nicht in-
vestieren; kaufen oder nicht kaufen; Jobangebot machen oder kein Jobangebot machen; Nul-
lination erwarten oder eine hohere Inationsrate erwarten).
Die beiden gestrichelten Linien in Abbildung 5.4 bezeichnen die Tatsache, dass der
Empfanger, der sich in diesen Knoten am Zug bendet nicht zwischen den jeweils ver-
bundenen Knoten unterscheiden kann; dadurch ist das Merkmal abgebildet, dass er zwar
die message des Senders, nicht aber dessen Typ beobachten kann. Die Auszahlungen an
den Endknoten m ussen f ur die Losbarkeit des Spiels nat urlich speziziert sein, sind f ur die
Illustration der allgemeinen Situation aber entbehrlich und fehlen daher in Abbildung 5.4.
Generell hangen die Auszahlungen von Sender und Empfanger (u
S
und u
E
) sowohl vom Typ
des Senders t
i
als auch von dessen Signal m
j
und der Aktion des Senders a
k
ab:
u
S
= u
S
(t
i
, m
j
, a
k
) (5.5)
u
E
= u
E
(t
i
, m
j
, a
k
) (5.6)
Natur
t
1
t
2
Sender
m
1
m
2
m
1
m
2
Empfnger
a
1
a
2
a
1
a
2
a
1
a
2
a
1
a
2
Abbildung 5.4: Struktur eines Signalspiels
Die Idee eines perfekten Bayesianischen Gleichgewichts ubertragt sich nun problemlos auf
die Struktur des Signalspiels: Der Empfanger muss f ur seine Entscheidung einen (potentiell)
auf das empfangene Signal konditionalen belief b = b(m
j
) uber den Typ des Senders bilden.
Nat urlich muss f ur jede Auspragung des Signals gelten, dass
t
i
T
b ( t
i
| m
j
) = 1. (5.7)
In Worten: F ur jedes Signal m
j
muss die Summe der den verschiedenen denkbaren Typen
zugeordneten Wahrscheinlichkeiten 1 betragen.
Der Empfanger maximiert dann f ur einen gegebenen belief seine Auszahlung uber die
Wahl seiner Aktion. F ur einen Aktionsraum A ist sein Problem also gegeben durch
max
a
k
A
t
i
T
b ( t
i
| m
j
) u
E
(t
i
, m
j
, a
k
) , (5.8)
5.3. SIGNALSPIELE 103
wobei T die Menge der moglichen Typen des Senders bezeichnet. Dieses Verhalten kann in
der Reaktionsfunktion
a
(m
j
) (5.9)
zusammengefasst werden.
Vollig analog dazu maximiert der Sender seinen erwarteten Nutzen uber die Wahl der
zur Verf ugung stehenden Signale, wobei er die Reaktionsfunktion (5.9) des Empfangers an-
tizipiert. Formal ist sein optimales Signal m
also bestimmt durch die Losung des folgenden

Problems:
max
m
j
M
u
S
(t
i
, m
j
, a
(m
j
)) (5.10)
Damit ist das Gleichgewicht des Signalspiels beschrieben bis auf die Bildung der beliefs
durch den Empfanger. Dem Empfanger wird unterstellt, dass er das Kalk ul (5.10) durch-
schaut. Daher kann er die Menge der Typen T aufteilen in solche, die das beobachtete Signal
m
j
senden und solche, f ur die es nicht optimal ist, m
j
zu senden. Sei T
j
die Menge aller
Typen f ur die m
(t
i
) = m
j
. Dann muss der belief des Empfangers gebildet werden gema
b ( t
i
| m
j
) =
p (t
i
)
t
i
T
j
p (t
i
)
. (5.11)
Dies ist die Anwendung der Bayesianischen Regel 5.2 im vorliegenden Kontext eines
Signalspiels.
Damit kann f ur den hier gewahlten Abstraktionsgrad das folgende Ergebnis festgehalten
werden: Die Losung eines Signalspiels in reinen Strategien ist gegeben durch
die Strategien von Sender und Empfanger sowie durch
die beliefs des Empfangers,
die die Gleichungen (5.7), (5.8), (5.10) und (5.11) erf ullen.
5.3.2 Mogliche Gleichgewichte eines Signalspiels
Abbildung 5.4 auf der vorherigen Seite machte deutlich, dass der Sender vier mogliche Stra-
tegien hat. Diese f uhren zu unterschiedlichen Losungen des Spiels, die nat urlich auch vom
Verhalten des Empfangers abhangen, deren Charakterisierung aber auch unabhangig davon
interessant ist.
Die vier Strategien des Senders sind:
Spiele m
1
unkonditional (d.h. sowohl bei t
1
als auch bei t
2
).
Spiele m
2
unkonditional.
Spiele m
1
, wenn t = t
1
und m
2
, wenn t = t
2
.
Spiele m
1
, wenn t = t
2
und m
2
, wenn t = t
1
.
Es ist klar, dass f ur den Empfanger die Optimalitat (aus Sicht des Senders) der beiden
ersten Strategien bad news ist: Unkonditionale Strategien vermogen es nicht, irgendetwas
uber den Typ des Senders zu verraten, da alle Typen das gleiche Signal senden. Wenn
eine der beiden ersten Strategien f ur den Sender optimal ist, spricht man daher auch von
Pooling-Gleichgewichten.
Auf der anderen Seite vermag die Optimalitat der dritten und vierten Strategie etwas
uber die wahre Natur des Typs des Senders zu verraten. Gleichgewichte, die die Optimalitat
dieser Verhaltensweise f ur den Sender implizieren, werden als separierende Gleichge-
wichte bezeichnet. Wenn der Einfachheit halber die Botschaft m
i
einfach lautet: Ich bin
vom Typ i, so konnte der Empfanger im dritten Fall dem Sender einfach glauben, wahrend
er im vierten Fall genau wei, dass der Sender in jedem Fall l ugt.
1
Wenn es mehr als zwei Typen gibt, sind nat urlich auch Gleichgewichte denkbar, in de-
nen ein partielles Pooling (synonym: partielles separating, semi-pooling, semi-separating)
auftritt. In diesen Fallen kann der Empfanger aus dem Signal zwar Information ziehen, d.h.
f ur ein bestimmtes Signal einen oder mehrere bestimmte Typen ausschlieen, aber nicht
oder jedenfalls nicht in jedem Fall sicher sagen, um exakt welchen Typ es sich handelt.
Ein unschones Merkmal von Signalspielen aber auch von dynamischen Spielen mit
unvollkommener Information im Allgemeinen ist die Tatsache, dass es auch in wohlspe-
zizierten Situationen haug kein eindeutiges Gleichgewicht gibt, sondern unterschiedli-
che Kombinationen von Strategien und beliefs, die das Kriterium des perfekten
Bayesianischen Gleichgewichts erf ullen. Darunter fallt auch die Moglichkeit, dass es in
Abhangigkeit der herrschenden beliefs sowohl Pooling-Gleichgewichte als auch separierende
Gleichgewichte geben kann. Das Grundproblem dabei ist, dass beliefs und Strategien ja nicht
unabhangig voneinander evaluiert werden konnen, sondern gleichberechtigte Bestandteile ei-
nes Gleichgewichts sind. Daher gibt es bei Vorliegen multipler perfekt Bayesianischer
Gleichgewichte keine Moglichkeit, diese Gleichgewichte weiter zu hierarchisieren.
5.4 Screening
5.4.1 Allgemeine Charakterisierung und Beispiele
Eine zweite, sehr bedeutsame Untergruppe dynamischer Spiele mit unvollkommener Infor-
mation sind sog. Screening-Spiele. Der gemeinsame Nenner dieser Art von Spielen ist das
Merkmal, dass der uninformierte Spieler zuerst ziehen muss und erst danach der
besser informierte Spieler seine Entscheidung zu fallen hat. Um etwas konkreter zu werden:
In typischen Screening-Situationen muss der schlechter informierte Spieler dem besser in-
formierten Spieler einen Vertrag anbieten, den dieser vor dem Hintergrund seiner besseren
Information akzeptieren oder ablehnen kann. Daher besteht die Herausforderung f ur den
schlechter informierten Spieler darin, einen Vertrag anzubieten, der es f ur den besser in-
formierten Spieler individuell rational macht, sich so zu verhalten, dass es im Interesse des
schlechter informierten Spielers ist.
Auch hier ist es hilfreich, konkrete Anwendungen zu benennen:
Versicherung: Ein Versicherungsunternehmen bietet einen Police an, wohl wissend,
dass der Versicherungsnehmer uber sein Risiko besser unterrichtet ist als der Versi-
cherungsanbieter selbst. In der zweiten Stufe kann dann ein Versicherungsnehmer das
Angebot annehmen oder ablehnen. Nat urlich antizipiert der Versicherungsanbieter das
typabhangige Optimalverhalten des Versicherungsnehmers und versucht daher, Policen
anzubieten, die trotz des Informationsnachteils nicht zu Verlusten f uhren.
2
Bildung/Training: Ein Sportler erhalt am Ende der Spielzeit ein Angebot f ur die
kommende Saison. Der Wert des Sportlers hangt nat urlich auch davon ab, was er in
1
Von einem rein strategischen bzw. informationsokonomischen Standpunkt aus betrachtet ist eine L uge
bzgl. einer dichotomen Aussage (d.h. die Antwort auf eine Frage, die man mit ja oder nein beantworten
kann) nat urlich genau so gut wie die Wahrheit, wenn man genau wei, dass es eine L uge ist. Moralische
Bewertungen spielen hierbei keinerlei Rolle.
2
Verluste waren dann unvermeidlich, wenn die Bedingungen so formuliert sind, dass nur die schlechten
Risiken die Police kaufen, die guten Risiken hingegen nicht. Eine weit verbreitete Moglichkeit der Ausstat-
tung von Policen ist die Vereinbarung eines relativ hohen Selbstbehaltes im Schadensfall. Dieser dient v.a.
dazu, dass sich die schlechten Risiken selbst aussortieren, d.h. es nicht in ihrem Interesse sehen, die Poli-
ce in Anspruch zu nehmen. Es ist aber trotz dieser Moglichkeiten ein in der Versicherungsokonomik gut
etabliertes Faktum, dass f ur einige Risiken solche Policen praktisch nicht existieren und man daher einen
exogenen (in dem Fall durch den Staat vorgegebenen) Versicherungszwang einf uhren muss. Dies ist z.B. in
der Krankenversicherung der Fall oder bei der Kfz-Haftpicht.
5.4. SCREENING 105
der spielfreien Zeit macht (feiern oder trainieren), wor uber aber der neue Arbeit-
geber nicht oder nicht perfekt informiert sein kann. Das gleiche gilt f ur latente oder
versteckte Verletzungen, wenn diese nicht mit objektiven arztlichen Tests verizierbar
sind sowie ggf. auch f ur die Motivation des Spielers. Daher muss das Angebot vor dem
Hintergrund unvollkommener Information abgegeben werden.
Im zweiten Beispiel sind in der ersten Stufe zwei schlecht informierte Spieler simultan am
Zug. Dadurch gewinnt die Situation an zusatzlichem Reiz, da auch ein Wettbewerb zwischen
diesen beiden in die Beschreibung der Losung aufgenommen werden muss.
Da in einem Screening-Spiel der schlechter informierte Spieler zuerst zieht, ist es f ur die
Etablierung der Losung nicht notwendig, etwas uber dessen beliefs zu sagen, da er
ja aus dem Verhalten der besser informierten Spieler aufgrund des Ablaufs keine entschei-
dungsrelevante Information mehr ziehen kann. Wie in Signalspielen kann es aber auch
hier zu Pooling-Gleichgewichten und separierenden Gleichgewichten kommen,
d.h. die (optimale) Entscheidung der besser informierten Spieler kann sich in Abhangigkeit
der nur f ur sie beobachtbaren Merkmalen unterscheiden (separierendes Gleichgewicht) oder
aber unabhangig von diesen Merkmalen f ur alle gleich sein (Pooling-Gleichgewicht).
5.4.2 Screening auf dem Versicherungsmarkt
Betrachten wir zunachst ein Screening-Spiel auf dem Versicherungsmarkt. Dessen
Struktur ist in Abbildung 5.5 zu sehen.
Natur
Kundeist
gutesRisiko
(q)
Versicherungsanbieter
Kundeist
schlechtesRisiko
(1-q)
Keinen Vertrag
anbieten
Kunde
Keinen Vertrag
anbieten
annehmen
ablehnen
annehmen
Vertrag
anbieten
Vertrag
anbieten
Abbildung 5.5: Screening auf dem Versicherungsmarkt
Die Natur entscheidet, ob ein bestimmter Kunde ein gutes oder schlechtes Risiko ist;
der Versicherungsnehmer kennt nur die Verteilung der Gesamtpopulation; in dieser seien
die guten Risiken mit einer Wahrscheinlichkeit von q enthalten, die schlechten Risiken mit
der entsprechenden Gegenwahrscheinlichkeit. Folgende Situationen konnen unterschieden
werden:
Pooling-Gleichgewicht 1: Alle Kunden kaufen die Police. In diesem Fall muss gelten,
dass die Police billig genug ist, um auch den guten Risiken attraktiv genug zu erschei-
nen; ist sie dies, so werden die schlechten Risiken in jedem Fall die Police kaufen. Wenn
s
g
und s
s
die erwarteten Schadenssummen f ur gute und schlechte Risiken sind, so muss
aus Sicht des (annahmegema risikoneutralen) Versicherungsanbieters gelten, dass die
Kosten der Police c die folgende Bedingung erf ullen c q s
g
+ (1 q) s
s
. Ist dies
der Fall, so ist es aus Sicht des Versicherungsunternehmens rational, die Versicherung
anzubieten, f ur c < q s
g
+ (1 q) s
s
wird er hingegen keine Policen anbieten.
Pooling-Gleichgewicht 2: Keiner der Kunden kauft die Police, da auch die schlech-
ten Risiken im Hinblick auf die Relation von erwarteter Schadenssumme s
s
und Ver-
sicherungspramie c sich ohne Police besser stellen.
Separierendes Gleichgewicht: Nur die schlechten Risiken kaufen die Police, da zwar
die Relation von s
s
und c attraktiv erscheint, vor dem Hintergrund der kleineren zu
erwartenden Schadenssumme s
g
die Police aber uberteuert erscheint. Es mag Falle
geben, in denen der Versicherungsnehmer auch dann noch mit nicht-negativen Gewin-
nerwartungen rechnen kann, typischerweise ist dies jedoch ein Fall, in dem der Markt
zusammenbricht.
Wie bereits angedeutet, hat der Versicherungsunternehmer in einem komplexeren Spiel
die Moglichkeit, zwei Kontrakte anzubieten. Auch hier soll nur die Idee anhand zweier Po-
licen veranschaulicht werden:
Police 1 (V
1
) verlangt eine hohe Versicherungspramie, gewahrt daf ur aber einen niedri-
gen Selbstbehalt. Dieser Vertrag ist f ur schlechte Risiken vorgesehen, die entsprechend zur
Kasse gebeten werden, die es aber insb. attraktiv nden, dass im Fall der Falle nur ein
niedriger Selbstbehalt zu zahlen ist. Die Pramie muss nat urlich den erwarteten Schadensfall
f ur die Versicherung abdecken.
Police 2 (V
2
) verlangt nur eine geringe Versicherungspramie, verlangt daf ur aber einen
hohen Selbstbehalt. Dieser Vertrag ist f ur die guten Risiken mageschneidert, da sie den
Schadensfall und damit den hohen Selbstbehalt wenig f urchten, und lieber die niedrige
Pramie nehmen.
Abbildung 5.6 zeigt die extensive Form dieses Spiels.
Natur
Kundeist
gutesRisiko
(q)
Versicherungsanbieter
Kundeist
schlechtesRisiko
(1-q)
Keinen Vertrag
anbieten
Kunde
Keinen Vertrag
anbieten
V
1
V
2
V
1
V
2
j
a
n
e
i
n j
a
n
e
i
n j
a
n
e
i
n j
a
n
e
i
n
Abbildung 5.6: Screening auf dem Versicherungsmarkt bei zwei Vertragsoptionen
Das Konzept des Versicherungsanbieters geht auf, wenn die mit den Pfeilen in Abbil-
dung 5.6 gekennzeichneten Gleichgewichte realisiert werden. Es handelt sich dann nat urlich
um ein separierendes Gleichgewicht, da die guten Risiken und die schlechten Risiken jeweils
andere Vertragsformen wahlen. Die Voraussetzungen f ur die Existenz dieses Gleichgewichts
konnen wie folgt beschrieben werden:
Beide Vertragsformen sind f ur den Versicherungsanbieter protabel.
Ein schlechtes Risiko muss sich durch V
1
besser stellen als durch V
2
sowie durch Verzicht
auf eine Versicherung.
Ein gutes Risiko muss sich durch V
2
besser stellen als durch V
1
sowie durch Verzicht
auf eine Versicherung.
5.5. ANWENDUNGEN 107
5.5 Anwendungen
5.5.1 Signalspiel auf dem Arbeitsmarkt (Spence 1973)
Spence (1973) formulierte ein klassisches Signalspiel, das die Rolle von Ausbildungsinve-
stitionen (wie z.B. ein wirtschaftswissenschaftliches Studium) untersucht. Die grundlegende
Idee dabei lautet wie folgt: Arbeitgeber sind nur unzureichend in der Lage, die tatsachli-
chen Fahigkeiten eines Bewerbers einzuschatzen. Man sieht es einem Bewerber nicht an der
Nasenspitze an, wie intelligent, anpassungsfahig und kreativ er ist. Ein sehr intelligenter, an-
passungsfahiger und kreativer Kopf kann auch nicht einfach zu seinem Wunscharbeitgeber
gehen und sagen: Seht her, ich bin sehr intelligent, anpassungsfahig und kreativ, weil ein
tumber, starrer und phantasieloser Bewerber ja das gleiche Interesse hat. Cheap talk ist
daher keine Moglichkeit, etwas uber seine echten Qualikationen glaubw urdig auszusagen.
1
Ein nahe liegendes Vehikel, etwas uber seine Fahigkeiten auszusagen, ist die formale
Qualikation, die man bspw. durch einen Universitatsabschluss erwirbt. Da dessen Erwerb
ja mit Aufwand verbunden ist, lauft man nicht in die cheap talk-Falle, insb. dann, wenn die
(monetaren, psychischen, . . . ) Kosten von den nicht beobachtbaren Fahigkeiten abhangen.
Die Idee ist dann, dass ein sehr intelligenter, anpassungsfahiger und kreativer Kopf einfacher
und eher an einen formalen Bildungsabschluss kommt als der tumbe, starre und phantasielose
Kommilitone. Ist dies der Fall, so wird die formale Qualikation als Signal f ur die
nicht beobachtbaren Fahigkeiten herangezogen. Das Frappierende daran ist, dass die
formale Qualikation uberhaupt nichts zu den tatsachlichen Fahigkeiten beitragen muss, per
se also vollig nutzlos sein kann, um dennoch die Signalfunktion aus uben zu konnen. In diesem
Fall konnen dann Universitaten oder andere Bildungseinrichtungen als relativ kostspielige
Generatoren von Signalen uber nicht beobachtbare Fahigkeiten interpretiert werden.
F ur die folgende Analyse werden nun zunachst die wichtigsten Symbole eingef uhrt: Die
unbeobachtbaren Fahigkeiten des Arbeiters werden durch bezeichnet, dessen beobachtbare
formale Bildung als e. Arbeiter produzieren einen Output y, wobei die Produktionsfunktion
allgemein
y = y (, e) (5.12)
lautet. Der bereits erwahnte Extremfall, dass die formale Qualikation per se wertlos
ist, ware gegeben durch
y
e
= 0, wodurch dann das zweite Argument in 5.12 verschwinden
w urde. In der hier prasentierten Version ist diese Eigenschaft von formaler Qualikation als
soziale Verschwendung angelegt; das Originalmodell von Spence (1973) und die sehr empfeh-
lenswerte Darstellung in Gibbons (1992), benutzen hingegen die allgemeinere Spezikation
5.12.
Arbeiter erhalten f ur ihre Arbeit einen Lohn w, der ggf. eine Funktion von e sein kann,
d.h.
w = w(e) . (5.13)
Zu beachten ist, dass in einem Pooling-Gleichgewicht diese Abhangigkeit nicht
existieren kann.
Damit das Signal der Bildung kein cheap talk ist, muss Bildung Kosten c verursachen,
wobei die Kosten auerdem von der Fahigkeit abhangen, d.h.
c = c (, e) (5.14)
1
Es gibt aber Situationen, in denen cheap talk, d.h. ein kostenloses Signal eine Wirkung zeitigen kann.
Daf ur ist es aber notwendig, dass unterschiedliche Sender ein jeweils anderes Interesse an der Reaktion des
Empfangers haben. Beim Signalspiel auf dem Arbeitsmarkt ist das nicht der Fall, weil alle ein Interesse an
einem moglichst hohen Lohn haben. F ur eine Charakterisierung von cheap-talk games vgl. Gibbons (1992),
ch. 4.3.
Die Auszahlung der Arbeiter u
A
hangt allgemein ab von w und c bzw. von w, e und ,
wahrend die Auszahlung der Unternehmer u
U
als Funktion y und w angesehen werden kann.
Daher kann auch die Kostenfunktion 5.14 direkt in die Nutzenfunktion eingebaut werden,
was im Beispiel dieses Abschnitts getan wird.
Betrachten wir also eine in ihrer Spezikation reichlich extreme, daf ur gut handhabbare
Form des Signalspiels auf dem Arbeitsmarkt. Die extensive Form ist in Abbildung 5.7 zu
sehen.
1
Die Natur macht hier den ersten Zug und weist allen Arbeitern eine Fahigkeit zu,
wobei diese mit der Wahrscheinlichkeit von jeweils 0,5 entweder den Wert 2 oder den Wert
5,5 annimmt. Der Arbeiter trit danach in Kenntnis dieser Fahigkeit seine formale Bildungs-
entscheidung, die hier wie schon die Fahigkeitsverteilung binar ist, d.h. e nimmt entweder
den Wert 0 oder 1 an. Die Kosten der Ausbildung sind direkt in der Nutzenfunktion u
A
()
enthalten. Im Modell von Spence konkurrieren nun zwei Unternehmen in Kenntnis von
e um den Arbeiter. Damit entspricht das Modell im Grunde nicht ganz der Struktur aus Ab-
bildung 5.4 auf Seite 102, da nun zwei Empfanger angesprochen werden. Die extensive Form
in Abbildung 5.7 breitet dieses Spiel jedoch nicht im Einzelnen aus, weil das Ergebnis sehr
einfach ist
2
: Die beiden Unternehmen uberbieten sich so lange, bis der angebotene Lohnsatz
dem erwarteten Output entspricht.
3
Dies ist in der Auszahlungsfunktion der Unternehmer
angegeben.
Abbildung 5.7: Signalspiel auf dem Arbeitsmarkt
Welche Gleichgewichte sind nun in diesem Spiel moglich?
Zunachst wird untersucht, ob ein Pooling-Gleichgewicht bei e = 0 existiert, d.h. ob es
ein Gleichgewicht gibt, bei dem weder die Arbeiter mit der hohen noch die mit der niedrigen
Fahigkeit eine formale Bildung wahlen. In diesem Fall waren die damit konsistenten beliefs
der Unternehmer gegeben durch
b ( = 2| e = 0) = b ( = 5, 5| e = 0) = 0, 5. (5.15)
1
Die Spezikationen sind entnommen aus Rasmusen (2001, p. 268).
2
Das Ergebnis ist wie gleich begr undet wird wirklich einfach, die Darstellung aber praktisch unmoglich,
da das Lohnangebot stetig variiert werden kann und daher keine endliche Zahl von

Asten diese Moglichkeiten
grasch abbilden kann.
3
Dies entspricht dem Ergebnis eines Bertrand-Wettbewerbs aus Abschnitt 3.7.2 auf Seite 57, wobei der
Wettbewerb im Signalspiel auf dem Faktormarkt ausgetragen wird, wahrend sich die Darstellung in 3.7.2
auf Bertrand-Wettbewerb auf dem G utermarkt bezog.
Die beliefs abseits des (moglichen) Gleichgewichtspfads sind dann ebenfalls fast trivia-
lerweise gegeben durch
b ( = 2| e = 1) = b ( = 5, 5| e = 1) = 0, 5. (5.16)
Die erwartete Produktion ist dann
y = E () = 0, 5 2 + 0, 5 5, 5 = 3, 75. (5.17)
Die Nullgewinnbedingung stellt sicher, dass
w = y = 3, 75 (5.18)
Der Nutzenwert sowohl f ur die fahigeren als auch f ur die unfahigeren Arbeiter ist dann
gegeben durch
u
A
() = w
8e
u
A
( = 5, 5) = u
A
( = 2) = 3, 75 (5.19)
Es bleibt zu pr ufen, ob sich eine der beiden Arbeitergruppen f ur die in (5.15) und (5.16)
gegebenen beliefs der nternehmer durch Abweichung besser stellen konnte. Da f ur e = 1 der
Nutzen sowohl der fahigeren wie auch der weniger fahigen Arbeiter sinkt, existiert dieser An-
reiz nicht. Mit anderen Worten: Das beschriebene Pooling-Szenario ist ein perfektes
Bayesianisches Gleichgewicht.
Allerdings ist dieses Gleichgewicht nicht das einzig denkbare Gleichgewicht. Untersuchen
wir also, ob das folgende separierende Gleichgewicht ebenfalls die Bedingungen f ur ein
perfektes Bayesianisches Gleichgewicht erf ullt:
Die fahigeren Arbeiter wahlen e = 1, die weniger fahigen e = 0. Die Unternehmen formen
ihre beliefs gema
b ( = 2| e = 0) = b ( = 5, 5| e = 1) = 1 (5.20)
auf dem Gleichgewichtspfad und
b ( = 2| e = 1) = b ( = 5, 5| e = 0) = 0 (5.21)
abseits des Gleichgewichtspfads. Dementsprechend konnen nun die Lohne dierenziert wer-
den, d.h. beide Gruppen erhalten (aufgrund der Null-Gewinnbedingung) ihre jeweilige Pro-
duktivitat, d.h.
w(e) =
_
2 f ur e = 0
5, 5 f ur e = 1
. (5.22)
Damit sind die Nutzen der beiden Arbeitergruppen gegeben durch
u
A
(w, , e) = w
8e
=
_
5, 5
8
5,5
4, 05 f ur e = 1, = 5, 5
2 f ur e = 0, = 2
. (5.23)
Wenig uberraschend, gewinnen die Fahigeren und verlieren die weniger Fahigen ge-
gen uber dem Pooling-Gleichgewicht. Zu untersuchen ist aber auch hier zunachst, ob Ab-
weichungen vom unterstellten Verhalten durch die Arbeiter f ur die in (5.20) und (5.21) cha-
rakterisierten beliefs und damit f ur das Lohnangebotsverhalten (5.22) optimal waren. F ur
einen der fahigeren Arbeiter ist dies oensichtlich nicht der Fall, da er bei e = 0 nur einen
Lohn in Hohe von w = 2 bekame, der sich in u
A
(w = 2, e = 0, = 5, 5) = 2 ubersetzt was
oensichtlich geringer ist als der Wert in Hohe von ca. 4,05. Wenn sich der weniger fahige
Arbeiter zu einer formalen Ausbildung entschlieen w urde, erhielte er gema (5.22) auch den
hohen Lohn, w urde aber den Nutzen u
A
(w = 4, 05, e = 1, = 2) 4, 05
8
2
0, 05 < 2
realisieren. F ur ihn lohnt sich also ein Abweichen ebenfalls nicht. Damit ist gezeigt, dass
auch diese Konstellation ein perfektes bayesianisches Gleichgewicht ist. Selbst in diesem sehr
einfachen Spiel gibt es also zwei vollig verschiedene Gleichgewichte, ein perfektes
bayesianisches Pooling-Gleichgewicht und ein perfektes bayesianisches separie-
rendes Gleichgewicht.
Eine Bemerkung zur Natur des separierenden Gleichgewichts ist noch angebracht: Da
beim

Ubergang vom Pooling-Gleichgewicht bei e = 0 zum separierenden Gleichgewicht
die beiden Gruppen unterschiedlich tangiert werden, existiert kein klares Pareto-Ranking
zwischen den beiden Situationen. Dennoch macht ein Blick auf (5.19) und (5.23) klar, dass
der Zugewinn der Fahigeren im separierenden Gleichgewicht geringer ist als der Verlust der
weniger Fahigen. Anders gesagt: Die weniger Fahigen hatten prinzipiell die Moglichkeit,
die Fahigen durch Bestechung am Erwerb einer formalen Qualikation zu hindern. Dies
reektiert die in diesem Modell getroene Annahme, dass formale Qualikation reine
Verschwendung ist. Dies ist nat urlich keineswegs notwendig.
Abschlieend wird noch gezeigt, dass das zweite prinzipiell denkbare Pooling-Gleichgewicht
die Situation, in der alle Arbeiter eine formale Ausbildung durchlaufen hier
nicht die Eigenschaft eines perfekten bayesianischen Gleichgewichts erf ullt.
Die beliefs waren in dieser Situation gegeben
b ( = 2| e = 1) = b ( = 5, 5| e = 1) = 0, 5 (5.24)
auf dem unterstellten Gleichgewichtspfad und
b ( = 2| e = 0) = b ( = 5, 5| e = 0) = 0, 5 (5.25)
abseits dieses Pfades.
Der Lohn ware aufgrund der Nicht-Unterscheidbarkeit der beiden Fahigkeitsgruppen wie
in (5.17) und (5.18) durch w = 3, 75 gegeben.
Die Auszahlungswerte waren dann
u
A
(w = 3, 75, , e = 1) = w
8e
=
_
3, 75
8
5,5
2, 30 f ur = 5, 5
3, 75
8
2
= 0, 25 f ur = 2
(5.26)
Wieder muss gepr uft werden, ob f ur die beliefs (5.24) und (5.25) Abweichung lohnt.
Dies ist diesmal der Fall, da die Entscheidung f ur e = 0 ein Nutzenniveau von
u
A
(w = 3, 75, , e = 0) = w
8e
= 3, 75 (5.27)
implizieren w urde, so dass f ur beide Gruppen von Arbeitern die Entscheidung f ur e = 0
vorzuziehen ware und gezeigt ist, dass ein Pooling-Gleichgewicht bei e = 1 nicht existiert.
F ur die weniger fahigen Arbeiter kann das Argument sogar noch verstarkt werden, da sich
f ur diese ein hoheres Auszahlungsniveau bei e = 0 ergabe, selbst wenn sie dann eindeutig als
weniger fahig eingestuft w urden was in den beliefs (5.24) und (5.25) aber nicht enthalten
ist. In diesem Fall ware ihre Auszahlung immer noch u
A
= 2 und damit hoher als in (5.26).
Die hier vorgestellte Variante des Modells von Spence (1973) ist denkbar einfach, zeigt
jedoch die wichtigsten Merkmale. Auf der Hand liegende Erweiterungen waren die folgenden:
Anstelle der hier eingef uhrten Annahme vollig unproduktiver Signale (d.h. die formale
Bildung tragt nichts zur Produktivitat bei) kann man auch produktive Signale
unterstellen, und damit eine Produktionsfunktion wie in Gleichung (5.12). Dies macht
die Modelle zweifelsohne realistischer.
Anstelle von binaren Auspragungen der Fahigkeiten und Signale (fahiger oder weniger
fahiger Arbeiter; formale Bildung oder keine formale Bildung) konnen stetig variier-
bare Variablen angenommen werden oder wenigstens mehr als zwei Zustande zuge-
lassen werden. Dies sorgt dann bspw. daf ur, dass nicht nur ein separierendes Gleich-
gewicht existiert, sondern dass z.B. vor dem Hintergrund der passenden beliefs alle
auf jegliche formale Bildung verzichten oder alle einen mittleren Bildungsgrad wahlen.
Weiterhin ist es hier denkbar, dass es zu partiell separierenden Gleichgewichten
kommt, in denen sich z.B. die GanzGuten von MittelGuten und den GanzSchlechten
mit ihrer Bildungsentscheidung absetzen, ein Unternehmer aber nicht unterscheiden
kann, ob er einen MittelGuten oder GanzSchlechten vor sich hat.
Vollig auen vor gelassen wurde hier die Moglichkeit von Gleichgewichten in ge-
mischten Strategien. So ist bspw. denkbar, dass ein Arbeiter mit einer bestimmten
Fahigkeit im Gleichgewicht zwischen zwei Bildungsentscheidungen stochastisch wahlt,
der Unternehmer also wieder nicht mit Sicherheit von dem Signal auf die Fahigkeit
schlieen kann. In diesem Fall ist dann f ur die Bildung der beliefs auch in dem einfa-
chen Modell wieder die Verwendung der Bayesianischen Regel notwendig (vgl. Gibbons
1992, p. 202 .)
Diese Auistung sowie die obige Analyse des sehr einfachen Modells machten jedoch
bereits die folgenden Dinge klar, die auch auf andere Modellierungen dynamischer Spiele
mit unvollkommener Information ubertragbar sind:
Auch bei Fokussierung auf perfekte bayesianische Gleichgewichte in reinen Strategien
bleiben typischerweise mehrere mogliche Gleichgewichtskonstellationen von Strategien
und beliefs ubrig, die ganz unterschiedliche qualitative Eigenschaften aufweisen.
Von daher hilft auch hier die Spieltheorie nur im Ausnahmefall dabei, ein eindeutiges
Gleichgewicht zu identizieren. Multiple Gleichgewichte sind eher die Regel als die
Ausnahme.
Die

Uberlebensfahigkeit von Gleichgewichten kann von relativ geringf ugigen
Details der Spezikation abhangen.
Signalspiele erfordern ein sehr hohes Ma an Durchblick der beteiligten Spieler.
Anders gesagt: Die Anforderungen der Rationalitatspramisse sind in solchen
Situationen relativ hoch. Dennoch dienen diese Spiele dazu, empirische Ratsel, wie
eben die hohe Bedeutung von formalen Bildungsabschl ussen jedenfalls in Professionen,
in denen die Fahigkeit schwer zu messen ist, zu verstehen.
1
5.5.2 Geldpolitik IV: Das Barro-Gordon-Modell bei unbekannter
Inationsaversion der Zentralbank
Auch im Kontext dynamischer Spiele mit unvollkommener Information kann eine auf das
Grundmodell von Barro/Gordon (1983) aufbauende Modikation erlautert werden. Dazu
lassen wir alle Komplikationen durch Timing und der moglichen Inationsaversion des pri-
vaten Sektors beiseite und konzentrieren uns auf das Grundmodell des Abschnitts 3.7.4 auf
Seite 60, das allerdings nun in einem 2-Perioden-Kontext gespielt wird. Das Modell dieses
Abschnitts basiert auf Vickers (1986) und ist auch in Gibbons (1992), p. 208 . kurz be-
schrieben. Didaktisch wird mit diesem Modell vor allem der Zweck verfolgt, zu zeigen, dass
man ein Signalspiel als Teil eines umfassenderen Spiels modellieren kann. Die Infor-
mationsunvollkommenheit betrit die Inationsaversion der Zentralbank. Diese war in der
Verlustfunktion 3.38, die hier noch einmal aufgeschrieben werden soll
L
G
=
2
+ (y y)
2
(5.28)
1
Juristen sind daf ur ein wohl besonders gut geeignetes Beispiel; hier ist die formale Ausbildung (mit
genauem Ergebnis etc.) extrem wichtig f ur Einstellungsentscheidungen, weil die relevanten Fahigkeiten kaum
in einem Einstellungsgesprach abgepr uft werden konnen. Dagegen kommt ein Formel I-Pilot sogar ohne
F uhrerschein aus, weil ein potentieller Nachfolger von Michael Schumacher im Grunde nur ein paar Runden
fahren muss um in etwa nachzuweisen, mit welcher Wahrscheinlichkeit (und Geschwindigkeit) er um eine
enge Kurve kommt.
mit bezeichnet.
1
Die privaten Wirtschaftssubjekte wissen nicht genau, ob ein sehr
inationsaverser Falke oder eine nur maig inationsaverse Taube die Politik dominiert.
Bekannt ist lediglich, dass
=
_

T
mit Wahrscheinlichkeit p
F
mit Wahrscheinlichkeit (1 p)
, (5.29)
wobei nat urlich gelten muss, dass
F
>
T
.
Der Ablauf des Spiels kann durch die Zeitachse in Abbildung 5.8 charakterisiert werden;
dieses Hilfsmittel bietet sich hier v.a. deswegen an, weil die Handlungsvariablen jeweils stetig
variierbar sind und daher ein Spielbaum nicht mehr gezeichnet werden kann.
Abbildung 5.8: Timing im Modell von Vickers (1986).
Bei der folgenden Charakterisierung der Losung wird eine mogliche Diskontierung der
Auszahlungen vermieden, so dass die Auszahlungen in beiden Perioden einfach aufaddiert
werden konnen.
Im Hinblick auf das 2-Periodenspiel ndet die bereits bekannte Methode der R uckwart-
sinduktion Verwendung. Zunachst geht es also um die Bestimmung von
2
. F ur gegebene
Inationserwartungen
e
2
wird die in Abschnitt 3.7.4 auf Seite 60 gefundene Reaktionsfunk-
tion (3.44) diese Frage beantworten. Mit der hier notwendigen Zeitindizierung lautet diese
2
=

i
+
2
_
e
2
+ ( 1) y
N
_

2
(
e
2
,
i
) , i = F, T, (5.30)
wobei angenommen sei, dass der nat urliche Output uber die Zeit hinweg konstant ist. Die
letzte Schreibweise f ur die Reaktionsfunktion dient nur der bequemeren Notation.
Als nachstes sind die Inationserwartungen
e
2
zu bestimmen. Der private Sektor erleidet
einen Verlust in Hohe der quadrierten Abweichung der tatsachlichen von der erwarteten
Inationsrate. Vor dem Hintergrund der unvollkommenen Information uber die wahre Natur
des Zentralbankers (5.29) und dessen Verhalten (5.30) ist die Aufgabe des privaten Sektors
als gegeben durch
min
e
2
b (
2
(
e
2
,
T
)
e
2
)
2
+ (1 b) (
2
(
e
2
,
F
)
e
2
)
2
e
2
=
e
2
(b, ...)
, (5.31)
wobei b den belief des privaten Sektors bzgl. der Wahrscheinlichkeit, dass eine Taube die
Zentralbank leitet, bezeichnet. (5.30) und (5.31) bestimmen das Ergebnis in der zweiten
Periode f ur gegebene beliefs.
1
Alle Symbole etc. werden genau so verwendet wie in Abschnitt 3.7.4 auf Seite 60.
Nun gilt es wieder zwei unterschiedliche Gleichgewichtskonstellationen zu unterscheiden,
namlich separierende und Pooling-Gleichgewichte.
In einem Pooling-Gleichgewicht ist das Signal der Zentralbank
1
wertlos, d.h. die
beliefs sind gegeben durch b = p. Die Inationserwartungen f ur Periode 2 werden gema
der Losung von (5.31) gebildet, die Zentralbank verhalt sich in Abhangigkeit von ihrem Typ
gema (5.30). Damit ist das Signalspiel zu Ende.
Hingegen beinhaltet ein separierendes Gleichgewicht Informationen uber den Typ
des Zentralbankers. Leitet der private Sektor aus der Beobachtung von
1
ab, dass es sich
um eine Taube (einen Falken) handelt, wird der belief aufdatiert auf p = 1 (p = 0). Die
Erwartungsbildung gema (5.31) wird entsprechend angepasst, was zusammen mit (5.30)
wieder das Gleichgewicht ergibt.
Selbst in diesem relativ einfachen Kontext ist die Untersuchung, ob eine bestimmte Kom-
bination von Verhaltensweisen und beliefs ein perfektes Bayesianisches Gleichgewicht, eine
echte Knochenarbeit, die hier nicht im Einzelnen geleistet werden soll. Wie immer gilt es,
die Konsequenzen einer Verhaltensweise gegeben die beliefs durchzuspielen und zu schauen,
ob an einer Stelle einer der Akteure einen Anreiz hat, von der vorgeschlagenen Strategie ab-
zuweichen. Als Beispiel sei die folgende Sequenz genannt, deren Validitat Schritt f ur Schritt
uberpr uft werden kann:
In Periode 1 bilden sich Inationserwartungen gema min
e
1
p (
1
(
e
1
,
T
)
e
1
)
2
+
(1 p) (
1
(
e
1
,
F
)
e
1
)
2
mit
1
(
i
) =

i
+
2
_
e
1
+ ( 1) y
N
_
, i = T, F.
Die Inationsrate in Periode 1 ist gegeben durch
1
(
i
) =

i
+
2
_
e
1
+ ( 1) y
N
_
, i =
T, F.
Die beliefs bzgl. des Typs des Zentralbankers f ur die Erwartungsbildung in der zweiten
Periode sind gegeben durch b =
_
0
1
=
1
(
F
)
1
1
=
1
(
F
)
.
In Periode 2 ist die Erwartungsbildung gegeben durch (5.31), wobei die im letzten
Schritt ermittelten beliefs Ber ucksichtigung nden.
In Periode 2 ist die Inationsrate gegeben durch (5.30) unter Ber ucksichtigung der
gerade ermittelten Inationserwartungen.
Kapitel 6
Verhandlungen
6.1 Lernziele
Verhandlungen sind auf allen moglichen Ebenen etwas fast Alltagliches. Die Palette dieser
Situationen reicht von der Entscheidungsndung zweier Personen uber die beste Alternati-
ve, das (gemeinsame) Wochenende zu verbringen uber bilaterale Lohnverhandlungen zwi-
schen Arbeitnehmern und Arbeitgebern bzw. deren Vertreter bis hin zu internationalen, bi-
oder multilateralen Verhandlungen beispielsweise uber Handelsbeschrankungen oder deren
Lockerung. Diese Liste liee sich fast beliebig verlangern und zeigt einmal mehr die groe
Bedeutung der Spieltheorie als Analysemethode.
In diesem Kapitel soll vermittelt werden, wie spieltheoretische Methoden zur Model-
lierung und Losung von Verhandlungssituationen genutzt werden konnen. In Abschnitt 6.2
werden zunachst einige methodische Vorbemerkungen gemacht, da sich in der Spieltheo-
rie zwei sehr verschiedene Arten der Modellierung von Verhandlungen herausgebildet haben,
namlich im Rahmen der Theorie kooperativer Spiele und als non-kooperative Spielsituation.
Abschnitt 6.3 auf Seite 117 widmet sich danach der Theorie non-kooperativer Verhand-
lungen und leitet die Losung f ur eine sehr allgemeine Klasse von Verhandlungssituationen
ab. Den analytischen Rahmen bildet dabei das Rubinstein-Spiel, das zwar nur in einer
relativ einfachen Form dargestellt wird; auf der Hand liegende Erweiterungen, die alle auf
inzwischen bereits bekannten Modellierungsprinzipien beruhen, lassen hier jedoch eine sehr
weitgehende Abbildung auch komplexerer Verhandlungssituationen (v.a. die Einbeziehung
von Unsicherheit) zu.
Der dogmengeschichtlich altere Ansatzpunkt der Modellierung von Verhandlungen er-
folgte im Rahmen der Theorie kooperativer Spiele. Dieser Ansatz und zwei verschiede-
ne axiomatisch begr undete Losungen, die Nash-Verhandlungslosung sowie die Kalai-
Smorodinsky-Losung, werden in Abschnitt 6.4 auf Seite 124 behandelt.
In Abschnitt 6.5 auf Seite 130 werden auch in diesem Kapitel einige Anwendungen die
Verwendung der Konzepte in konkreten Verhandlungssituationen demonstrieren.
Alle Modellierungen in diesem Kapitel gehen aus didaktischen Gr unden von nur jeweils
zwei Verhandlungspartnern aus. Die Erweiterung auf mehr beteiligte Parteien ist von der
Idee her einfach moglich. Allerdings werden die Situationen deutlich komplizierter (aber
eben nicht komplexer), so dass hier darauf verzichtet wird.
6.2 Methodische Vorbemerkung
Trotz der bereits im letzten Abschnitt begr undeten Relevanz von Verhandlungen sind diese
in den meisten okonomischen Modellen nicht wirklich enthalten. So wird beispielsweise die
Marktpreisbildung als Ergebnis einer anonymen Interaktion zwischen vielen Individuen
115
116 KAPITEL 6. VERHANDLUNGEN
auf wenigstens einer Marktseite betrachtet womit Verhandlungen keine Rolle mehr spielen.
Allenfalls wird darauf hingewiesen, dass im Hintergrund die gedankliche Konstruktion eines
Walrasianischen Auktionators f ur den Ausgleich von Angebot und Nachfrage auf
einem Markt oder einem System von Markten sorgt.
Dies liegt nicht etwa daran, dass die Wirtschaftstheorie die Bedeutung von Verhandlun-
gen nicht erfasst hatte. Der Grund f ur die weitgehende Absenz von Verhandlungen in den
Standardmodellen der okonomischen Theorie ist vielmehr die schwierige Modellierbar-
keit dieses sozialen Phanomens. Reale Verhandlungen sind namlich ein durchaus komplexer
Prozess, bei dem psychologische Aspekte, das framing der Verhandlungen, die Reputation
der Verhandlungspartner, deren Konzentrationsfahigkeit und viele Dinge mehr eine wich-
tige Rolle spielen. Das rechte Wort zur rechten Zeit, die personliche Chemie zwischen
den Personen am Verhandlungstisch haben ohne Zweifel eine in konkreten Verhandlungs-
situationen nicht zu unterschatzende Bedeutung.
1
Die Spieltheorie ist nicht in der Lage
und intendiert auch gar nicht diese weichen Aspekte, deren Bedeutung hier gar nicht
in Abrede gestellt werden soll, abzubilden. Daf ur gelingt es ihr aber eher, eine Verhand-
lungssituation in ihren wesentlichen Elementen zu beschreiben bzw. auch darauf
aufmerksam zu machen, was es f ur eine solche Beschreibung braucht und insbesondere auch
eine konkrete Losung daf ur anzugeben. Im Kern sind dies drei Elemente, namlich die Be-
schreibung
der Praferenzen der Verhandlungspartner;
der moglichen Auszahlungen bei erfolgreicher Verhandlung;
der Auszahlungen bei einem Scheitern der Verhandlung.
Eine Verhandlungssituation ist immer dadurch gekennzeichnet, dass ein Verhandlungs-
ergebnis eine Pareto-Verbesserung relativ zu den Auszahlungen bei Scheitern der
Verhandlungen erlaubt. Ware dies nicht der Fall, hatte zumindest eine der beiden Par-
teien keinerlei Anreiz, sich uberhaupt auf eine Verhandlung einzulassen und das Problem
ware trivial.
2
In einem guten Teil dieses Kapitels wird der gemeinsame Gewinn bei erfolgrei-
chen Verhandlungen exogen vorgegeben. Damit liegt eine Verhandlung vor, die als Splitting
the Pie bzw. Verteilungsspiel bezeichnet werden kann. In den Anwendungen am Ende des
Kapitels wird jedoch auch ein sich endogen ergebender Gewinn aus den Verhandlungen
modelliert.
Das Verhandlungsproblem kann in seiner einfachsten Form (mit exogener Gesamtaus-
zahlung, die hier den Wert 1 annehmen moge, und mit auf Null normierten Auszahlungen
f ur beide Verhandlungspartner bei Scheitern der Verhandlungen) in Abbildung 6.1 auf der
nachsten Seite dargestellt werden. Alle Allokationen (bzw. Verhandlungsergebnisse) auf der
ezienten Grenze sind moglich, die Verhandlungslosung muss nun noch spezizieren, ob die
eziente Grenze erreicht wird und falls ja, welcher Punkt darauf.
Wenn das Verhandlungsproblem dann formuliert ist, gibt es zwei prinzipiell verschie-
dene Vorgehensweisen f ur die Bestimmung des Verhandlungsergebnisses:
Beginnend mit dem zweiten wesentlichen Beitrag zur Spieltheorie von John Nash aus
dem Jahr 1950, der Nash-Verhandlungslosung
3
, hat sich die kooperative Spiel-
theorie der Losung des Verhandlungsproblems wie folgt genahert: Es werden plausi-
ble, einleuchtende Kriterien formuliert, die eine Verhandlungslosung aufweisen sollte.
1
Neben dem Studium der Spieltheorie konnen daher auch Dinge wie Rollenspiele oder andere gruppendy-
namische

Ubungen durchaus auf eine erfolgreiche Verhandlungsf uhrung vorbereiten. Dies kann man trotz
der methodischen Welten die hier dazwischen liegen mogen durchaus als Komplement zum Studium der
Spieltheorie ansehen.
2
Man kann sich darunter die Verhandlung vorstellen, ob ein (zahlungsfahiger) und dem Wirt namentlich
bekannter Gast in der Kneipe seine Zeche bezahlt. Da er dazu juristisch verpichtet ist und der Wirt diesen
Anspruch auch durchsetzen kann, wird er sich auf diese Frage typischerweise nicht ernsthaft einlassen.
3
Vgl. Nash (1950b).
6.3. NICHT-KOOPERATIVE VERHANDLUNGEN 117
1
u
2
u
1
1
0
effizienteGrenze
Abbildung 6.1: Das Verteilungsspiel: splitting the pie
Danach wird eruiert, welche Losungsmethode diese Eigenschaften generiert.
1
Diese
Vorgehensweise ist die historisch altere Methode, wird hier jedoch aufgrund der not-
wendigen ad hoc Annahmen als zweite behandelt. Der entsprechende Abschnitt betritt
damit gegen uber den vorhergehenden Kapiteln konzeptionelles Neuland.
Alternativ dazu hat sich seit dem bahnbrechenden Beitrag von Rubinstein (1982) auch
eine non-kooperative Theorie der Verhandlungen entwickelt, die eine ganzlich
andere Modellierungsstrategie verfolgt: Es wird unterstellt, dass die beteiligten Ak-
teure abwechselnd Angebote unterbreiten, die von dem (den) Verhandlungspartner(n)
akzeptiert oder zur uckgewiesen werden konnen. Sobald ein Angebot akzeptiert wird,
ist das Spiel zu Ende. Damit bewegen wir uns in konzeptionell bekanntem Fahrwas-
ser, da hier einfach eine dynamische (und ggf. endlich oder unendlich oft wiederholte)
Spielsituation vorliegt, die bereits analysiert wurde.
6.3 Nicht-kooperative Verhandlungen
Dieser Abschnitt unterscheidet sich von den vorhergehenden Kapiteln 3-5 nicht fundamental
in dem Sinn, dass eine prinzipiell andere Situation untersucht werden w urde, f ur die erst
wieder ein passendes Losungskonzept entwickelt werden m usste. Vielmehr handelt es sich bei
der spieltheoretischen Analyse von Verhandlungen letztlich nur um die Anwendung bereits
bekannter Konzepte. Diese Bemerkung impliziert (nat urlich) keineswegs, dass es in diesem
Abschnitt nichts zu lernen gibt, sondern dient dazu, dass man sich die Verbindung zwischen
den bisher eingef uhrten Konzepten und deren Anwendungen im Kontext der Modellierung
von Verhandlungen immer vor Augen halt.
Wie bereits erlautert, bildet die non-kooperative Spieltheorie einen Verhandlungsprozess
durch die Abfolge alternierender Angebote ab. Daher spricht man auch von sequentiellen
Verhandlungen (sequential bargaining). Zunachst wird im Folgenden ein endlicher Zeit-
horizont unterstellt, d.h. die Akteure haben nur eine begrenzte Zahl von Moglichkeiten, ein
Angebot zu machen. Danach wird diese Situation verallgemeinert zu einem Spiel, in dem bis
zur Einigung potentiell unendlich viele alternierende Angebote gemacht werden
konnen.
1
Die Einordnung in die kooperative Spieltheorie verdankt sich der Tatsache, dass man zur Losung
des Verhandlungsproblems letztlich eine Konstruktion benotigt, die die Nutzenfunktionen beider Akteure
ber ucksichtigt. Dies ist zwar nicht dasselbe wie die Maximierung der gemeinsamen Nutzensumme (was eine
nahe liegende Konkretisierung von Kooperation ware), geht aber ein gutes St uck in diese Richtung.
6.3.1 Verteilungsspiel I: Endlicher Zeithorizont
Angenommen, Spieler 1 und Spieler 2 spielen das in Abbildung 6.1 auf der vorherigen Seite
dargestellte Verteilungsspiel, dem nun aber noch die folgende zeitliche Struktur
1
gegeben
wird, die in Abbildung 6.2 zu sehen ist.
2
In Periode 1 macht Spieler 1 ein Angebot f ur die
Teilung des e, dieser Vorschlag besteht in den Anteilen s
1
f ur Spieler 1 und damit (1 s
1
)
f ur Spieler 2. Dieser kann den Vorschlag akzeptieren oder ablehnen. Bei Akzeptanz endet
das Spiel mit den entsprechenden Auszahlungen. Wenn Spieler 2 jedoch ablehnt, muss er
seinerseits einen Vorschlag machen, der wiederum einen Anteil f ur Spieler 1, namlich s
2
(der
Index bezieht sich auf die Periode, nicht auf den Spieler!) und dementsprechend (1 s
2
)
f ur Spieler 2 speziziert. Nun ist es Spieler 1, der den Vorschlag ablehnen oder akzeptieren
kann. Akzeptiert er, endet das Spiel mit der Realisierung des Vorschlags von 2, wenn nicht
endet das Spiel mit Auszahlungen von Null f ur jeden. Abbildung 6.2 zeigt also letztlich
einfach ein dynamisches Spiel bei vollkommener Information in seiner extensiven Form, d.h.
als Spielbaum. In Kapitel 4 wurden daher im Prinzip alle konzeptionellen Voraussetzungen
f ur die Analyse dieser Situation geschaen wie im Lauf der Entwicklung der Losung dieser
Verhandlungssituation deutlich werden sollte.
Abbildung 6.2: Endliche sequentielle Verhandlung
Die Losung des Problems besteht nun in der Suche nach dem teilspielperfekten
Gleichgewicht, das (wie in Kapitel 4) per R uckwartsinduktion gefunden werden kann. In
Periode 2 hat Spieler 2 das Vorschlagsrecht. Da Spieler 1 nur eine take or leave it-Wahl
hat, kann Spieler 2 den Vorschlag 1 s
2
= 1, d.h. s
2
= 0 machen. Spieler 1 ist indierent
und akzeptiert den Vorschlag.
3
Das Vorschlagsrecht in der letzten Periode zusammen mit
der Auszahlung von Null bei Scheitern der Verhandlung f ur den Gegenspieler verschat hier
Spieler 2 also eine sehr weitreichende Machtposition.
F ur die Entscheidung in der ersten Periode durchschauen beide Spieler annahme-
gema die gerade geschilderte Logik in Periode 2. Insbesondere wei Spieler 1, dass jeder
Vorschlag von ihm durch Spieler 2 abgelehnt werden wird, wenn dieser dem Spieler 2 nicht
mindestens die gerade geschilderte Auszahlung gewahrt. Wenn zwischen den Perioden nicht
abgezinst wird, ist Spieler 1 vollig indierent zwischen jedem Vorschlag s
1
[0, 1]. s
1
= 0
1
Es ist eine instruktive

Ubung, sich zu uberlegen, welche Strategiekombinationen ein Nash-Gleichgewicht
in einem statischen Spiel (in dem beide Spieler simultan ihre Oerten machen) darstellen. Antwort: Es sind
alle Vorschlage, deren Summe gleich dem exogen festgelegten Preis entspricht.
2
Verhandlungskosten werden hier nicht explizit gemacht, konnten aber leicht aufgenommen werden, in-
dem die Auszahlungen an den Endknoten des Spiels um die wahrend der Verhandlung anfallenden Kosten
korrigiert werden.
3
Man konnte hier die Indierenz aufheben, in dem Spieler 2 seinem Kontrahenten eine minimale po-
sitive Summe uberlasst. Diese unnotige Komplikation wird hier vermieden. Man beachte dabei, dass die
Rationalitatspr amisse auch mit der Akzeptanz sehr ungleicher Verhandlungsergebnisse konsistent ist, wenn
der benachteiligte Spieler keine bessere Alternative durchsetzen kann. Fairness-
Uberlegungen spielen hier

keine Rolle.
w urde von 2 sofort akzeptiert, alles andere abgelehnt. Von daher ist in diesem Fall s
1
= 0
und dementsprechend 1 s
1
= 1 also die denkbar krasseste Ungleichverteilung das
teilspielperfekte Gleichgewicht dieser Verhandlungssituation.
Wird zwischen den Perioden abdiskontiert
1
, so ist der in der zweiten Periode erreichbare
e f ur Spieler 2 aus Sicht der Periode 1 nur noch 1 e wert, wobei 0 < 1 wieder den
Diskontfaktor bezeichnet. Dementsprechend wird Spieler 2 auf ein Angebot des Spielers 1
in der ersten Periode eintreten, das ihm dann bereits einen Anteil sichert, d.h.
(1 s
1
) = s
1
= 1 (6.1)
ist das Angebot, das Spieler 1 in Periode 1 machen wird und auf das Spieler 2 eintreten
wird, da er sich auch durch seine Machstellung in Periode 2 nicht besser stellen kann. 6.1
ist also die teilspielperfekte Losung dieser Verhandlungssituation. F ur = 1 impliziert
diese Losung nat urlich die zuvor abgeleitete vollige Ungleichverteilung im Fall ohne zeitliche
Diskontierung.
Drei Merkmale dieser Losung verdienen besondere Erwahnung:
Wird die sequentielle Verhandlung nach einer ex ante festgelegten und bekannten Zahl
von Runden (im Beispiel: 2) abgebrochen, so hat derjenige Spieler einen Vorteil,
der das Recht hat, den letzten Vorschlag zu machen.
Dieser Vorteil ist umso groer, je niedriger die unterstellte Zeitpraferenzrate (d.h.
je naher der Diskontfaktor bei dem Wert 1 liegt) ist. Ohne Abdiskontierung geht der
gesamte Kooperationsgewinn an den Spieler, der den letzten Vorschlag macht.
Im Fall mit Diskontierung (d.h. < 1) wird das Spiel in jedem Fall gleich in
der ersten Periode beendet.
2
Der Spieler mit dem Nachteil, in der letzten Periode
keinen Vorschlag machen zu konnen, kann durch die Diskontierung einen Teil des
Verhandlungsgewinns an sich ziehen. Dieses Ergebnis ist intuitiv verstandlich, da das
einzige Drohpotential des Spielers 1 darin besteht, die Entscheidung uberhaupt erst
in die zweite Periode zu verlagern. Sein durch diese Macht erreichbarer Anteil an dem
Verhandlungsgewinn wird umso hoher sein, je hoher die Zeitpraferenzrate ist, d.h. je
niedriger der Diskontfaktor ist.
Nat urlich kann man das Spiel in Abbildung 6.2 auf der vorherigen Seite noch um die
Moglichkeit weiterer alternierender Angebote erweitern mit dem klaren Ergebnis, dass diese
Ausdehnung das Drohpotential durch die mogliche Verschiebung der Auszahlungen am Ende
des Spiels ebenfalls vergroert.
6.3.2 Verteilungsspiel II: Unendlicher Zeithorizont, Rubinstein-Spiel
Es ist nicht ganz einfach, sich ein Umfeld vorzustellen, in dem tatsachlich einer der verhan-
delnden Parteien ein letztes Wort zugestanden wird. Typischerweise laufen Verhandlungen
ohne einen klar denierten Endpunkt ab. Und selbst wenn dieser zeitlich deniert ware (z.B.
durch das Ende der Friedenspicht bei Tarifverhandlungen oder durch das Auslaufen jedes
anderen Vertrags uber dessen Verlangerung man verhandeln kann), besteht kein Anlass zur
Vermutung, dass diese Limitation auch festlegt, welche der Verhandlungsparteien ein
1
Die Frage, ob dies von Bedeutung ist oder nicht, kommt auf den konkreten Kontext an. Wenn die
Angebote und Gegenangebote sofort hintereinander gemacht werden konnen, kann man die Abdiskontierung
getrost vernachlassigen, wenn hingegen langere Intervalle dazwischen liegen, so muss das ber ucksichtigt
werden.
2
Ohne Diskontierung sind die Verhandlungspartner letztlich indierent, zu welchem Zeitpunkt das Spiel
den beschriebenen Ausgang ndet, d.h. gleich in Periode 1 oder erst in Periode 2.
letztes Angebot machen kann. Daher ist Abschnitt 6.3.1 auf der vorherigen Seite im Grun-
de nur eine erste Annaherung an die Modellierung einer Verhandlung mit alternierenden
Angeboten.
Viel plausibler ist es, von einem unbegrenzten Zeithorizont auszugehen, d.h. eine Struktur
wie in Abbildung 6.3 zu unterstellen. Diese Struktur konstituiert das Rubinstein-Spiel,
das nach dem bahnbrechenden Aufsatz von Ariel Rubinstein (1982) benannt ist.
Abbildung 6.3: Unendliche sequentielle Verhandlung: Das Rubinstein-Spiel
Die Methode der R uckwartsinduktion steht nun bei unendlicher Wiederholung des Spiels
nicht mehr ohne weiteres zur Verf ugung. Dennoch kann das Spiel relativ einfach gelost wer-
den, wenn man sich vor Augen f uhrt, dass das in Periode 3 beginnende Teilspiel exakt die
gleiche Struktur aufweist wie das gesamte, d.h. in Periode 1 beginnende Spiel
1
: In beiden
Fallen kann Spieler 1 einen Vorschlag machen, den Spieler 2 annehmen oder ablehnen kann
um f ur den Fall der Ablehnung einen eigenen Vorschlag zu machen usw.. Sowohl in Peri-
ode 1 als auch in Periode 2 sind prinzipiell unendlich viele Wiederholungen dieser Sequenz
moglich.
2
Diese Struktur erlaubt es, die Methode der R uckwartsinduktion auch auf das unendlich
wiederholte Spiel anzuwenden. Unter Ber ucksichtigung von zeitlicher Diskontierung, die in
diesem Fall sogar zwischen den beiden Verhandlungspartnern unterschiedlich sein kann
3
, ist
die Logik der R uckwartsinduktion dabei wie folgt:
Angenommen, Spieler 1 kann in Periode 3 (von der wir noch gar nicht wissen, ob sie
erreicht werden wird) einen nat urlich erst noch zu bestimmenden maximalen Anteil s durch-
setzen, d.h. er schlagt die Aufteilung ( s, 1 s) vor und Spieler 2 stimmt dem zu.
Dann wei Spieler 2 in Periode 2, dass er einen Vorschlag machen kann, der dem Spieler
1 einen Anteil in Hohe von
1
s belasst, wobei
1
der Diskontierungsfaktor des Spielers 1 ist.
Aus Sicht der Periode 2 ist
1
s f ur Spieler 1 nat urlich genau so viel wert wie s in Periode 3,
daher wird er dem Vorschlag zustimmen. Spieler 2 erhalt dann nat urlich den Anteil 1
1
s.
In Periode 1 wei nun Spieler 1, dass er ein Angebot machen kann. Damit Spieler 2 dieses
Angebot gerade noch akzeptiert, muss es f ur diesen einen Anteil
2
(1
1
s) vorsehen, wobei
2
der Diskontfaktor f ur Spieler 2 ist. Die in Periode 1 maximal durchsetzbare Forderung
f ur Spieler 1 ist dementsprechend gegeben durch den Anteil 1
2
(1
1
s).
Da aber nun die Struktur der Spiele, die in Periode 1 und 3 beginnen, vollig identisch
ist, m ussen die jeweils durchsetzbaren Anteile ebenfalls identisch sein. Es muss also gelten,
dass
s = 1
2
(1
1
s) , (6.2)
1
Dieser Losungsweg geht zur uck auf den Beitrag von Shaked/Sutton (1984).
2
Genauso sind nat urlich die in Periode 2 und 4 startenden Teilspiele vollig isomorph.
3
Auch dem gesunden Menschenverstand ist problemlos zuganglich, dass in Verhandlungssituationen eine
im Vergleich zum Verhandlungsgegner starker ausgepragte Ungeduld sich schadlich auf das Verhandlungs-
ergebnis auswirkt. Dies wird eines der Ergebnisse der folgenden Analyse sein.
was sich leicht nach s auosen lasst:
s =
1
2
1
1
2
. (6.3)
Das Angebot durch Spieler 1 in Periode 1 einer Aufteilung des zu erzielenden Verhand-
lungsgewinns gema (6.3) stellt ein teilspielperfektes Nash-Gleichgewicht des Rubinstein-
Spiels dar.
Zu pr ufen ist nun noch, ob dieses Gleichgewicht eindeutig ist, oder ob es weitere teilspiel-
perfekte Losungen gibt. Um diese Frage nach der moglichen Existenz multipler Gleichgewich-
te zu beantworten, wird nun untersucht, wie hoch die von Spieler 1 minimal durchsetzbare
Forderung ist, die mit s bezeichnet sei. Wenn Spieler 1 in Periode 3 wenigstens s erwarten
kann, so kann Spieler 2 in Periode 2 dem Spieler 1 nicht weniger als
1
s anbieten, d.h. f ur
sich selbst den Anteil 1
1
s sichern. Damit muss Spieler 1 in Periode 1 an Spieler 2 einen
Vorschlag machen, der diesem wenigstens den Gegenwartswert des letztgenannten Anteils
sichert, d.h.
2
(1
1
s). Dies impliziert nat urlich einen Anteil f ur Spieler 1 in Hohe von
s = 1
2
(1
1
s) (6.4)
Man sieht durch einen Vergleich von (6.4) mit (6.2) sofort, dass der minimale Anteil,
den Spieler 1 erwarten kann genau so gro ist wie der maximale Anteil, den er durchsetzen
kann. Damit ist das eindeutige teilspielperfekte Nash-Gleichgewicht des Rubinstein-Spiels
gegeben durch
s = s s
=
1
2
1
1
2
(6.5)
Die Eigenschaften dieser Losung sollen nun noch etwas genauer unter die Lupe genommen
werden:
Spieler 1 erhalt umso mehr (Spieler 2 damit umso weniger) je geduldiger er ist, d.h.
je groer
1
ist. Algebraisch lasst sich dies sehr einfach aus (6.5) ermitteln:
s
1
=
2
(1
2
)
(1
1
2
)
2
> 0.
Umgekehrt protiert Spieler 1 von der Ungeduld des 2, d.h. es ist
s
2
=
(1
1
)
(1
1
2
)
2
< 0.
Die Intuition f ur diese Ergebnisse ist klar: Je geduldiger ein Spieler ist, desto starker
wird sein Drohpotential f ur das Ablehnen eines Angebots und desto hoher muss also
das Angebot an ihn im Gleichgewicht sein.
Bei identischen Diskontierungsfaktoren der beiden Spieler, d.h. f ur
1
=
2
ist
das Ergebnis des Rubinstein-Spiels gegeben durch s
=
1
1
2
=
1
1+
.
1
Das letzte Ergebnis gibt auch Auskunft uber den Spezialfall, dass bei de Spieler kei-
nerlei Diskontierung vornehmen, d.h.
1
=
2
= 1. In diesem Fall ist s
=
1
2
, d.h. der
e wird gleichmaig aufgeteilt was eine intuitiv sehr plausible Losung ist.
F ur alle < 1 hat der erste Spieler jedoch wie im endlich wiederholten Spiel einen
echten First-Mover-Vorteil, d.h. er kann (etwas) mehr als die Halfte des e beanspru-
chen und kann dies auch durchsetzen, da Spieler 2 in der ersten Runde lieber etwas
weniger als die Halfte akzeptiert als seinerseits erst in der nachsten Runde ein Angebot
zu unterbreiten.
Abbildung 6.4 auf der nachsten Seite zeigt die Losungen gema (6.5) f ur Werte von
1
[0, 1] und drei alternative Werte f ur
2
. Die wichtigsten der gerade diskutierten Eigen-
schaften der Losung des Rubinstein-Spiels werden hier gut sichtbar.
1
F ur die zweite Schreibweise ist zu ber ucksichtigen, dass der Nenner in der ersten Schreibweise wie folgt
aufgelost werden kann. 1
2
= (1 ) (1 +).
Abbildung 6.4: Losungen des Rubinstein-Spiels
6.3.3 Die Einbeziehung von Auenoptionen im Rubinstein-Spiel
Das Rubinstein-Spiel fand in der verhandlungstheoretischen Literatur eine sehr weite Beach-
tung. Allerdings ist es unstrittig, dass die gerade prasentierte Form sehr wenig interessante
und f ur reale Verhandlungssituationen bedeutsame Merkmale enthalt. Diese konnen jedoch
teilweise sehr einfach in die gezeigte Struktur eingebaut werden. Zu diesen Merkmalen zahlen
insbesondere die Ber ucksichtigung von
Verhandlungskosten, die in jeder Runde als xer Betrag anfallen konnen, wobei die
im letzten Unterabschnitt gezeigte Analyse jedoch bereits proportionale Verhandlungs-
kosten durch die Diskontierung mit abbildet und sogar den Fall, dass diese Kosten
zwischen den Verhandlungspartnern dierieren mit beinhaltet;
Unsicherheiten diverser Arten, bspw. uber die genau Hohe der Auszahlungen, uber
Praferenzen der Verhandlungspartner etc.;
Risikoaversion der Akteure, was einen Einuss auf die Nutzenkonsequenzen des
Scheiterns von Verhandlungen und damit auf das Verhandlungsergebnis hat;
Auenoptionen (outside options) d.h. Moglichkeit beim Scheitern der Verhandlungen
eine bestimmte Option zu haben (z.B. mit einem andern Partner zu verhandeln).
Auenoptionen werden auch als Drohpunkte (threat points) bezeichnet.
Die Einbeziehung von Auenoptionen soll nun noch kurz gezeigt werden. Dazu wird
angenommen, dass beide Spieler nach einem Angebot nunmehr drei Moglichkeiten haben:
Sie konnen es akzeptieren, ablehnen und ein Gegenangebot machen (wie bisher) oder aber
die Verhandlung abbrechen und eine Auenoption wahrnehmen z.B. mit einem anderen
Partner Verhandlungen aufnehmen. In diesem Fall erhalten beide Spieler die Auszahlun-
gen (
1
,
2
). Nat urlich darf die Summe der Auenoptionen den Verhandlungsgewinn nicht
ubersteigen, da ansonsten wenigstens ein Verhandlungspartner kein Interesse an der Ver-
handlung haben kann. Beim Spiel um einen Verhandlungsgewinn von 1 muss also gelten,
dass
1
+
2
< 1. Um die Situation nicht zu kompliziert werden zu lassen, wird davon
ausgegangen, dass der Wert der Auenoptionen f ur beide Spieler uber die gesamte mogliche
Dauer des Spiels hinweg konstant ist.
Abbildung 6.5 auf der nachsten Seite zeigt die geschilderte Situation.
Wieder kann man von einer maximal durchsetzbaren Auszahlung s f ur Spieler 1 in Pe-
riode 3 ausgehen. Die

Uberlegung von Spieler 2 f ur sein Angebot in Periode 2 modiziert
Abbildung 6.5: Das Rubinstein-Spiel mit Auenoptionen.
sich nun aber etwas: Damit Spieler 1 akzeptiert, muss er ihm mindestens seine Auenopti-
on garantieren, d.h. Spieler 2 muss in Periode 2 folgendes Angebot machen: max (
1
s,
1
).
Dazu wird er aber nur bereit sein, wenn der f ur ihn verbleibende Teil mindestens seiner
eigenen Auenoption entspricht, d.h. f ur 1
1
s
2
. In Periode 1 kann Spieler 1 also einen
Vorschlag machen, der Spieler 2 wenigstens max (
2
(1
1
s) ,
2
) belasst. Das ist aber f ur
Spieler 1 nur dann attraktiv, wenn sein Anteil mindestens seiner Auenoption entspricht,
d.h. f ur 1
2
(1
1
s)
1
. Es leuchtet unmittelbar ein, dass f ur den Fall, dass die Auen-
optionen keine bindenden Restriktionen darstellen, das Verhandlungsergebnis mit dem Spiel
ohne Auenoptionen ubereinstimmen, diese jedoch den zulassigen Moglichkeitenraum f ur
das Verhandlungsergebnis unabhangig von Unterschieden der Diskontierungsfaktoren und
der Reihenfolge der Vorschlagsmoglichkeiten begrenzen.
Abbildung 6.6 illustriert dieses Ergebnis. Nur der fett ausgezogene Bereich der Vertei-
lungsmoglichkeiten ist relevant, da die Auenoptionen der Verhandlungspartner die Macht
der oder des jeweils Anderen unabhangig von den weiteren Merkmalen der Verhandlungssi-
tuation begrenzen. Die Abbildung macht auch klar, dass ein Scheitern der Verhandlungen
und damit die Realisierung der Auenoption f ur beide Verhandlungspartner nicht w unschens-
wert ist, d.h. dass die Verhandlung eindeutige Paretoverbesserungen zulasst.
*
1 s ?
*
s
1
1
0
1
?
2
?
Abbildung 6.6: Ergebnisraum f ur das Rubinstein-Spiel mit Auenoptionen.
Anhand von Abbildung 6.6 kann man sich auch noch einmal gut die Logik Forderung vor
Augen f uhren, dass die Summe der Auenoptionen nicht der Verhandlungsgewinn (hier: 1)
uberschreiten darf ohne dass es zum Abbruch der Verhandlungen kommt. Es w urde einfach
kein relevanter Bereich auf der ezienten Grenze, der in Abbildung 6.6 fett ausgezeichnet
ist, ubrig bleiben. Daher w urden hier die Verhandlungen von demjenigen mit der besseren
Auenoption abgebrochen, ohne dass der Spieler mit der niedrigeren Auenoption eine f ur
beiden Seiten akzeptable Moglichkeit hatte, diesen wieder an den Verhandlungstisch zur uck-
zubringen.
6.4 Kooperative Verhandlungen
6.4.1 Die Nash-Verhandlungslosung (Verteilungsspiel III)
Wie bereits in den methodischen Vorbemerkungen in Abschnitt 6.2 auf Seite 115 ausgef uhrt
wurde, geht die kooperative Spieltheorie einen modellierungstechnisch ganzlich anderen Weg
als den in Abschnitt 6.4 gerade beschrittenen. Die bahnbrechende Arbeit von Nash (1950b)
geht von einer Reihe von Axiomen aus, die eine Verhandlungslosung erf ullen sollte
bzw. erf ullen muss und identiziert dann eine Methode, die zu einer Losung f uhrt, in der
diese Axiome immer erf ullt sind. Daher spricht man bisweilen auch von einem axiomati-
schen Ansatz der Verhandlungstheorie.
Die von Nash postulierten Axiome sind die Folgenden:
Ezienz: Die Verhandlungslosung muss die Eigenschaft der Paretooptimalitat auf-
weisen. Dieses Axiom verbietet letztlich Verschwendung, d.h. der Verhandlungsgewinn
wird vollstandig verteilt.
Symmetrie: Wenn die Verhandlungssituation vollig symmetrisch ist (wie das bei-
spielsweise bei splitting the pie der Fall ist), so muss auch die Verhandlungslosung
symmetrisch sein. Eine andere, allgemeinere Formulierung der gleichen Eigenschaft
lautet: Die Verhandlungslosung darf nicht davon abhangen, wie die beteiligten Spieler
bezeichnet werden.
Invarianz gegen uber monotonen Transformationen der Auszahlungen: Die-
ses Axiom stellt sicher, dass die Verhandlungslosung nicht davon abhangt, in welchen
Einheiten die Auszahlungen gemessen werden
Unabhangigkeit der Losung von irrelevanten Alternativen: Dieses Axiom for-
dert, dass sich die Verhandlungslosung nicht andert, wenn Handlungsmoglichkeiten
ausgeschlossen werden, die ohnehin nicht gewahlt w urden. Dies klingt zunachst ex-
trem plausibel und vollig unangreifbar, kann aber dennoch zu merkw urdigen Eigen-
schaften einer Losung f uhren, wie in Abschnitt 6.4.2 auf Seite 126 deutlich werden
wird.
John Nash zeigte nun, dass diesen Axiomen Gen uge getan ist, wenn das folgende Problem
gelost wird:
Seien u
1
und u
2
die Auszahlungen zweier an einem Verhandlungsspiel beteiligten Spieler
sowie
1
und
2
deren Drohpunkte. Dann lasst sich die Verhandlungslosung charakterisieren
durch
max = (u
1
1
) (u
2
2
) , (6.6)
wobei die Nebenbedingung zu beachten ist, dass sich die Summe der beiden Auszahlungen
auf der ezienten Grenze bendet, d.h. die Losung zulassig ist.
1
Zu maximieren ist uber
die Handlungsparameter, die den beteiligten Spielern zur Verf ugung stehen.
1
Bei splitting the pie wurde die Summe der Auszahlungen als konstant, d.h. unabhangig von den
gewahlten Strategien angenommen. Dieses vereinfachende Merkmal ist jedoch in den meisten okonomisch
relevanten Verhandlungssituationen nicht gegeben.
6.4. KOOPERATIVE VERHANDLUNGEN 125
wird als Nash-Maximand oder Nash-Produkt bezeichnet. In (6.6) ist nicht spezi-
ziert, wor uber maximiert werden soll. Dies hangt von der konkreten Verhandlungssituation
ab. In Lohnverhandlungen sind es eben die Lohne, in Verhandlungen uber den Verkauf einer
Firma der zu zahlende Preis und in splitting the pie (Verteilungsspiel) die Anteile, die die
Verhandlungspartner am Kuchen bekommen.
F ur das Verteilungsspiel lautet die Konkretisierung von (6.6) wie folgt:
max
s
= (s
1
) (1 s
2
) . (6.7)
In der Formulierung des Problems ist die Restriktion, dass sich die beiden Anteile auf 1
erganzen m ussen, bereits enthalten. Die Bestimmung des Verhandlungsergebnisses ist nun
denkbar einfach. Durch Anwendung der Produktregel errechnet sich
s
= (1 s
2
) (s
1
) = 1 2s
2
+
1
!
=0
s
=
1
2
(1 +
1
2
)
. (6.8)
Wenn beide bei Scheitern der Verhandlungen leer ausgehen (d.h. f ur
i
= 0, i = 1, 2)
resultiert die intuitiv plausible Losung, dass der zu verteilende Verhandlungsgewinn (hier
eben 1 e) gerade halbiert wird. Die Losung (6.8) macht ebenfalls klar, dass auch diese
Modellierung der Verhandlung nicht zu einem sinnvollen Ergebnis f uhrt, wenn die Summe
der Auenoptionen bzw. Auszahlungen in den Drohpunkten groer ist als der aufzuteilende
Verhandlungsgewinn. Es ist sofort zu sehen, dass s
in diesem Fall negativ w urde, was f ur

einen Anteil ganz oensichtlich keine vern unftige Losung ist.
Im Gegensatz zum Rubinstein-Spiel mit sequentiellen Angeboten spielt nun aber Dis-
kontierung keine Rolle. Dies resultiert aus der Modellierungsentscheidung, in der eine
zeitliche Struktur der Verhandlungen gar nicht erst angelegt ist.
Aufschlussreich sind auch die unterschiedlichen Rollen der Drohpunkte im Rubinstein-
Spiel und in der Nash-Losung. Wahrend beim Rubinstein-Spiel die Drohpunkte das Losungs-
spektrum nur begrenzten, spielen sie f ur die Nash-Losung in jedem Fall eine Rolle.
Man kann sich das so vorstellen, dass bei der Nash-Verhandlungslosung die Parteien von
dem Verhandlungsgewinn erst einmal ihre jeweiligen Auenoption subtrahieren (also den
entsprechenden Teil des e vom Tisch nehmen) und dann uber den Rest verhandeln als ob
sie keine Auenoption hatten.
Die Nash-Losung (6.8) ist auch einer graphischen Intuition gut zuganglich. Dazu ist
es hilfreich, den Nash-Maximanden explizit als Funktion der Anteile f ur die beiden Spieler,
s
1
und s
2
zu schreiben:
1
= (s
1
1
) (s
2
2
). Totale Dierentiation nach s
1
und s
2
liefert
d = (s
1
1
) ds
2
+ (s
2
2
) ds
1
(6.9)
Setzt man diesen Ausdruck gleich Null, so errechnet sich die Steigung eines locus mit
einem konstanten Wert des Nash-Produkts als
ds
1
ds
2
d=0
=
s
1
1
s
2
2
< 0, (6.10)
womit ein konstanter Wert von oensichtlich entlang einer fallenden Hyperbel gegeben
ist.
Abbildung 6.7 auf der nachsten Seite zeigt alle Bestandteile der Nash-Losung. Die durch-
gezogene Gerade reprasentiert die eziente Grenze (entlang der sich die beiden Anteile zu
1 addieren). Die beiden Hyperbeln gelten f ur zwei unterschiedliche, aber jeweils konstan-
te Werte des Nash-Produkts, wobei gilt, dass

< . Die Nash-Losung ist gegeben durch
den Tangentialpunkt der Zielfunktion und der Nebenbedingung. Damit ist dies von der
1
Bisher wurde einfach die Konvention s
1
= s und die Restriktion s
2
= 1 s
1
= 1 s benutzt.
Struktur her sehr nahe an einem aus der Mikrookonomik gangigen Nutzenoptimierungs-
kalk ul, wobei die Besonderheit der Verhandlungslosung darin liegt, dass sie eine bestimmte
Art einer uber die Verhandlungsteilnehmer aggregierten Nutzenfunktion heranzieht. Wie
aus (6.6) ersichtlich ist, besteht die Aggregation aus einem gleichgewichteten geometrischen
Mittel der um die Drohpunkte korrigierten Nutzenpositionen der beteiligten Akteure.
Abbildung 6.7: Verteilungsspiel III: Die Nash-Verhandlungslosung.
Die letzte Beobachtung f uhrt zu einer nahe liegenden Erweiterung der Modellierung.
Wenn man namlich von asymmetrischen Machtpositionen zwischen den Verhandlungspart-
nern ausgeht, die sich aus Merkmalen erklaren, die auerhalb des Modells liegen,
1
so kann
man dies wenn auch etwas krude durch eine Verschiebung der Gewichte f ur den Nash-
Maximanden abbilden. Dies f uhrt dann zu dem verallgemeinerten Nash-Maximanden
max = (u
1
1
)
(u
2
2
)
1
, (6.11)
wobei die relative Machtposition des Spielers 1 bezeichnet. Zu beachten ist, dass f ur
= 0, 5 der in (6.6) unterstellte Symmetriefall gegeben ist. In (6.11) w urde dieser Fall zu
dem Ausdruck =
_
(u
1
1
) (u
2
2
) f uhren, was aber aquivalent mit (6.6) ist, weil
eine monotone Transformation des Nash-Maximanden das Ergebnis vollig unber uhrt lasst.
2
6.4.2 Eine unsch one Eigenschaften der Nash-Verhandlungslosung:
Glaubigerverhandlungen
Eine in der Realitat sehr wichtige Verhandlungssituation betrit die Aufteilung einer Kon-
kursmasse zwischen zwei oder mehr Glaubigern. Angenommen, eine Firma hinterlasst e
50000 an verwertbaren assets, und zwei Glaubiger 1 und 2 haben (gleichrangige) Anspr uche
in Hohe von a
1
= 40000 und a
2
= 30000. Nat urlich besteht das Problem des Konkurses ge-
nau darin, dass die Summe der Anspr uche hoher ist als die verwertbaren assets. Die beiden
Glaubiger m ussen eine Einigung erzielen, d.h. ohne wechselseitiges Einverstandnis kommt
keiner der beiden Glaubigern an die Konkursmasse heran. Damit sind aber die Drohpunk-
te gleich Null. Gesetzlich geregelt ist, dass kein Glaubiger mehr als die ihm zustehenden
Anspr uche a
i
, i = 1, 2 mitnehmen kann. Wenn man davon ausgeht, dass beide Glaubiger
risikoneutral sind, kann die Auszahlungssumme gleich den Nutzen gesetzt werden, womit
das Nash-Programm wie folgt lautet:
1
Das ware z.B. die politische R uckendeckung von Gewerkschaften bei Lohnverhandlungen.
2
Daher wird der verallgemeinerte Nash-Maximand zumeist auch in logarithmierter Form geschrieben, da
dies das Ergebnis unber uhrt lasst, aber analytisch etwas traktabler ist. Anstelle von (6.11) kann man daher
auch von ln = ln(u
1
1
) + (1 ) ln(u
2
2
) ausgehen.
max
u
1
,u
2
u
1
u
2
s.t.
_
_
_
u
1
+u
2
50000
u
1
40000
u
2
30000
(6.12)
Die Losung dieses Problems lautet nat urlich u
1
= u
2
= 25000, d.h. die beiden Glaubiger
teilen sich einfach die zur Verf ugung stehende Summe, die beiden letzten Nebenbedingungen
in (6.12) erweisen sich als nicht bindend. Diese Losung erf ullt nat urlich alle in Abschnitt
(6.6) aufgelisteten Axiome, ist aber insofern unschon als die vollige Bedeutungslosigkeit
der Hohe der individuellen Anspr uche unrealistisch erscheint. Diese Eigenschaft hat zu tun
mit dem Axiom der Unabhangigkeit der Verhandlungslosung von irrelevanten Alternativen.
Wenn ein Glaubiger die Auszahlung an den anderen Glaubiger komplett verhindern kann
(die Drohpunkte sind ja jeweils gleich Null), dann spielt es eben keinerlei Rolle mehr, wie
hoch die individuellen Anspr uche sind.
1
Man kann dies auch weiter auf die Spitze treiben,
indem man annimmt, dass die Anspr uche wie folgt verteilt sind: a
1
= 45000, a
2
= 25000.
Das Nash-Verhandlungs-Programm ist nun
max
u
1
,u
2
u
1
u
2
s.t.
_
_
_
u
1
+u
2
50000
u
1
45000
u
2
25000
, (6.13)
was oensichtlich nichts an dem Ergebnis u
1
= u
2
= 25000 andert. Der kleine Glaubiger
erhalt damit eine vollige Abdeckung seiner Forderungen, wahrend sich der groe Glaubiger
mit einer Quote von 45/25 = 55,
5% zufrieden geben muss.

Abbildung 6.8 illustriert die Logik des Glaubigerspiels. Die Forderungshohen verbieten
nur Losungen oberhalb bzw. rechts von a
1
bzw. a
2
, d.h. den schraerten Bereich. Nur f ur
den Fall, dass eine der beiden Forderungen unter die Halfte der zur Verf ugung stehenden
Konkursmasse rutscht, wird eine Ecklosung realisiert, d.h. der kleine Glaubiger bekommt
seine Forderung vollstandig ersetzt, der groe Glaubiger erhalt den Rest.
2
u
1
u
50 k
45
50 k
2
a
1
a
(25,25)
Abbildung 6.8: Die Irrelevanz der Forderungshohe im Glaubigerspiel
Dieses Merkmal der Nash-Losung wurde vielfach kritisiert und f uhrte zur Entwicklung
der Kalai-Smorodinsky-Losung, die Gegenstand des nachsten Abschnitts ist.
6.4.3 Die Kalai-Smorodinsky-Losung
Um diese Losung besser zu verstehen, sei zunachst auf eine weitere unschone Eigenschaft
der Nash-Verhandlungslosung aufmerksam gemacht, die in den bisherigen Beispielen nicht
1
Man kann das auch so ausdr ucken, dass in der Verhandlungssituation die aufgehauften Forderungen
sunk costs und nur noch den Zweck einer Eintrittskarte zum modellierten Verhandlungsspiel haben.
sichtbar wurde. Im linken Teil von Abbildung 6.9 ist durch die fett ausgezogene Linie die
eziente Grenze eines nicht naher spezizierten Verhandlungsspiels eingezeichnet. Bei iden-
tischen Praferenzen und Drohpunkten der Akteure resultiert die symmetrische Losung in
Punkt A.
2
u
1
u
1
u
2
u
45 45
A A
B
Abbildung 6.9: Die Nicht-Monotonizitat der Nash-Losung.
Nun wird unterstellt, dass sich die Menge der zur Verf ugung stehenden Losungen erwei-
tert, wenn auch auf eine sehr asymmetrische Art und Weise, indem sich der ache Abschnitt
nach oben verlagert. Das Resultat ist im rechten Teil von Abbildung 6.9 zu sehen. Man
sieht sofort, dass das Nash-Programm zur Verhandlungslosung in Punkt B f uhrt, was ei-
ne ebenfalls unschone Eigenschaft impliziert: Obwohl sich die Moglichkeiten insgesamt
verbessert haben, verliert Spieler 2 in B relativ zu A. Dies scheint als Beschreibung einer
Verhandlungslosung nicht realitatsnah zu sein. Der Beitrag von Kalai-Smorodinsky (1975)
versucht diesem Problem abzuhelfen, indem f ur die Verhandlungslosung eine bestimmte
Monotonieeigenschaft postuliert wird. Diese verlangt etwas lose formuliert , dass eine
Pareto-Verbesserung der in einem Spiel denkbaren Auszahlungsvektoren keinen
der Spieler schlechter stellen darf. Oensichtlich ist diese Eigenschaft f ur die Nash-
Losung eines Verhandlungsspiels nicht erf ullt: Die Verschiebung der ezienten Grenze ist
eine Pareto-Verbesserung, f uhrt aber zu einer Verschlechterung der Auszahlung f ur Spieler
2, wenn man die Nash-Losung zugrunde legt.
Diese Monotonieeigenschaft setzen Kalai und Smorodinsky (1975) an die Stelle des
Axioms der Unabhangigkeit der Verhandlungslosung von irrelevanten Alternativen. Die
Losung eines Verhandlungsspiels lasst sich dann wie folgt charakterisieren:
Sei u = ( u
1
, u
2
) der Vektor des in einer Verhandlung maximal denkbaren Ergebnisses
bei volliger Ausbeutung des Verhandlungspartners
1
und = (
1
,
2
) der Vektor der
Drohpunkte. Dann ist die Kalai-Smorodinsky-Losung u
= (u
1
, u
2
) charakterisiert durch
u
1
u
2
=
u
1
1
u
2
2
, (6.14)
wobei
u
i
u
i
und
u
1
1
u
2
2
=
u
1
1
u
2
2
f ur i = 1, 2. (6.15)
In Worten: Gleichung (6.14) verlangt, dass das Verhaltnis der durch die Verhandlung
herbeigef uhrten Verbesserungen gegen uber dem Drohpunkt f ur beide Spieler dem Verhalt-
nis der maximal aus einer Verhandlung erzielbaren Verbesserungen bei jeweils volliger Aus-
beutung der anderen Verhandlungspartei(en) entspricht. Gleichung (6.15) stellt sicher, dass
1
In splitting the pie ware dies nat urlich ein Anteil von 1 f ur beide Spieler.
sich die Losung auf der ezienten Grenze bendet. Der Beitrag von Kalai und Smorod-
insky bestand in dem Beweis, dass die durch (6.14) und (6.15) charakterisierte Losung der
Monotonieeigenschaft sowie den ersten drei der zu Beginn von Abschnitt (6.6) genannten
Axiomen Gen uge tut. Es ist wichtig sich vor klarzumachen, dass dieses Kriterium genau-
so wie die Nash-Verhandlungslosung nicht aus individuellen Optimalitatskalk ulen abgeleitet
ist. Somit werden im Grunde nur arbitrare, wenngleich sehr plausible Forderungen an die
zu ermittelnde Verhandlungslosung verlangt.
Die Kalai-Smorodinsky-Losung lasst sich grasch jedenfalls in einem 2-Personen-Spiel
sehr einfach darstellen. Man zeichnet einfach eine Gerade durch und u und sucht dann
den Schnittpunkt dieser Geraden mit der ezienten Grenze. Abbildung 6.10 demonstriert
diese Methode f ur die in Abbildung 6.9 auf der vorherigen Seite erlauterte Situation.
1
u
A
B
?
1
u
2
u
2
u
u
Abbildung 6.10: Die Kalai-Smorodinsky-Losung.
Punkt A ist die Kalai-Smorodinsky-Losung f ur beide Spiele. Damit vermeidet dieses
Konzept die oben gezeigte unschone Eigenschaft der Nash-Losung.
Ebenfalls instruktiv ist ein Blick zur uck auf die Modellierung der Glaubigerverhandlun-
gen aus Abschnitt 6.4.2 auf Seite 126. Dort hatte ja gestort, dass die Hohe der oenen
Forderungen f ur die Verhandlungen keine Rolle spielte. Da diese aber den maximalen Ver-
handlungsgewinn bestimmen, werden sie in der Kalai-Smorodinsky-Losung mit einbezogen.
Die maximal bei Ausbeutung des anderen verhandelbare Forderung u
i
, i = 1, 2 f ur jeden
einzelnen Glaubiger i ist gegeben durch das Minimum aus der Hohe der oenen Forderungen
und der Hohe der zur Verteilung anstehenden assets.
In Abbildung 6.11 auf der nachsten Seite ist der Unterschied zwischen Nash- und Kalai-
Smorodinsky-Losung (Punkte KS und N) zu sehen. Es leuchtet ein, dass die Kalai-Smorodinsky-
L osung f ur identische R uckzahlungsquoten sorgt, solange die Hohe der individuellen Forde-
rungen unterhalb der Summe der assets bleibt.
Es ist nicht moglich, anhand theoretischer

Uberlegungen eine Rangfolge zwischen den
beiden Losungskonzepten von Nash bzw. Kalai-Smorodinsky zu etablieren. Der Unterschied
besteht einfach darin, dass bei ersterem die Eigenschaft der Unabhangig der Losung von ir-
relevanten Alternativen gegeben ist, wahrend bei letzterem die individuellen Auszahlungen
eine monotone Funktion der insgesamt moglichen Auszahlungen sind. Beides sind plausi-
ble Eigenschaften, die sich jedoch unter bestimmten Umstanden gegenseitig ausschlieen
konnen, d.h. nicht gleichzeitig zu verwirklichen sind. Generell ist es denkbar, die beiden
Konzepte auf den empirischen Pr ufstand zu stellen, indem das Ergebnis konkreter Verhand-
lungen beobachtet (oder im Labor simuliert) werden.
Als einschlagige Pionierarbeit auf diesem Gebiet ist hier Nydegger/Owen (1975) zu be-
zeichnen. Hier wurden 10 Mal jeweils 2 Verhandlungspartner einander gegen ubergestellt und
mit einer konkreten Verhandlungssituation konfrontiert.
2
u
1
u
50 k
50 k
2
u
1
u
u
45
KS
N
Abbildung 6.11: Nash- und Kalai-Smorodinsky-Losungen bei Glaubigerverhandlungen
Das einfachste Beispiel f ur eine solche Verhandlungssituation ist das splitting the pie-
Spiel in diesem Fall ging es um einen $. Hier kam in der Tat heraus, dass alle 20 Ver-
handlungspaare die halftige Aufteilung vornahmen was in diesem Fall sowohl das Nash-
als auch das Kalai-Smorodinsky-Programm prognostiziert hatten.
Eine einfache Variante dieses Spiels verlangte zusatzlich, dass Spieler 1 hochstens 60
Cent von dem zu teilenden $ erhalten darf. Die Nash-Losung dieser Situation ist nach wie
vor die halftige Aufteilung des $ da ja nur irrelevante Alternativen (dass namlich Spieler
1 mehr als 60 Cent erhalt) verboten werden. Die Kalai-Smorodinsky-Losung 6.14 verlangt
nun aber
u
1
u
2
=
u
1
1
u
2
2
bzw. da in diesem Fall f ur die Drohpunkte
1
=
2
= 0 gilt
u
1
u
2
=
u
1
u
2
=
60
100
, da die maximal denkbare Auszahlung f ur Spieler 1 nur noch 60 Cent
betragt, wahrend sie f ur Spieler 2 nat urlich 1 $ = 100 Cent betragt. Zusammen mit der
Bedingung, dass beide Auszahlungen sich zu einem $ addieren m ussen, d.h. u
1
+ u
2
= 1
folgt daraus unmittelbar, dass Spieler 1 die Auszahlung u
1
= 37, 5 Cent erhalten sollte
und dementsprechend f ur Spieler 2 eine Auszahlung von u
2
= 62, 5 Cent resultiert. Die
Spieler in der Versuchsreihe von Nydegger/Owen blieben jedoch durchweg bei der halftigen
Aufteilung was ein klares Verdikt gegen die Kalai-Smorodinsky-Losung ist. In anderen
Experimenten mit etwas anders gelagerten Verhandlungssituationen wurde jedoch auch ein
anderes Resultat erzielt. Daher bleiben beide Losungskonzepte nach wie vor relevant und
konnen nebeneinander als jeweils sinnvolle wenngleich nicht alternativlose Prognose des
Verhandlungsergebnisses Verwendung nden.
6.5 Anwendungen
6.5.1 Lohnverhandlungen I: Verteilung von Renten in einem end-
lichen Spiel
Das hier zu analysierende Verhandlungsspiel wird von Dixit/Nalebu (1997), ch. 11 beschrie-
ben und ist eine sehr instruktive Anwendung des Prinzips der R uckwartsinduktion.
Die Situation ist folgende: Ein Ferienhotel r ustet sich f ur die Saison, die 101 Tage dauern
moge. Management und Personal sind aufeinander angewiesen, d.h. wenn sich beide nicht
auf einen Lohn einigen, muss das Hotel geschlossen bleiben, konnte aber auch im Extremfall
erst am 101. Tag (f ur einen Tag) eronen, wenn f ur diesen Tag eine Einigung erzielt wird,
zuvor jedoch kein Ergebnis erreicht werden konnte.
Nach Abzug aller sonstigen Kosten wirft der Hotelbetrieb jeden Tag einen Betrag von e
1000 ab, der im Prinzip zwischen Management und Belegschaft geteilt werden kann.
1
Auen-
1
Dass das am letzten Tag der Saison noch geht, wenn zuvor das Hotel die ganze Saison aufgrund der
optionen haben weder das Management noch die Belegschaft, von Diskontierung wird hier
abstrahiert. Abgesehen vom Lohn ist es der Belegschaft egal, ob sie arbeitet oder sich dabei
langweilt, weiter auf eine Einigung zu warten. Am ersten Tag (aber so fr uh am Morgen,
dass man danach noch f ur diesen Tag aufmachen kann) macht die Belegschaft (B) ein Ange-
bot; das Management kann dieses akzeptieren, oder ablehnen. Wird das Angebot akzeptiert,
kann die Saison losgehen. Falls nicht, macht M an Tag 2 ein Angebot, das nun B akzeptieren
oder ablehnen kann, etc.. Diese Struktur ist in Abbildung 6.12 zu sehen, wobei s
1
den in
Periode 1 vorgeschlagenen Anteil an den taglich erzielbaren Einnahmen in Hohe von e 1000
bezeichnet. Dieser Anteil w urde bei Akzeptanz die ganze Saison uber angewandt werden.
Relativ zur Analyse in Abschnitt 6.3.1 auf Seite 118 neu ist bei diesem Spiel, dass ein Betrag
nicht einmalig auf dem Tisch liegt, sondern jeden Tag neu anfallt, d.h. dass die insgesamt
zur Verteilung anstehende Summe mit jedem Tag, den man sich fr uher einigt, um e 1000
steigt. Man kann dies jedoch als (wenngleich extreme Form) Diskontierung verstehen: Je
spater man sich einigt, desto geringer ist der zu verteilende Kooperationsgewinn.
Abbildung 6.12: Lohnverhandlungen zwischen Belegschaft und Management
Auf welchen Lohn (pro Tag und Gesamtbelegschaft) wird man sich wann einigen? Die
Antwort darauf gibt wie immer in solchen Situationen die Methode der R uckwartsinduktion.
Periode 101: Hier macht annahmegema B den Vorschlag. Es geht (noch) um e 1000 in
dieser Periode, danach ist das Spiel f ur alle Beteiligten zu Ende. M wird also jeden Vorschlag
akzeptieren, der zu nicht-negativen Auszahlungen f uhrt, daher ist
s
101
= 1, (6.16)
d.h. B kann den gesamten an diesem Tag erzielbaren Erlos f ur sich beanspruchen, M
verliert nichts dabei, auf den Vorschlag einzutreten. B kann durch dieses Angebot e 1000
f ur sich sicherstellen.
Periode 100: Nun kann M ein Angebot machen. M wei dabei, dass B f ur sich e 1000
sicherstellen kann. Daher wird B kein Angebot akzeptieren, bei dem sie schlechter wegkommt.
Umgekehrt kann B aber auch nichts durchsetzen, was einen hoheren Betrag abwirft. Daher
wird M folgendes Angebot machen:
s
100
= 0, 5 (6.17)
Dieses Angebot stellt sicher, dass sowohl M als auch B an den letzten beiden Tagen
jeweils insgesamt e 1000 erhalten.
Periode 99: In dieser Periode realisiert B, dass M f ur sich e 1000 durchsetzen kann.
Daher kann von den ab Periode 99 moglichen Gesamteinnahmen in Hohe von e 3000 die
fehlenden Einigung lahmgelegt wurde, erscheint nicht besonders realistisch, wird hier aber der Einfachheit
halber angenommen. Die beschriebene Losungsprozedur konnte durchaus mit einem im Zeitablauf kleiner
werdenden Erlos pro Tag umgehen.
Belegschaft e 2000 f ur sich beanspruchen, was erreicht wird durch ein Angebot
s
99
=
2
3
. (6.18)
Dieser Vorschlag belasst M die ab Periode 100 durchsetzbare Auszahlung von e 1000,
bringt aber B eine Auszahlung von e 2000.
Periode 98: M ist sich nun bewusst, dass B e 2000 durchsetzen kann und bietet daher
wieder
s
98
= 0, 5 (6.19)
an, was eine Gesamtauszahlung in Hohe von e 2000 jeweils f ur B und f ur M impliziert.
Periode 97: B wei, dass M e 2000 f ur sich sicherstellen kann, daher wird es genau e
3000 der nun zu verteilenden e 5000 f ur sich beanspruchen, was einem Vorschlag f ur eine
Aufteilung von
s
97
=
3
5
(6.20)
entspricht. Das Prinzip sollte jetzt klar geworden sein: In jeder geradzahligen Periode wird M
eine jeweils halftige Aufteilung vorschlagen, in jeder ungeradzahligen Periode wird B einen
Anteil vorschlagen, der sich von oben asymptotisch einer halftigen Aufteilung annahert. Die
Asymmetrie beruht auf der Tatsache, dass B annahmegema das Vorschlagsrecht in der
letzten Periode hat. Je mehr Perioden das Spiel hat, desto geringer wird dieser Vorteil, d.h.
f ur ein zwar endliches, aber sehr lang dauerndes Spiel wird man sich im Limit auf eine
halftige Aufteilung des Kooperationsgewinns einigen. Nat urlich kann man die Rollen von B
und M auch vertauschen, wenn man M das Vorschlagsrecht in der letzten Periode gibt, da
weitere Asymmetrien in der Situation nicht angelegt sind.
Ein Zur uckrechnen (f ur die Situation, dass B das Vorschlagsrecht in der letzten Peri-
ode 101 und in allen ungeradzahligen Perioden zuvor hat) bis zur Periode 1 f uhrt zu der
teilspielperfekten Forderung der Belegschaft in Hohe von
s
97
=
101
51
0, 505. (6.21)
Auf diese Forderung wird das Management eintreten, womit die Saison gerettet ist und
die zu verteilenden Einnahmen zu 50,5% an die Belegschaft und zu 49,5% an das Manage-
ment gehen.
Abbildung 6.13 auf der nachsten Seite zeigt das zeitliche Prol der teilspielperfekten
Forderungen in allen Perioden t [1, 101].
Man sieht hier sehr gut, dass eine deutliche Abweichung von der halftigen Aufteilung
des Kooperationsgewinns erst weit am Ende des Spiels zu einer teilspielperfekten Losung
wird. Erst dann f uhrt die Macht, die aus dem letzten Vorschlagsrecht erwachst, zu einer
deutlichen Asymmetrie.
6.5.2 Lohnverhandlungen II: Die Nash-Losung
Eine ganzlich andere Art der Verhandlung uber Lohne bietet das sog. Zeuthen-Nash-Jackman-
Modell aus der Arbeitsmarkttheorie
1
Hier verhandeln zunachst Gewerkschaften G mit Un-
ternehmen U uber den zu bezahlenden Reallohn.
2
Alle Beteiligten wissen dabei, dass die
1
Friedrich Zeuthen ist ein Arbeitsmarkttheoretiker, der bereits in den 1930er uber Lohnverhandlungen
nachdachte, dem aber nat urlich das analytische Instrumentarium fehlte, Nash lieferte das Losungskonzept
und Richard Jackman f uhrte das folgende Modell (bzw. eine allgemeinere Version davon) als Hauptvehikel
zur Beschreibung und Analyse der europaischen Arbeitsmarktsituation in die Literatur ein. Eine ausf uhrliche
Darstellung ndet sich bei Landmann/Jerger (1999, Kap. 5).
2
Nat urlich werden in Lohnverhandlungen streng genommen nur Nominallohne gesetzt. Die hier getroene
Vereinfachung unterstellt zweierlei: Zum einen hat die Unternehmung keine Preissetzungsmacht auf ihrem
Absatzmarkt und zum anderen wirken die Lohne in dem betrachteten (kleinen) Unternehmen nicht auf das
0,5
0,6
0,7
0,8
0,9
1
101 91 81 71 61 51 41 31 21 11 1
Abbildung 6.13: Abwechselnde teilspielperfekte Forderungen in den Lohnverhandlungen zwi-
schen Management und Belegschaft.
Unternehmung nach erfolgreichen Lohnverhandlungen nur so viele Beschaftigte einstellt, wie
sie f ur richtig (also gewinnmaximal) halt.
1
Der Ablauf dieses Spiels ist in Abbildung 6.14 zusammengefasst.
GundUverhandeln
ber(Real-)Lohn W
Uentscheidetuni-
lateralberBeschftigung,
gegebendenLohn W
Zeit
Abbildung 6.14: Timing im Zeuthen-Nash-Jackman-Modell zwischen Gewerkschaft (G) und
Unternehmen (U).
Zunachst muss untersucht werden, wie sich die Unternehmung auf der zweiten Stufe
verhalt. Da sie ihren Output Y mit Hilfe des Faktors Arbeit N produziert, den sie f ur einen
Reallohn von W pro Einheit
2
beschaftigen kann, lautet das Gewinnmaximierungsproblem
wie folgt:
max
N
= Y WN s.t. Y = F (N) , (6.22)
wobei Y = F (N) die Produktionsfunktion ist. F ur die folgende Analyse wird dabei der
Einfachheit halber von einer einfachen Cobb-Douglas-Produktionsfunktion mit xem (und
auf 1 normierten) Kapitalstock ausgegangen:
Y = F (N) = N
mit 0 < < 1 (6.23)

aggregierte Preisniveau. Durch diesen Trick sind sowohl Produzenten- als auch Konsumentenpreise x und
die Verhandlungen uber Nominallohne sind gleichzeitig auch Verhandlungen uber Reallohne. Eine Analyse
der makrookonomischen Konsequenzen von Lohnsetzungen m usste hier sorgfaltiger modellieren.
1
Aufgrund dieser Eigenschaft spricht man in der Literatur von sog. right-to-manage-Modellen.
2
Das Outputgut Y ist das numeraire, d.h. W gibt an, wie viele Einheiten Y man f ur eine Einheit N
bekommt.
Die Bedingung erster Ordnung f ur den optimalen Arbeitseinsatz liefert
N
=
Y
N
W = 0
W =
Y
N
, (6.24)
was die denkbar einfachste Form einer Arbeitsnachfragekurve ist. Es wird gerade soviel
Arbeit eingestellt, dass die Grenzproduktivitat dem Reallohn entspricht. F ur spateren Ge-
brauch wird schon hier festgehalten, dass die Arbeitsnachfrage (6.24) bei G ultigkeit der
Produktionsfunktion (6.23) charakterisiert ist durch W = N
1
bzw. aufgelost nach N:
N =
_
W
_ 1
1
. (6.25)
Damit ist die Elastizitat der Beschaftigung bei Variation des Reallohns gegeben durch
N|W
= ( 1)
1
. (6.26)
Die Unternehmer gehen in die Lohnverhandlungen mit dem Ziel, einen moglichst hohen
Gewinn zu erzielen, wobei das Verhalten (6.24), d.h. die Arbeitsnachfrage als Funktion des
auszuhandelnden Lohnes antizipiert wird. Eine Auenoption existiert nicht, d.h. wenn keine
Einigung zustande kommt, so ndet keine Produktion statt. Die Gewinne der Unternehmung
sind dann gleich Null.
1
Damit ist der Unternehmenspart des Nash-Maximanden gegeben
durch
= Y WN
. .
Zielfunktion
0
. .
Auenoption
= Y WN (6.27)
F ur die Gewerkschaft sei unterstellt, dass sie die Einkommenssumme ihrer Klientel (Ge-
werkschaftsmitglieder) maximieren mochte. Dabei erhalten die beschaftigten Gewerkschafts-
mitglieder den Reallohn W, die Arbeitslosen erhalten eine staatliche Transferleistung in
Hohe von A (f ur Auenoption). Wenn weiterhin die Zahl der Gewerkschaftsmitglieder auf 1
normiert wird, so lautet der Gewerkschaftspart des Nash-Maximanden wie folgt:
u
G
= NW + (1 N) A
. .
Zielfunktion
1 A
. .
Auenoption
= N (W A) (6.28)
Somit ist der Nash-Maximand gegeben durch
= u
G
= [Y WN] [N (W A)]
ln

= ln (Y WN) + ln (N (W A))
. (6.29)
Die Optimierung uber W f uhrt zu
W
=
1
Y WN
_
Y
N
N
W
W
N
W
N
_
+
1
N (W A)
_
N +
N
W
(W A)
_
= 0.
(6.30)
Dieser Ausdruck sieht zunachst etwas hasslich aus, ist aber relativ leicht (aber nicht
ohne Bleistift und Papier) in eine h ubsche Form zu bringen. Zunachst heben sich aufgrund
1
Dies ist eine unschuldige Normierung, da man auch einen negativen Gewinn beispielsweise aufgrund
von bereits vor den Lohnverhandlungen eingegangenen Verpichtungen zur Anmietung von Produktionsan-
lagen mit einbeziehen konnte.
von (6.24) die beiden ersten Terme in der Klammer des ersten Summanden gegenseitig auf.
Dies f uhrt zu
N
Y WN
+
1
N (W A)
_
N +
N
W
(W A)
_
= 0. (6.31)
Betrachten wir den ersten Term etwas genauer. Dieser kann (durch Erweitern mit N
1
)
auch geschrieben werden als
1
Y
N
W
=
1
_
Y
N
N
Y
_
. .
1
Y |N
Y
N
. .
W
W
=
1
W
_
1
Y |N
1
_
=
1
W
_
1
Y |N
Y |N
_ =

Y |N
W
_
1
Y |N
_ =

W (1 )
(6.32)
wobei 0 <
Y |N
= < 1 die Elastizitat des Outputs bei Variation der Einsatzmenge des
Faktors Arbeit angibt. Dass diese Elastizitat dem Parameter entspricht, ergibt sich direkt
aus (6.23).
Der zweite Summand in (6.31) kann ebenfalls leicht etwas vereinfacht werden:
1
N (W A)
_
N +
N
W
(W A)
_
=
1
(W A)
+
N/W
N
=
1
(W A)
+
N
W
W
N
1
W
=
1
(W A)
+
N|W
1
W
=
1
(W A)
+
1
1
1
W
, (6.33)
wobei im letzten Schritt (6.26) Verwendung ndet.
Zusammenfassen, d.h. Einsetzen von (6.32) und (6.33) in (6.31) liefert

W (1 )
+
1
(W A)
+
1
1
1
W
= 0. (6.34)
Dies lasst sich leicht nach W auosen, wenn man die drei Summanden in 6.34 mit
W (1 ) (W A) durchmultipliziert und die Terme in W und A zusammenfasst. Dies
f uhrt zu der Schlussgleichung
W = A
1 +
2
. (6.35)
Damit erhalten wir das Ergebnis, dass die Lohnverhandlungen zu einem Aufschlag
auf die Auenoption der Gewerkschaftsmitglieder f uhren, wobei der Aufschlagsfak-
tor produktionstechnisch bedingt ist.
1
Die Hohe des Aufschlagsfaktors lasst sich dabei leicht
verstehen. Die Quotientenregel liefert
W
=
A
2
2
< 0, d.h. der Lohn ist umso kleiner, je
groer die Produktionselastizitat des Faktors Arbeit ist. Dies ist deswegen der Fall, weil ein
hoherer Wert von einen (betragsmaig) hoheren Wert der Elastizitat der Arbeitsnachfra-
ge
N|W
= ( 1)
1
mit sich bringt, d.h. zu einer acheren Arbeitsnachfragefunktion im
WN-Quadranten f uhrt. Dies wiederum impliziert einen hohen marginalen Beschaftigungs-
verlust f ur eine gegebene Lohnerhohung. Die Gewerkschaft wird sich daher c.p. mit einem
niedrigeren Lohn begn ugen.
1
Wenn Preissetzungsmacht des Unternehmens auf dem Absatzmarkt mit in die Betrachtung einbezogen
wird, lasst sich zeigen, dass diese ebenfalls auf den Lohn mit einwirkt.
6.5.3 Wie funktionieren Ehen und WGs? Die Perspektive der ko-
operativen Haushaltstheorie
Die Haushaltstheorie oder Konsumtheorie zeigt, wie eine homogene organisatorische Einheit,
die f ur gewohnlich als Haushalt bezeichnet wird, optimale Entscheidungen trit. Dabei wird
so getan, als ob Unterschiede zwischen den Mitgliedern eines Haushalts keine Rolle spielen.
Typischerweise zeigt die Lebenserfahrung, dass diese Beschreibung jedenfalls nicht vollkom-
men zutreend ist; vielmehr spielen Interessenkongruenzen aber auch Interessenkonikte
innerhalb eines Haushalts eine bedeutsame Rolle. Daher kann die Verhandlungstheorie auch
dazu benutzt werden, einen genaueren Blick auf das Innenleben von Haushalten zu werfen
oder wie in der

Uberschrift zu diesem Abschnitt anklingt: einen Blick hinter die Kulissen von
Ehen und Wohngemeinschaften zu riskieren. Dabei sind immer zwei Schritte bedeutsam:
Wie kommt die Entscheidung f ur oder gegen eine gemeinsame Haushaltsf uhrung zu-
stande?
Wenn ein gemeinsamer Haushalt gegr undet ist: Wie wird in diesem Haushalt uber
Einkommensentstehung und Einkommensverwendung entschieden?
Beide Schritte hangen nat urlich eng miteinander zusammen, wie sich aus dem folgenden
Modell erhellen wird. In diesem Modell gehen wir aus von zwei Individuen (mit den phan-
tasielosen Namen A und B), die jeweils Arbeitseinkommen erzielen konnen und dieses f ur
ein gemeinschaftlich nutzbares Gut x sowie ein nur individuell nutzbares Gut y ausgeben
konnen. Unter x kann man sich dabei Dinge wie Wohnung, Strom, Waschmaschine etc. vor-
stellen, unter y Kleidung, Essen, Eintrittskarten f ur Fuballspiele etc.. Das Gut y wird hier
als numeraire benutzt, d.h. der Preis dieses Gutes ist auf den Wert 1 normiert. Gut x habe
einen Preis von p. Die beiden Individuen konnen ihre Arbeitskraft zu den Lohnsatzen w
i
,
i = A, Banbieten. Nat urlich kann die Lohnhohe individuell verschieden sein.
Die Nutzenfunktionen von A und B sind wie folgt gegeben
u
i
= u
i
(x
i
, y
i
, L
i
) , (6.36)
wobei diese Nutzenfunktionen keineswegs identisch sein m ussen und es im Normalfall
auch nicht sind.
Uberlegen wir zunachst, wie sich die beiden Individuen ohne einen gemeinsamen Haushalt
verhalten w urden. Das Problem besteht darin, (6.36) unter der Nebenbedingung, dass die
Einnahmen (in dem Modell annahmegema nur aus Arbeitseinkommen) die Ausgaben (f ur
x und y) nicht unterschreiten, zu maximieren. Die Nebenbedingungen (das sind einfach die
individuellen Budgetrestriktionen) sind dabei wie folgt gegeben:
p x
i
+y
i
w
i
L
i
, i = A, B. (6.37)
Die Lagrangefunktion dieses Problems ist
i
= u
i
(x
i
, y
i
, L
i
) +
i
(p x
i
+y
i
w
i
L
i
) . (6.38)
Diese ist uber die Handlungsvariablen x
i
, y
i
und L
i
zu optimieren. Die aus dieser Opti-
mierung resultierenden Bedingungen erster Ordnung sind wie folgt gegeben:
i
x
i
=
u
i
x
i
+ p = 0 (6.39)
i
y
i
=
u
i
y
i
+ = 0 (6.40)
i
L
i
=
u
i
L
i
w
i
= 0 (6.41)
Die vierte Bedingung erster Ordnung, d.h.

i
i
= 0 stellt die Einhaltung der Budgetre-
striktion (6.37) sicher. Diese Gleichung sowie die drei Gleichungen (6.39) bis (6.41) deter-
minieren die Optimalwerte von x
i
, y
i
und L
i
sowie die Schattenvariable (Lagrangemultipli-
kator)
i
.
Diese Optimalwerte bei jeweils individueller Maximierung seien bezeichnet mit x
s
i
, y
s
i
und

L
s
i
. Nat urlich hangen diese Optimalwerte vom jeweils relevanten Lohnsatz sowie dem
Relativpreis der beiden G uter ab, d.h. es gilt z.B. x
s
i
= x
s
i
(w
i
, p). Damit werden die Nut-
zenniveaus u
s
i
erreicht. Das Superscript s steht f ur separat.
Wie entscheidet sich nun, ob die beiden einen gemeinsamen Haushalt gr unden? Ganz
einfach: Da (bzw. genauer: falls) die Entscheidung f ur beide freiwillig ist, m ussen beide
einen positiven Anreiz daf ur haben. Das jeweils im Haushalt erzielbare Nutzenniveau muss
also hoher sein als ohne einen gemeinsamen Haushalt. Bezeichnen wir die nat urlich erst
noch zu berechnenden Optimalwerte der individuellen Nutzenniveaus bei gemeinsamer
Haushaltsf uhrung mit u
g
i
, so m ussen also die beiden Gleichungen
u
g
i
u
s
i
, i = A, B (6.42)
erf ullt sein. Man kann (6.42) als Partizipationsbedingungen am gemeinsamen Haushalt
interpretieren.
Damit ware die erste der beiden eingangs genannten Fragen beantwortet wenn denn
klar ware, wie hoch der in einem gemeinsamen Haushalt realisierbare Nutzen f ur die beiden
ist. Die zweite der beiden Fragen ist daher f ur die Beantwortung der ersten Frage essenti-
ell. Anders gesagt: Ob es zu dem gemeinsamen Haushalt kommt, hangt davon ab, welche
Entscheidungen im gemeinsamen Haushalt getroen werden. Und dieses kann als Verhand-
lungsproblem formalisiert werden.
Bevor dieses Verhandlungsproblem aufgeschrieben und gelost wird, noch zwei Bemer-
kungen zur Nutzenfunktion 6.36 bzw. den Modikationen, die f ur die Abbildung eines ge-
meinsamen Haushalts vorzunehmen sind.
Da das Gut x annahmegema gemeinsam genutzt wird, ist eine Indexierung in einem
gemeinsamen Haushalt hinfallig.
Bei separater Optimierung ist es vollig ausreichend, die eigenen Wahlhandlungsva-
riablen in die Nutzenfunktion aufzunehmen. Allerdings kann es sein, dass in einem
gemeinsamen Haushalt auch ein direkter Einuss der individuellen Variablen des
einen auf die Nutzenposition des andern existiert, d.h. die Nutzenfunktionen wie folgt
zu spezizieren sind:
1
u
i
= u
i
(x, y
i
, L
i
, y
i
, L
i
) , i = A, B (6.43)
Die gemeinsame Budgetrestriktion des Haushalts ist nun gegeben durch
p x +y
A
+y
B
w
A
L
A
+w
B
L
B
(6.44)
Um die Nash-Verhandlungslosung zu ermitteln, braucht es nun noch eine sinnvolle
Spezikation der individuellen Drohpunkte. Hier liegt es auf der Hand, diejenigen Nutzen-
niveaus heranzuziehen, die bei einer separaten Optimierung erzielbar sind, d.h. die bereits
charakterisierten Niveaus u
s
i
. Damit lautet das Nash-Programm f ur den gemeinsamen Haus-
halt
max
x,y
A
,y
B
,L
A
,L
B
N = (u
A
u
s
A
) (u
B
u
s
B
) + (p x +y
A
+y
B
w
A
L
A
w
B
L
B
) (6.45)
1
Es ist n utzlich, sich ubungshalber einige konkrete Beispiele f ur die beiden letzten Argumente vorzustellen.
Die Bedingungen erster Ordnung dieses Problems sind gegeben durch
N
x
=
u
A
x
(u
B
u
s
B
) +
u
B
x
(u
A
u
s
A
) + p = 0 (6.46)
N
y
A
=
u
A
y
A
(u
B
u
s
B
) +
u
B
y
A
(u
A
u
s
A
) + = 0 (6.47)
N
y
B
=
u
A
y
B
(u
B
u
s
B
) +
u
B
y
B
(u
A
u
s
A
) + = 0 (6.48)
N
L
A
=
u
A
L
A
(u
B
u
s
B
) +
u
B
L
A
(u
A
u
s
A
) w
A
= 0 (6.49)
N
L
B
=
u
A
L
B
(u
B
u
s
B
) +
u
B
L
B
(u
A
u
s
A
) w
B
= 0 (6.50)
Diese f unf Gleichungen determinieren zusammen mit der Budgetbedingung (6.44) in
Gleichungsform die f unf Entscheidungsvariablen des Haushalts, die mit x
g
, y
g
A
, y
g
B
,

L
g
A
und
L
g
B
bezeichnet werden sollen und auerdem wie ublich die Schattenvariable . Einsetzen
dieser Optimalwerte in die beiden Nutzenfunktionen (6.43) liefern die optimierten individu-
ellen Nutzenniveaus u
g
i
in dem gemeinsamen Haushalt als Funktion der beiden Lohnsatze
und des Preises p. Damit lassen sich auch die Partizipationsbedingungen (6.42) evaluieren.
Aufgrund der durchaus nicht geringen Komplexitat soll hier ein konkretes, d.h. mit be-
stimmten Nutzenfunktionen ausspeziziertes Beispiel nicht gerechnet werden. Allerdings las-
sen sich auch auf der hier benutzten Abstraktionsebene einige allgemeine Lehren aus der
Analyse dieses Abschnitts ziehen:
Was in einem gemeinsamen Haushalt passiert, hangt (unter anderem) davon ab, was
zu erwarten ist, wenn der Haushalt nicht existiert.
Je besser der Drohpunkt eines Haushaltsmitglieds, desto eher kann dieses seine Vor-
stellungen durchsetzen. Dies ist an den Bedingungen (6.46) bis (6.50) unmittelbar
ablesbar: Der (marginale) Nutzeneekt einer Entscheidung f ur i wird immer gewichtet
mit dem Abstand zwischen Nutzenniveau und Drohpunkt des anderen, d.h. mit der
Dierenz u
i
u
s
i
. Je hoher der Drohpunkt von i, desto geringer also das Gewicht,
mit dem die Konsequenzen einer Entscheidung f ur i in das Kalk ul einieen.
Eine entscheidende Komponente der individuellen Drohpunkte ist der jeweils erzielbare
Lohnsatz. Je hoher dieser im Vergleich zum Lohnsatz des anderen ist, desto besser der
Drohpunkt und damit das Ergebnis in einem gemeinsamen Haushalt. Diese Erkenntnis
aus der kooperativen Spieltheorie mag mit erklaren, warum sich zumeist WGs und
Ehepaare bilden, in denen die Partner ein ahnliches Einkommenspotential haben.
Nat urlich spielen genuine Unterschiede in den Praferenzen der beiden Hautshaltmit-
glieder eine wichtige Rolle f ur die Entscheidungen in diesem Haushalt. Wenn beispiels-
weise A eine sehr hohe Abneigung gegen (bezahltes) Arbeitsangebot hat und diese
Eigenschaft nicht mit B teilt, d.h. f ur
u
A
L
A
<
u
B
L
B
< 0, wird der Haushalt auch c.p.
das Arbeitsangebot eher durch B entfalten lassen.
Das hier vorgestellte Grundmodell kann vielfach erweitert werden. So ware es beispiels-
weise moglich, Nicht-Arbeitseinkommen zu ber ucksichtigen. Ebenso kann man das gemein-
sam konsumierbare Gut x so modellieren, dass dies nicht auf dem Markt (zu einem Preis von
p) gekauft werden kann, sondern im Haushalt erstellt werden muss, aber Arbeitszeit kostet.
Damit waren (nicht externalisierbare) Haushaltsarbeiten mit in die Betrachtung aufgenom-
men und selbstverstandlich lassen sich auch unterschiedliche absolute und/oder kompara-
tive Vorteile bei der Erzielung von Einkommen auf dem Arbeitsmarkt und der Produktivitat
im Haushalt abbilden.
Am Ende dieses Abschnitts soll noch kurz darauf eingegangen werden, wie die Kalai-
Smorodinsky-Losung des Haushaltsproblems zu ermitteln ware. Dazu rufen wir uns aus
Abschnitt 6.4.3 in Erinnerung, dass f ur diese Losung der Vektor der bei volliger Ausbeutung
des anderen erzielbaren Nutzenniveaus benotigt wird. Dieser Vektor ist gegeben durch die
L osung der beiden Probleme
max
x,y
A
,y
B
,L
A
,L
B
u
i
+ (p x +y
A
+y
B
w
A
L
A
w
B
L
B
) , i = A, B, (6.51)
in denen jeweils einer der beiden Partner die eigene Position optimiert, wobei er uber den
anderen nach Belieben verf ugt. Die Budgetrestriktion des Haushalts ist nach wie vor durch
6.44 gegeben. Die Drohpunkte ergeben sich wie bei der Nash-Losung durch die Nutzenni-
veaus bei individueller Optimierung. Damit konnen die Kriterien 6.14 und 6.15 angewandt
werden. Aufgrund der algebraischen Komplexitat sei auch hier auf ein ausspeziziertes Bei-
spiel verzichtet.
Kapitel 7
Auktionen
7.1 Lernziele
Auktionen sind eine sehr alte Form der Zusammenf uhrung von Angebot und Nachfrage mit
einem praktisch unerschopichen Anwendungsbereich: Sklaven, Kunstwerke, Konkursmas-
sen, Haushaltsauosungen wurden und werden in Auktionen verkauft. Selbst das gesamte
romische Kaiserreich wurde im Jahr 193 n. Chr. von einem gewissen Senator Didius Julia-
nus ersteigert. Anbieter waren die Pratorianer (kaiserliche Garde), die zuvor schlicht den
amtierenden Kaiser Pertinax ermordeten und dann bei 6250 Drachmen (= 25000 Sesterzen)
pro Pratorianer den Zuschlag f ur das Kaiserreich erteilten.
1
Didius Julianus ereilte aber eine
fr uhe Form des winners curse: 66 Tage nach Abgabe seines Angebots wurde er seinerseits
erschlagen.
Ein entscheidendes Merkmal von Auktionen besteht darin, dass der Verkaufer die Bewer-
tungen und damit Zahlungsbereitschaften des in Rede stehenden Guts durch den oder die
potentielle(n) Kaufer nicht kennt. W urde er namlich diese Bewertungen kennen, so konnte
der Verkaufer das Gut einfach dem Kaufer mit der hochsten Zahlungsbereitschaft zu genau
diesem Preis anbieten. Eine Auktion ist also ein moglicher Mechanismus f ur einen Verkaufer,
etwas uber die Zahlungsbereitschaften der potentiellen Kaufer zu erfahren.
Moderne Auktionen umfassen so unterschiedliche Dinge wie
die Platzierung von Staats- und anderen Anleihen auf Finanzmarkten;
die Allokation von Mobilfunklizenzen;
die Privatisierung von Staatseigentum in sehr groem Umfang in den osteuropaischen
Landern nach dem Fall des Eisernen Vorhangs;
die Vergabe oentlicher Auftrage
2
;
die Vergabe von Bohr- und Sch urfrechten;
die Allokation von Umweltverschmutzungsrechten;
und auch aufgrund geringer werdender Transaktionskosten auch den Kauf bzw. Verkauf
relativ geringwertiger G uter zwischen Privatkunden beispielsweise uber Ebay.
1
Dies entspricht in heutiger Kaufkraft einer Summe von etwa 100.000 US-$. Bei einer Starke der Prato-
rianergarde von ca. 10.000 Mann summierte sich der Gesamtbetrag f ur das Romische Reich also auf rund
eine Milliarde US-$.
2
Hier erhalt der Anbieter den Zuschlag, der zum niedrigsten Preis eine bestimmte Leistung durchf uhrt.
141
142 KAPITEL 7. AUKTIONEN
Durch die Moglichkeit elektronischer Auktionen hat sich das Spektrum der Einsatzmoglich-
keiten von Auktionen dramatisch erweitert. Selbst modernes Rechnerdesign greift auf Aukti-
onsmechanismen zur uck, indem konkurrierenden Verwendungen von Prozessorkapazitat ein
Wert beigelegt wird. Diejenige Verwendung mit der hochsten Zahlungsbereitschaft wird
dann als erstes durchgef uhrt was letztlich einen optimalen Umgang mit Flaschenhalsen
der Prozessorkapazitat und damit eine optimierte Rechnerleistung ermoglicht. Gerade bei
Rechnern, die parallel an verschiedenen Aufgabenteilen, die miteinander zusammen hangen,
arbeiten, leuchtet die Verwendung einer solchen internen Auktion unmittelbar ein.
Auktionen sind einer spieltheoretischen Analyse zuganglich, weil es sich um eine Situati-
on mit strategischer Interaktion zwischen Anbieter und ggf. mehreren Nachfragern handelt.
Auch die Interaktion verschiedener Bieter untereinander kann strategische Elemente beinhal-
ten. Da zudem den Beteiligten wichtige Informationen fehlen (wie oben bereits gesagt, fehlt
dem Anbieter immer die Information uber die Bewertung des Auktionsgegenstands durch
die Bieter) sind Auktionen letztlich nichts anderes als Spiele mit unvollkommener In-
formation. Die Interdependenz zwischen dem Verhalten der an einer Auktion beteiligten
Akteure kommt vor allem darin Ausdruck, dass das Gebot eines Nachfragers abhangig vom
Verhalten der anderen Nachfrager ist, da ja auf konkurrierende Gebote reagiert werden muss
entweder mit

Uberbieten oder mit R uckzug. Dabei kann es sich um dynamische oder stati-
sche Spiele handeln, je nachdem, ob man uber mehrere (beliebig viele?) Runden mitsteigern
oder aber nur ein einziges Angebot abgeben kann.
Die systematische spieltheoretische Analyse von Auktionen begann mit der Arbeit von
William Vickrey (1961).
1
Einen breiten, jedoch sehr anspruchsvollen

Uberblick uber die
inzwischen sehr groe Literatur zu Auktionen bietet das Buch von Krishna (2002).
Abschnitt 7.2 auf der nachsten Seite befasst sich mit einigen grundlegenden Begrif-
fen der Auktionstheorie, insb. mit vier wichtigen Grundformen von Auktionen. In Ab-
schnitt 7.3 auf Seite 147 wird dann kurz dargestellt, inwiefern bzw. unter welchen Umstanden
die Auktionen zu gleichen bzw. unterschiedlichen Ergebnissen f uhren, d.h. es geht um die
Aquivalenzeigenschaften unterschiedlicher Auktionsformen. Abschnitt 7.4 auf Sei-

te 148 widmet sich einer sehr bekannten und instruktiven auktionstheoretischen Anomalie,
dem winners curse. Bis zu diesem Punkt wird (wenigstens implizit) davon ausgegan-
gen, dass jeweils nur ein Objekt versteigert wird. Allerdings geht es in Auktionen gar nicht
so selten auch darum, dass mehrere Objekte gleichzeitig versteigert werden sei es als xe
Pakete oder auch in B undeln, die ex ante nicht fertig gesch urt sind. Diese Situation ei-
ner solchen multi-object auction ist theoretisch sehr interessant, weil die Bewertungen
einzelner Gegenstande in einer solchen Auktion typischerweise eine Funktion der Vertei-
lung aller Gegenstande ist.
2
Dieser Umstand verkompliziert die Analyse der strategischen
Interaktion zwischen Verkaufer und Kaufern bzw. auch zwischen verschiedenen potentiellen
Kaufern ganz erheblich. Diese Situation ist aber nicht nur theoretisch spannend, sondern
auch empirisch interessant. Bei den in den letzten Jahren spektakularsten Versteigerungen
wurden die Rechte an bestimmten Frequenzspektren f ur die mobile Kommunikation mit
dem UMTS-Standard verkauft. Da es hierbei um die simultane Versteigerung mehrerer Fre-
quenzpakete ging, waren dies typische Beispiele f ur multi-object auctions. Abschnitt 7.5
auf Seite 151 befasst sich mit den wichtigsten theoretischen Aspekten, aber auch mit einer
kurzen Zusammenfassung der wichtigsten Aspekte der UMTS-Auktionen.
1
Im Jahr 1996 wurde William Vickrey f ur diese Arbeiten der Nobelpreis f ur

Okonomie (zusammen mit
James Mirrlees) zuerkannt.
2
Von multi-object auctions sind zu unterscheiden multi-unit auctions, bei denen es nur darum geht,
mehr als eine Mengeneinheit des gleichen Guts zu versteigern.
7.2. GRUNDLEGENDE BEGRIFFE 143
7.2 Grundlegende Begrie
7.2.1 Wert und Bewertung einer Auktion
Ein f ur jede Auktion zentrales Merkmal ist die Bewertung des Auktionsgegenstands durch
die verschiedenen Bieter.
1
Dabei ist zunachst zwischen dem Wert eines Gegenstandes f ur
einen Bieter und der Schatzung dieses oft nicht genau bekannten Wertes oder - um ein
k urzeres Wort zu haben - der Bewertung zu unterscheiden. Gibt es hier einen Unterschied,
so liegt oensichtlich eine Bewertungsunsicherheit durch den Bieter vor was der Normalfall
sein d urfte. Im Folgenden sei mit v
i
die Bewertung eines Gegenstandes durch den Bieter i
bezeichnet. Hinsichtlich dieser Bewertungen werden die folgenden Unterscheidungen bzw.
Begrisbestimmungen vorgenommen:
Wenn eine Bewertung v
i
allen anderen Bietern j = i unbekannt sind, spricht man von
private values.
Wenn die Bewertungen eines Gegenstands durch zwei Bieter i und j unabhangig von-
einander sind, spricht man von independent values. Es gilt hier, dass v
i
v
j
.
2
Beide Eigenschaften sind typischerweise gegeben, wenn es um Liebhaberobjekte geht oder
generell um Dinge, die man f ur den Eigengebrauch ersteigern mochte ohne eine Wiederver-
kaufsabsicht. Der entscheidende Punkt ist, dass im Verlauf der Auktion das Verhalten der
jeweils anderen Bieter keinerlei (relevante) Information f ur den Wert oder die Bewer-
tung eines Auktionsgegenstands beinhaltet. Damit ist auch eine wichtige Komponente
der strategischen Interaktion ausgeschaltet.
In vielen Auktionen ist diese Unabhangigkeit der Bewertungen aber nicht gegeben, weil
alle Bieter unvollkommenen uber den Auktionsgegenstand informiert sind, dabei aber ggf.
unterschiedliche Informationen haben. Wird beispielsweise das Forderrecht f ur ein

Olvor-
kommen versteigert, so wird jeder Bieter eine eigene Abschatzung der Ergiebigkeit und
Qualit at vornehmen. Dar uber hinaus kann ein Bieter aber auch hoen, vom Bietungsver-
halten der anderen etwas lernen zu konnen: Wenn meinem Mitbieter das

Olfeld x e wert
ist, dann wird das schon seine Gr unde haben, die letztlich auch f ur mich zutreend sind.
Oensichtlich hat mein Konkurrent einen Grund anzunehmen, dass das Feld diesen Betrag
wert ist. Also werde ich mal mithalten. In diesem Fall spricht man von
interdependent values. Diese sind also gegeben, wenn die Bewertung durch den Bie-
ter i (z.B. aufgrund des unterschiedlichen Informationsstandes zwischen den Bietern)
unter anderem abhangt von der Bewertung durch Bieter j: v
i
= v
i
(v
j
, ...) i = j.
Synonym zu interdependent values ndet auch der Begri correlated values Ver-
wendung in der Literatur.
Nat urlich muss der interdependente bzw. korrelierte Wert f ur die Bieter nicht identisch
sein. So kann ein bestimmtes

Olvorkommen f ur eine Firma attraktiver sein als f ur eine
andere, weil sie beispielsweise bereits spezielles Bohrgerat und/oder qualizierte Arbeiter
vor Ort hat. Trotz dieser unterschiedlichen Werte bzw. Bewertungen sind in diesem Beispiel
jedoch die Angebote der Konkurrenz nicht wertlos, sondern konnen die eigene Bewertung
beeinussen.
Ein besonders einfacher haug aber auch realistischer Spezialfall von interdependent
values liegt vor, wenn der Wert eines Gegenstands f ur alle Bieter gleich ist, d.h.
1
Davon zu unterscheiden ist die Frage, ob der Verk aufer diese Bewertungen kennt. Wie bereits im einlei-
tenden Abschnitt gesagt, ist eine Auktion fast dadurch deniert, dass dies nicht der Fall ist.
2
Die Begrisverwendung in der Literatur ist leider nicht ganz einheitlich. Bisweilen wird die Eigenschaft
der Unabhangigkeit von Bewertungen bereits als Merkmal von private values gesehen. Oft wird auch von
independent private values gesprochen, wobei hier dann klar ist, dass beide der o.g. Eigenschaften gemeint
sind.
common values vorliegen. In diesem Fall gilt also i : v
i
= v +
i
, wobei
i
ein
unabhangig mit Mittelwert von Null verteilter Storterm ist. v ist dann der typischer-
weise zwar unbekannte, aber f ur alle Bieter identische Wert. Der Storterm bringt hier
zum Ausdruck, dass auch bei einem gleichen Wert des Auktionsgegenstands die Bewer-
tungen nicht identisch sein m ussen, da individuelle Abweichungen vom wahren Wert
aufgrund von Informationsunvollkommenheiten, die in Bewertungsunsicherheiten re-
sultieren, auftreten konnen.
Ein Beispiel f ur common values sind IPOs junger Aktien. Auch wenn ex ante die
Einschatzungen des Werts junger Aktien zwischen Bietern deutlich voneinander abweicht,
sind diese plausiblerweise ex post f ur alle Bieter gleich viel wert jedenfalls wenn man von
Dingen absieht wie Erlangung von Sperrminoritaten durch den Kauf dieser Aktien oder
unterschiedliche Korrelationsmuster mit schon existierenden Portfolios.
7.2.2 Auktionsformen
Unabhangig von der Bewertung durch die Teilnehmer an einer Auktion gibt es extrem viele
und verschiedene konkrete Auktionsformen der Phantasie sind da kaum Grenzen gesetzt.
1
Bei aller Formenvielfalt lassen sich jedoch vier Grundformen unterscheiden, die in Abbil-
dung 7.1 aufgelistet sind und nachfolgenden jeweils kurz erlautert werden.
Auktionen konnen generell mit oenen oder verdeckten Geboten arbeiten. Bei oenen
Geboten ist weiterhin zu unterscheiden, ob der Bietprozess abnehmende oder zunehmende
Preise nennt. Bei verdeckten Auktionen kann danach unterschieden werden, ob der Preis
dem hochsten oder dem zweithochsten Gebot entspricht.
Auktionen
offene Auktionen verdeckteAuktionen
Englische A.
(FirstPriceOpen Cry)
Hollndische A.
(absteigendeGebote)
FirstPrice Sealed Bid
Vickrey
(SecondPrice Sealed Bid)
Auktionen
offene Auktionen verdeckteAuktionen
Englische A.
(FirstPriceOpen Cry)
Hollndische A.
(absteigendeGebote)
FirstPrice Sealed Bid
Vickrey
(SecondPrice Sealed Bid)
Abbildung 7.1: Vier Auktionsformen
Vickrey Auctions (Second Price Sealed Bid)
Diese Form der Auktion sieht vor, dass alle Bieter ihre Gebote (ohne vorherige Absprache)
in verschlossenen Umschlagen hinterlegen. Der Auktionator onet dann alle Umschlage und
erteilt demjenigen Bieter den Zuschlag, der das hochste Gebot abgegeben hat. Dieser muss
dann jedoch nur den Preis des zweithochsten Gebots bezahlen. Daher wird diese von Vickrey
(1961) zuerst beschriebene Form auch als second price sealed bid auction bezeichnet.
Obgleich das Design auf den ersten Blick etwas eigenartig aussieht, lasst sich eine Vickrey-
Auktion f ur den Fall von private independent values besonders einfach analysieren. Das
Ergebnis lautet wie folgt:
Theorem: Die ehrliche Bekanntgabe der eigenen Bewertung des Auktionsgegenstandes
ist eine schwach dominante Strategie eines Bieters in einer Vickrey-Auktion.
1
Ab Ende des 17. Jhd. wurden die G uter der ostindischen Kompanie in England in sog. Kerzenauktionen
verkauft. Dabei wurde eine kleine Kerze angez undet; den Zuschlag erhielt, wer das letzte Angebot vor dem
Verloschen der Kerze machte.
Beweis: Die Bewertung des Auktionsgegenstandes durch Bieter i sei mit v
i
bezeichnet.
Wenn i mehr als v
i
bietet, und er das hochste Gebot abgibt, muss er u.U. einen Preis
bezahlen, der uber seiner Zahlungsbereitschaft liegt. Verliert er die Auktion dennoch, ist
sein Nutzen einfach Null. Also wird er niemals einen hoheren Betrag als v
i
bieten. Wenn er
jedoch einen niedrigeren Betrag bietet, ist es denkbar, dass er die Auktion verliert und der
Zuschlag zu einem Preis p < v
i
erfolgt, der auch f ur Bieter i attraktiv gewesen ware. Daher
wird i nie ein niedrigeres Gebot als v
i
abgeben. Dies ist eine (nur) schwach dominante
Strategie, weil f ur p = v
i
Bieter i gerade indierent ist, ob er die Auktion gewinnt oder
verliert.
Das Design der Vickrey-Auktion ndet sich auch in der Realitat haug wieder. Durch die
Moglichkeit, in ebay einen Bietagenten zu beauftragen bis zu einer bestimmten Summe alle
eingehenden Gebote um die Bietmarge zu uberbieten, bezahlt letztlich der Hochstbietende
die zweithochste marginale Zahlungsbereitschaft (plus Bietmarge), nicht aber sein Hochst-
gebot. In einer Online-Auktion ist dies allein schon deswegen ein sinnvolles design, weil
potentielle Kaufer dadurch die Moglichkeit haben, alle relevanten Angaben zu einem belie-
bigen Zeitpunkt einzugeben und dann das Ende der Auktion auch nicht vor dem Bildschirm
abzuwarten.
First Price Sealed Bid Auctions
Bei dieser Auktionsform werden ebenfalls Gebote in verschlossenen Umschlagen (oder auf
eine andere Art verdeckt) abgegeben. Allerdings bezahlt hier der Hochstbietende auch den
von ihm genannten Preis. Zumindest auf den ersten Blick erscheint diese Auktionsform
plausibler und aus der Sicht des Verkaufers deutlich attraktiver zu sein.
Allerdings ist es selbst bei independent private value auctions deutlich schwieriger, eine
gleichgewichtige Bietstrategie zu formulieren. Die ehrliche Bekanntgabe der Bewertung v
i
ist namlich kein Optimum mehr, da ja dann der erwartete Nutzen aus einer gewonnenen
Auktion gleich Null ware. Trivialerweise galte dann namlich, dass p = v
i
v
i
p = 0.
Jeder, der eine solche Auktion gewinnt, ist also gerade indierent, ob er gewinnt oder verliert,
wenn als Bietstrategie die Bekanntgabe von v
i
gewahlt wird.
Daher muss eine gleichgewichtige Bietstrategie in jedem Fall ein Gebot benennen, das
unterhalb von v
i
liegt. Wie viel man darunter gehen sollte, ist aber nicht einfach und auch
nicht generell zu beantworten, da sich der folgende trade-o auftut: Je geringer das Gebot
ist, desto hoher ware die Dierenz v
i
p im Fall des Zuschlags und damit der Nutzen aus
einer gewonnenen Auktion. Auf der anderen Seite geht aber mit einem geringeren Gebot
auch die Wahrscheinlichkeit zur uck, dass man den Zuschlag erhalt. Eine Abwagung dieser
beiden Eekte bedingt mindestens eine Vorstellung uber die Verteilung der Zahlungsbereit-
schaften aller Bieter egal, ob diese jeweils unabhangig oder miteinander korreliert sind.
Diese Vorstellung ist notwendig, um abschatzen zu konnen, mit welcher Wahrscheinlichkeit
ein bestimmtes Gebot tatsachlich gewinnen wird. Eine genauere formale Analyse unterbleibt
hier.
Wenden wir uns nun den oenen Auktionen zu, bei denen der gerade aktuelle Preis
wahrend der laufenden Auktion allen Beteiligten bekannt ist. Es leuchtet ein, dass nun aus
dem Bieterverhalten wahrend des Auktionsprozesses im Prinzip bestimmte Informationen
uber die Bewertungen des Auktionsgegenstandes durch die jeweils anderen abgeleitet werden
konnen. Es bleibt zu sehen, inwiefern diese Informationen f ur die beteiligten Bieter relevant
sind und zu entsprechend verschiedenen Bietstrategien f uhren.
Hollandische Auktion
Bei der hollandischen Auktion wird vom Verkaufer (bzw. Auktionator) zunachst ein
Hochstpreis benannt, der anschlieend kontinuierlich gesenkt wird. Der Verkaufer kann sich
dabei die Moglichkeit vorbehalten, einen Mindestpreis anzugeben, bei dem das Angebot
zur uckgezogen w urde. Jeder der potentiellen Kaufer kann jederzeit die Auktion beenden,
indem er den gerade angezeigten Preis akzeptiert.
1
Das mag nicht besonders alltaglich klin-
gen, in Rasmusen (2001, p. 328) wird aber uber die kanadische Tabakborse berichtet, in
der die Kaufer um eine Art Uhr herumsitzen, die den Preis jeweils um
1
/
4
Cent nach unten
zahlt. Etwas

Ahnliches kann man bisweilen beim Verkauf verderblicher Waren beobachten,
wenn Anbieter gegen Handelsschluss die Preise sukzessive senken. Ein wichtiges Merkmal
dieser Auktionsform ist, dass sie trotz des oenen Formats keine relevante Information uber
die Bewertungen durch die anderen Bieter liefert. Denn erst wenn ein Bieter den Auktions-
gegenstand ubernimmt, signalisiert er etwas uber seine Zahlungsbereitschaft.
2
Und genau
dann ist die Auktion auch schon zu Ende. Deshalb ist f ur diese Auktionsform auch die Un-
terscheidung zwischen private values und interdependent bzw. common values nicht wirklich
bedeutsam.
Englische Auktion
Die gangigste Form ist die sog. englische Auktion, in der bindende und allen Teilnehmern
sofort bekannte Angebote genannt werden m ussen und das hochste Angebot den Zuschlag zu
dem letztgenannten Preis erhalt.
3
Jeder Bieter wird hier seine Bietstrategie wahlen vor dem
Hintergrund des Wertes, den er dem Auktionsgegenstand beimisst, seinen Einschatzungen
bzgl. der Bewertungen des Gegenstands durch die anderen Bieter und dem Verlauf der
Auktion, d.h. den bereits abgegebenen Angeboten.
Bei independent value auctions, die als englische Auktion durchgef uhrt werden, liegt
die optimale Strategie jedes Teilnehmers auf der Hand: Man bietet unterhalb des eigenen
Werts bzw. der eigenen Bewertung immer mit und uberbietet dabei andere Gebote um den
geringstmoglichen Betrag.
4
Das Ergebnis der Auktion wird sein, dass der Spieler mit der
hochsten Bewertung den Artikel zum Preis der zweithochsten Bewertung zuz uglich der mi-
nimal notwendigen

Uberbietung erhalt. Dies ist auch der Fall bei interdependent values,
weil ja im Verlauf der Auktion relevante Signale uber die Bewertungen des Auktionsgegen-
standes durch die Mitspieler bekannt werden. Relevant sind diese Signale deswegen, weil eine
oenbarte hohere Bewertung der Mitbieter wahrend der laufenden Auktion in die Revisi-
on der eigenen (interdependenten) Bewertung einieen und rechtzeitig in ein entsprechend
hohes eigenes Gebot umgesetzt werden kann.
Englische Auktionen weisen die sog. no-regret property auf. Auch wenn nach der
Auktion die Bewertungen aller Bieter klar waren, bleibt das Verhalten aller Beteiligten
optimal und daher nicht im Nachhinein zu bedauern. Der Gewinner bedauert den Gewinn
nicht, weil er unterhalb der eigenen Bewertung des Gegenstands geblieben ist egal ob diese
Bewertung durch die im Verlauf der Auktion abgegebenen Gebote der anderen beeinusst
wurde oder nicht. Und alle Verlierer der Auktion brauchen nicht zu bedauern, dass sie
den Zuschlag nicht erhalten haben, weil dieser ja zu einem Preis erfolgte, der hoher liegt
1
F ur alle, die sich schon einmal mit der genauen Prozedur der Allokation von Zentralbankgeld durch
die EZB an die Geschaftsbanken befasst haben: Dort gibt es auch ein hollandisches (und als Gegenst uck:
amerikanisches) Verfahren zur Allokation des Zentralbankgelds f ur eine gegebene Struktur von Angeboten
seitens der Geschaftsbanken im Rahmen eines Zinstendergesch afts. Nach dem hollandischen Zuteilungsver-
fahren werden alle akzeptierten Gebote zu dem niedrigsten von der EZB noch akzeptierten Zins bedient. Im
Gegensatz dazu wird bei amerikanischen Zuteilungsverfahren jedes Gebot zu dem genannten Zins bedient.
Mit dieser Unterscheidung hat das hier besprochene hollandische Auktionsverfahren nichts zu tun. In der
Auktionstheorie haben sich f ur diese Unterscheidung innerhalb von multi-unit auctions die Begrie uniform
price auction (alle Bieter bezahlen das gleiche) versus discriminatory price auctions (unterschiedliche
Bieter bezahlen f ur das gleiche unterschiedlich viel) eingeb urgert.
2
Zuvor erfahrt man auch schon etwas, dass namlich niemandes Bietstrategie vorsieht, zu einem entspre-
chend hohen Preis ein Gebot abzugeben. Aber diese Information ist oensichtlich f ur das eigene Verhalten
irrelevant.
3
Daher wird diese Auktionsform auch rst price open cry bezeichnet.
4
Die meisten Auktionsregeln schreiben bestimmte minimale Erhohungsschritte vor, die typischerweise
vom bereits erreichten Betrag abhangen.
7.3.

AQUIVALENZEIGENSCHAFTEN VON AUKTIONEN 147
als ihre Bewertung also subjektiv uberteuert ist. Im Gegensatz dazu weisen Hollandische
Auktionen diese no-regret property nicht auf, weil ja der Gewinner den Zuschlag potentiell
deutlich uber der ihm unbekannten zweithochsten Bewertung erhalt.
7.3

Aquivalenzeigenschaften von Auktionen
Die Beschreibung der vier Auktionsformen im letzten Abschnitt lasst nicht ohne weite-
res erkennen, ob bzw. unter welchen Unterschieden diese zum gleichen Ergebnis gelangen.
Ein guter Teil der Auktionstheorie beschaftigt sich mit genau dieser Frage. Der normative
Hintergrund dabei ist die Beratung vor allem von Anbietern, aber auch von Nach-
fragern von G utern, die versteigert werden sollen. Insbesondere die Versteigerung der
UMTS-Lizenzen generierte dabei einen immensen Bedarf f ur Beratung. Es ist wichtig, die
Konsequenzen unterschiedlicher Auktionsdesigns zu verstehen, um hier entsprechenden Rat
f ur das design von Auktionen und gegeben das design f ur das Verhalten in Auktionen
geben zu konnen.
Die starkste

Aquivalenz besteht zwischen der Hollandischen Auktion und der
First Price Sealed Bid Auktion. Diese beiden Auktionsformen sind strategisch aquivalent
in dem Sinn, dass sich die Bieter jeweils identisch verhalten. Auch ohne formalen Beweis
kann man sich dies relativ einfach verdeutlichen: Der entscheidende Punkt ist, dass bei beiden
Auktionen keinerlei relevante Informationen uber die Bewertungen der jeweils anderen Bieter
bekannt werden. Bei der First Price Sealed Bid Auktion ist dies durch die Konstruktion der
Auktion vollkommen klar, wie bereits erwahnt wird aber auch beim oenen, hollandischen
Auktionsformat die erste relevante Information erst dann bekannt, wenn die Auktion vor uber
ist. Die

Aquivalenz hangt deshalb auch nicht davon ab, ob es sich um private independent
oder interdependet value auctions handelt.
Eine schwachere Form der

Aquivalenz liegt zwischen der englischen Auktion
und einer Vickrey-Auktion vor. Beide sind namlich nur dann identisch, wenn alle Bie-
ter eine private valuation vornehmen. Dann wird in beiden Formaten derjenige Bieter mit
der hochsten Zahlungsbereitschaft das Gut zu dem Preis erhalten, den der Bieter mit der
zweithochsten Zahlungsbereitschaft maximal bietet bei der englischen Auktion zuz uglich
der Bietmarge. Liegen hingegen interdependent values vor, so sind die beiden Formen nicht
identisch. Das oene englische Format ermoglicht es namlich, wahrend des Bietvorgangs die
eigene Bewertung aufgrund der Gebote der anderen nach oben zu korrigieren, wahrend das
geschlossene Format der Vickrey-Auktion dies nicht zulasst.
Ein sehr wichtiges

Aquivalenzergebnis der Auktionstheorie ist die Tatsache, dass f ur
independent private valuations in allen Auktionsformen der erwartete Preis, den ein Auk-
tionsgegenstand erzielt, der gleiche ist. Dieses Ergebnis von Vickrey (1961) rmiert in der
Literatur als revenue equivalence theorem. Wichtig ist, dass dieses Ergebnis zweierlei
nicht impliziert:
Zum einen sind die gleichgewichtigen Bietstrategien nicht allen vier Formen die
gleichen; so hatten wir ja gesehen, dass bei der Second Price Sealed Bid Auktion das
ehrliche Oenlegen der Bewertung gleichgewichtig ist, wahrend dies f ur eine First Price
Sealed Bid Auktion nicht der Fall ist.
Zum anderen impliziert das genannte Ergebnis nicht, dass in jeder private value Auk-
tion unabhangig von der Form der gleiche Preis resultiert. Dies ist deshalb nicht der
Fall, weil es f ur das hollandische und das First Price Sealed Bid Format jeweils eine
Schatzung der zweithochsten Zahlungsbereitschaft braucht. Man kann nun plausibler-
weise davon ausgehen, dass diese Schatzung in der Erwartung bzw. bei hinlanglich
hauger Wiederholung der Auktion im Durchschnitt korrekt ist was dann zu dem
revenue equivalence theorem f uhrt. Das impliziert aber nicht, dass jede Realisation f ur
die Schatzung korrekt und damit das Ergebnis konkreter Auktionen immer identisch
ist
Wichtige Unterschiede zwischen den Formaten und bei der Formulierung der weiteren
Details innerhalb eines Auktionsformats betreen vor allem die Wahrscheinlichkeit,
dass sich Bieter in irgendeiner Weise nat urlich zum Nachteil des Verkaufers koor-
dinieren konnen. Verschiedene Auktionsformen machen aber die sog. Bieterkollusion
unterschiedlich leicht. Angenommen, zwei Bieter 1 und 2 wissen voneinander, dass 1 die
hohere Zahlungsbereitschaft hat und sie einigen sich darauf, dass zwar 1 die Auktion ge-
winnt, dass aber das Hochstgebot auch (deutlich) unterhalb der Zahlungsbereitschaft des 2
bleibt.
1
In einer oenen englischen Auktion ist dies einigermaen leicht durchzusetzen, denn
1 sieht sofort, wenn 2 sich nicht an die Abmachung halt und kann dann glaubw urdig die
Auktion bis uber die Zahlungsbereitschaft des 2 hinaus treiben. In diesem Sinne ermoglicht
die englische Auktion die rechtzeitige Entdeckung eines Abweichens von kollusivem Verhal-
ten und stabilisiert damit die Kollusion. Demgegen uber ware bei einer First Price Sealed
Bid Auktion die Kontrolle schwieriger, da der 2 die Auktion nun tatsachlich gewinnt, wenn
er sich gerade nicht an die Abmachung halt und ein klein wenig mehr bietet als zuvor f ur
den 1 ausgemacht. Wenn der 1 die Auktion ganz sicher gewinnen will, muss er die Bewer-
tung des 2 wirklich uberbieten und diesen Preis auch bezahlen.

Ahnliches gilt auch f ur die
Hollandische Auktion. Sobald hier der Preis die Zahlungsbereitschaft des 2 unterschreitet,
konnte dieser jederzeit zuschlagen und damit die Auktion beenden, ohne dass 1 noch etwas
dagegen tun konnte. Daher d urfte es hier schwieriger sein, Abweichungen von Kollusion zu
verhindern, was Kollusion wiederum weniger attraktiv und wahrscheinlich macht.
Wenn ein Verkaufer also Kollusion f urchtet zwischen den Bietern, die sich f ur sein Pro-
dukt interessieren, so tut er gut daran, keine englische Auktion zu veranstalten. Nat urlich
impliziert dies nicht, dass eine hollandische Auktion oder ein nicht oenes Format eine per-
fekte Versicherung gegen Bieterkollusion darstellen. Selbstverstandlich konnen auch verdeckt
abgegebene Angebote abgesprochen sein. Diverse Skandale im Bereich oentlicher Ausschrei-
bungen illustrieren dies immer wieder.
2
Die hier immer wieder beobachtbare oder wenigstens
vermutbare Kollusion wird verstandlich, wenn man sich vor Augen f uhrt, dass die Konkur-
renz um Auftrage zwischen Firmen letztlich ein wiederholtes Spiel ist. Bekanntermaen kann
in einem solchen Kontext ein Verhalten Teil einer gleichgewichtigen (teilspielperfekten) Stra-
tegie sein, das in einem one-shot-Spiel nicht moglich ware.
7.4 Winners curse
Stellen wir uns folgende Situation vor: Eine Firma steht zum Verkauf, und Sie uberlegen,
ob und wenn ja bis zu welchem Preis Sie mitbieten sollen. Da die Firma durch Sie nicht
vollstandig evaluiert werden kann, wissen Sie nur etwas uber die Wahrscheinlichkeitsvertei-
lung des tatsachlichen Werts. Um die Dinge moglichst einfach zu halten, sei angenommen
dass ein Firmenanteil (z.B. eine Aktie) mit jeweils gleicher Wahrscheinlichkeit zwischen 0
und 100 e wert sein kann. Dementsprechend ist der Erwartungswert des Firmenanteils ge-
geben durch
1
101
100
i=0
i = 50. Das alte Management der zu verkaufenden Firma kennt diese
naturgema sehr gut und wei daher besser, was die Firma wert ist, hat aber keine Moglich-
keit, diesen Wert glaubhaft zu kommunizieren. Der Einfachheit halber sei angenommen, dass
das alte Management den (zwischen 0 und 100 e liegenden) Wert ganz genau kennt. Das
alte Management kann beim Verkauf der Firma mitbieten.
Die Frage ist nun, welchen Betrag Sie als risikoneutraler Investor f ur diese Firma ma-
1
F ur sich genommen ist das nat urlich f ur den 2 keine dominante Strategie, da er ja bis zu seiner Bewertung
gehen konnte. Allerdings konnte es Teil einer gleichgewichtigen Strategie in einem groeren Zusammenhang
sein; innerhalb dieses groen Spiels w urde Bieter 1 dem Bieter 2 dann ebenfalls bestimmte Vorteile zu-
kommen lassen m ussen.
2
Eine typische Ausschreibung eines oentlichen Auftrags kann als First Price Sealed Bid Auktion ver-
standen werden: Es erhalt das g unstigste Angebot den Zuschlag zu dem in diesem Angebot genannten Preis.
7.4. WINNERS CURSE 149
ximal bieten sollten. Zur Illustration sei eine englische Auktion angenommen. Eine nahe
liegende Antwort ware nat urlich, dass Sie bis zu 50 e, d.h. bis zu dem Erwartungswert des
Firmenwerts mitbieten und danach aussteigen, sollte der Preis noch hoher gehen. Diese auf
den ersten Blick plausible Strategie w urde aber bei Gewinn der Auktion mit Sicherheit (!)
zu einem Verlust f uhren, was folgende

Uberlegung klar macht: Wenn das Gebot (von 50 e
oder weniger) gewinnt, steht fest, dass das alte Management kein hoheres Gebot abgegeben
hat und auch nicht abgeben wollte und damit der Firmenanteil in jedem Fall nicht mehr als
der zuletzt gebotene und damit auch zu bezahlenden Preis wert ist. Ist die Firma hingegen
mehr wert, kommt man mit einem Maximalangebot in Hohe des erwarteten Firmenwerts
nicht zum Zuge, da ja das besser informierte alte Management dann uberbieten wird. Da-
mit unterliegt der Auktionsgewinner in der Tat einem Fluch, eben dem winners curse:
Wenn man die Auktion gewinnt, verliert man sicher. Nur wenn man den Zuschlag nicht
erhalt, kann man Verluste vermeiden. Das Beispiel ist extrem gewahlt, macht aber klar,
dass aufgrund der existierenden Informationsasymmetrie auch ein risikoneutraler rationaler
Investor kein positives Gebot abgeben sollte.
Das Merkmal eines (nat urlich verlustbringenden) erfolgreichen Gebots oberhalb des tat-
sachlichen Werts der Firma hangt jedoch nicht an der gerade getroenen Annahme der
(extremen) Informationsasymmetrie. Betrachten wir daher die folgende, deutlich realisti-
schere Situation: Wiederum betragt der Erwartungswert der Firma 50 e, die individuellen
Einsch atzungen der einzelnen Bieter variieren aber um diesen Wert. Beispielsweise sollen
f unf Anbieter subjektive Einschatzungen des Firmenwerts in Hohe von {30, 40, 50, 60, 70}
haben, so dass auch die durchschnittliche Bewertung dem Erwartungswert der Firma ent-
spricht. Wenn man nun nur die eigene Einschatzung, nicht aber die objektiv vorhandene
Unsicherheit, dem eigenen Bietverhalten zugrunde legt, so ist klar, dass der Bieter mit der
hochsten Zahlungsbereitschaft die Auktion gewinnt und einen Preis bezahlt, dessen Hohe
von dem Auktionsdesign abhangt, der aber oberhalb des Firmenwerts von 50 e liegt. Dies
f uhrt jedoch zu einem Verlust wiederum ist der Auktionsgewinner ein Opfer des winners
curse geworden.
Der Grund daf ur ist nun einfach einzusehen: Wenn individuelle Bewertungen mit Un-
sicherheiten behaftet sind und um den wahren Wert streuen, so f uhrt eine Unterschatzung
einfach nur dazu, dass man die Auktion verliert und eine Auszahlung von Null realisiert.
Eine

Uberschatzung f uhrt jedoch zum Gewinn der Auktion und damit zu einem Verlust.
Anders gesagt: Wenn man eine common value Auktion gegen sachkundige Mitbieter ge-
winnt, sollte man sich Sorgen machen. Es gewinnte namlich derjenige die Auktion, der den
groten positiven Bewertungsfehler macht. Die Konsequenz daraus ist oensichtlich: Bei
Bewertungsunsicherheit sollte rationalerweise das Maximalgebot nur einen Teil
der eigenen Bewertung betragen! Eine genaue formale Analyse ist jedoch auch in die-
sem Fall relativ anspruchsvoll und kommt nicht ohne Annahme bzgl. der Verteilung der
Bewertungen aus.
Die urspr ungliche Formulierung des winners curse basiert auf einem Beispiel der

Olindu-
strie. Die Firmen, die die Bohrrechte im Golf von Mexiko ersteigert haben, konnten mit ihren
Operationen allesamt keinen Prot machen, haben also oensichtlich bei der Auktion der
Bohrrechte zu viel daf ur bezahlt. Die Analyse dieser Situation in Capen/Clapp/Campbell
(1971) f uhrte den Begri in die Literatur ein.
Rasmusen (2001), S. 333 listet f ur vier verschiedene Sealed Bid Auktionen von

Olbohr-
rechten in den 1960er Jahren die (von seriosen Anbietern) abgegebenen Gebote auf. Das
Verhaltnis von hochstem und niedrigstem Gebot schwankte dabei zwischen 6,9 und 108,8.
1
Schon dieses krasse Verhaltnis legt nahe, dass die Idee des winners curse in diesen Fallen
eine wichtige Rolle spielte.
Wichtig ist allerdings die Erkenntnis, dass der winners curse im Gleichgewicht, d.h.
1
Das sind wohlgemerkt keine Gebote im Verlauf einer aufsteigenden Auktion, sondern einzige und nale
Gebote in einer Sealed Bid Auktion.
bei rationalem Bieterverhalten, keine Rolle spielt. Denn wie so oft gilt auch hier, dass
die Einsicht in das Problem bereits davor bewahrt, (im Erwartungswert) ein Opfer davon
zu werden. Diese Einsicht besteht darin, dass die eigene Bewertung des Guts nicht in vol-
lem Umfang als Maximalgebot genannt werden darf, sondern entsprechend herunterskaliert
werden muss - wohlgemerkt gilt diese Anforderung an die gleichgewichtige Bietstrategie f ur
rationale und auch risikoneutrale Bieter. Allerdings ist es sehr schwierig anzugeben, wie
gro der Abstand zwischen Bewertung und Gebot liegen muss. Die Antwort darauf hangt
ab von der empirischen Verteilung der Bewertungen durch die Bieter - und nat urlich die
Korrekturen, die diese bei der Umwandlung von Bewertungen in Gebote vornehmen.
Die folgende Illustration zeigt den winners curse noch einmal sehr schon: Einer Gruppe
von StudentInnen wurde eine transparente Schachtel mit einigen M unzen gezeigt. Nat urlich
konnte per Blickdiagnose der Betrag nicht gezahlt, sondern allenfalls grob geschatzt wer-
den. Dar uber hinaus wurde die Information gegeben, dass sich in der Schachtel ausschlie-
lich auf Cent lautende M unzen (d.h. M unzen zu 1, 2,5, 10, 20 und 50 Cent) benden. Diese
Schachtel wurde zur Versteigerung im First Price Sealed Bid-Verfahren gebracht. Nat urlich
hatte die Schachtel f ur alle Bieter den gleichen Wert, namlich die sich darin tatsachlich
bendliche Summe. Das Problem bestand nat urlich in der Abschatzung, wie viel in der
Schachtel wirklich ist. Es waren tatsachlich genau 1,49 e. Die folgende Abbildung 7.2 zeigt
die Hohe der insgesamt 21 Gebote:
14
30
45
52
62
72 73 75 77
80 80 81 82
85
93
105
150
163
167
195
317
0
50
100
150
200
250
300
350
1 3 5 7 9 11 13 15 17 19 21
G
e
b
o
t
e
i
n
C
e
n
t
wahrerWert:149
Gebote-MW:100
Gebote-Median:80
"Winningbid":317
Abbildung 7.2: The winners curse
Folgende Beobachtungen sind bemerkenswert:
16 von 21 Geboten waren unterhalb des wahren Wertes von 1,49 e. Sowohl Mittelwert
(100 Cent) als auch Median (80 Cent) der Gebote lagen deutlich unterhalb des wahren
Wertes. Dieses Bieterverhalten deutet entweder auf eine stark ausgepragte Risikoaver-
sion hin oder aber auf eine Einsicht in die Problematik des winners curse.
Immerhin 5 von 21 Geboten (knapp 24 %) waren hoher als der wahre Wert, d.h. sind
im Fall des Gewinns mit Verlust verbunden. F unf Bieter waren also potentielle Opfer
des winner curse, auch wenn der Fluch letztlich nur einen wirklich ereilt hat.
Der Gewinner der Auktion mit einem Gebot von 3,17 e ist tatsachlich der (einzige)
Verlierer. Auch wenn der Verlust mit 1,68 e in absoluten Zahlen uberschaubar ist,
wurde immerhin mehr als das Doppelte (!!) des wahren Wertes geboten.
7.5. ERWEITERUNGEN UND ANWENDUNGEN 151
7.5 Erweiterungen und Anwendungen
Auktionen von einzelnen Objekten erf ullen typischerweise zwei zentrale Eigenschaften:
1
Auktionen sorgen f ur allokative Ezienz in dem Sinne, dass derjenige Bieter das
Objekt erhalt, der dieses am hochsten bewertet.
Auktionen sorgen daf ur, dass der Verkaufer den grotmoglichen Betrag f ur das Objekt
erlost, also seine Einnahmen aus dem Verkauf maximiert. Dies resultiert insb.
aus der (f ur den Bieter rationalen) Oenbarung der Bewertungen der Bieter.
Die folgenden Abschnitte zeigen, dass dies in einem Kontext mit mehreren G utern nicht
mehr notwendigerweise erf ullt ist. Dies ist bereits dann der Fall, wenn mehrer Einheiten
eines Guts homogenen Guts versteigert werden sollen, was in Abschnitt 7.5.1 untersucht
wird. Die Abschnitte 7.5.2 auf der nachsten Seite bis 7.5.4 auf Seite 153 befassen sich mit
der simultanen Versteigerung von heterogenen G utern. Abschlieend wird in Abschnitt 7.5.5
auf Seite 154 auf einige wichtige Aspekte der Versteigerung der UMTS-Lizenzen ein.
7.5.1 Multi-Unit-Auktionen
Im multi-unit-Auktionen werden mehrere homogene Einheiten eines Produkts simul-
tan versteigert. Oft werden Auktionen dabei so ausgestaltet, dass alle erfolgreichen Bieter
den gleichen Preis bezahlen m ussen (uniform price auction). Schon in diesem einfachen Fall
werden die beiden gerade genannten Eigenschaften der allokativen Ezienz und der Ein-
nahmenmaximierung moglicherweise verletzt. Dies ist im Folgenden zu zeigen.
Angenommen, es gibt n Einheiten dieses Produkts und jeder der mehr als n Bieter
mochte jeweils nur eine Einheit. Dann kann ein Auktionator alle Bieter jeweils zu einem
verdeckt gemachten Gebot auordern. Der Auktionator sucht dann die n hochsten Gebote
heraus und benennt den Preis des n+1-hochsten Gebots f ur alle erfolgreichen Bieter. Damit
liegt eine einfache Erweiterung der Zweitpreisauktion auf den Fall von n Einheiten vor die
n+1-Preisauktion. Auch hier haben alle Bieter einen Anreiz, die wahren Bewertungen auch
zu bieten. Ein einfaches Beispiel moge den Mechanismus illustrieren. Es sei n = 3 und es
mogen Gebote vorliegen, die Preise von 100, 90, 80, 50 und 10 bezahlen. Dann gehen die drei
Einheiten zu einem Preis von jeweils 50 an diejenigen, die 100, 90 und 80 geboten hatten.
Sowohl allokative Ezienz als auch Einnahmenmaximierung liegen vor.
Betrachten wir nun den folgenden nur leicht komplizierteren Fall, in dem ein Bieter Ver-
wendung auch f ur mehrere Einheiten des gleichen Produkts haben kann. Wieder
sollen insgesamt 3 Einheiten zur Verf ugung stehen. Die nicht mit Unsicherheit behafteten
Bewertungen durch drei Bieter A, B und C f ur die erste, zweite und dritte Einheit (denken
Sie an drei Flaschen Wein) sind in der folgenden Tabelle 7.1 auf der nachsten Seite zu-
sammengefasst. Der Nettonutzen (Konsumentenrente) eines Bieters f ur die jeweilige Einheit
entspricht dieser Bewertung abz uglich des dem Verkaufer zu bezahlenden Preises. Es sei
weiterhin angenommen, dass diese Informationen allgemein bekannt sind.
Nat urlich w urde die Forderung nach Ezienz der aus der Auktion resultierenden Alloka-
tion implizieren, dass A alle drei Einheiten des Guts erhalt seine Zahlungsbereitschaft auch
f ur die dritte Einheit ist groer als die nachstgrote Zahlungsbereitschaft, die B f ur die erste
Einheit aufbringen w urde. Bei diesem Ergebnis (und unter Vernachlassigung der Bietmarge)
ware der Nettonutzen von A gegeben durch 100 + 90 + 80 (3 50) = 270 150 = 120.
Allerdings ist dies kein gleichgewichtiges Ergebnis. A hatte namlich einen strategischen An-
reiz, seine Zahlungsbereitschaft f ur die dritte Einheit zu verschweigen und nur ein Gebot
abzugeben in Hohe von 10 (+ Bietmarge) f ur zwei oder drei Einheiten. Da zu diesem Preis
1
Jehiel/Moldovanu (2003) geben einen guten

Uberblick uber die Schwierigkeiten, die sich bei multi-object
auctions ergeben konnen und diskutieren die Erfahrungen mit den Versteigerungen der UMTS-Lizenzen in
Europa. Der folgende Abschnitt macht einigen Gebrauch von dieser Darstellung.
Bieter/Gut 1. Einheit 2. Einheit 3. Einheit
A 100 90 80
B 50 0 0
C 10 0 0
Tabelle 7.1: Zahlungsbereitschaften dreier Bieter f ur jeweils drei Einheiten eines Gutes
C nach wie vor aus dem Rennen ist, nunmehr aber B eine Einheit nimmt, erhalt A bei
diesem Gebot zwei Einheiten zum Preis von 10 + Bietmarge. Wird die Bietmarge wie-
der vernachlassigt, so ergibt sich durch dieses Gebot ein Nettonutzen f ur A in Hohe von
100 + 90 (2 10) = 190 20 = 170 > 120. Gegen uber der ehrlichen Angabe der Zahlungs-
bereitschaften kann er sich also besser stellen und wird dies auch tun. Dennoch ergibt sich
eine ineziente Allokation (B bekommt eine Einheit, die A als dritte Einheit hoher schatzen
w urde) und auch das Ziel der Einkommensmaximierung durch den Verkaufer ist oensicht-
lich verletzt, da er f ur die drei Einheiten des Guts bei einem Preis von 10 insgesamt nur 30
erlost, wahrend auch f ur einen Preis, der 50 uberschreitet (aber nicht hoher als 80 ist) das
Angebot vollstandig nachgefragt w urde und einen Umsatz von 150 garantieren w urde.
7.5.2 Komplementaritaten bei multi-object auctions
Angenommen in der Regensburger Innenstadt werden zwei nebeneinander liegende Auto-
stellplatze frei und der Vermieter veranstaltet eine Auktion um diese Platze. Diese Auktion
kann entweder um den Verkaufspreis gehen oder aber auch uber den monatlichen Mietpreis.
Um die Zahlen ubersichtlich zu halten, nehmen wir letzteres an.
Es gibt zwei potentielle Bieter, A und B. A hat einen Wagen mit Anhanger und w urde
100 e f ur beide Platze zusammen bieten, jedoch 0 f ur einen einzelnen Stellplatz, da ein
einzelner Platz sein Problem nicht lost. Damit liegt eine klare und sogar denkbar extreme
Komplementaritat vor: Ein Stellplatz allein hat f ur A keinerlei Wert, erst die Kombination
der beiden Platze schat f ur ihn einen Wert und induziert eine entsprechende Zahlungs-
bereitschaft. B hat hingegen nur ein normales Auto, das mit einem Stellplatz auskommt.
F ur diesen w urde er 75 e bieten, wobei es ihm letztlich egal ware, ob er daf ur einen oder
zwei Platze erhalt. Weitere Gebote gibt es nicht. Nat urlich w urden sowohl allokative Ezi-
enz als auch Einnahmenmaximierung fordern, dass Bieter A beide Platze erhalt. Dies ware
auch ohne weiteres der Fall, wenn die beiden Platze als Paket erwerbbar sind, d.h. wenn die
Auktionsprozedur die Flexibilitat aufweist, dass nicht nur ein Gebot auf einen Platz abge-
geben werden kann, sondern auch auf beide zusammen. Werden namlich die Platze einzeln
versteigert, so w urde Bieter A bei einem Preis von 50 e pro Platz aussteigen und Bieter
B erhalt zu diesem Preis den Zuschlag. B zu uberbieten liegt also nicht im Interesse von A,
obwohl A eine hohere Bewertung und damit Zahlungsbereitschaft aufweist.
Halten wir also fest: Bei Komplementaritaten zwischen einzelnen Bestandteilen eines
B undels konnen separate Auktionen der Bestandteile zu Verletzungen sowohl der Ezienz-
bedingung f uhren als auch einer Einnahmenmaximierung seitens des Verkaufers im Wege
stehen. Die Losung des Problems best unde in diesem Fall in der Zulassigkeit der Abgabe
von Geboten auf entsprechende Pakete.
7.5.3 Multi-object auctions ohne Komplementaritaten: Die Moglich-
keit eines Zielkonikts zwischen Ezienz- und Einnahmenziel
Auch ohne das Vorliegen von Komplementaritaten zwischen den G utern kann es gravierende
Probleme bei der Beurteilung von multi-object auctions geben. Wiederum soll ein einfaches
Beispiel den Punkt verdeutlichen. Hier mogen zwei Bieter, A und B die Moglichkeit haben
von einem Verkaufer zwei G uter, nennen wir diese 1 und 2 zu ersteigern. Es gibt dabei
auch keinerlei Bewertungsprobleme die folgenden (Brutto-) Bewertungen in Tabelle 7.2
seien bekannt und auch nicht mit Unsicherheit behaftet. Allerdings sind die Praferenzen
sehr heterogen, d.h. auch die Reihenfolge der Bewertung der beiden G uter dieriert hier
uber die beiden Bieter.
Bieter/Gut Gut 1 Gut 2 {1 und 2}
A 100 70 170
B 50 120 200
Tabelle 7.2: Zahlungsbereitschaften von zwei Bietern (A und B) f ur zwei Produkte (1 und
2)
Zwei separate Zweitpreisauktionen (oder auch englische Auktionen) w urden unter Ver-
nachlassigung der Bietermarge zu dem Ergebnis f uhren, dass Gut 1 f ur einen Preis von 80
an Bieter A geht und Gut 2 zu einem Preis von 70 an Bieter B. Allokative Ezienz ware
erreicht, da die G uter jeweils an die Bieter mit der hochsten Zahlungsbereitschaft gehen.
Der Verkaufer erzielt Einnahmen f ur beide G uter in Hohe von 80 + 70 = 150.
Die letzte Spalte von Tabelle 7.2 gibt die kumulierte Bewertung f ur das G uterb undel
{1 und 2} durch die beiden Bieter an. Da hier keinerlei Komplementaritaten unterstellt
werden, entsprechen diese kumulierten Bewertungen einfach den Summen der Bewertungen
der beiden G uter. Es ist sofort zu sehen, dass der Verkaufer bei den hier vorliegenden
Bewertungen ein besseres Resultat erzielen konnte, wenn er die beiden G uter b undelt. Eine
Zweitpreisauktion f ur das gesamte B undel w urde dieses namlich zu einem Preis von
170 an Bieter B gehen lassen. Oensichtlich sind hier die Einnahmen des Verkaufers hoher
als bei separaten Auktionen (170 > 150), allerdings resultiert eine allokative Inezienz: Gut
1 geht an Bieter B, obwohl Bieter A dies hohere bewertet.
In diesem Fall liegt somit ein Zielkonikt zwischen Einnahmenmaximierung sei-
tens des Verkaufers und allokativer Ezienz vor. Wenn nun ein ausschlielich an den
Einnahmen interessierter Verkaufer die Auktion zu gestalten hat, liegt es auf der Hand, dass
er eine B undelung vorzieht. Dies ist aber beispielsweise schon dann nicht mehr der Fall, wenn
der Staat G uter zu versteigern hat und dabei die allokative Ezienz durchaus ein Kriterium
ist.
7.5.4 Multi-object auctions und Bieterkollusion
Das Problem der Bieterkollusion kann auch bei Versteigerung einzelner Objekte auftreten.
Wie bereits ausgef uhrt, ist dabei die englische Auktion am ehesten anfallig, weil ein ab-
weichendes Verhalten des absichtlichen Verlierers rechtzeitig festgestellt werden konnte
und dieser daher sich eher an die Abmachung halten wird als bei Auktionen mit verdeckten
Geboten. Bei simultaner Versteigerung mehrerer (teilbarer) Objekte verscharft sich dieses
Problem jedoch, weil nun die Bieter allesamt erfolgreich sein konnen in dem Sinn, dass sie
sich die Objekte teilen, dabei aber alle von einem niedrigen Preis protieren. Wahrend ei-
ne explizite Absprache durchaus illegal sein kann, ist es dann moglich, in einer englischen
Auktion uber den Preis Signale auszusenden.
Das prominenteste Beispiel daf ur ist die Versteigerung der Mobilfunklizenzen der zweiten
Generation (GMS) f ur Deutschland im Oktober 1999.
Gegenstand dieser Versteigerungen waren 9 identische Blocke zu je 2 x 1 MHz und ein
Block zu 2 x 1,4 MHz (mit entsprechend hoherer Kapazitat). Das Minimalangebot wurde
auf 1 Million DM pro MHz-Paar festgelegt, die minimale Erhohung zwischen zwei Runden
auf 10%, wobei alle gebotenen Betrage durch 10000 DM ganzzahlig teilbar sein mussten. Die
beiden groen Spieler waren Mannesman und T-Mobile, auerdem waren als von vorneherein
kleinere Spieler Viag Interkom und E-Plus mit dabei. Diese sind dann allerdings sehr schnell
im Verlauf der Auktion ausgestiegen.
In der ersten Runde gab Mannesmann das folgende Gebot ab: F ur die Blocke: 1-5: je
36,36 Millionen DM, f ur die Blocke 6-9: je 40 Millionen DM, f ur Block 10: 56 Millionen DM.
In der zweiten Runde bot dann T-Mobile f ur die Blocke 1-5 je 40,01 Millionen DM,
uberbot aber Mannesmann bei den Blocken 6-10 nicht. Damit war die Auktion bei einem
Preis von ca. 20 Millionen DM pro MHz f ur alle Beobachter uberraschend fr uh beendet.
Insgesamt wurden 416,05 Millionen DM bei dieser Auktion erlost. Zum Vergleich: Die Erlose
bei der Versteigerung der UMTS-Lizenzen waren mit insg. ca. 100 Milliarden DM um einen
Faktor 240 (!) hoher.
Im Nachhinein wurde das Bieterverhalten wie folgt interpretiert: Durch den sehr weit
uber dem Minimalgebot von 1 Million DM pro MHz-Paar liegenden Einstieg signalisierte
Mannesmann an T-Mobile, dass nicht lange in letztlich uninteressanten Regionen herum-
gealbert werden solle, sondern man einem raschen Ende der Auktion nat urlich zu einem
attraktiven Preis nicht im Wege stehen w urde. Weiterhin signalisierte Mannesmann durch-
aus verstandlich, exakt wo der Preis liegen und wie die Aufteilung erfolgen sollte. Die Blocke
1-5 stellen ja exakt das gleiche Gut dar wie die Blocke 1-9 und Block 10 ist prazise 40%
mehr wert. F ur Block 10 wurde auch prazise 40% mehr geboten als f ur die Blocke 6-9. F ur
die Blocke 1-5 wurde demgegen uber exakt der Betrag geboten, der bei Aufstockung um 10%
(die minimale Erhohung zwischen zwei Runden) eben den Betrag von 40 Millionen DM er-
geben hatte. T-Mobile hat dann in der zweiten Runde den Mindestbietbetrag f ur die Blocke
1-5 von 40 Millionen DM um den geringstmoglichen Betrag von 10000 DM uberschritten.
Diese unnotige

Uberschreitung wurde so interpretiert und oensichtlich auch verstan-
den , dass man zwar mit dem von Mannesmann signalisierten Plan einverstanden ist, sich
aber gegen die kleineren Mitbieter durchaus weiter zur Wehr setzen w urde, wenn diese den
Preis nach oben treiben sollten. Da aber Viag Interkom und E-Plus die Botschaft verstanden
hatten, zogen sich diese zur uck und es kam zu dem beschriebenen Ergebnis.
Ein Vertreter von T-Mobile kommentierte dieses Ergebnis im Nachhinein wie folgt: No,
there were no agreements with Mannesmann. But Mannesmanns rst bid was a clear oer.
Given Game Theory, it was expected that they show what they want most.
Dieses Beispiel zeigt, wie in oenen Auktionsformaten eine selbstverstandlich nicht
justitiable Form der Absprachen auftreten kann. Dabei ist es durchaus glaubw urdig, dass
es in der Tat keinerlei (verbotene) explizite Absprachen gegeben hat. Es reichte vollig, dass
sich der erste Bieter einen Plan ausgedacht hat, bei dem er davon ausgehen konnte, dass er
a) verstandlich signalisierbar und b) konsensfahig ist. Beides ist mit dem ersten Gebot von
Mannesmann tatsachlich gelungen.
7.5.5 Die Versteigerung der UMTS-Lizenzen
Die Versteigerung der UMTS-Lizenzen war v.a. in den europaischen Landern eine spekta-
kulare Anwendung von Auktionen. Von den 14 Mitgliedslandern der Europaischen Union
(vor der Osterweiterung am 1.5.2004 und ohne Luxemburg), haben sechs Staaten die Li-
zenzen uber Verwaltungsprozeduren (sog. beauty contests) verteilt (Finnland, Frankreich,
Irland, Portugal, Schweden, Spanien). Bei diesen ging es um die

Uberpr ufung technischer
und nanzieller Leistungsfahigkeit der Bewerber um Lizenzen, mit denen dann in der Re-
gel ein positiver Preis f ur die Lizenz ausgehandelt wurde. Nur im Fall Finnlands wurde
die Lizenz den Netzbetreibern kostenlos uberlassen. Die anderen Lander wahlten alle ein
Auktionsformat, wobei es auch hier wieder sehr deutliche Unterschiede in der konkreten
Ausgestaltung zwischen den Landern gegeben hat.
Spektakular waren bei diesen Auktionen nat urlich insb. die schieren Summen, um die es
ging. Mehr als 37 Mrd. e wurden in Grobritannien erlost, in Deutschland waren es etwas
uber 50 Mrd. e. Tabelle 7.3 auf der nachsten Seite zeigt die Erlose f ur einige Lander in
e je Einwohner f ur einige Lander in Europa. Es ging jeweils um die Nutzungsrechte eines
Frequenzspektrums von zwischen 125 und 155 MHz f ur eine Dauer von 20 Jahren. In den
einzelnen Landern wurden dabei zwischen zwei und sechs Lizenzen vergeben.
1
Land e/Einwohner
Finnland 0
Spanien 15
Grobritannien 648
Niederlande 171
Deutschland 613
Italien 240
Osterreich 82
Frankreich 337
Tabelle 7.3: Auktionserlose f ur die UMTS-Lizenzen je Einwohner
Auf der anderen Seite waren mit diesen Auktionen aber auch interessante theoretische
Komplikationen verbunden, auf die im Folgenden eingegangen werden soll. Dabei sind im
Zusammenhang mit UMTS-Auktionen zwei Stichworte von besonderer Bedeutung: Kom-
plementaritaten der zu versteigernden G uter und Externalitaten des Auktions-
ergebnisses auf den nachfolgenden Wettbewerb im Mobilfunkmarkt. Beide Eigenschaften
werden nachfolgend kurz diskutiert.
Komplementaritaten
Auf diese Eigenschaft wurde bereits weiter oben eingegangen. Im Zusammenhang mit Mo-
bilfunklizenzen bedeutet ein groeres Frequenzspektrum und damit der simultane Erwerb
mehrerer Frequenzpakete eine hohere Kapazitat f ur den spateren Betrieb. Aufgrund von
Fixkosten f ur den Netzwerkaufbau (Sende- und Empfangseinrichtungen), aber auch f ur Wer-
bung und f ur den laufenden Betrieb ist es daher durchaus plausibel, dass bspw. ein Spek-
trum von 40 MHz mehr wert ist als das Doppelte von 20 MHz. Die

Uberlegungen weiter
oben legten nahe, dass in einem solchen Fall sowohl Ezienz- als auch Einnahmemaximie-
rungs uberlegungen f ur eine gewisse Flexibilitat des Auktionsdesigns sprechen. Insbesondere
sollte es den Bietern moglich sein, Gebote f ur mehrere Pakete abgeben zu konnen. Bei der
UMTS-Auktion in Deutschland war dies folgendermaen geregelt: Bei einem Gesamtange-
bot von 12 Frequenzblocken musste ein Bieter wenigstens f ur zwei Blocke bieten, war aber
beschr ankt auf maximal 3 Blocke. Das Auktionsdesign sah nicht vor, dass alle 12 Blocke
versteigert werden mussten. Mit dieser Regel war klar, dass am Ende zwischen null und
sechs Firmen den Mobilfunkmarkt unter sich aufteilen w urden.
Externalitaten des Auktionsergebnisses auf den Wettbewerb
Im Gegensatz zu vielen anderen Auktionen wurde bei der Versteigerung der UMTS-Lizenzen
ein Geschaft nicht abgeschlossen, sondern vielmehr eronet. Schlielich ist die Lizenz ja
nur eine Eintrittskarte in einen wichtigen Markt. Selbstverstandlich hangt f ur einen Bieter
der Wert dieser Eintrittskarte ab von den auf dem Mobilfunkmarkt ( uber 20 Jahre) zu
erwartenden Gewinnen. Gleichzeitig hangen diese Gewinne aber von der Marktstruktur ab,
die in genau dieser Auktion bestimmt wird. Da ja ex ante, wie gerade gesehen, die Zahl der
spateren Wettbewerber nicht feststand, ergab sich hier eine sehr bedeutsame Interdependenz:
Der Wert des Auktionsgegenstandes hangt von der Marktsituation ab, die sich aber erst
1
Obwohl die Versteigerungsbedingungen in Deutschland eine eindeutige Verpichtung zum jeweils vollig
getrennten Ausbau und Betrieb des Netzes vorsahen, ist mittlerweile aufgrund massiver nanzieller Probleme
einiger der Betreiber klar, dass dies nicht geschehen wird.
durch die Auktion bestimmt. Abbildung 7.3 visualisiert diesen Zusammenhang. Aus der Sicht
eines potentiellen Bieters handelt es sich dabei um ein 2-stuges Spiel, wobei strategische
Interaktionen sowohl innerhalb der einzelnen Stufe als auch uber die beiden Stufen hinweg
eine oensichtliche Bedeutung haben.
Bieterverhaltenbei
derLizenzauktion
Strukturdes UMTS-
Mobilfunkmarktes
Abbildung 7.3: Die Besonderheit der UMTS-Auktion
Schon nur diese Struktur macht deutlich, dass es ein eindeutiges Gleichgewicht bei diesem
2-stugen Spiel nicht mehr geben kann, sondern nunmehr die Erwartungen der Marktteil-
nehmer eine entscheidende Rolle spielen. Wird ein harter Wettbewerb mit vielen Anbietern
und entsprechend geringen Gewinnmargen erwartet, so wird die Zahlungsbereitschaft bei der
Auktion nicht sehr hoch sein und damit die Lizenz relativ billig werden was die Erwartun-
gen dann ex post genau erf ullt. Umgekehrt wird f ur Lizenzen mehr bezahlt, wenn eine wenig
kompetitive Marktstruktur erwartet wird. Aufgrund der hohen (und dann f ur zusatzliche
Bieter unattraktiven) Preise wird auch diese Erwartung sich selbst erf ullen. Man spricht
in diesem Zusammenhang auch von self-fullling prophecies. Der entscheidende Punkt
dabei ist, dass unterschiedliche ex ante Erwartungen ein Verhalten induzieren, dass diese
Erwartungen ex post validiert. Damit liegen nat urlich multiple Gleichgewichte vor, die
es vollig unmoglich machen, eine konkrete Prognose uber das Auktionsergebnis abzugeben.
Eine vor der UMTS-Auktion von Investment-Banken erstellte Studie uber den Wert
der Lizenzen arbeitete diesen Punkt sehr deutlich heraus: Unter der Hypothese, dass bei
insgesamt vier Firmen im Markt sich eine dominante Firma (mit hoherem Frequenzspektrum
als die anderen) herausbilden kann, wurde der Wert auf 88,4 Milliarden e taxiert also noch
einmal deutlich mehr als die tatsachlich erloste Summe. Wenn allerdings f unf Firmen auf
dem Markt sind und dabei ein aggressiver neuer Wettbewerber f ur rasch sinkende bzw.
generell tiefe Preise sorgt, wurde die Lizenz mit nur noch 13,5 Milliarden e bewertet. Schon
diese dramatischen Unterschiede machen klar, mit welchen Schwierigkeiten die Bewertung
im Vorfeld der Auktion behaftet war.
Kapitel 8
Koalitionsspiele
8.1 Lernziele
Die Spieltheorie analysiert Situationen strategischer Interaktion zwischen zwei oder auch
mehreren Akteuren. Bisher wurde dabei immer unterstellt, dass ein Spieler ausschlielich
sein Eigeninteresse verfolgt. Die Auszahlungen f ur den anderen Spieler waren f ur die jeweils
eigenen Entscheidungen nur insoweit von Interesse, als diese die Strategiewahl der Gegen-
spieler bestimmten. In diesem Sinn waren die in den Kapiteln 3-5 behandelten Situationen
allesamt non-kooperativ und damit Gegenstand der non-kooperativen Spieltheorie. Die
gleiche Perspektive wurde auch in der non-kooperativen Verhandlungstheorie beibehalten.
Bei der Analyse von Verhandlungen hatten wir allerdings gesehen, dass auch eine ganz ande-
re Vorgehensweise gewahlt werden kann, indem eine kooperative Sichtweise eingenommen
wird. Sowohl in der Nash- als auch in der Kalai-Smorodinsky-Losung einer Verhandlungssi-
tuation werden die Positionen aller beteiligten Spieler ber ucksichtigt.
In diesem Kapitel wird ebenfalls eine kooperative Perspektive eingenommen, gegen uber
den einfachen 2-Personenspielen, die bisher vor allem untersucht wurden, jedoch ein Spiel
mit wenigstens drei Spielern unterstellt und zugelassen, dass diese Spieler in Untergruppen
oder auch als Gesamtheit Koalitionen eingehen konnen. Dies ist nicht nur ein in realisti-
schen Entscheidungssituationen in allem moglichen Gremien und Parlamenten immer wieder
beobachtbares Phanomen, sondern legt auch nahe, dass eine kooperative Perspektive gerade
in diesem Zusammenhang eine besonders realistische und plausible Perspektive ist.
In Abschnitt 8.2 werden die grundlegenden Begrie zur genauen Charakterisierung der
beschriebenen Spiele eingef uhrt. Abschnitt 8.3 auf Seite 166 stellt die bedeutendsten Losungs-
konzepte f ur Koalitionsspiele vor, deren anschlieend in Abschnitt 8.4 auf Seite 169 weiter
vertieft wird.
8.2 Grundlegende Begrie
8.2.1 Kooperative Mehrpersonenspiele ohne Koalitionsbildung
Eine auf der Hand liegende Verallgemeinerung der Nash-Verhandlungslosung aus Abschnitt 6.4.1
auf Seite 124 in einem Zwei-Personenspiel besteht darin, bei I Spielern mit Auszahlungen
u
i
(s) und Drohpunkten
i
einen Nash-Maximanden wie folgt zu denieren
1
:
1
Ebenfalls sehr einfach moglich ware nat urlich eine Ber ucksichtigung unterschiedlicher Gewichte analog
zu dem verallgemeinerten Nash-Maximanden in Gleichung 6.11. Dieser ware dann gegeben durch =
I
Q
i=1
(u
i
(s)
i
)
i
.
157
158 KAPITEL 8. KOALITIONSSPIELE
= (u
1
(s)
1
) (u
2
(s)
2
) . . . (u
I
(s)
I
)
=
I
i=1
(u
i
(s)
i
)
(8.1)
s bezeichnet dabei den Vektor der Strategievariablen, die insgesamt von den I Spielern
kontrolliert werden konnen. Es spielt dabei in einem kooperativen Verhandlungskontext
egal ob zwischen zwei oder mehr Verhandlungspartnern keine Rolle, ob die Kontrolle
einer Variablen einem bestimmten Spieler zugeordnet werden kann und falls dem so ware,
welchem.
Die Losung des Verhandlungsproblems ware dann gegeben durch die Bedingungen erster
Ordnung
s
= 0, (8.2)
wobei dieses System von Bedingungen erster Ordnung so viele Gleichungen hat, wie der
Vektor s Elemente aufweist. 8.2 legt dann die Optimalwerte der Strategievariablen fest, die
mit s
bezeichnet seien. Daraus ergeben sich dann sofort die in der Verhandlungslosung
realisierten Auszahlungen als
u
i
(s
) , i = 1, ..., I, (8.3)
wobei sichergestellt sein muss, dass u
i
(s
)
i
i.
Diese Vorgehensweise erlaubt es jedoch nicht, die eingangs erwahnten Koalitionsbildun-
gen zu ber ucksichtigen und ndet daher kaum Anwendung in der Analyse von Verhandlungen
zwischen mehr als zwei Spielern.
8.2.2 Koalitionen
Unter einer Koalition wird typischerweise der Zusammenschluss von wenigstens zwei Ent-
scheidungstragern verstanden, die ihre Aktionen untereinander absprechen und festlegen
konnen. Ein wichtiges Merkmal von Koalitionen ist, dass innerhalb von Koalitionen bin-
dende Absprachen getroen werden konnen. Diese Moglichkeit wird im Folgenden nicht
weiter hinterfragt, sondern als gegeben angenommen. Dies bedeutet insbesondere, dass ein
Mitglied einer Koalition verlasslich und glaubw urdig auf ein Verhalten festgelegt werden
kann, das f ur die gesamte Koalition (im Zusammenspiel mit dem Verhalten der anderen
Koalitionare) optimal ist, das aber nicht notwendigerweise die ceteris paribus individuell
rationale Strategiewahl reektiert.
Welche und wie viele Koalitionen kann es innerhalb einer Gesamtheit von I Spielern
prinzipiell geben? Hier helfen einige Ergebnisse aus der Kombinatorik.
I Elemente konnen in beliebig groen Gruppen (einschlielich der leeren Menge und der
groen Koalition) auf 2
I
verschiedene Arten kombiniert werden. Da die Betrachtung
der leeren Menge in diesem Zusammenhang nicht interpretierbar ist, ergeben sich bei
I Spielern 2
I
1 Koalitionsmoglichkeiten, wobei hier die I denkbaren Einerkoalitionen
mit enthalten sind. Will man diese ausschlieen, so verbleiben 2
I
I 1 echte
Koalitionen (einschlielich der groen Koalition).
Koalitionen bestehen aus einem Teil der I Mitglieder. Die Zahl der Mitglieder sei mit k
bezeichnet, wobei gelten muss, dass k I. Aus einer Gesamtheit der Groe I konnen
_
I
k
_
=
I!
k!(Ik)!
Gruppen der Groe k konstruiert werden.
1
Koalitionsgroe k Anzahl der
Koalitionen mit
Groe k?
Konkrete Koalitionen
1
_
4
1
_
= 4 {1}, {2}, {3}, {4}
2
_
4
2
_
= 6 {1, 2}, {1, 3},{1, 4},{2, 3},{2, 4},{3, 4}
3
_
4
3
_
= 4 {1, 2, 3}, {1, 2, 4},{1, 3, 4},{2, 3, 4}
4
_
4
4
_
= 1 {1, 2, 3, 4}
Tabelle 8.1: Koalitionsmoglichkeiten bei 4 Spielern
F ur I = 4 seien die moglichen Koalitionen in Tabelle 8.1 zusammengestellt:
Es ist sofort zu verizieren, dass in diesem Fall 2
4
1 = 15 verschiedene Koalitionen (ein-
schlielich der 1-er Koalitionen) moglich sind.
1
Daraus erhellt sich auch sofort die Tatsache,
dass die Analyse von Verhandlungen mit der Moglichkeit von Kooperationen innerhalb von
auch recht uberschaubaren Gruppen ein wirklich komplexes Problem ist. In einer Gruppe
von 10 Personen gibt es bereits 1023 Koalitionsmoglichkeiten, die derzeit 601 Abgeordneten
des Deutschen Bundestags konnten sich auf ca. 8, 299 10
180
verschiedene Arten zusammen-
tun, wenn dabei keinerlei Parteigrenzen respektiert werden w urden, d.h. sich jeder mit jedem
in beliebig groen Gruppen der Groe 1 k 601 zusammentun konnte.
2
Von daher schat
die B undelung der Abgeordneten in Fraktionen durchaus eine gewisse und vielleicht sogar
w unschenswerte

Ubersichtlichkeit.
8.2.3 Transferierbarer Nutzen, die charakteristische Funktion und
ein Beispiel
In der Theorie der Koalitionsspiele wird haug angenommen, dass die Auszahlungen zwi-
schen den Teilnehmern direkt miteinander verglichen werden konnen, d.h. eine Auszahlungs-
einheit bei Individuum i genau so zu bewerten ist wie eine Auszahlungseinheit bei einem
Individuum j = i. Anders gesagt: Der Nutzen ist transferierbar. Dies ist immer dann auch
durchaus realistisch, wenn die Auszahlungen eines konkreten Spiels in Geldeinheiten ge-
messen werden konnen und man mit der Annahme leben kann, dass eine Geldeinheit f ur
alle Teilnehmer gleich viel wert ist. Unter dieser Annahme kann eine charakteristische
Funktion v (C) deniert werden, die f ur alle denkbaren Koalitionen C die erreichbaren
Auszahlungen angibt. Die Auszahlungen beziehen sich dann immer auf die Koalition insge-
samt. Wie diese Auszahlung auf die Koalitionsmitglieder verteilt wird, steht hier nicht zur
Diskussion.
1
Die Operation wird bezeichnet mit I uber k. Die Fakultat einer nat urlichen Zahl x 1 ist deniert
durch x!
x
Q
i=1
i. Es gilt auerdem die Konvention, dass 0! = 1.
1
Einerkoalitionen sind keineswegs ein irrelevanter Spezialfall bei Verhandlungsspielen. Diese sind namlich
genau dann optimal, wenn sich keine echte Koalition mit zwei oder mehr Mitgliedern nden lasst, die
eine hohere gemeinsame Auszahlung generiert als durch individuell rationales Verhalten ohne Absprachen
in dieser Koalition. Ohne entsprechende Kooperationsanreize wird es also auch keine Kooperation geben.
2
Dies ist eine absolut monstrose Zahl man schreibt die Ziern 8299 auf und hangt danach 177 Nullen
an. Zum Vergleich: Die Erde wiegt ca. 6 10
24
kg, die Zahl der Atome (!) im gesamten Universum (!) wird
in der Groenordnung 10
78
vermutet. Selbst wenn man also die Zahl der Atome im Universum quadiert,
ware man mit 10
156
noch immer einen Faktor, der dem Gewicht der Erde in kg entspricht, von der Zahl der
moglichen Koalitionen im Bundestag entfernt.
Die Ermittlung der charakteristischen Funktion ist aber auch f ur eine gegebene Zuord-
nung von allen denkbaren Strategiekombinationen zu Auszahlungen f ur alle Teilnehmer nicht
trivial bzw. nicht eindeutig. Die Schwierigkeit liegt namlich darin begr undet, dass jeweils
eine Annahme dar uber getroen werden muss, wie sich die Spieler auerhalb der gerade
betrachteten Koalition verhalten.
Auf die die Spieltheorie quasi begr undende Monographie von von Neumann/Morgenstern
(1944) geht der Vorschlag zur uck, dass die charakteristische Funktion so deniert wird,
dass sie die minimalen Werte benennt, die eine Koalition f ur sich sicherstellen
kann. Dies ist insofern ein Minimax-Wert, als es der kleinste Wert (d.h. f ur das denkbar
schlechteste Verhalten der Spieler auerhalb der Koalition) ist, den die Koalition durch die
f ur sie optimalen Strategieparameter f ur sich erreichen kann. Bei der Bestimmung der f ur
sie optimalen Strategie rechnet eine Koalition also immer mit dem Schlimmsten.
Ein denkbar einfaches Beispiel soll dies verdeutlichen. Angenommen drei Spieler 1, 2
und 3 haben jeweils 2 Strategieoptionen, A und B. Es gibt in diesem Fall also 2
3
= 8
Moglichkeiten, wie diese Strategien kombiniert werden konnen. Diese sind mit den damit
verbundenen Auszahlungen in der nachfolgenden Tabelle 8.2 aufgelistet
1
:
Strategie A, A,
A
A, B,
A
A, A,
B
A, B,
B
B, A,
A
B, B,
A
B, A,
B
B, B,
B
Auszahlung 4, 4, 4 2, 5, 2 2, 2, 5 0, 3, 3 5, 2, 2 3, 3, 0 3, 0, 3 1, 1, 1
Tabelle 8.2: Ein Drei-Personen-Spiel
In der ersten Zeile sind die Kombinationen der Strategiewahlen der Spielern 1, 2 und
3 aufgelistet, in der zweiten die entsprechenden Auszahlungen f ur alle drei Spieler. Zwei
Merkmale sollten sofort auallen:
Bei der Strategiekombination {A, A, A} ist die Auszahlungssumme mit 12 am hochsten.
F ur jeden Spieler ist B eine strikt dominante Strategie, deren Befolgung durch alle
allerdings zu einer kollektiv oensichtlich inezienten Losung f uhrt.
Bei drei Spielern gibt es 2
3
1 = 7 verschiedene Koalitionen, konkret die groe Koali-
tion, 3 Zweier-Koalitionen und 3 Einer-Koalitionen. Tabelle 8.3 auf der nachsten Seite
listet die charakteristische Funktion des Spiels aus Tabelle 8.2 auf, wobei der erste Teil das
Minimax-Kriterium zugrunde legt. Auf die beiden anderen Abschnitten wird weiter unten
naher eingegangen.
Die charakteristische Funktion ist die Zuordnung der 7 Koalitionen der ersten Zeile zu den
jeweiligen Auszahlungen bzw. Auszahlungssummen. Als Gleichung kann die charakteristi-
sche Funktion unter Zugrundelegung des Minimax-Kriteriums v
m
(C) wie folgt geschrieben
werden:
v
m
(C) =
_
_
_
12 C mit |C| = 3
4 C mit |C| = 2
1 C mit |C| = 1
. (8.4)
|C| bezeichnet die Anzahl der Mitglieder in der Koalition C. F ur die groe Koalition liegt
das Ergebnis auf der Hand: Die Strategiekombination A, A, A liefert die hochste Auszah-
lungssumme (in Hohe von 12). Da es Spieler auerhalb der Koalition gar nicht gibt, greift die
Minimax-
Uberlegung in diesem Fall nicht. Alle Einer-Koalitionen konnen f ur sich durch

Wahl der Strategie B die Auszahlung 1 sichern. Je nach Verhalten der beiden anderen Spieler
konnen dann namlich die Auszahlungen 5, 3 und 1 realisiert werden, wahrend bei Wahl von
1
Das Zahlenbeispiel ist entnommen dem Lehrbuch von Myerson (1991), S. 425
Koalition {1, 2, 3} {1, 2} {1, 3} {2, 3} {1} {2} {3}
1) Minimax-Kriterium
Opt.
Strategie
A, A, A A, A A, A A, A B B B
Auszahlung 12 4 4 4 1 1 1
2) Defensives Verhalten
Opt.
Strategie
A, A, A A, A A, A A, A B B B
3) Rationale Drohung
Opt.
Strategie
A, A, A B, B B, B B, B B B B
Tabelle 8.3: Drei charakteristische Funktionen
... des Spiels aus Tabelle 8.2 auf der vorherigen Seite unter Verwendung unterschiedlicher
Kriterien
A die Auszahlungen 4, 2 und 0 resultieren konnen. Damit wird die Einer-Koalition immer
B wahlen und damit mindestens die Auszahlung von 1 sicherstellen konnen.
Etwas aufwendiger ist die Begr undung des Werts der charakteristischen Funktion f ur
eine Zweier-Koalition. F ur {1, 2} sei die Ableitung der optimalen Strategie und der damit
verbundenen Auszahlung f ur diese Koalition im Detail skizziert.
1
Die beiden Koalitionare
haben die Moglichkeit, sich auf vier verschiedene Strategiekombinationen zu einigen, wobei
sie dann hinsichtlich der Wahl des Gegenspielers (d.h. von Spieler 3) das f ur sie Schlechteste
unterstellen. In Tabelle 8.4 sind alle Alternativen und deren Bewertung aufgelistet.
Wahl von {1, 2}
Wahl von 3
Min. Wert f ur {1, 2}
A B
A, A 4 + 4 = 8 2 + 2 = 4 4
A, B 2 + 5 = 7 0 + 3 = 3 3
B, A 5 + 2 = 7 3 + 0 = 3 3
B, B 3 + 3 = 6 1 + 1 = 2 2
Tabelle 8.4: Strategiewahl einer Zweier-Koalition und Bestimmung des Werts einer charak-
teristischen Funktion unter Verwendung des Minimax-Kriteriums
Man sieht aus dieser Tabelle sofort, dass die Wahl von A, A im schlechtesten Fall die
Auszahlung 4 generiert und daher die f ur die Koalition {1, 2} beste Option darstellt wie
gesagt, wenn unterstellt wird, dass hinsichtlich der Wahl der anderen Spieler der schlechteste
Fall eintritt.
Wie bereits gesagt, ist das Minimax-Kriterium aber nicht alternativlos. Man konnte
als zweite Moglichkeit f ur eine Ableitung der charakteristischen Funktion unterstellen,
dass sich Koalitionen defensiv verhalten in dem Sinn, dass sie durch ihre Strategiewahl
die Summe ihrer Auszahlungen maximieren unter der Annahme, dass sich alle Gegenspie-
ler (die sog. komplementare Koalition) zusammentun und ihrerseits die Summe ihrer
Auszahlung maximieren. Eine Koalition unterstellt also immer Konspiration seitens aller
1
Da die anderen Zweier-Koalitionen symmetrisch zu diesem Fall sind, ist die Herleitung f ur die entspre-
chenden Werte der charakteristischen Funktion vollig identisch.
Nicht-Mitglieder. F ur die groe Koalition ist die Hypothese uber das Verhalten der Anderen
wiederum uninteressant. F ur das Beispiel aus Tabelle 8.2 auf Seite 160 sind aber nun die
Uberlegungen f ur Einer- und Zweier-Koalitionen in der folgenden Tabelle 8.5 zusammenge-

fasst.
1
F ur alle denkbaren Strategiewahlen werden die Auszahlungsvektoren f ur eine Einer-
und die dazu komplementare Zweier-Koalition angegeben. Aufgrund der Symmetrie konnte
die Einer-Koalition auch aus {1} oder {2} bestehen (mit entsprechender Modikation f ur
die komplementaren Koalitionen), ohne dass sich die Auszahlungsvektoren andern w urden.
{2, 3 }
1 A, A A, B B, A B, B
A (4, 8) (2, 7) (2, 7) (1, 2)
B (5, 4) (3, 3) (3, 3) (1, 2)
Tabelle 8.5: Strategiewahl von Einer- und Zweierkoalitionen bei defensivem Verhalten
Die jeweils erste Zahl gibt die Auszahlung von {1}, die zweite die Auszahlungssumme f ur
{2, 3} an.
Man sieht unmittelbar, dass B f ur {1} sowie A, A f ur die Koalition {2, 3} (schwache) do-
minante Strategiewahlen darstellen und damit Auszahlungen von 5 f ur die Einer-Koalitionen
und 4 f ur die Zweier-Koalitionen verbunden sind. Die charakteristische Funktion v
d
(C) f ur
defensives Verhalten ware damit gegeben durch
v
d
(C) =
_
_
_
12 C mit |C| = 3
4 C mit |C| = 2
5 C mit |C| = 1
. (8.5)
Als drittes Kriterium kann schlielich noch angenommen werden, dass Koalitionen versu-
chen, den Abstand ihrer Auszahlungen zu den Auszahlungen der komplementaren
Koalition zu maximieren und damit eine rationale Drohung auszusprechen. Die Be-
wertung der Strategiekombinationen erfolgt hier also nicht direkt mit den Auszahlungen,
sondern mit dem Abstand der erreichten Auszahlungen zu den von der komplementaren
Koalition erreichten Auszahlungen. Dieser Abstand wird ermittelt, in dem einfach die Wer-
te in jedem Auszahlungsvektor in Tabelle 8.5 voneinander subtrahieret werden. Dies ist in
Tabelle 8.6 erfolgt.
{2, 3}
{1} A, A A, B B, A B, B
A (-4, 4) (-5, 5) (-5, 5) (-1, 1)
B (1, -1) (0, 0) (0, 0) (-1, 1)
Tabelle 8.6: Strategiewahl von Einer- und Zweierkoalitionen bei rationalen Drohungen
Die jeweils erste Zahl gibt u({1})u({2, 3}) an, die zweite den Abstand u({2, 3})u({1}).
B ist hier f ur die Einer-Koalition eine dominante Strategie. Gegeben diese Wahl, ent-
schliet sich die Zweier-Koalition f ur die Strategie B, B. Die resultierenden Auszahlung(ssumm)en
sind mithin 2 f ur eine Zweier-Koalition und 1 f ur eine Einer-Koalition unter der Annahme
rationaler Drohungen. Die charakteristische Funktion v
rD
(C) lautet damit
1
Man kann dies deswegen sehr einfach machen, weil ja in einem Drei-Personen-Spiel zu jeder Einer-
Koalition die Zweier-Koalition die komplement are Koalition ist und auch vice versa zu jeder Zweier-Koalition
eine Einer-Koalition komplementar ist.
v
rD
(C) =
_
_
_
12 C mit |C| = 3
2 C mit |C| = 2
1 C mit |C| = 1
. (8.6)
Nat urlich m ussen die drei Kriterien (m, d, rD) nicht notwendigerweise zu unterschiedli-
chen charakteristischen Funktionen f uhren. Man spricht von orthogonalen Koalitionen,
wenn das Kriterium in der Tat keine Rolle f ur die Gestalt der charakteristischen Funktion
spielt.
Hinsichtlich der Beurteilung des Kooperationspotentials ist die Eigenschaft der Supe-
radditivitat der charakteristischen Funktion von Bedeutung. F ur zwei sich nicht uber-
schneidende Koalitionen C
1
und C
2
liegt diese Eigenschaft vor, wenn ein Zusammengehen
dieser beiden Koalition zu mindestens dem gleichen Ergebnis f uhrt wie eine getrennte Op-
timierung. Formal ausgedr uckt ist also eine charakteristische Funktion superadditiv, wenn
f ur C
1
C
2
= immer gilt, dass v (C
1
C
2
) v (C
1
) + v (C
2
). Eine nach dem Minimax-
Kriterium ermittelte charakteristische Funktion weist diese Eigenschaft immer auf, f ur die
beiden anderen benutzten Kriterien ist dies nicht notwendigerweise der Fall.
8.2.4 Der Shapley-Shubik-Index
Viele Verhandlungs- und auch Abstimmungssituationen nden statt in einem Kontext, in
dem nicht jeder alles machen kann oder in dem eine gewisse Ordnung im Verhalten der
Mitglieder zumindest nicht unplausibel ist. Als Beispiel daf ur sei das Abstimmungsverhalten
im Bundestag genannt. Bei den meisten Abstimmungen verhalten sich hier die Abgeordneten
einer Fraktion aufgrund von Fraktionssolidaritat bzw. Fraktionsdisziplin
1
einheitlich. Nun
kann man sich Koalitionen innerhalb der vier Fraktionen vorstellen und sich die Frage stellen,
wie machtig eine bestimmte Fraktion ist. Ein erstes und auf der Hand liegendes Ma daf ur
ware nat urlich einfach die (relative) Fraktionsstarke heranzuziehen. Tabelle 8.7 beinhaltet
die Daten f ur Anfang 2005
2
die beiden letzten Zeilen werden noch erklart werden.
SPD CDU/CSU B90/Die
Gr unen
FDP
Anzahl Abgeordnete 249 247 55 47
Relative Fraktionsstarke 41,639 41,304 9,197 7,860
ShapShu I 1/3 1/3 1/3 0
ShapShu II 1/2 1/2 0 0
Tabelle 8.7: Wie machtig sind die einzelnen Fraktionen im Dt. Bundestag?
Es ergibt sich das nat urlich bekante Bild von zwei ahnlich groen Fraktionen, die aber
ohne Koalition keine eigene (einfache) Mehrheit zustande bringen. Dar uber hinaus gibt es
zwei deutlich kleinere Fraktionen, die aber untereinander nicht dramatisch unterschiedlich
sind - oder jedenfalls nicht zu sein scheinen.
1
Ein formaler Fraktionszwang ist in Deutschland aufgrund von Art. 38 (1) GG nicht verfassungsgema.
Dort heit es: Die Abgeordneten des Deutschen Bundestages werden in allgemeiner, unmittelbarer, freier,
gleicher und geheimer Wahl gewahlt. Sie sind Vertreter des ganzen Volkes, an Auftrage und Weisungen nicht
gebunden und nur ihrem Gewissen unterworfen.
2
Es gab zu diesem Zeitpunkt drei fraktionslose Abgeordnete im Deutschen Bundestag, namlich zwei Ab-
geordnete der PDS sowie der von der CDU/CSU-Fraktion aufgrund mangelnden Geschichtsverstandnisses
ausgeschlossene Abgeordnete Martin Hohmann. Diese werden aus der folgenden Analyse aus Vereinfachungs-
gr unden ausgeschlossen, d.h. der Bundestag schrumpft auf die 598 Abgeordneten mit Fraktionszugehorig-
keit.
Denn die Fraktionsstarke an sich sagt noch nichts direkt aus f ur die Macht einer Fraktion
bei einer konkreten Abstimmung. Daf ur ist es notwendig zu klaren, ob sie in irgendeiner
denkbaren Koalition das entscheidende Z unglein auf der Waage sein, d.h. eine pivotale
Rolle spielen kann. Da von vorneherein keine Koalition ausgeschlossen werden soll, werden
einfach alle denkbaren Konstellationen durchgespielt. Dies geschieht wie folgt:
Man ordnet alle Fraktionen in allen denkbaren Konstellationen an. Bei I Fraktionen
ergibt dies I! Moglichkeiten, dies zu tun.
Man geht all diese Moglichkeiten durch und fragt jeweils, welche Fraktion die pivotale
Rolle spielt, d.h. die f ur die Erreichung einer Mehrheit notwendige Stimme beibringt.
Anschlieend wird gefragt, in welchem Anteil der I! Moglichkeiten, eine Fraktion die
pivotale Rolle spielt. Diese Zahl wird als Shapley-Shubik-Index bezeichnet.
Es leuchtet sofort ein, dass im zweiten der gerade genannten Schritte die konkrete
Abstimmungsregel von entscheidender Bedeutung ist. In der nachfolgenden Analyse wer-
den hier zwei wichtige Spezialfalle untersucht, namlich zum einen die ubliche Mehrheits-
entscheidung, bei der es mehr als 50% der Stimmen braucht und zum anderen die 2/3-
Mehrheitsentscheidung, die es in Deutschland f ur Verfassungsanderungen braucht.
Die vier Fraktionen lassen sich auf 4! = 24 verschiedene Weisen anordnen. Bei 598 Mit-
gliedern ist die einfache Mehrheit erreicht, wenn das 300. Mitglied erreicht ist. Die Fraktion,
die diesen Abgeordneten in ihren Reihen hat, ist also die pivotale Fraktion. F ur eine 2/3-
Mehrheit spielt der 399. Abgeordnete diese Rolle. In der nachfolgenden Tabelle 8.8 auf der
nachsten Seite werden alle Konstellationen gezeigt. Die Konstruktion der ersten Konstella-
tion (1-2-3-4) wird hier naher erlautert: Wenn zunachst Fraktion 1 ihre 249 Stimmen abgibt
und logisch danach Fraktion 2 ihre 247, so verf ugt letztere sowohl uber die 300. als auch
uber die 399. Stimme und ist damit sowohl bei Entscheidungen mit einfacher Mehrheit als
auch bei Entscheidungen, die eine 2/3-Mehrheit erfordern pivotal. Dasselbe gilt nat urlich
auch f ur die nachste Konstellation, da es ja auf die Reihenfolge der Fraktionen 3 und 4 in
diesem Fall nicht ankommt.
Das Ergebnis der Analyse ist zumindest auf den ersten Blick uberraschend: Obwohl
Fraktion 3 sehr viel kleiner ist als die Fraktionen 1 und 2 ist sie bei Abstimmungen mit
einfacher Mehrheit gleich machtig wie die groen. Die Intuition daf ur ist recht einfach: Die
kann als Mehrheitsbeschaerin f ur zwei andere Fraktionen dienen und genau das gleiche
gilt auch f ur diese groeren. Im Gegensatz dazu wird der Fraktion 4 ein Shapley-Shubik-
Index von Null zugeordnet, weil sie in keiner denkbaren Zweier-Koalition f ur die Mehrheit
sorgen kann und es sie in keiner denkbaren Dreier-Koalition, in der sie Mitglied sein konnte
(das sind die Koalitionen {1, 2, 4}, {2, 3, 4} und {1, 3, 4}) f ur die Mehrheit braucht.
F ur Entscheidungen mit die 2/3-Mehrheit andert sich das Bild deutlich: Hier teilen sich
die beiden groen Fraktionen 1 und 2 die Macht untereinander auf, weil ihre gemeinsame
Mitwirkung immer sowohl notwendig als auch hinreichend ist. Der kleine Groenunterschied
spielt keinerlei Rolle, da es f ur keine Fraktion ohne die jeweils andere geht.
Die beiden unteren Zeilen in Tabelle 8.7 auf der vorherigen Seite zeigen die Shapley-
Indices f ur die vier Fraktionen und machen noch einmal den zentralen Punkt deutlich, dass
namlich ein einfacher Blick auf die Stimmenanteile keineswegs hinreichend ist, um die wahre
Abstimmungsstarke einer Fraktion beurteilen zu konnen.
Die Konstruktion des Shapley-Shubik-Index kann auch formal nachvollzogen werden. Er
errechnet sich f ur einen Spieler i I wie folgt:
Shapley-Shubik-Index
i
=
C {1, . . . , I} i C
i ist pivotal
(|C| 1)! (I |C|)!
I!
(8.7)
Einfache Mehrheit 2/3-Mehrheit
Pivotstimme: Nr. 300 Pivotstimme: Nr. 399
Permutation 1
(249)
2
(247)
3
(55)
4
(47)
1
(249)
2
(247)
3
(55)
4
(47)
1-2-3-4
1-2-4-3
1-3-2-4
1-3-4-2
1-4-2-3
1-4-3-2
2-1-3-4
2-1-4-3
2-3-1-4
2-3-4-1
2-4-1-3
2-4-3-1
3-1-2-4
3-1-4-2
3-2-1-4
3-2-4-1
3-4-1-2
3-4-2-1
4-1-2-3
4-1-3-2
4-2-1-3
4-2-3-1
4-3-1-2
4-3-2-1
Summe: 8 8 8 0 12 12 0 0
ShapShu 1/3 1/3 1/3 0 0,5 0,5 0 0
Tabelle 8.8: Die Ermittlung des Shapley-Shubik-Index f ur die Fraktionen des Dt. Bundestags
Dabei bezeichnet |C| die Anzahl der Mitglieder in einer Koalition C. (8.7) bedarf si-
cherlich der Erlauterung. Im Gegensatz zur Konstruktion zu Fu in Tabelle 8.8 auf der
vorherigen Seite wird nicht uber alle I! Permutationen der Spieler summiert, sondern nur
uber die Teilmenge der aus den I Spielern denkbaren Koalitionen, in denen Spieler i Mit-
glied ist. Dar uber hinaus werden nur diejenigen Koalitionen ber ucksichtigt, in denen i eine
pivotale Rolle spielen kann. In einer groen Koalition kann kein einzelnes Mitglied pivotal
sein, daher wurde diese bei der Summierung in (8.7) auen vor gelassen.
1
Der Ausdruck
im Summenzeichen ist einfach die Wahrscheinlichkeit daf ur, dass i das pivotale Mitglied
auch wirklich stellt so ist es ja beispielsweise bei der Koalition {1, 2} gleich wahrschein-
lich, 1 bzw. 2 pivotal sind. Dies soll kurz erlautert werden: Der Ausdruck (|C| 1)! gibt
die Zahl der moglichen Permutationen der aus Sicht von i anderen Koalitionsmitgliedern
an, (I |C|)! die Zahl der Permutationen, die mit Spielern auerhalb von C vorgenommen
werden konnen. Das Produkt also der Zahler des Summanden gibt damit die Zahl der
Permutationen an, in denen i pivotales Mitglied von C ist. Wird dies durch die Gesamtzahl
aller denkbaren Permutationen I! dividiert, erhalt man die Wahrscheinlichkeit daf ur, dass
i als pivotales Mitglied von C die Abstimmung letztlich entscheiden kann.
Die Anwendung von (8.7) illustriert das relativ zur Betrachtung jeder einzelnen Permu-
tation enorme Vereinfachungspotential der Berechnung. F ur den Shapley-Shubik-Index der
Fraktion 1 bei Abstimmungen mit 50%-Mehrheiten kann man sich namlich sehr schnell das
folgende klar machen:
Pivotal kann 1 nur in Zweier- und Dreier-Koalitionen sein. In der Einer-Koalition {1}
kann keine Mehrheit erreicht werden, in der groen Koalition braucht es 1 nicht f ur
das Erreichen einer Mehrheit.
1 ist Mitglied in drei Zweier-Koalitionen und kann in allen zweien davon pivotal sein,
namlich in allen auer in der Koalition mit 4.
1 ist ebenfalls Mitglied in drei Dreier-Koalitionen, allerdings nicht potentiell pivotal
in der Koalition mit 2 und 3, da diese beiden eine eigene Mehrheit zustande bringen
werden.
Daraus folgt, dass die relevanten Koalitionen, die die Summationsbedingung f ur 1
erf ullen die folgenden sind: {1, 2}, {1, 3}, {1, 2, 4}, {1, 2, 4}.
Damit lasst sich (8.7) wie folgt anwenden:
Shapley-Shubik-Index
1
=
(2 1)! (4 2)!
4!
2 +
(3 1)! (4 3)!
4!
2 (8.8)
=
2
24
4 =
1
3
,
was nat urlich dem Ergebnis aus Tabelle 8.8 auf der vorherigen Seite entspricht.
8.3 Losungskonzepte f ur Koalitionsspiele
Die bisherigen

Uberlegungen konnten nicht oder jedenfalls nicht unmittelbar daf ur heran-
gezogen werden, eine Losung f ur eine kooperative Verhandlungssituation mit der Moglichkeit
von Koalitionsbildungen anzugeben oder auch nur einzugrenzen, wie dies im Kontext ohne
Koalitionsbildungen mit der Nash- oder der Kalai-Smorodinsky-Losung erfolgte.
Die Literatur uber kooperative Koalitionsspiele hat eine groe Zahl unterschiedlicher
Losungskonzepte erarbeitet, die alle jeweils plausible, aber eben nicht alternativlose Anfor-
derungen an die Losung stellen. Dies ist insofern eine unschone Situation als eine eindeutige
1
Es m usste sonst in der Summierungsbedingung C {1, . . . , I} heien.
8.3. L
OSUNGSKONZEPTE F
UR KOALITIONSSPIELE 167
Losung in einem solchen Kontext sehr haug nicht gegeben werden kann. Allerdings traf dies
ja selbst f ur Situationen zu, in denen es ausschlielich um individuelle Rationalentscheidun-
gen ging und

Uberlegungen einer Gruppenrationalitat keinerlei Rolle spielten.
Neben der Tatsache, dass es mehrere Losungskonzepte gibt, liefern auch nicht alle Losungs-
konzepte ein eindeutiges Ergebnis. Einige Konzepte grenzen namlich nur einen Bereich ab,
in dem die Losung liegen muss bzw. nicht liegen kann. Man spricht in diesem Zusammen-
hang von einem Bereichskonzept, oder synonym von einem Mengenansatz. Entschei-
dender Punkt ist, dass es keine Losungsfunktion gibt, d.h. eine ein-eindeutige Zuordnung
von den Charakteristika der Situation zu den resultierenden Auszahlungen, sondern nur eine
Korrespondenz. Es gibt allerdings auch sog. Wertkonzepte, die eine eindeutige Losung
angeben.
Im Folgenden werden zwei Bereichskonzepte (Imputationsmenge sowie der Kern eines
Spiels) und ein Wertkonzept (Shapley-Wert) naher charakterisiert. Weitere Konzepte wie
z.B. die Verhandlungsmenge, der Kernel und der Nucleolus eines Spiels werden hier nicht
betrachtet. Es handelt sich dabei um weitere Verfeinerungen des Kerns.
8.3.1 Imputationsmenge eines Spiels
Die Imputationsmenge eines Spiels besteht aus allen Auszahlungen, die den beiden Kriterien
der individuellen Rationalitat und der Gruppenrationalitat(oder kollektive Rationa-
litat) gen ugen. Man kann dies alternativ auch so ausdr ucken, dass man von Allokationen
in der Imputationsmenge verlangt, dass sie weder durch Einer-Koalitionen noch durch die
groe Koalition verworfen werden.
Formal: Eine Allokation u
i
{u
1
, . . . , u
I
} ist in der Imputationsmenge eines Spiels,
wenn gilt, dass
iI
u
i
= v ({I}) (Gruppenrationalitat)
i : u
i
v ({i}) (individuelle Rationalitat)
. (8.9)
v ({I}) ist die Auszahlung, die die groe Koalition f ur sich garantieren kann, die Auszah-
lungen in den Einer-Koalitionen sind durch die entsprechenden Werte der charakteristischen
Funktion v ({i}) gegeben.
Man beachte, dass f ur eine Angabe der Imputationsmenge wie auch f ur die anderen
der nachfolgend diskutierten Konzepte die charakteristische Funktion bekannt sein muss.
Wie in Abschnitt 8.2.3 auf Seite 159 gesehen, konnen bereits hier unterschiedliche Kriteri-
en angewandt werden, die auch zu unterschiedlichen charakteristischen Funktionen f uhren,
wenn es sich nicht um orthogonale Koalitionen handelt.
F ur das 3-Personenspiel aus Tabelle 8.2 auf Seite 160 und die charakteristische Funktion
v
m
(C), die mit Hilfe des Minimax-Kriteriums abgeleitet wurde, sei das Konzept sofort ange-
wandt. Aus 8.4 ist klar, dass jeder Spieler f ur sich die Auszahlung 1 garantieren kann. Damit
gehoren die Auszahlungen aus den Strategiekombinationen A, B, B sowie B, B, A und B, A,
B nicht zur Imputationsmenge, da hier das Kriterium der individuellen Rationalitat verletzt
ware. Das Kriterium der Gruppenrationalitat ist aber nur erf ullt bei der Strategiekombina-
tion A, A, A, so dass der damit verbundene Auszahlungsvektor einziges Element im Kern
dieses Spiels ist.
Es ist auch denkbar, dass die Imputationsmenge gar keine Losung liefert, d.h. der leeren
Menge entspricht. Dies ist der Fall, wenn in dem gleichen 3-Personenspiel aus Tabelle 8.2 auf
Seite 160 f ur die Ableitung der charakteristischen Funktion unter der Hypothese defensiven
Verhaltens f uhrt. In diesem Fall ist wie aus 8.5 ersichtlich v ({i}) = 5. Es gibt jedoch keine
Strategiekombination, die diese (oder einen hohere) Auszahlung f ur alle Spieler liefert. Damit
ware vor dem Hintergrund dieser charakteristischen Funktion f ur jede denkbare Allokation
das Kriterium der individuellen Rationalitat verletzt. Damit ist die Imputationsmenge in
diesem Fall leer.
8.3.2 Der Kern eines Spiels
Der Kern eines Spiels (englisch: core) verfeinert das Konzept der Imputationsmenge weiter,
ist aber auch ein Bereichskonzept, d.h. kann mehrere Losungen beinhalten. Das Konzept ver-
langt von einer moglichen Losung, dass es keine Koalition gibt, die diese Losung verwerfen
kann bzw. ein Interesse daran hat. Wenn eine Losung von irgendeiner Koalition verworfen
werden kann, so gehort sie nicht zum Kern. Damit ist der Kern eine Teilmenge der Impu-
tationsmenge. Wie im letzten Abschnitt gesehen, verlangte die Imputationsmenge ja, dass
eine Allokation nicht von Einer-Koalition und auch nicht von der groen Koalition verworfen
wird. Der Kern dehnt dieses Kriterium auf alle denkbaren Koalitionen aus.
Formal: Eine Allokation u
i
{u
1
, . . . , u
I
} ist im Kern eines Spiels, wenn gilt, dass
iC
u
i
v (C) C I. (8.10)
(8.10) muss dabei von allen aus den I Spielern zu bildenden Koalitionen C erf ullt werden.
In dem Spiel aus Tabelle 8.2 ist nat urlich nur die Strategiekombination A, A, A bzw. die
damit verbundene Allokation im Kern, da nur hier das bereits von der Imputationsmenge
verlangte Kriterium der Gruppenrationalitat erf ullt wird.
Ein sehr wichtiger Anwendungsbereich des Kerns betrit das allgemeine Tauschgleich-
gewicht in einer Wettbewerbs-
Okonomie. Hier zeigte F.Y. Edgeworth schon Ende des 19.

Jahrhunderts, dass der Preismechanismus daf ur sorgt, dass Allokationen entlang einer Kon-
traktkurve gefunden werden. Da diese sowohl individuell als auch f ur die gesamte Gruppe
bzw. irgendeine denkbare Koalition rational sind, entspricht die Kontraktkurve dem Kern
einer Tauschokonomie. Allerdings sind die ublichen Darstellungen mit 2 G utern (die es min-
destens braucht, damit etwas getauscht werden kann) und 2 Personen (die es f ur einen
Tausch nat urlich auch wenigstens braucht) nicht dazu geeignet, Koalitions uberlegungen in
einem Mehr-Personen-Kontext anzustellen.
8.3.3 Der Shapley-Wert eines Spiels
Der Shapley-Wert eines Spiels ist eine im Grunde sehr nahe liegende Erweiterung bzw.
Verallgemeinerung des Shapley-Shubik-Machtindexes und ist in der Lage, eine einwertige
Losung eines kooperativen Koalitionsspiels zu generieren. Dabei wird jedem Spieler eine
eindeutige Auszahlung aus dem Spiel zugeordnet. Das Konzept baut genau wie die Nash-
Verhandlungslosung auf einigen plausiblen, aber wiederum nicht vollkommen alternativlosen
Axiomen auf. Daher gibt es auch im Bereich der Wertkonzepte eine Vielzahl alternativer
Konzepte.
Der Shapley-Wert eines Koalitionsspiels ist deniert als
Shapley-Wert
i
=
C{1,...,I} iC
(|C| 1)! (I |C|)!
I!
[v (C) v (C ohne {i})] (8.11)
In der eckigen Klammer steht der Nutzenzuwachs f ur eine Koalition C durch den Bei-
tritt von i erfahrt. Dieser Zuwachs ist nat urlich nur dann von Null verschieden, wenn i eine
pivotale Rolle spielt. Insofern kann die Summierungsbedingung des Shapley-Shubik-Index
i ist pivotal hier vernachlassigt werden. Wie bereits im Zusammenhang mit diesem Index
ausf uhrlich erlautert, gibt der Bruch vor der eckigen Klammer die Wahrscheinlichkeit an, mit
der i wirklich die pivotale Rolle innehat. Der Nutzenzuwachs durch i kann hier jeden beliebi-
gen Wert betragen, wahrend bei der Berechnung des Shapley-Shubik-Index dieser Wert auf
1 normiert wurde. Die Interpretation des Shapley-Wertes ist unmittelbar einleuchtend: Eine
Spieler i erhalt einen Betrag, der sich aus dem von ihm zu leistenden marginalen Beitrag
zu jeder denkbaren Koalition ergibt. Wie bereits gesehen, kann dieser Wert trotz positiver
Stimmanteile Null sein und hangt auch davon ab, ob einer bestimmte Abstimmungsregel
Anwendung ndet bzw. wie genau diese ausgestaltet ist.
8.4. WEITERE BEI-(SPIELE) 169
8.4 Weitere Bei-(Spiele)
In diesem Abschnitt werden zwei weitere Spiele besprochen, deren Eigenschaften aufschlussreich
f ur die in diesem Kapitel eingef uhrten Konzepte sind.
Verteilungsspiele
Im Folgenden werden drei Varianten eines einfachen Verteilungsspiels eingef uhrt, in dem es
darum geht, eine Summe von 300 (Geldeinheiten) auf drei Personen zu verteilen. F ur alle
Varianten muss also gelten, dass die Summe der Zahlungen x
1
+x
2
+x
3
300 ist. Negative
Auszahlungen werden ausgeschlossen, d.h. i : x
i
0.
Variante A sieht vor, dass sich alle drei Spieler auf eine bestimmte Allokation einigen und
daher den gleichen Vorschlag machen m ussen. Ist dies nicht der Fall, gibt es f ur niemanden
eine Auszahlung. Bezeichnet man mit s
i
die Strategie von Spieler i, die jeweils aus einem
Vektor von Auszahlungsvorschlagen besteht, d.h. s
i
= (x
1
, x
2
, x
3
), i {1, 2, 3}, so ist das
Spiel wie folgt deniert:
u
A
i
(s
1
, s
2
, s
3
) = x
i
f ur s
1
= s
2
= s
3
= (x
1
, x
2
, x
3
) ,
i
x
i
300
u
A
i
(s
1
, s
2
, s
3
) = 0 f ur s
j
= s
k
f ur beliebige j, k
(8.12)
In Variante B m ussen f ur die positive Aussch uttung sich nur die Spieler 1 und 2 einig
sein und einen durchf uhrbaren Vorschlag unterbreiten. Das Verhalten von Spieler 3 hat in
diesem Fall keinerlei Einuss auf die Auszahlungen. Dies kann ausgedr uckt werden als
u
B
i
(s
1
, s
2
, s
3
) = x
i
f ur s
1
= s
2
= (x
1
, x
2
, x
3
) ,
i
x
i
300
u
A
i
(s
1
, s
2
, s
3
) = 0 f ur s
1
= s
2
(8.13)
Schlielich wird in Variante C zugelassen, dass sich eine beliebige Koalition aus (minde-
stens) zwei Spielern ndet, die den gleichen durchf uhrbaren Vorschlag unterbreiten. Damit
gilt
u
C
i
(s
1
, s
2
, s
3
) = x
i
f ur s
j
= s
k
= (x
1
, x
2
, x
3
) f ur beliebige j, k,
i
x
i
300
u
C
i
(s
1
, s
2
, s
3
) = 0 f ur s
1
= s
2
= s
3
= s
1
. (8.14)
Die charakteristischen Funktionen dieser drei Varianten werden nach dem Minimax-
Kriterium ermittelt, d.h. geben an, was ein einzelner Spieler bzw. eine Koalition mindestens
f ur sich sicherstellen kann. Dann ergibt sich sofort
v
A
(C) =
_
0 f ur |C| {1, 2}
300 f ur |C| = 3
(8.15)
v
B
(C) =
_
300 f ur |C| = 3 und C = {1, 2}
0 sonst
(8.16)
v
C
(C) =
_
0 f ur |C| = 1
300 f ur |C| {2, 3}
(8.17)
Die Imputationsmenge besteht hier bei allen drei Varianten aus allen denkbaren Al-
lokationen, die mit Auszahlungen, die sich auf 300 addieren, verbunden sind. Keine dieser
Allokationen widerspricht der Anforderung der Gruppenrationalitat, da die groe Koalition
in allen drei Fallen 300 f ur sich sicherstellen kann. Der Vorschlag ist aber auch individuell
rational, weil in keinem der drei Falle die Einer-Koalitionen einen positiven Betrag sichern
konnen. Irgendeine Art von Kooperation wird in allen drei Varianten verlangt.
Das Beispiel zeigt, dass die Imputationsmenge hier kaum eine Hilfestellung bietet und
praktisch nichts verbietet. Insb. wird auch der dem gesunden Menschenverstand sofort evi-
denten Machstellung der Spieler 1 und 2 in Variante B keinerlei Rechnung getragen.
Betrachten wir also den Kern dieser drei Verteilungsspiele. F ur Variante A lasst der Kern
wiederum alle Allokationen zu, bei denen sich die Auszahlungen auf 300 addieren, wobei aber
alle nicht-negativen Betrage f ur die einzelnen Spieler zulassig sind. Die Intuition daf ur ist,
dass aufgrund der Erfordernis der Einstimmigkeit des Vorschlags Zweier-Koalitionen genauso
wenig einen positiven Betrag durchsetzen konnen wie Einer-Koalitionen.
Dies andert sich in Variante B. Hier kann die Zweier-Koalition C = {1, 2} die Aus-
zahlungssumme unter sich aufteilen, wahrend das Verhalten von Spieler 3 unerheblich ist.
Daher sind alle Allokationen mit x
1
+x
2
= 300, x
3
= 0. F ur die Aufteilung der Auszahlung
auf die Spieler in der Koalition impliziert die Theorie kooperativer Spiele nichts.
1
In Variante C ist hingegen der Kern leer. Hier kann jede Zweier-Koalition die komplette
Auszahlung f ur sich sicherstellen. Dann ginge aber der ausgeschlossene Spieler leer aus.
Dieser konnte aber seinerseits Mitglied einer anderen Zweier-Koalition sein, die wiederum
den dann ausgeschlossenen Spieler ausbeutet. Nat urlich ist dieses Argument zirkular, lauft
aber darauf hinaus, dass es keine denkbare Allokation gibt, die nicht von einer bestimmten
Zweier-Koalition angegrien w urde. Das Kriterium (8.10) kann nicht erf ullt werden.
Das Handschuhspiel
Angenommen, 100 Personen besitzen einen linken, 101 andere Personen einen rechten Hand-
schuh. Ansonsten sind die Handschuhe nicht unterschiedlich. Ein einzelner Handschuh habe
den Wert 0, ein passendes Paar hingegen der Wert von 1. Die Mengen der Personen seien hier
mit L bzw. R bezeichnet. Die charakteristische Funktion ordnet also jeder denkbaren Koali-
tion der insgesamt 201 Personen
2
die Anzahl der in dieser Koalition zusammenndenden
Paare zu, d.h.
v (C) = min (|C L| , |C R|) . (8.18)
In diesem Fall besteht der Kern aus nur einer einzigen Allokation, namlich
u
i
=
_
1 f ur i L
0 f ur i R
(8.19)
In Worten: Die Besitzer der linken Handschuhe konnen die gesamte Auszahlung an sich
ziehen, die Besitzer der rechten Handschuhe gehen leer aus. Die Intuition daf ur ist folgende:
Angenommen, ein Spieler aus R habe eine positive Auszahlung. Dann haben die anderen
200 Spieler notwendigerweise weniger als die Auszahlung von 100. Von dieser Position kann
sich die Koalition der 200 Spieler oensichtlich verbessern, da man ja unter sich 100 Paare
hat und damit die Auszahlung von 100 nicht mit dem 101. Spieler teilen muss. Diese Logik
gilt nat urlich f ur alle Besitzer rechter Handschuhe. Diese werden ausbeutbar, weil es von
ihrem Gut ein wenn auch nur marginales

Uberangebot gibt.
Nat urlich ist die Allokation (8.19) insofern nicht stabil als sie komplett umkippen w urde,
wenn sich noch zwei weitere linke Handschuhe annden und damit das

Uberangebot die
Seite wechselt.
3
1
Man konnte die Situation aber als ein zusatzliches Spiel modellieren. Ohne weitere modellexogene Struk-
tur ist dies isomorph dem hier eingef uhrten Verteilungsspiel der Variante A f ur nur 2 Spieler.
2
Das ist wieder eine unvorstellbar groe Zahl (in etwa 3, 21 10
60
).
3
Man kann f ur solche Situationen das Konzept eines -Kerns anwenden, der auch Allokationen zulasst,
die Auszahlungssummen f ur eine Koalition knapp unterhalb des Wertes der charakteristischen Funktion
zulasst. Vgl. dazu Myerson (1991), p. 430.
Literaturverzeichnis
[1] Barro, Robert J., David B. Gordon (1983): A Positive Theory of Monetary Policy
in a Natural Rate Model, in: Journal of Political Economy, Vol. 91, 1983, p. 589-610
[2] Benoit, Jean-Pierre, Vijay Krishna (1985): Finitely Repeated Games, in: Eco-
nometrica, Vol. 53, 1985, p. 905-922
[3] textscBrams, Steven J. (2003): Biblical Games, Cambridge, MA: MIT-Press, 2
nd
ed.,
2003 (originally published in 1980)
[4] Capen, E., R. Clapp and W. Campbell (1971): Competitive Bidding in High-Risk
Situations, in: Journal of Petroleum Technology, Vol. 23, 1971, p. 641-653
[5] Eichberger, J urgen (1993): Game Theory for Economists, San Diego: Academic
Press, Inc., 1993
[6] Fudenberg, Drew, Jean Tirole (1991a): Perfect Bayesian Equilibrium and Se-
quential Equilibrium, in: Journal of Economic Theory, Vol. 53, 1991, p. 236-260
[7] Fudenberg, Drew, Jean Tirole (1991b): Game Theory, Cambridge/MA: MIT-
Press, 1991
[8] Gardner, Roy (1995): Games For Business and Economics, New York: John Wiley
& Sons, 1995
[9] Gibbons, Robert (1992): A Primer In Game Theory, Harlow, England: Pearson
Education, 1992
[10] Hardin, G. (1968): The Tragedy of the Commons, Science, 162, 1968, p. 1243-1248
[11] Hargreaves Heap, Shaun P. and Yanis Varoufakis (1995): Game Theory. A
Critical Introduction, London: Routledge, 1995
[12] Jerger, J urgen (1992): Das St. Petersburg-Paradoxon, in: WiSt - Wirtschaftswis-
senschaftliches Studium, August 1992, S. 407-410
[13] Jerger, J urgen (2002a): How Strong Is the Case For a Populist Central Banker? A
Note, in: European Economic Review, Vol. 46, 2002, p. 623-632
[14] Jerger, J urgen (2002b): Socially Optimal Monetary Policy Institutions, in: Euro-
pean Journal of Political Economy, Vol. 18, 2002, p. 761-781
[15] Kalai, Ehud and Meir Smorodinsky (1975): Other Solutions to Nashs Bargaining
Problem, in: Econometrica, Vol. 43, 1975, p. 513-518.
[16] Kreps, David and Robert Wilson (1982): Sequential Equilibria, in: Econometrica,
Vol. 50, 1982, p. 863-894
[17] Krishna, Vijay (2002): Auction Theory, San Diego: Academic Press, 2002
171
172 LITERATURVERZEICHNIS
[18] Luce, R.D., H. Raiffa (1957): Games and decisions, New York: John Wiley & Sons,
1957
[19] Myerson, Roger B. (1991): Game Theory. Analysis of Conict, Cambridge/Mass.:
Harvard University Press, 1991
[20] Nash, John (1950a): Equilibrium Points in n-Person Games, in: Proceedings of the
National Academy of Sciences, Vol. 36, 1950, p. 48-49
[21] Nash, John (1950b): The Bargaining Problem, in: Econometrica, Vol. 18, 1950, p.
155-162
[22] Nydegger, Rudy, G. Owen (1975): Two-Person Bargaining: An Experimental Test
of Nash Axioms, in: International Journal of Game Theory, Vol. 3, 1975, p. 239-249
[23] Osborne, Martin J. and Ariel Rubinstein (1994): A Course in Game Theory,
Cambridge, MA: MIT-Press, 1994
[24] Rasmusen, Eric (2001): Games and Information: An Introduction to Game Theory,
Oxford: Blackwell Publishing, 3
rd
ed., 2001
[25] Rubinstein, Ariel (1982): Perfect Equilibrium in a Bargaining Model, in: Econome-
trica, 50, 1982, p. 97-109
[26] Rubinstein, Ariel (1998): Modeling Bounded Rationality, Cambridge/Mass.: MIT
Press, 1998
[27] Selten, Reinhard (1975): Spieltheoretische Behandlung eines Oligopolmodells mit
Nachfragetragheit, in: Zeitschrift f ur die gesamte Staatswissenschaft, Bd. 12, 1965, S.
301-324
[28] Selten, Reinhard (1975): Reexamination of the Perfectness Concept for Equilibrium
Points in Extensive Games, in: International Journal of Game Theory, Vol. 4, 1975, p.
25-55
[29] Selten, Reinhard (1978): The Chain-Store Paradox, in: Theory and Decision, Vol.
9, 1978, p. 127-159
[30] Shaked, Avner, und John Sutton (1984): Involuntary Unemployment as a Perfect
Equilibrium in a Bargaining Model, in: Econometrica, Vol. 52, 1984, p. 1351-1364
[31] Spence, A. Michael (1973): Job Market Signalling, in: Quarterly Journal of Econo-
mics, Vol. 87, 1973, p. 355-374
[32] Tversky, A., D. Kahnemann (1986): Rational Choice and the Framing of Decisions,
in: Journal of Business, Vol. 59, 1986, p. 251-278
[33] Vickers, John (1986): Signalling in a Model of Monetary Policy with Incomplete
Information, in: Oxford Economic Papers, Vol. 38, 1986, p. 443-455
[34] Vickrey, William (1961): Counterspeculation, Auctions and Competitive Sealed
Tenders, in: Journal of Finance, Vol. 16, 1961, p. 8-37
[35] Von Neumann, John, Oskar Morgenstern (1944): The Theory of Games in
Economic Behavior, New York: John Wiley, 1944

Jurgen Jerger, Spieltheorie

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Jurgen Jerger, Spieltheorie

Hochgeladen von

Copyright:

Verfügbare Formate

Spieltheorie

Skript zur Vorlesung im SS 2006

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

sind diese Mae gegeben durch ARA = (1 ) W

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

UHRUNG: ELEMENTE DER SPIELTHEORIE

Okonomische Beispiele f ur Gefangenendilemmata

Ubereinstimmung mit der allgemeinen Denition seien diese p

(Z) < 0, (3.27)

die Gesamtzahl der Ziegen im Nash-Gleichgewicht bezeichnet.

) I c = 0 f uhrt, die durch I dividiert werden kann

) < 0, d.h. der negative zweite Summand ist betragsmaig kleiner in

Okonomen den Nobelpreis 2004 eintrug.

, q = 0) ein perfektes bayesianisches Gleich-

immer besser stellen als durch R

, q = 0) nicht miteinander konsistent.

also bestimmt durch die Losung des folgenden

Uberlegungen spielen hier

in diesem Fall negativ w urde, was f ur

5% zufrieden geben muss.

mit 0 < < 1 (6.23)

Aquivalenzeigenschaften unterschiedlicher Auktionsformen. Abschnitt 7.4 auf Sei-

Uberlegung in diesem Fall nicht. Alle Einer-Koalitionen konnen f ur sich durch

Uberlegungen f ur Einer- und Zweier-Koalitionen in der folgenden Tabelle 8.5 zusammenge-

Okonomie. Hier zeigte F.Y. Edgeworth schon Ende des 19.

Das könnte Ihnen auch gefallen