Sie sind auf Seite 1von 58

Vorlesung Einfhrung in die Spieltheorie u

Tim Hellmann

24.11.2009

Tim Hellmann

Einfhrung in die Spieltheorie u

Verhaltensstrategien und teilspielperfekte Gleichgewichte

Tim Hellmann

Einfhrung in die Spieltheorie u

Verhaltensstrategien
Denition Eine Verhaltensstrategie fr Spieler i N in einem extensiven Spiel u mit vollstndiger Information ist eine Menge von a Wahrscheinlichkeitsverteilungen bi , so dass bi (x, ) eine Wahrscheinlichkeitsverteilung auf Ax ist fr x K . u lokale Strategien fr jedes x K \P0 : bi (x, ) (Ax ) wobei u bi (x, a) die Wahrscheinlichkeit einer Aktion a Ax ist. Menge der Verhaltensstrategien von i N\ {0} : Bi :=
xPi

{bi (x, ) (Ax )} Bi

Menge der Verhaltensstrategiekombinationen: B =

iN

Tim Hellmann

Einfhrung in die Spieltheorie u

Verhaltensstrategien
Auszahlungen fr Verhaltensstrategiekombinationen u ui (b) :=
aA

ui (a)
iN\{0} xPi \P0

bi (x, ax )

Unterschied zu reinen/gemischten Strategien?


eine reine Strategie ist ein umfassender Handlungsplan. eine gemischte Strategie ist eine Wahrscheinlichkeitsverteilung uber alle reinen Strategien. eine Verhaltensstrategie ist eine Menge von Wahrscheinlichkeitsverteilungen, die fr jeden u Entscheidungsknoten von Sp. i N eine Wahrscheinlichkeitsverteilung uber die Menge der mglichen o Aktionen ist.

eine reine Strategie ist sowohl eine gemischte als auch eine Verhaltensstrategie.
Tim Hellmann Einfhrung in die Spieltheorie u

Verhaltensstrategien, Agentennormalform
Denition Die Agentennormalform des extensiven Spiels ist das strategische Spiel ANF () = K \P0 , (Ax )xK \P0 , (ux )xK \P0 , wobei ux = ui(x) fr alle x K \P0 . u Jeder Entscheidungsknoten wird ein eigener Spieler. Die Nutzenfunktion wird von dem Spieler ubernommen der an dem Knoten x K \ P0 entscheidet. Die reinen Strategien sind fr jeden Knoten/Spieler u x K \ P0 die mglichen Aktionen Ax and x. o reine Strategiekombinationen von ANF () sind diese von gemischte Strategiekombinationen von ANF () sind Verhaltensstrategiekombinationen von !!! auch beim Ubergang von zu ANF () gehen Informationen verloren.
Tim Hellmann Einfhrung in die Spieltheorie u

Verhaltensstrategien, Nash-Gleichgewicht

Die Denition eines Nash-Gleichgewichts in Verhaltensstrategien analog: Denition Eine Verhaltensstrategiekombination b des extensiven Spiels u ist ein Nash-Gleichgewicht, wenn ui (b ) ui bi , bi fr alle i N\ {0} und bi Bi .

Tim Hellmann

Einfhrung in die Spieltheorie u

Beispiel fr eine Verhaltensstrategie u

Eine Verhaltensstrategie fr Sp.1 wre zum Beispiel... u a b1 , so dass


1 1 b1 (x1 , ) = ( 2 , 1 ) und b1 (x5 , ) = ( 3 , 2 ) 2 3
Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel fr eine Verhaltensstrategie u

Eine Verhaltensstrategie fr Sp.1 wre zum Beispiel... u a b1 , so dass


1 1 b1 (x1 , ) = ( 2 , 1 ) und b1 (x5 , ) = ( 3 , 2 ) 2 3
Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel fr eine gemischte Strategie u

Eine gemischte Strategie fr Spieler 1 wre zum Beispiel u a 1 , so dass


...
Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel fr eine gemischte Strategie u

Eine gemischte Strategie fr Spieler 1 wre zum Beispiel u a 1 , so dass


1 (ac) = 1/8,
Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel fr eine gemischte Strategie u

Eine gemischte Strategie fr Spieler 1 wre zum Beispiel u a 1 , so dass


1 (ac) = 1/8, 1 (ad) = 1/4
Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel fr eine gemischte Strategie u

Eine gemischte Strategie fr Spieler 1 wre zum Beispiel u a 1 , so dass


1 (ac) = 1/8, 1 (ad) = 1/4, 1 (bc) = 1/8
Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel fr eine gemischte Strategie u

Eine gemischte Strategie fr Spieler 1 wre zum Beispiel u a 1 , so dass


1 (ac) = 1/8, 1 (ad) = 1/4, 1 (bc) = 1/8, 1 (bd) = 1/2
Tim Hellmann Einfhrung in die Spieltheorie u

Teilspielperfekte Gleichgewichte

Tim Hellmann

Einfhrung in die Spieltheorie u

Teilspiele
Teilbaum von (X , ) bei x K : (T x ,
x)

T x := {x X |x = x oder x x } x := |Tx , Einschrnkung von auf T x a Wurzel: x; K x := K T x , Z x := Z T x

bei jedem x K beginnt ein Teilspiel x = ((T x , von , so dass


N x := {0} {i N|Pix = } , wobei Pix := Pi T x P x := {Pix |i N x } Ax := y T x Ay ; Ax := Ai Ax for all i N x i x p x := {py |y P0 } uix := ui |Z x for all i N x \ {0}
x

), N x , P x , Ax , p x , u x )

Tim Hellmann

Einfhrung in die Spieltheorie u

Beispiel, Teilspiele

Gesucht Teilspiel x2 ! Schneide einfach den Rest weg...


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel, Teilspiele

Gesucht Teilspiel x2 ! Schneide einfach den Rest weg...


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel, Teilspiele

x2 ist also das Tupel x2 = ((T x2 , mit


T x2 = {x2 , x4 , x5 , x8 , x9 } (die ubrig gebliebenen Knoten). N x2 = {0, 1, 2}, beide Spieler knnen noch entscheiden. o x x x P0 2 = , P1 2 = {x5 }, P2 2 = {x2 } (die Spielerpartitionen im Teilspiel). Ax2 = {(c, d)} Ax2 = {(A, B)} (die Aktionspartitionen im 1 2 Teilspiel). x p x2 = , da P0 2 = (die Zufallszge im Teilspiel). u x2 a u = ui |x4 ,x8 ,x9 (die eingeschrnkte Nutzenfunktion im Teilspiel).
x2

), N x2 , P x2 , Ax2 , p x2 , u x2 )

Tim Hellmann

Einfhrung in die Spieltheorie u

Teilspielperfekte Gleichgewichte

Denition Eine Verhaltensstrategiekombination b B des extensiven Spiels ist ein teilspielperfektes Gleichgewicht, wenn in allen Teispielen x x von die Restriktion von b auf K x \P0 ein Nash-Gleichgewicht ist. da o = , ist jedes teilspielperfekte Gleichgewicht auch ein Nash-Gleichgewicht enthlt keine echten Teilspiele, dann fallen beide Konzepte a zusammen

Tim Hellmann

Einfhrung in die Spieltheorie u

Rckwrtsinduktion u a

Wie kann man teilspielperfekte Gleichgewicht ermitteln? durch Rckwrtsinduktion u a


bestimme alle minimalen Teilspiele, d.h. solche, die selbst keine echten Teilspiele enthalten xiere in diesen eines der Gleichgewichte und bestimme die Auszahlungen aller Spieler entferne die Knoten aller dieser Teilspiele bis auf die Wurzel weise den Wurzeln die Gleichgewichtsauszahlungen zu fortsetzen bis es keine echten Teilspiele mehr gibt Kombination aller so xierten lokalen Stratregien ist ein teilspielperfektes Gleichgewicht

damit ist auch die Existenz teilspielperfekter Gleichgewichte in Verhaltensstrategien klar

Tim Hellmann

Einfhrung in die Spieltheorie u

Rckwrtsinduktion u a
in jedem Entscheidungsknoten beginnt ein Teilspiel. bei Rckwrtsinduktion enthalten die untersuchten Teilspiele u a hchstens einen richtigen Spieler. o Gleichgewichtssuche = Ein-Spieler-Optimierungsproblem. es gibt immer (teilspielperfekte) Gleichgewichte sogar in reinen Strategien. Theorem (Ein-Schritt-Abweichungseigenschaft) In extensiven Spielen mit vollstndiger Information liegt ein a teilspielperfektes Gleichgewicht genau dann vor, wenn es fr keinen u Spieler in keinem Teilspiel eine einseitige protable Abweichungsmglichkeit gibt. o alle teilspielperfekten Gleichgewichte lassen sich durch Rckwrtsinduktion nden. u a
Tim Hellmann Einfhrung in die Spieltheorie u

Rckwrtsinduktion u a

Korollar (tsp und Rckwrtsinduktion) u a In endlichen extensiven Spielen mit vollstndiger Information ist die a Menge der teilspielperfekten Gleichgewichte gleich der Menge der Strategienprole, die durch Rckwrtsinduktion gewonnen werden. u a Korollar (Existenz von tsp Gleichgewichten) In jedem endlichen extensiven Spielen mit vollstndiger Information a gibt es ein teilspielperfektes Gleichgewicht.

Tim Hellmann

Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Berechne in diesem Bsp die teilspielperfekten Gleichgewichte.


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Die x K sind Kandidaten fr die Wurzel eines Teilbaums. u


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Untersuche zunchst die minimalen Teilspiele x3 und x5 . a


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Die beiden optimalen Strategien sind c Ax5 und C Ax3 .


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Eliminiere die nicht-optimalen anderen Strategien.


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Dies ergibt den resultierenden Baum.


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Nehme nun wiederum die minimalen Teilspiele.


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Die eindeutige optimale Strategie ist daher A Ax2 .


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Eliminiere die nicht-optimale andere Strategie.


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Dies ergibt den resultierenden Baum.


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Der einzige Teilbaum ist der Baum selbst.


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Die eindeutige optimale Strategie ist daher b Ax1 .


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Die optimalen Strategien in den Teilbumen sind nun markiert. a


Tim Hellmann Einfhrung in die Spieltheorie u

Beispiel zur Rckwrtsinduktion u a

Rckwrtsinduktion ergibt: u a einziges teilspielperfektes Gleichgewicht ist das Verhaltensstrategienprol b B(), so dass
b1 = (bx1 , bx5 ) mit bx1 = b und bx5 = c b2 = (bx2 , bx3 ) mit bx1 = A und bx5 = C

Dies entspricht also dem reinen Strategienprol (bc, AC ) S.

Tim Hellmann

Einfhrung in die Spieltheorie u

Markteintrittspiel

Rckwrtsinduktion ergibt: u a ...


Tim Hellmann Einfhrung in die Spieltheorie u

Markteintrittspiel

Rckwrtsinduktion ergibt: u a ...


Tim Hellmann Einfhrung in die Spieltheorie u

Markteintrittspiel

Rckwrtsinduktion ergibt: u a ...


Tim Hellmann Einfhrung in die Spieltheorie u

Markteintrittspiel

Rckwrtsinduktion ergibt: u a ...


Tim Hellmann Einfhrung in die Spieltheorie u

Markteintrittspiel

Rckwrtsinduktion ergibt: u a (in, accept) ist einziges teilspielperfektes Gleichgewicht.


Tim Hellmann Einfhrung in die Spieltheorie u

Markteintrittspiel

wir hatten noch ein weiteres Nash Gleichgewicht. Warum ist dieses nicht teilspielperfekt?
Tim Hellmann Einfhrung in die Spieltheorie u

Ein weiteres Beispiel Nichteindeutigkeit von teilspielperfekten Gleichgewichten


teilspielperfekte Gleichgewichte mssen nicht immer eindeutig u sein. im unteren Beispiel gibt es mehrere teilspielperfekte Gleichgewichte.

Tim Hellmann

Einfhrung in die Spieltheorie u

Ein weiteres Beispiel Nichteindeutigkeit von teilspielperfekten Gleichgewichten


teilspielperfekte Gleichgewichte mssen nicht immer eindeutig u sein. b1 = a und b2 = (A, C , F ) ist teilspielperfektes Gleichgewicht.

Tim Hellmann

Einfhrung in die Spieltheorie u

Ein weiteres Beispiel Nichteindeutigkeit von teilspielperfekten Gleichgewichten


teilspielperfekte Gleichgewichte mssen nicht immer eindeutig u sein. b1 = a und b2 = (A, D, F ) ist auch tsp Gleichgewicht.

Tim Hellmann

Einfhrung in die Spieltheorie u

Zermelos Theorem - Beispiel: Nimm (1)

zwei Spieler, 1 und 2 zwei Haufen mit Spielsteinen; je endlich und nichtleer abwechselnd, mit 1 beginnend, nehmen die Spieler von genau einem der Haufen mindestens einen Stein es gewinnt, wer den letzten Stein genommen hat Wie sollten die Spieler das Spiel spielen?

Tim Hellmann

Einfhrung in die Spieltheorie u

Zermelos Theorem - Beispiel: Nimm (2)

gleich groe Haufen:


2 kann den Sieg erzwingen nimm jeweils vom anderen Haufen soviele Steine wie 1 zuvor, d.h. stelle gleiche Haufengren her o irgendwann nimmt 1 den letzten Stein von einem Haufen und der andere ist noch nicht leer

unterschiedlich groe Haufen:


1 kann den Sieg erzwingen nimm zuerst vom greren Haufen soviele Steine, da danach o beide Haufen gleich gro sind danach ist 1 in der Situation wie 2 bei gleich groen Haufen

Tim Hellmann

Einfhrung in die Spieltheorie u

Zermelos Theorem - Beispiel: Nimm (3)


endliches extensives Spiel mit vollstndiger Information und a ohne Zufallszge u zwei Spieler zwei Spielausgnge1 gewinnt oder 2 gewinnt a entgegengesetzte Prferenzen a Fakt:
entweder Spieler 1 kann den Sieg sicherstellen oder Spieler 2 kann den Sieg sicherstellen

Kann man das verallgemeinern? Ja.

Tim Hellmann

Einfhrung in die Spieltheorie u

Zermelos Theorem
Theorem In einem endlichen extensiven Spiel mit vollstndiger Information, a zwei Spielern und ohne Zufallszge, u drei Spielausgngen 1 gewinnt oder 2 gewinnt oder a unentschieden und entgegengesetzten Prferenzen a hat/haben entweder 1 eine reine Gewinnstrategie, d.h. 1 kann (unabhngig von 2s Verhalten) den Sieg erzwingen, a oder 2 eine reine Gewinnstrategie oder sowohl 1 als auch 2 eine reine Strategie, die ein Unentschieden garantiert.
Tim Hellmann Einfhrung in die Spieltheorie u

Zermelos Theorem

Anwendungen: Schach
Entweder wei oder schwarz hat eine Gewinnstrategie, oder beide haben eine Strategie, die ein Unentschieden garantiert. Auch wenn noch keine solche Strategie bekannt ist, gibt es sie. Ubersteigt die Rechenfhigkeiten des Gehirns und jedes a Computers.

TicTacToe
beide Spieler knnen ein Unentschieden garantieren. o z.B. Sp.1 setzt sein X in die Mitte, Sp.2 sein O in eine Ecke. danach knnen beide Spieler einfach auf die drohende o Vervollstndigungen reagieren. a

Tim Hellmann

Einfhrung in die Spieltheorie u

Ausblick

What is left?
1

Kooperative Spiele
Verhandlungsspiele

Spiele mit unvollstndiger Information a


Bayesianische Spiele extensive Spiele mit unvollstndiger Information a

Tim Hellmann

Einfhrung in die Spieltheorie u

Verhandlungen als Spiele in extensiver Form

Tim Hellmann

Einfhrung in die Spieltheorie u

Motivation
In Verhandlungen gibt es normalerweise 2 (oder mehrere) Parteien, die sich uber etwas einigen mssen u
Einigung uber den Kaufpreis eines Objekts, Aufteilung eines gemeinsamen Besitzes (z.B. Erbe ), Tarifverhandlungen zwischen Arbeitnehmern und Arbeitgebern, usw.

Alle diese Beispiele haben eines gemeinsam:


Ein Mehrwert fr beide Spieler mu aufgeteilt werden. u Welche Aufteilungsregeln sind sinnvoll bzw. gerecht?

Zwei Anstze: a
nicht kooperativ als extensives Spiel, kooperativ, eine Schiedsrichterlsung. o

Tim Hellmann

Einfhrung in die Spieltheorie u

Sequentielle Verhandlungen (1)


zwei Personen, 1 und 2 verhandeln uber die Aufteilung eines Kuchens der Gre 1 o wechselseitige Angebote mit Spieler 1 beginnend (Periode 0)
Spieler 1 macht in den geradzahligen Perioden Angebote Spieler 2 in den ungeradzahligen

nimmt der andere an, dann endet die Verhandlung mit der vorgeschlagenen Aufteilung nimmt der andere nicht an, dann macht dieser in der nchsten a Periode ein Angebot usw. Lnge des Spiels ist entscheidend, a prinzipiell auch unendlich langer Verhandlungsproze = nicht-endliches Spiel
Tim Hellmann Einfhrung in die Spieltheorie u

Sequentielle Verhandlungen (2)

Prferenzen sind durch Diskontieren mit den Parametern a 1 , 2 (0, 1) gegeben


endet das Spiel in der Periode t mit der Aufteilung (a1 , a2 ) t t dann sind die Auszahlungen (1 a1 , 2 a2 ) d.h. Spieler i ist indierent zwischen i ai in der Periode t und ai in der Periode t + 1

Annahme: Jede Einigung nach endlich vielen Perioden ist nicht schlechter als keine Einigung.

Tim Hellmann

Einfhrung in die Spieltheorie u

Beispiel das Ultimatumspiel


Das zuvor beschriebene Spiel dauert beim so genannten Ultimatumspiel nur eine Periode: Es gibt zwei Spieler, die einen Betrag von $c aufteilen wollen. Spieler 1 macht einen Vorschlag, wie dieser Betrag aufzuteilen ist. Akzeptiert Spieler 2 dann wird der Betrag entsprechend aufgeteilt. Akzeptiert Spieler 2 nicht, bekommen beide nichts. Wir nehmen hier an, dass Spieler 1 jeden Betrag anbieten kann, er ist nicht Beschrnkt auf Vielfache von 1 cent. a Lsung? o Nash-Gleichgewicht: Jeder akzeptierte Vorschlag kann durch ein Nash-Gleichgewicht gesttzt werden. u Benutze daher tsp. GGW

Tim Hellmann

Einfhrung in die Spieltheorie u

Beispiel das Ultimatumspiel

Teilspielperfekte Gleichgewichte im Ultimatumsspiel, Rckwrtsinduktion: u a Untersuche fr jeden Aufteilungsvorschlag von Sp.1 (a1 , a2 ) u (so dass a1 + a2 = 1) die optimale Aktion von Sp.2:
Wenn Sp.2 akzeptiert (A), dann erhlt er $a2 , a wenn Sp.2 nicht akzeptiert (N), dann erhlt er $0. a Falls a2 > 0, dann akzeptiert Sp.2 immer, falls a2 = 0, dann ist Sp.2 indierent zwischen A und N

Tim Hellmann

Einfhrung in die Spieltheorie u

Beispiel das Ultimatumspiel

Nehme zunchst bei Indierenz zwischen A und N an, dass a Sp.2 A whlt: a
dann ist (a1 , a2 ) = (c, 0) teilspielperfekt, d.h. Sp.1 gibt Sp.2 nichts!

Nehme nun bei Indierenz zwischen A und N an, dass Sp.2 N whlt: a
dann ist kein Vorschlag (a1 , a2 ) fr Sp.1 optimal, da u
(c, 0) fhrt zu Nichtakzeptanz von Sp.2 und u fr jeden Vorschlag (a1 , a2 ) von Sp.1, so dass a2 > 0, gibt es u einen besseren, z.B. (a1 + a2 /2, a2 /2)

Daher ist einziges teilspielperfektes Gleichgewicht (c, 0), Sp.1 bekommt alles und Sp.2 nichts.

Tim Hellmann

Einfhrung in die Spieltheorie u