Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER...

117
-1 -0.5 0 0.5 1 1.5 2 -1 -0.5 0 0.5 1 1.5 2 line 1 line 2 line 3 Spieltheorie Vorlesung, zuerst gehalten im Sommersemester 2005 Tomas Sauer Lehrstuhl f ¨ ur Numerische Mathematik Justus–Liebig–Universit¨ at Gießen Heinrich–Buff–Ring 44 D-35392 Gießen Version 1.0 Vorl¨ aufig endg ¨ ultige Version 14.8.2005 M3 M3 M2 M2 M3 M3 M2 M1 Ende Ende Ende Ende α β γ

Transcript of Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER...

Page 1: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

-1

-0.5

0

0.5

1

1.5

2

-1 -0.5 0 0.5 1 1.5 2

line 1line 2line 3

SpieltheorieVorlesung, zuerst gehalten im Sommersemester 2005

Tomas Sauer

Lehrstuhl fur Numerische MathematikJustus–Liebig–Universitat Gießen

Heinrich–Buff–Ring 44D-35392 Gießen

Version 1.0Vorlaufig endgultige Version 14.8.2005

M3

M3M2

M2

M3

M3

M2

M1

Ende

Ende

Ende

Ende

α

β

γ

Page 2: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

Statt einer Leerseite . . . 0

Links were electronic now, not narrative . . . Until the advent of hyperlinks, onlyGod had been able to see simultaneously into past, present and future alike; humanbeings were imprisoned in the calendar of their days.

S. Rushdie, Fury

“Money don’t buy happiness [. . . ]” – “I only wanted to rent it for a few weeks”

T. Pratchett, Maskerade

Nature is not embarrassed by difficulties of analysis.

A. Fresnel

To isolate mathematics from the practical demands of the sciences is to invite thesterility of a cow shut away from the bulls.

P. Chebyshev

Und eine Bemerkung zur in diesem Skript verwendeten Orthographie:

Ich spreche und schreibe Deutsch. Das große, weite und tiefe Deutsch, das dieReformer nicht verstehen. Und nicht ertragen.

R. Menasse

Page 3: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

INHALTSVERZEICHNIS 1

Inhaltsverzeichnis 01 Grundideen der Spieltheorie – Bei–Spiele 2

1.1 Stein, Schere, Papier, Formalismus . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Optimale Strategien – reine und gemischte Strategien . . . . . . . . . . . . . . 41.3 Ein ganz einfaches Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.4 Vollstandige und unvollstandige Information . . . . . . . . . . . . . . . . . . . 101.5 Endliche und unendliche Spiele . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Zweipersonen–Nullsummenspiele 132.1 Definition des Spiels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.2 Die Optimallosung, reine und gemischte Strategien . . . . . . . . . . . . . . . 192.3 Das Minimax–Theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.4 Struktur der Optimallosungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3 Bestimmung optimaler gemischter Strategien 333.1 Polyeder, Ecken und Kanten . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.2 Lineare Optimierung und Dualitat . . . . . . . . . . . . . . . . . . . . . . . . 383.3 Der Simplexalgorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.4 Transport, zwei Phasen und Spiele . . . . . . . . . . . . . . . . . . . . . . . . 46

4 Verhandlungsspiele, Gleichgewichte und die Nutzenfrage 564.1 Verhandlungen und die Vorteile der Kooperation . . . . . . . . . . . . . . . . . 564.2 Nash–Gleichgewicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614.3 Nutzen und Nutzenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 664.4 Der Satz vom Diktator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684.5 Das Gesetz des Schweigens . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5 Mehrpersonenspiele 765.1 Einfache Dreipersonenspiele . . . . . . . . . . . . . . . . . . . . . . . . . . . 765.2 Drei Personen und der volle Formalismus . . . . . . . . . . . . . . . . . . . . 805.3 Mehrpersonenspiele und Koalitionen . . . . . . . . . . . . . . . . . . . . . . . 815.4 Das Aufteilen der Beute . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 885.5 Dreipersonenspiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

6 Einfache Spiele und Mehrheiten 996.1 Gewinnkoalitionen, Verlustkoalitionen und einfache Spiele . . . . . . . . . . . 996.2 Mehrheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1026.3 Losungen fur einfache Spiele . . . . . . . . . . . . . . . . . . . . . . . . . . . 1036.4 Einfache Losungen fur gewichtete Mehrheiten . . . . . . . . . . . . . . . . . . 108

Page 4: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE

Sicher konnen Computer Probleme losen,Informationen speichern, kombinierenund Spiele spielen – aber es macht ihnenkeinen Spaß.

L. Rosten

Grundideen derSpieltheorie – Bei–Spiele 1

Spieltheorie befasst sich mit der Frage, wie man in “Konfliktsituationen” optimale Entschei-dungen trifft. Um es mit Karlin [13] zu sagen:

The art of making optimal judgments according to various criteria is as old as man-kind; it is the essence of every field of endeavor from volleyball to logistics1. Thescience of making such judgments, as opposed to the mere art, is a newer develop-ment . . .

Im diesem ersten Kapitel wollen wir uns anhand von ein paar Bei–Spielen eine Ubersicht uberdie wesentlichen Ansatze und Ideen verschaffen, bevor wir uns dann vertieft an die mathemati-schen Grundlagen machen.

1.1 Stein, Schere, Papier, Formalismus

Ein klassisches Kinder- und nicht nur Kinderspiel ist “Stein, Schere, Papier”, bei dem zweiSpieler, nennen wir sie kreativ S1 und S2, gleichzeitig mit jeweils einer Hand entweder einenStein (Faust), eine Schere (Zeige- und Mittelfinger gespreizt) oder Papier (flache Hand) darstel-len. Der Gewinner wird dann nach folgenden Regeln ermittelt:

1. Der Stein macht die Schere stumpf, also gewinnt Stein gegen Schere.

2. Die Schere schneidet Papier, also gewinnt die Schere gegen das Papier.

3. Das Papier wickelt den Stein ein, also gewinnt Papier gegen Stein.

Man sieht, die Situation ist schon symmetrisch und es gibt entweder ein Unentschieden2 oderein Spieler gewinnt und der andere verliert. In letzterem Fall konnen wir davon ausgehen, daß

1Wir werden uns im Rahmen der Vorlesung allerdings weder mit Volleyball noch mit Logistik befassen, so vielist eigentlich vorhersagbar.

2Wenn beide Spieler dieselbe Wahl getroffen haben.

Page 5: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

1.1 Stein, Schere, Papier, Formalismus 3

ein Gewinn3 vom Verlierer an den Sieger ubertragen wird. Diese Situation bezeichnet man alsein Nullsummenspiel: Was einer gewinnt, das muß der andere verlieren. Normieren wir denGewinn zu 1, dann konnen wir den Ablauf des Spiels aus der Sicht der Spieler in Tabellendarstellen:

S1 \ S2 St Sch PSt 0 1 -1

Sch -1 0 1P 1 -1 0

S1 \ S2 St Sch PSt 0 -1 1

Sch 1 0 -1P -1 1 0

Das sind die Auszahlungstabellen fur S1 (links) und S2 (rechts), die wir als Mathematikernaturlich auch als Matrizen darstellen konnen und werden, namlich

A1 =

0 1 −1−1 0 11 −1 0

, A2 =

0 −1 11 0 −1−1 1 0

, (1.1)

und die Tatsache, daß wir es mit einem Nullsummenspiel zu tun haben, ist dann schlicht undergreifend aquivalent zu A1 + A2 = 0. So konnen wir naturlich nun jedes Zweipersonenspieldarstellen: Hat Spieler S1 die Wahlmoglichkeiten oder Strategien s1,1, . . . , s1,m und Spieler S2

entsprechend4 s2,1, . . . , s2,n, dann stellen wir das Spiel durch die beiden AuszahlungsmatrizenA1, A2 ∈ Rm×n dar, die sich aus den Auszahlungsfunktionen F1, F2 durch

(A`)jk = F` (s1j, s2k)

ergeben. Und nochmals langsam: In unserem Beispiel haben wir es mit den symmetrischenStrategien

s11 = s21 = s1 = Stein, s21 = s22 = s2 = Schere, s31 = s32 = s3 = Papier

zu tun.

Beispiel 1.1 (Gefangenendilemma) Zwei Verbrecher werden festgenommen und getrennt von-einander verhort. Der Polizei ist klar, daß sie beide eine Menge auf dem Kerbholz haben, kannaber leider nur kleinere Vergehen wirklich nachweisen5. Deswegen erhalten beide das Angebot,als Kronzeuge gegen den anderen auszusagen – in diesem Falle wurde der Kronzeuge einenStrafnachlass erhalten, der nicht gestandige Verbrecher hingegen die volle Harte der Justizgeniessen durfen. Wenn naturlich beide gestandig sind, dann braucht man keinen Kronzeugen

3Beispielsweise eine Einheit Geld – der Phantasie sind hier keine Grenzen gesetzt, aber fur unsere Zwecke hierist es vollig irrelevant.

4Es hat niemand gesagt, daß Spiele immer symmetrisch sein mussen und daß beide Spieler immer dieselbeAnzahl an Strategien haben.

5Das ist nicht so unrealistisch: So wurde beispielsweise Al Capone nur wegen Steuerhinterziehung angeklagtund verurteilt.

Page 6: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

4 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE

mehr und der “Rabatt” ist dahin. In negativen Jahren Gefangnis sehen also die Auszahlungs-matrizen wie folgt aus6:

A1 = AT2 =

[−1 −5−3 −7

],

wobei s1 = “schweigen” und s2 = “aussagen” ist. Ist es besser zu schweigen oder auszusagen?Was ist die optimale Strategie?

Beispiel 1.1 ist kein Nullsummenspiel, denn

A1 + A2 =

[−2 −8−8 −14

]6= 0.

Trotzdem kann man es zu einem Nullsummenspiel machen, indem man einen Spieler S3 einfuhrt,der nur eine Strategie und die Auszahlungsmatrix A3 = −A1 − A2 hat – trivialerweise istdann A1 + A2 + A3 = 0. Allerdings haben wir es dann nicht mehr mit einem Zweipersonen-spiel zu tun, sondern mit einem Dreipersonenspiel und wir sehen bereits eine Eigenart vonn–Personenspielen mit n > 2: Es wird Kooperation moglich, bei der mehrere Spieler gegenandere Spiele Koalitionen bilden konnen.

Beispiel 1.2 (Koalitionen) Das klassische und aus der Politik bekannte Mehrpersonenspielheißt “Koalition”. Nehmen wir an, ein Parlament habe 9 Sitze, die sich auf die drei Partei-en S, C und F wie folgt verteilen:

Partei S C FSitze 4 4 1

Es ist naheliegend, daß die beiden großen Parteien lieber mit F koalieren werden als miteinan-der, denn sie werden in solch einer Koalition naturlich ein großeres Stuck vom Kuchen bekom-men7. Was ist also das “optimale” Angebot, das die Parteien einander fur Koalitionen machenkonnen?

In diesem Sinne konnen wir ja auch das Gefangenendilemma aus Beispiel 1.1 sehen: Die Spie-ler konnen entweder miteinander oder mit der Justiz kooperieren, also mit dem “unsichtbaren”dritten Spieler, der nur eine Strategie zur Auswahl hat, namlich abwarten, was die beiden ma-chen.

1.2 Optimale Strategien – reine und gemischte StrategienWieder ist “Stein, Schere, Papier” ein gutes Beispiel: Die eigentliche Kunst des Spiels liegt inder Psychologie, also in der Fahigkeit, die Entscheidung des Gegners vorherzusagen und ent-sprechend dagegen zu handeln – das ist die wirkliche Bedeutung des im Sport so oft mißbrauch-ten Wortes “antizipieren”. Tatsachlich konnten wir auch vom “Elfmeterdilemma” sprechen. Nur

6Und im Gegensatz zu “Stein, Schere, Paier” liegt das Interesse der Spieler daran, die “Auszahlung” in Jahrenzu minimieren, deswegen der Vorzeichenwechsel.

7Und wer an die Sonntagsrede von der Bedeutung einer starken Opposition glaubt ist ohnehin selbst schuld.

Page 7: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

1.2 Optimale Strategien – reine und gemischte Strategien 5

ist Psychologie leider mathematisch nicht wirklich fassbar8 und deswegen gehen wir bei der Be-stimmung der optimalen Losung immer davon aus, daß wir es mit einem Gegner zu tun haben,der “vernunftig” agiert9. Die Optimallosung versucht nun, die Strategie so zu wahlen, daß beibester Wahl des Gegners das beste Ergebnis erreicht wird.

Dabei betrachten wir zuerst das Nullsummenspiel! Hier wird S1 sich also alle seine Stra-tegien s11, . . . , s1m ansehen und annehmen, daß S2 clever genug ist, in jedem Fall die besteGegenstratgie zu wahlen, daß also fur j = 1, . . . ,m die Strategie s2k mit von j abhangigem kgewahlt wird, so daß

(A2)jk = maxk′=1,...,n

(A2)jk′ = maxk′=1,...,n

(−A1)jk′ = mink′=1,...,n

(A1)jk′ ,

und dann wird S1 das beste unter diesen j auswahlen:

(A1)jk = maxj′=1,...,m

mink′=1,...,n

(A1)j′,k′ . (1.2)

Diese Vorgehensweise bestimmt aber nur j! Der Index k der Strategie, die S2 wahlt, ergibt sichals Losung des Minimax–Problems

(A1)jk = mink′=1,...,n

maxj′=1,...,m

(A1)j′,k′ , (1.3)

und im allgemeinen gilt, daß maxj mink 6= mink maxj – im Falle von Gleichheit spricht mandann von einem Sattelpunkt.

Ubung 1.1 Geben Sie eine Matrix A = [ajk] an, so daß

maxj

minkajk 6= min

kmaxjajk

ist. ♦

Beispiel 1.3 S1 will seine optimale Strategie fur “Stein, Schere, Papier” bestimmen und bildetdaher fur jedes j, also jede Zeile von A1 die Minima: 0 1 −1

−1 0 1

1 −1 0

111

und wenn er nun maximiert, dann ist er so schlau wie zuvor, denn das Maximum wird fur alledrei Strategien angenommen.

8Zumindest beim Elfmeter stimmt das nicht so wirklich: Schutzen wie Torhuter haben normalerweise Prafe-renzen, die sich aus der “Handigkeit” ergeben, aber das musste man dann halt in der Auszahlungsmatrix beruck-sichtigen.

9Was nicht erst seit Loriots klassischem Sketch vom Skatspieler nicht immer und uneingeschrankt zutreffenmuss.

Page 8: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

6 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE

Beispiel 1.4 Naturlich gibt es auch Matrizen mit Sattelpunkt, beispielsweise[1 2−1 −2

],

denn hier liefert max min die Auswahl[1 2

−1 −2

]1−2

−→[

1 2−1 −2

],

was dasselbe Resultat liefert wie die min max–Suche:[1 2−1 −2

]1 2

−→[

1 2−1 −2

].

Die Wahl der reinen Strategie liefert uns also, wie Beispiel 1.3 zeigt, keine besonders aufregen-den Resultate fur “Stein, Schere, Papier” – alle Strategien sind absolut gleichwertig und es wirdsich auch zeigen, daß Spiele mit Sattelpunkt generell nicht besonders interessant und “spielens-wert” sind. Daher nehmen wir einen etwas anderen Standpunkt ein und nehmen an, wir wurdennicht eine Partie spielen, sondern mehrere und die Spieler wahlen jede ihrer Strategien mit einerWahrscheinlichkeit pj bzw. qk, j = 1, . . . ,m, k = 1, . . . , n. Diese gemischten Strategien umfas-sen auch den Fall reiner Stragien, indem man ein pj und ein qk gleich Eins setzt. Die erwarteteAuszahlung fur ein Nullsummenspiel ist dann

E (A1,p, q) := ±m∑j=1

n∑k=1

(A1)jk pj qk = ±pTA1q, p =

p1...pm

, q =

q1...qn

,und S1 versucht nun, den Wahrscheinlichkeitsvektor p so zu wahlen, daß dieser Ausdruck maxi-miert wird, wohingegen S2 sein q so wahlt, daß der Ausdruck minimiert wird. Nun, die FunktionE (A1, ·, q) nimmt10 ein Extremum, ganz egal welches, entweder in einem Randpunkt an, dasheißt, wenn pj = 0 fur mindestens ein j ist, oder aber, wenn der Gradient den Wert Null hat.Letzteres ist ziemlich unwahrscheinlich, denn es wurde fordern, daß fur ` = 1, . . . ,m

0 =∂

∂p`E (A1,p, q) =

∂p`

m∑j=1

n∑k=1

(A1)jk pj qk =n∑k=1

(A1)`k qk,

also0 = A1q = pTA1q = E (A1,p, q) , fur alle p

ist. Aber Moment mal – hier ist eine interessante Beobachtung: Ist die Matrix A1 nicht inver-tiebar11, und gibt es12 p ≥ 0 oder q ≥ 0, so daß pTA1 = 0 oder A1q = 0 ist und wahlt derentsprechende Spieler diese gemischte Strategie, dann kann sein Kontrahent machen, was erwill – das erwartete Ergebnis ist vollkommen unabhangig von dieser Strategie.

10Fur “festes q”.11Beispielsweise, wenn m 6= n ist!12Achtung: Positivitat ist eine Forderung, denn wir wollen Wahrscheinlichkeiten und die durfen keine negativen

Eintrage haben.

Page 9: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

1.3 Ein ganz einfaches Beispiel 7

Beispiel 1.5 (Stein, Schere, Papier) Diese Unabhangigkeit ist auch das, was man erwartenwurde, wenn einer der Spieler (beispielsweise ein Computer) strikt gleichverteilt zufallig spielt,dann kann der andere Spieler machen, was er will, das Spiel ist ein reines Glucksspiel, mankann genausogut gleich um die Wette wurfeln. Und wie’s der Zufall will, ist das auch noch dieoptimale Strategie, vorausgesetzt, man hat keinen psychologischen Vorteil.

Aber die gemischten Strategien erlauben noch eine andere Sichtweise des Spiels, namlichdas Ersetzen der Auszahlungsmatrix A1 durch eine Auszahlungsfunktion

f1 : Sm × Sn → R, f1 (p, q) = pTA1q, (1.4)

wobeiSk =

p ∈ Rk : pj ≥ 0, p1 + · · ·+ pk = 1

das k–dimensionale Einheitssimplex bezeichnet13. Fur solche Funktionen gilt dann eine derwesentlichen Aussagen der Spieltheorie, namlich das Minimax–Theorem, das uns sagt, daß imgemischten Sinne jedes Zweipersonen–Nullsummenspiel einen Sattelpunkt besitzt und das wirnaturlich auch noch beweisen werden.

Satz 1.6 (Minimax) Fur jede Matrix A ∈ Rm×n gilt

maxp∈Sm

minq∈Sn

pTAq = minq∈Sn

maxp∈Sm

pTAq. (1.5)

1.3 Ein ganz einfaches BeispielSchauen wir uns einmal den einfachsten Fall eines Spieles an, namlich ein Zweipersonen–Nullsummenspiel mit nur jeweils zwei Strategien, also der Auszahlungsmatrix

A1 = −A2 =

[a bc d

].

Bei den gemischten Strategien (p, 1− p) und (q, 1− q) ist die zu erwartende Auszahlung

E(p, q) = apq + bp(1− q) + c(1− p)q + d(1− p)(1− q)= d+ p(b− d) + q(c− d) + pq(a− b− c+ d)

= d+ p(b− d) + q [(a− b− c+ d)p+ c− d]

= d+ q(c− d) + p [(a− b− c+ d)q + b− d] .

Ist also a + d 6= b + c, dann konnen beide Spieler das Spiel unabhangig von der Wahl desGegners machen, indem sie

p =d− c

a− b+ d− c, und q =

d− ba− c+ d− b

(1.6)

13Mehr dazu spater.

Page 10: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

8 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE

wahlen. Nun sollten das naturlich auch Wahrscheinlichkeiten sein, also zwischen 0 und 1 liegen,mit anderen Worten es sollte

1 ≤ p−1 =a− b+ d− c

d− c= 1 +

a− bd− c

⇒ a− bd− c

> 0

sein. Wenn das nicht der Fall ist, dann haben b − a und d − c dasselbe Vorzeichen. Sind dieseVorzeichen beide

positiv, das heißt, ist b > a und d > c, dann wird Spieler 2 auf jeden Fall Strategie 1 wahlen,sind sie beide

negativ, dann ist b < a und d < c und Spieler 2 wird sich auf alle Falle fur Strategie 2entscheiden14,

aber in beiden Fallen kann Spieler 1 sich nun die fur ihn gunstigere Zeile aussuchen und beideSpieler wurden sich nur verschlechtern, wenn sie die Strategie wechseln. Mit anderen Worten:Das Spiel hat einen Sattelpunkt. Dasselbe Argument trifft naturlich auch fur die Wahle von q zuund wir konnen die folgende Beobachtung machen.

Lemma 1.7 Die nach (1.6) bestimmten Zahlen p und q liegen genau dann in [0, 1] und sindsomit Wahrscheinlichkeiten bzw. gemischte Strategien, wenn das Spiel keinen Sattelpunkt hat.

Damit sind wir im Geschaft: Entweder hat das Spiel einen Sattelpunkt und wird sich auf diesemeinpendeln, oder es gibt zwei gemischte Strategien, die den Ausgang des Spieles jeweils vonder anderen Strategie unabhangig machen. Nennen wir diese beiden p∗ und q∗. Dann ist

v := E (p∗, q∗) = minq∈[0,1]

E (p∗, q) = maxp∈[0,1]

E (p, q∗)

und somitmaxp∈[0,1]

minq∈[0,1]

E (p, q) ≥ v ≥ minq∈[0,1]

maxp∈[0,1]

E (p, q) . (1.7)

Umgekehrt gilt aber sogar die folgende allgemeine Tatsache.

Lemma 1.8 Fur jede reellwertige Funktion f : X × Y → R gilt

infy∈Y

supx∈X

f(x, y) ≥ supx∈X

infy∈Y

f(x, y). (1.8)

Sind X und Y kompakt und ist f stetig, dann kann man sup und inf auch durch min und maxersetzen.

Beweis: Fur jedes feste y ∈ Y ist supx∈X f(x, y) ≥ f(x, y), also ist fur ξ ∈ [0, 1]

g(ξ, y) := supx∈X

f(x, y)− f(ξ, y) ≥ 0 ⇒ g(ξ) := infy∈Y

g(ξ, y) ≥ 0,

14Sofern Spieler 2 vernunftig spielt . . .

Page 11: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

1.3 Ein ganz einfaches Beispiel 9

also auch

0 ≤ supξ∈X

g(ξ) = supξ∈X

infy∈Y

g(ξ, y) = supξ∈X

infy∈Y

(supx∈X

f(x, y)− f(ξ, y)

)= sup

ξ∈Xinfy∈Y

supx∈X

f(x, y)− supξ∈X

infy∈Y

f(ξ, y) = infy∈Y

supx∈X

f(x, y)− supx∈X

infy∈Y

f(x, y),

wie behauptet. Die Kompaktheits- und Stetigkeitsaussagen sollten aus der Analysis bekanntsein, siehe [10].

Kombinieren wir also nun (1.8) mit (1.7), dann ist letztendlich

v = E (p∗, q∗) = maxp∈[0,1]

minq∈[0,1]

E (p, q) = minq∈[0,1]

maxp∈[0,1]

E (p, q)

und damit sind die “unabhangigen” Strategien auch optimale Strategien. Der Erwartungswert vbei optimaler Spielweise heißt auch Wert15 des Spiels; ist er positiv, dann bevorzugt das SpielSpieler 1, ist er negativ, dann kommt Spieler 2 besser davon und ist er gleich Null, dann nenntman das Spiel fair.

Bemerkung 1.9 Die explizite Formel (1.6) fur die optimalen Strategien p∗, q∗ eines Zweiper-sonen–Nullsummenspiels andert sich nicht, wenn man zu jeder Auszahlung denselben Wert ad-diert, also A1 durch

A′1 = A1 + c

[1 11 1

]=: A1 + c 11T

ersetzt16, oder wenn man A1 mit einem beliebigen, von Null verschiedenen Wert multipliziert17.Damit gilt aber auch:

1. Der Wert eines Spieles wird immer mit denselben Strategien bestimmt und kann durchAddition von

c [p∗, 1− p∗][

1 11 1

] [q∗

1− q∗]

= c [p∗, 1− p∗][

11

]= c

auf jeden beliebigen anderen Wert gebracht werden.

2. Ersetzt man A1 durch A′1 = A1 − v11T , dann ist das zu A′1 gehorige Spiel fair.

15“value”16Zur Erinnerung: Fur zwei Vektoren x, y beliebiger, nicht notwendig gleicher Lange ist xyT = [xjyk : j, k]

eine Matrix vom Rang 1, manchmal auch als Tensorprodukt oder Kroneckerprodukt, siehe z.B. [16, 29], der beidenVektoren bezeichnet. Insbesondere ist

11T =

1 . . . 1...

. . ....

1 . . . 1

die Matrix, die aus lauter Einsen besteht (aber nicht die Einheitsmatrix!) und in Matlab bzw. Octave unter demNamen ones abrufbar ist.

17Fur die Strategie ist es irrelevant, ob man um Euro oder Cent spielt.

Page 12: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

10 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE

Die wahre Kunst besteht naturlich in der Erfindung von Spielen, die auf ganz subtile Weiseunfair sind, und sei es nur durch eine minimale Veranderung der Regeln, siehe beispielsweiseUbung 2.1 oder das “Skin Game” aus Beispiel 2.18.

Ubung 1.2 Das Daiquiri–Spiel aus [30]: Zwei Manner, Alex und Olaf, siehe Abb. 1.1, sit-zen in einer Bar und vereinbaren folgendes Spiel. Beide legen legen jeweils ein oder zweiStreichholzer fr den anderen unsichtbar auf den Tresen. Stimmen die Zahlen uberein, so mußAlex seinem “Freund” Olaf diese Anzahl an Daiquiris ausgeben (zu je 5.50 Euro), andernfallskommt Alex mit der Zahlung von einem Euro davon. Welchen Betrag muß Olaf vorher an Alexgeben, damit das Spiel fair ist? ♦

Abbildung 1.1: Alex und Olaf aus [30].

1.4 Vollstandige und unvollstandige InformationDie Bei–Spiele, die wir bisher betrachtet haben, haben die Gemeinsamkeit, daß sie fur beideSpieler absolut unvollstandige Information bieten, denn keiner der beiden Spieler weiss, wiesich der andere entscheidet, die Strategien werden unabhangig voneinander gewahlt.

Das Gegenstuck dazu sind Spiele mit vollstandiger Information, bei denen jeder Spieler zujedem Zeitpunkt die gesamte Spielsituation kennt und seine Strategie entsprechend anpassenkann; Beispiele hiefur sind Schach oder “Russisch Roulette”, bei dem ein Zufallsaspekt dazu-kommt18. Solche Spiele sind, wie bereits in [20]19 bewiesen, immer determiniert, das heißt, siehaben immer einen Sattelpunkt und damit gibt es a priori eine optimale Strategie. Fur Schachbedeutet das, daß man das Spiel eigentlich nicht spielen zu brauchte, sofern es nur komplettverstanden ist, denn der Sattelpunkt wurde ja entweder sicheren Sieg fur Weiß, sicheres Remisoder sicheren Sieg fur Schwarz bedeuten, siehe Abb. 1.2. Glucklicherweise ist aber Schachkomplex genug, um sich vollstandig erfassen zu lassen, so daß die “mechanische” Behandlungvon Schach darin besteht, eine gewisse Menge von Halbzugen vorauszuberechnen und dann die

18Solange man es nicht mit einer Automatikpistole spielt – solche Falle werden immer wieder auf einschlagigenInternetseiten berichtet.

19So, jetzt haben wir die Bibel der Spieltheorie auch zum ersten Mal zitiert.

Page 13: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

1.5 Endliche und unendliche Spiele 11

Abbildung 1.2: Das schwierigste Schachproblem: Weiß zieht und setzt in 48 Zugen matt.

resultierenden Stellungen zu bewerten und entsprechend “lokal optimale” Strategien zu wahlen.Die Kunst dabei, also bei der Erstellung eines guten Schachprogramms liegt weniger in der An-zahl der Halbzuge (das ist “brute force” und der Rechenaufwand wachst exponentiell mit derBerechnungstiefe), sondern in der Bewertung von Stellungen. Fruhe Schachprogramme konn-ten lediglich Matt erkennen und haben ansonsten aufsummiert, wie viel “Material” noch aufdem Brett war, aber heute ist das doch schon um einiges cleverer.

Viele Gesellschaftsspiele wie Skat, Schafkopf, Bridge, Poker und so weiter leben davon,daß die Information nicht nicht vollstandig aber eben auch nicht vollkommen unvollstandigist20. Bei derartigen Spielen kann man sich durch gutes Erinnerungsvermogen und ein bißchenWahrscheinlichkeitsrechnung einen gewissen Vorteil verschaffen, wie auch bei Knatsch [26]oder insbesondere Blackjack. Das ist ubrigens angeblich auch der Grund, warum technischeHilfsmittel in Spielcasinos verboten sind.

Generell kann die Informationsverteilung in manchen Spielen auch sehr unterschiedlichsein, vom “allwissenden” Spielleiter bis hin zu “rollenabhangigen” Informationen; ein schonesBeispiel hierfur ist [5]. All das sind Aspekte, die man kaum mehr mathematisch beschreibenkann und deswegen entziehen sich auch die meisten oder zumindest die besten Gesellschafts-spiele dem Formalismus dieser Vorlesung, was sie allerdings in keinster Weise reizlos macht.

1.5 Endliche und unendliche SpieleUnser bisheriger Formalismus konnte nur endliche Spiele behandeln, also Spiele, bei denenjedem Spieler nur endlich viele Strategien zur Verfugung stehen. Durch die gemischten Strate-gien weicht man dann zwar auf eine kontinuierliche Menge aus, aber die Endlichkeit des Spielsliefert uns zumindest einen endlichdimensionalen Raum. Trotzdem gibt es auch Spiele, die un-

20Eine Karte, die ich habe, kann der Gegner schon einmal nicht haben, außerdem erlauben auch die Ansagenoder Koalitionen Ruckschlusse auf Kartenverteilungen.

Page 14: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

12 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE

endlich viele, ja sogar kontinuierliche Strategien ermoglichen, typischerweise die sogannten“Stopprobleme”.

Beispiel 1.10 (Duell) Zwei Schutzen stehen sich zu einem Duell gegenuber21 und durfen zumselben Zeitpunkt die Pistole heben, dann zielen und wann immer sie wollen schießen. Je mehrZeit sich ein Schutze zum Zielen laßt, desto hoher wird seine Trefferwahrscheinlichkeit, abernaturlich auch das Risiko, getroffen zu werden. Was ist der optimale Zeitpunkt, abzudrucken?

Soviel schon mal im Voraus: die mathematische Behandlung solcher Spiele, die sich mit dem Ti-ming von Aktionen befassen, siehe [13, Vol II, S. 101ff], hangt auch davon ab, ob mit oder ohne“Schalldampfer” gearbeitet wird, ob ein Duellant also weiß, daß sein Kontrahent vorbeigeschos-sen22 hat oder nicht – wir sind also auch bereits wieder bei der Frage nach der Vollstandigkeitder Information.

21Wer will kann ja annehmen, daß es sich bei einem der beiden um Evariste Galois handeln wurde.22Einen Treffer wurde er schon merken . . .

Page 15: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

13

Sine victoriae spe nemo volens in aciemdescendit.Ohne Hoffnung auf Sieg zieht niemandfreiwillig in den Kampf.

Petrarca, De spe vincendi – Von derHoffnung auf Sieg, 1366

Zweipersonen–Nullsummenspiele 2

Beginnen wir also mit dem einfachsten Typ von Spielen, namlich mit Zweipersonen–Nullsum-menspielen. Und da definieren wir am besten zuerst einmal alle Begriffe, die wir brauchen, undzwar richtig.

2.1 Definition des Spiels

Bei der Begriffsbildung folgen wir im wesentlichen den beiden “Standardwerken” [13] und[20], bei denen sich diese Vorlesung auch am reichlichsten bedient23. Die meisten der Konzeptewurden aber bereits 1928 von John von Neumann24 [18] in der anscheinend allerersten Arbeitzum Thema Spieltheorie angegeben wurden.

Definition 2.1 Ein n–Personen–Spiel S , n ∈ N, besteht aus n Strategiemengen S1, . . . , Snund einer Auszahlungsfunktion a : S1 × · · · × Sn → Rn, die den “Gewinn” der einzelnenSpieler unter Verwendung der jeweiligen Strategien angibt.

1. Das Spiel S heißt Zweipersonenspiel, wenn n = 2 ist25.

2. Das Spiel S heißt Nullsummenspiel, wenn

0 ≡ 1Ta =n∑j=1

aj, d.h. 0 =n∑j=1

aj (s1, . . . , sn) , sj ∈ Sj, j = 1, . . . , n.

23Es sind auch die mathematisch substantiellsten unter den Buchern. Es gibt zur Spieltheorie zwar relativ vielpopularwissenschaftliche Literatur, aber die ist dafur auch gerne mal ungenau, wenn es um die “harten” mathema-tischen Details geht.

24Der auch der Vater des von Neumannschen Universalrechners ist, einer erstaunlich genauen Beschreibung desDigitalcomputers noch bevor solche Gerate realisiert werden konnten.

25Das sollte niemanden so wirklich uberraschen.

Page 16: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

14 2 ZWEIPERSONEN–NULLSUMMENSPIELE

3. Sind die Strategiemengen Sj endlich, ist also sj := #Sj <∞, j = 1, . . . , n, dann setzenwir Sj = 1, . . . , sj, σ = (s1, . . . , sn), und erhalten die Auszahlungsmatrizen

A = [Aj : j = 1, . . . , n] = [Aj,α = aj (α1, . . . , αn) : j = 1, . . . , n, α ∈ Nn, α ≤ σ] ,

wobeiα ≤ β ⇔ αj ≤ βj, j = 1, . . . , n,

eine gebrauchliche Halbordnung fur Multiindizes α, β ∈ Nn darstellt.

4. Im Fall eines Zweipersonen–Nullsummenspiels mit endlicher Strategiemenge ist das Spieldurch eine Matrix A ∈ Rs1×s2 beschrieben, fur die A1 = A und A2 = −A gilt.

Beispiel 2.2 Wie wir schon in Beispiel 1.1 gesehen haben, ist die Spielmatrix zu Stein, Schere,Papier von der Form

A =

0 1 −1−1 0 11 −1 0

und hat die schone Eigenschaft, daß alle Zeilensummen und alle Spaltensummen den Wert 0haben, also daß 1TA = A1 = 0 ist. Außerdem ist A schiefsymmetrisch26, also AT = −A;das druckt die Tatsache aus, daß die Strategien, die ja beiden Spielern unabhangig voneinanderzur Verfugung stehen, auch fur beide Spieler gleichwertig sind, was eine weitere Symmetrieei-genschaft des Spiels ist.

Der Formalismus aus Definition 2.1 reicht zwar aus, um “Stein, Schere, Papier” zu beschrei-ben, aber bei eher klassischen Gesellschaftsspielen, selbst bei Schach, erscheint das ein wenigschwach. Einen Ausweg findet man aber bereits in [20], wo ein Spiel aus Spielzugen aufgebautwerden kann.

Definition 2.3 (Spielzuge und Information) Ein n–Personen–Spiel bestehe aus einer Abfolgevon Zugen M0,M1, . . . nach den folgenden Regeln:

1. Im k–ten Zug Mk kann Spieler nk entweder eine bewusste, rein von ihm abhangige Ent-scheidung treffen, einen Spielzug erster Ordnung durchfuhren, oder eine zufallige, vonihm nicht beeinflußbare Handlung abrufen, was man als Spielzug zweiter Ordnung be-zeichnet.

2. Nach diesem Zug entsteht eine neue Spielsiutation, die entweder einen neuen Spieler nk+1

festlegt, oder das Spiel ist beendet und die Auszahlungen werden bestimmt.

3. Die Information Ik ⊂ 1, . . . , k − 1, die Spieler nk vor Spielzug k zur Verfugung steht,beschreibt, welche Ergebnisse der Spielzuge Mk dem Spieler zur Verfugung stehen.

4. Das Spiel S beitzt vollstandige Information, wenn Ik = 1, . . . , k − 1 fur alle k undalle moglichen gewahlten Spielzuge.

26Auf Englisch skew symmetric.

Page 17: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

2.1 Definition des Spiels 15

5. Das Spiel S heißt endlich, wenn jeder Spieler zu jedem Zeitpunkt nur endlich viele Stra-tegien zur Auswahl hat und wenn es eine Zahl N ∈ N gibt, so daß das Spiel, unabhangigvom Ablauf, nach maximal N Zugen beendet ist.

Beispiel 2.4 (Draw Poker) Die Unterscheidung zwischen Spielzugen erster und zweiter Artsieht man gut am Beispiel der “klassischen” Pokervariante Draw Poker. Eine Pokerpartie mitn Spielern lauft folgendermaßen ab:

• Jeder Spieler zahlt einen Festbetrag in den Topf ein. Das muss man naturlich nicht alsSpielzuge verbuchen.

• Jeder Spieler erhalt 5 Karten aus einem gemischten Blatt, was wir als Spielzuge zweiterArt M1, . . . ,Mn verbuchen konnen.

• Nun kommt eine Bietrunde, die wir als eine Serie Mn+1, . . . ,Mm von Zugen erster Artbeschreiben konnen – hierbei kann jeder Spieler erhohen, dabeibleiben oder passen; dieInformation, die Spieler nk beim k–ten Zug zur Verfugung steht, ist

Ik = nk,m, . . . , k − 1 ,

also die eigenen Karten und alle vorhergehenden Gebote.

• Im nachsten Schritt kann jeder Spieler bis zu drei Karten austauschen, das sind ZugeMm+1, . . . ,Mm+n erster Art, von denen auch alle Spieler informiert werden, und dannZuge Mm+n+1, . . . ,Mm+2n zweiter Art, von deren Ergebnis nur der jeweils aktive Spielerinformiert wird.

• Schließlich erfolgt eine zweite Bieterunde, an deren Ende alle Spieler, die noch nichtgepasst haben, ihre Karten vergleichen.

Ein Spiel, das auf Zugen, seien es Zuge erster oder zweiter Art, beruht, kann man immer alseinen Baum darstellen, bei dem alle Moglichkeiten fur M1 an der “Wurzel” aufgelistet werdenund dann, in Abhangigkeit von den vorhergehenden Zugen, alle regelkonformen Moglichkeitenfur M2, M3 und so weiter, siehe Abb 2.1. Und nun ist klar, wie derartige Spiele in die Normal-form aus Definition 2.1 gebracht werden konnen: Jedes Blatt27 entspricht einer Auszahlung diemit den Wahrscheinlichkeiten der Zuge zweiter Art auf dem Weg dahin gewichtet wird, und diezugehorigen Strategien sind die entsprechenden Zuge erster Art.

Man kann das auch sehr formal definieren und den Ubergang von Spielbaumen zu Auszah-lungsmatrizen exakt beschreiben, wie es in [20, Chapter II, S. 46–84] auch geschehen ist, aberdas wurde uns ein wenig zu lange aufhalten und der einzige Preis, den wir fur diese “Schlam-pigkeit” zu zahlen haben werden, besteht darin, daß wir beim Beweis von Satz 2.12 nicht formalganz vollstandig und korrekt argumentieren konnen. Aber das lasst sich verschmerzen.

Bemerkung 2.5 Diese Sichtweise auf ein Spiel ist weniger abwegig, als es zuerst einmal er-scheinen mag: Gerade beim Schach wahlt man oft ganze Zugkombinationen als Strategien,beispielsweise bei den Eroffnungen (Spanisch, Konigsindisch etc.).

27Also jeder Knoten, der keinen Nachfolgeknoten hat, in unserem Fall genau dann, wenn das Spiel endet.

Page 18: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

16 2 ZWEIPERSONEN–NULLSUMMENSPIELE

M3

M3M2

M2

M3

M3

M2

M1

Ende

Ende

Ende

Ende

Abbildung 2.1: Ein Beispiel fur die ersten drei Zuge in einen Spielbaum. Wann immer dasEnde des Spiels erreicht wird, erfolgt eine Auszahlung.

Zum Abschluss wollen wir dieses Konzept noch anhand eines Spieles aus [30] illustrieren28.

Beispiel 2.6 (Russisch Roulette) Um das “normale” russische Roulette (ein Trommelrevolvermit 6 Patronen, von denen nur eine scharf ist, die anderen funf sind blind29) etwas interessanterzu machen spielen A und B es mit Einsatz. Das Spiel lauft folgendermaßen ab:

1. Jeder Spieler setzt eine Gewinneinheit30.

2. Spieler A kann nun entweder zwei weitere Einheiten setzen und den Revolver an B wei-tergeben (“Passen”) oder eine Einheit setzen, den Revolver an seine Schlafe halten undabdrucken.

3. Hat Spieler A seinen Zug uberlebt, dann hat Spieler B dieselben Optionen, darf aber dieTrommel nicht verandern.

4. Das Spiel ist zuende und die uberlebenden Spieler teilen die Einsatze untereinander auf.

Der Spielbaum zu Beispiel 2.6 findet sich in Abb. 2.2, man sieht, daß es sich offenbar um einNullsummenspiel handelt. Spieler A hat zwei Strategien, Passen (P) und Spielen (S), wohinge-gen Spieler B vier Strategien hat: Immer Spielen (S), immer Passen (P), dieselbe Strategie wie

28Dieses Spiel ist zur Nachahmung nicht empfohlen! Insbesondere nicht fur Kinder!29Es hat mit Sicherheit auch schon “Experten” gegeben, die Platzpatronen verwendet haben – wenn man sich

die Pistole dann an die Schlafe halt, ist der Unterschied zu scharfen Patronen eher marginal.30Im Originaltext von [30] geht es um Zigarettenpackchen, so daß den Spielern nur die Wahl zwischen schnellem

und langsamem Tod bleibt.

Page 19: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

2.1 Definition des Spiels 17

1/2

2/1

1/1

2/1

0 / 0

2/2

2/2

5/6

1/6−2 / 2S

P P

S5/6

1/6 2 / −2

−0.5 / 0.5

S

P0.5 / −0.5

4/50/0

1/5 2 / −2

Abbildung 2.2: Der Ablauf des “Russisch Roulette” aus Beispiel 2.6. Bei den Zugen istangegeben, welcher Spieler am Zug ist und ob es ein Zug erster oder zweiter Art ist, beiden Ergebnissen die Auszahlung.

A (A) oder die entgegengesetzte Strategie (E). Gewichten wir die Auszahlungen schließlich mitden jeweiligen Wahrscheinlichkeiten, so erhalten wir die folgende Auszahlungsmatrix, genauer,die folgende Matrix von erwarteten Auszahlungen:

S P A ES 0 1/12 0 1/12P −1/12 0 0 −1/12

oder, als Matrix,

A =

[0 1

120 1

12

− 112

0 0 − 112

](2.1)

Das Spiel ist erstaunlich fair und symmetrisch und die optimale Strategie besteht fur beideSpieler darin, zu spielen – der Erwartungswert ist dann Null31.

Ubung 2.1 Bestimmen Sie die Auszahlungsmatrix fur den Fall, daß Spieler B die Revolver-trommel nochmals drehen darf. Ist das Spiel dann immer noch fair? ♦Doch die Matrix A in (2.1) hat noch eine weitere interessante Eigenschaft: Jeder Eintrag in derersten Zeile dominiert den zugehorigen Eintrag der zweiten Zeile, auf “mathematisch” a1k ≥a2k, k = 1, 2, 3, 4. Damit gibt es aber fur A gar keinen rationalen Grund, jemals zu passen, dennwas auch immer B tun wird, er fahrt immer schlechter.

31Das entspricht der Anschauung: Was hat man bei diesem Spiel schon zu gewinnen?

Page 20: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

18 2 ZWEIPERSONEN–NULLSUMMENSPIELE

Definition 2.7 (Dominanz von Zeilen und Spalten) Wir sagen die Zeile j der Matrix A ∈Rm×n dominiere die Zeile j′ 6= j, wenn

ajk ≥ aj′k, k = 1, . . . , n.

Analog definiert sich die Dominanz von Spalten. Eine Strategie j fur Spieler A heißt redun-dant, wenn die Zeile j von einer anderen Zeile j′ dominiert wird, und entsprechend auch furStrategien von B, also Spalten der Matrix A.

Redundante Strategien konnen wir also getrost entfernen ohne das Spiel relevant zu verandern,da kein rationaler Spieler sie jemals spielen wird. Tun wir das mit der Matrix aus (2.1), dannwird zuerst die Strategie “P” von Spieler A redundant und dann die beiden Strategien “P” und“E” von Spieler B, der also nur noch spielen oder genauso handeln wird wie A, was, nachdemA ja immer spielt, dasselbe ist. Mit anderen Worten:

Die optimale Strategie fur beide Spieler besteht darin, zu spielen, nicht zu passen.

Beispiel 2.8 (Stein, Schere, Papier, Brunnen) In der Spielpraxis wird “Stein, Schere, Papei-er” oftmals noch um die Option Brunnen erweitert, wobei der Brunnen Stein und Schere besiegt(beide fallen hinein), aber gegen das Papier verliert, das ihn abdeckt; die Spielmatrix ist also

0 1 −1 −1−1 0 1 −11 −1 0 11 1 −1 0

Nun dominiert aber die letzte Zeile32 dieser Matrix, also die Strategie “Brunnen”, die ersteZeile, die zum “Stein” gehort und somit gibt es fur Spieler 1 keine Veranlassung, jemals Steinzu spielen – er wurde mit Brunnen ja immer besser abschneiden. Entfernt man die erste Zeile,dann sieht man aber auch, daß die erste Spalte (also wieder der Stein) jetzt die letzte Spaltedominiert, daß also auch Spieler 2 vom Stein besser die Finger lasst. Somit erhalt man durchdie Streichungen

0 1 −1 −1−1 0 1 −11 −1 0 11 1 −1 0

→ −1 0 1 −1

1 −1 0 11 1 −1 0

→ 0 1 −1−1 0 11 −1 0

,womit wieder genau “Stein, Schere, Papier” ubrigbleibt. Der Brunnen bringt dem Spiel alsoabsolut nichts!

32Vielen Dank an Rolf Klaas, der mich auf diese einfache und elegante Losung hingewiesen hat.

Page 21: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

2.2 Die Optimallosung, reine und gemischte Strategien 19

2.2 Die Optimallosung, reine und gemischte StrategienBisher haben wir schon einige Spiele kennengelernt, in unseren Formalismus transformiert undzum Teil auch die optimalen Strategien mit ad–hoc–Methoden bestimmt, von einer wirklichenSpieltheorie sind wir aber immer noch weit entfernt!

Sei also jetzt ein Zweipersonen–Nullsummenspiel, das heißt, eine Matrix A ∈ Rm×n,gegeben, wobei die Auszahlung fur Spieler 2 wieder durch−A beschrieben wird. Nun beziehenwir wieder den pessimistischen Standpunkt aus Sicht von Spieler 1 und fragen uns, welcheMindestauszahlung wir im Spiel auf jeden Fall erreichen konnen. Wurde Spieler 2 fur Strategiej von Spieler 1 die optimale Gegenstrategie spielen, dann betragt die Auszahlung fur dieseStrategie

v1j := mink=1,...,n

ajk, j = 1, . . . ,m, (2.2)

und der garantierte Mindestgewinn von Spieler 1 betragt

v1 := maxj=1,...,m

v1j = maxj=1,...,m

mink=1,...,n

ajk (2.3)

Das ist nach all unseren Vorbemerkungen genausowenig neu oder uberraschend wie die Tatsa-che, daß sich die unvermeidbare Maximalauszahlung, die Spieler 2 leisten muss, als

v2 := mink=1,...,n

maxj=1,...,m

ajk (2.4)

ergibt. Unter Verwendung von Lemma 1.8 konnen wir dann unsere schone neue Notation in dieUngleichung

v1 ≤ v2 (2.5)

stecken – der garantierte Mindestgewinn ist kleiner als die unvermeidbare Maximalauszahlung.Und wenn Gleichheit gilt, dann ist das Spiel “gelaufen”.

Satz 2.9 (Reine Strategien) Ist v1 = v2 =: v, dann gibt es optimale reine Strategien j∗ ∈1, . . . ,m und k∗ ∈ 1, . . . , n, so daß

v = aj∗k∗ und ajk∗ ≤ aj∗k∗ ≤ aj∗k, j = 1, . . . ,m, k = 1, . . . , n. (2.6)

Definition 2.10 Das Paar j∗, k∗ bezeichnet man – sofern es existiert – als Sattelpunkt des Null-summenspiels mit Auszahlungsmatrix A.

Bemerkung 2.11 1. Der Begriff der “Optimalitat” von reinen Strategien ist jetzt klar undimmer in einem konservativen, vorsichtigen oder pessimistischen33 Sinn zu verstehen:Beharrt Spieler 1 auf seiner Optimalstrategie j∗, dann tut Spieler 2 gut daran, auch seineOptimalstrategie k∗ zu wahlen, denn eine andere Strategie birgt zwar vielleicht Chancen,auf alle Falle aber auch das Risiko eines geringeren Gewinns, zumindest, wenn in (2.6)auch ein paar strikte Ungleichungen auftreten34.

33Damit will ich aber auf keinen Fall behaupten, die drei Adjektive waren Synonyme! Ganz im Gegenteil: Essind unterschiedliche Arten, diese Form von Optimalitat zu bewerten, so daß hoffentlich fur jeden subjektivenGeschmack ein passendes Adjektiv dabei ist.

34Das muß nicht sein, wie das todlangweilige Spiel auf der Basis von A = 0 zeigt.

Page 22: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

20 2 ZWEIPERSONEN–NULLSUMMENSPIELE

2. Ein Spiel besitzt also genau dann einen Sattelpunkt, wenn v1 = v2 ist. Glucklicherweiseerfullen die meisten interessanten Spiele die strikte Ungleichung v1 < v2, um nur dasBeispiel “Stein, Schere, Papier” zu nennen.

Beweis von Satz 2.9: Wahle j∗ und k∗ so, daß

v1 = v1j∗ = maxj=1,...,m

v1j und v2 = v2k∗ = mink=1,...,n

v2k

ist. Mit v1 = v2 = v ist also

aj∗k∗ ≥ mink=1,...,n

aj∗k = v1j∗ = v = v2k∗ = maxj=1,...,m

ajk∗ ≥ aj∗k∗

und daher muß uberall Gleicheit gelten, so daß

v = aj∗k∗ = mink=1,...,n

aj∗k = maxj=1,...,m

ajk∗

ist, woraus (2.6) unmittelbar folgt.

Obwohl fur vorsichtige Spieler aufgrund ihrer Determiniertheit eher langweilig, sind Spielemit reinen Strategien durchaus nicht ungebrauchlich und auch keine Seltenheit. Die folgendeAussage wurde so auch bereits in [20] bewiesen35.

Satz 2.12 Jedes endliche Spiel mit vollstandiger Information besitzt einen Sattelpunkt.

Korollar 2.13 (Siehe [20, 15.7]) Sobald es richtig verstanden ist, ist Schach langweilig.

Beweis von Satz 2.12: Wir erinnern uns an das Konzept der Zuge aus Definition 2.3. Bei ei-nem Zweipersonenspiel konnen wir immer annehmen, daß Spieler 1 die Zuge 2k − 1, k ∈ N,und Spieler 2 die Zuge 2k, k ∈ N, ausfuhrt; sollten die Spielregeln Mehrfachzuge zulassen36,dann fassen wir die einfach zu einem Zug zusammen. Schließlich stellen wir wie in Abb. 2.1alle moglichen Spiele in einem nach Voraussetzung endlichen Baum zusammen, der eine Ma-ximallange N besitzt und beweisen den Satz durch Induktion37 uber N .

Der Fall N = 1 ist dabei trivial: Hier entscheidet nur Spieler 1 und der wahlt einfachdie Strategie, die ihm genehm ist; die Auszahlungsmatrix eines solchen Spiels ist ja nur einZeilenvektor.

Um von N → N +1 zu kommen, betrachten wir nun einen Baum der Maximallange N +1.Durch den ersten Zug von Spieler 1 zerfallt der Baum in eine endliche Anzahl von Teilbaumen,

35Und wird in [30] auch respektvoll erwahnt, als Beispiel was “richtige” Mathematiker so alles zustandebringen.36Wie beispielsweise Dame oder Muhle. Oder Bigamie: zwei simultane Damespiele auf einem Brett, eines auf

den weißen, eines auf den schwarzen Feldern!37Bereits bei der Einfuhrung der Baumstruktur fur Spielzuge erwahnt von Neumann, daß sich hinter dem Kon-

zept ein induktives Argument verbirgt. Man sollte auch nicht vergessen, daß dies seinerzeit sehr innovativ war: DiePopularitat von Baumen und anderen Graphenstrukturen ist stark durch die Informatik motiviert, die zu dieser Zeitgerade von J. von Neumann mitbegrundet wurde – Stichwort wieder einmal Universalrechner, siehe auch [19].

Page 23: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

2.2 Die Optimallosung, reine und gemischte Strategien 21

die wir als Spiele S1, . . . ,SM mit “Strategiemengen” σ1(`), σ2(`) ⊂ N und Auszahlungsma-trizen

A` =[a`jk : j ∈ σ1(`), k ∈ σ2(`)

]ansehen konnen38. Da unser Spiel S uber vollstandige Information verfugt, ubertragt sich dasnaturlich auf die Spiele S`, insbesondere ist beiden Spielern zu Beginn von S` die gesamteSpielsituation bekannt, ` = 1, . . . ,M , und da die zugehorigen Spielbaume nun nur noch LangeN haben, existiert fur jedes dieser Spiele S` ein Strategiepaar j∗` , k

∗` ∈ σ1(`)× σ2(`), so daß

v` = maxj∈σ1(`)

mink∈σ2(`)

a`jk = mink∈σ2(`)

maxj∈σ2(`)

a`jk = a`j∗` k∗` ,

und somit istv := max

`=1,...,Mmaxj∈σ1(`)

mink∈σ2(`)

a`jk = max`=1,...,M

mink∈σ2(`)

maxj∈σ1(`)

a`jk.

Die Strategie, die sich fur Spieler 1 aufdrangt ist also, im ersten Zug `∗ mit

v`∗

= max`=1,...,M

v`

und dann39 j∗`∗ zu spielen — diese Strategie bezeichnen wir mit j∗. Durch diesen ersten Zugbleiben aber fur Spieler 2 nur die Strategien aus σ2 (`∗) ubrig, und fur die ist

mink∈σ2(`∗)

max`=1,...,M

maxj∈σ1(`)

a`jk = max`=1,...,M

mink∈σ2(`∗)

maxj∈σ1(`)

a`jk = a`∗

j∗` k∗`

= v,

womit auch S einen Sattelpunkt hat.Einen Fall haben wir ubrigens unterschlagen: Daß M1, ganz egal fur welchen Spieler, ein

Zug zweiter Art, also rein zufallig ist. Aber da das nur gewichtete Kombinationen der jeweiligenAuszahlungen sind, ist das kein wirkliches Problem.

Es gibt also eine ganze, alles andere als triviale, Klasse von Spielen, die einen Sattelpunkt besit-zen und so durch “einfache” reine Strategien determiniert sind. Trotzdem konnen wir bei wei-tem nicht alle Spiele auf diese Weise beschreiben, wobei wieder einmal “Stein, Schere, Papier”als Standarbeispiel fungiert. In solchen Fallen nehmen wir dann Zuflucht zu den gemischtenStrategien.

Definition 2.14 Sei S ein Zweipersonen–Nullsummenspiel mit Auszahlungsmatrix A ∈ Rm×n.Eine gemischte Strategie fur Spieler 1 ist ein Wahrscheinlichkeitsvektor p ∈ Sm, eine gemischteStrategie fur Spieler 2 entsprechend q ∈ Sn. Dabei ist

Sk :=x = (x1, . . . , xk) ∈ Rk : xj ≥ 0, x1 + · · ·+ xk = 1

.

38Was in [20] sehr schon erklart wird: Der erste Zug ` des Spiels S wird Bestandteil der Spielregeln von S`.39Die Zwei–Sterne–Strategie . . .

Page 24: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

22 2 ZWEIPERSONEN–NULLSUMMENSPIELE

Bei gemischten Strategien interessiert man sich dann naturlich fur die erwartete Auszahlung;unter der omniprasenten Annahme, daß die Wahrscheinlichkeiten p und q unabhangig vonein-ander gewahlt sind40 tritt das Strategiepaar (j, k) und damit die Auszahlung ajk mit Wahrschein-lichkeit pjqk auf, so daß die erwartete Auszahlung

E (A,p, q) =m∑j=1

n∑k=1

ajkpjqk = pTAq

ist.

Bemerkung 2.15 Ein Spiel heißt symmetrisch, wenn die Rollen der beiden Spieler vertausch-bar sind, wenn also41

E (A,p, q) = −E (A, q,p)

ist, was wiederum genau dann der Fall ist, wenn A = −AT gilt, wenn also die Matrix Aschiefsymmetrisch ist.

Der Begriff der optimalen Strategie ist nun ganz analog zum “diskreten” Fall. Wieder wirdSpieler 1 versuchen, seine Strategie p∗ so zu wahlen, daß der erwartete “Garantiegewinn”

v1 = maxp∈Sm

minq∈Sn

E (A,p, q)

erreicht wird, wohingegen Spieler 2 sein q∗ so wahlt, daß

v2 = minq∈Sn

maxp∈Sm

E (A,p, q)

die zu erwartende Maximalauszahlung so klein wir moglich macht. Nur passiert jetzt beimUbergang zu den gemischten Strategien ein kleines “Wunder”, das sich mathematisch dadurcherklaren lasst, daß die diskrete Funktion (j, k) → ajk im Prinzip beliebig unstrukturiert seinkann, die die Bilinearform (p, q) → pTAq hingegen eine Funktion mit sehr viel Strukturund schonen Eigenschaften ist. Und genau das fuhrt zum Minimax–Theorem, das wir uns imnachsten Abschnitt ansehen wollen.

2.3 Das Minimax–TheoremUnd schon sind wir also beim ersten “Hauptsatz” der Spieltheorie, der zuerst in [18] formuliertund bewiesen wurde.

Satz 2.16 (Minimax) Fur jede Matrix A ∈ Rm×n gibt es eine Zahl v ∈ R, so daß

v = maxp∈Sm

minq∈Sn

pTAq = minq∈Sn

maxp∈Sm

pTAq. (2.7)

40Daß die Strategiewahl unabhangig und a priori erfolgt, das haben wir ja auch fur die “Baumstruktur” vonSpielzugen gesehen, beispielsweise beim “Russisch Roulette”.

41Achtung: Vertauschung der Spieler fuhrt zum umgekehrten Vorzeichen bei der (erwarteten) Auszahlung!

Page 25: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

2.3 Das Minimax–Theorem 23

Definition 2.17 Die Zahl v aus (2.7) heißt Wert des Spieles und man nennt ein Spiel fair, wennv = 0 ist.

Beispiel 2.18 (“Skin game” aus [7, S. 121–124]) Die Kunst beim “Design” von Spielen be-steht darin, die Auszahlung so zu wahlen, daß das Spiel zwar fair erscheint, es aber nicht ist.Ein schones Beispiel ist das “Skin Game”, bei dem beide Spieler ein As (Wert 1) und eine Zwei(Wert 2) der Farben Karo und Kreuz erhalten, außerdem hat Spieler 1 (der “Carnival Man”,der dieses Spiel anderen anbietet) die Karo 2 und sein Gegenspieler die Kreuz 2. Die Regel isteinfach: Bei gleicher Farbe gewinnt Spieler 1, bei unterschiedlichen Farben Spieler 2, die bei-den Zweien werden als Unentschieden gewertet. Der Auszahlungsbetrag ist der Wert der Kartedie der Sieger gespielt hat, was zur folgenden Auszahlungsmatrix aus Sicht von Spieler 1 fuhrt:

♦A ♣A ♣ 2♦A 1 −1 −2♣A −1 1 1♦ 2 2 −1 0

⇒ A =

1 −1 −2−1 1 12 −1 0

.Das sieht doch eigentlich alles sehr fair und symmetrisch aus, aber ist es das auch? Wir werdensehen!

Ubung 2.2 Ist das “Skin Game” aus Beispiel 2.18 fair? Bestimmen Sie den Wert des Spiels!Hinweis: Achten Sie auf Dominanzen. ♦

Korollar 2.19 Die erwartete Mindestauszahlung fur Spieler 1 bei optimaler Spielweise betragtv, die fur Spieler 2 −v.

Korollar 2.20 Symmetrische Spiele sind fair: Ist A schiefsymmetrisch, dann ist v = 0.

Beweis: Mit AT = −A, also insbesondere m = n folgt, daß pTAq = qTATp = −qTApund daher ist

v = maxp∈Sm

minq∈Sm

pTAq = maxp∈Sm

minq∈Sm

−qTAp = maxp∈Sm

(−max

q∈Sm

qTAp

)= − min

p∈Sm

maxq∈Sm

qTAp = −minq∈Sn

maxp∈Sm

pTAq = −v,

also v = 0.

Der Beweis von Satz 2.16 ist ein bißchen aufwendig und folgt der Darstellung aus [20], deraber nicht die “Originalversion” aus [18] ist. Tatsachlich gibt es mehrere Beweise, einen aufder Basis von Fixpunktsatzen, oder eben auch den, den wir hier sehen werden. Der Einfachheithalber verwenden wir jetzt die erwartete Auszahlungsfunktion

a (p, q) = pTAq.

Die erste Beobachtung sagt uns, daß wir fur die Bestimmung extremaler Strategien nur Eck-punkte des Simplex betrachten mussen.

Page 26: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

24 2 ZWEIPERSONEN–NULLSUMMENSPIELE

Lemma 2.21 Fur p ∈ Sm und q ∈ Sn gilt

minq′∈Sn

a (p, q′) = mink=1,...,n

m∑j=1

ajk pj = mink=1,...,n

(pTA

)k

(2.8)

und

maxp′∈Sm

a (p′, q) = maxj=1,...,m

n∑k=1

ajk qk = maxj=1,...,m

(Aq)j . (2.9)

Beweis: Fur beliebige k Strategien q1, . . . , qk ∈ Sn, k ∈ N, sowie α ∈ Sk und p ∈ Sm ist

a

(p,

k∑`=1

α` q`

)=

k∑`=1

pTA (α` q`) =k∑`=1

α` a (p, q`) . (2.10)

Fur die Einheitsvektoren ej ∈ Sn, j = 1, . . . , n, ist q = q1 e1 + · · ·+ qm em und daher

a (p, q) =m∑j=1

qj a (p, ej) ≥m∑j=1

qj︸ ︷︷ ︸=1

mink=1,...,n

a (p, ek) = mink=1,...,n

(pTA

)k.

Da die rechte Seite unabangig von q ist, gilt die Abschatzung auch fur das Minimum und es ist

minq∈Sm

a (p, q) ≥ mink=1,...,n

(pTA

)k

= mink=1,...,n

a (p, ek) ≥ minq∈Sm

a (p, q) ,

woraus (2.8) folgt. Der Beweis von (2.9) geht ganz analog42.

So, jetzt geht es an die konvexe Analysis. Dazu erinnern wir uns zuerst daran, daß eine MengeΩ ⊂ Rm als konvex bezeichnet wird, wenn

x,y ∈ Ω ⇐⇒ αx + (1− α) y ∈ Ω, α ∈ [0, 1]. (2.11)

Aus (2.11) folgt dann auch, daß fur jede konvexe Menge

x1, . . . ,xn ∈ Ω ⇔n∑j=1

qj xj ∈ Ω, q ∈ Sn ⇔ [x1, . . . ,x] Sn ⊆ Ω,

wobei [x1, . . . ,x] die Matrix mit den Spaltenvektoren x1, . . . ,xn bezeichnet und

[[x1, . . . ,xn]] := conv (x1, . . . ,xn) := [x1, . . . ,x] Sn

die konvexe Hulle von x1, . . . ,xn. Eine Hyperebene H ⊂ Rm ist ein m − 1–dimensionaleraffiner Unterraum von Rm, der als

H =x ∈ Rm : vTx + c = 0

, v ∈ Rm \ 0, c ∈ R (2.12)

gegeben ist. Konvexe Mengen lassen sich immer schon durch Hyperebenen abgrenzen, und dasist das nachste Resultat.

42Eine Tatsache, die aber niemanden davon abhalten sollte, diesen Teil des Beweises trotzdem mal ubungshalberdurchzuspielen!

Page 27: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

2.3 Das Minimax–Theorem 25

Proposition 2.22 (Trennhyperebenensatz) Ist Ω ⊂ Rm abgeschlossen und konvex und y ∈Rm \ Ω, dann gibt es v ∈ Rm und c ∈ R, so daß

vTy + c < 0 < yTΩ + c :=vTx + c : x ∈ Ω

. (2.13)

Mit anderen Worten: y und Ω liegen auf unterschiedlichen Seiten von H bzw. in unterschiedli-chen von H induzierten Halbraumen43, die zu v und c gehorige Hyperebene ist also ein Trenn-hyperebene fur y und Ω.

Beweis: Wir sammeln ein paar Beobachtungen uber konvexe Mengen und Normen auf.

1. Die euklidische Norm ‖·‖2 ist strikt konvex, d.h. fur x,x′ und 0 < α < 1 ist, unterVerwendung der guten alten Cauchy–Schwarz–Ungleichung, siehe44 z.B. [6, S. 190–191]oder [11, S. 15]

‖αx + (1− α)x′‖22 =

m∑j=1

[α2x2

j + 2α(1− α)xj x′j + (1− α)2x′j

2]

≤ α2 ‖x‖22 + (1− α)2 ‖x′‖2

2 + 2α(1− α)m∑j=1

∣∣xj x′j∣∣≤ α2 ‖x‖2

2 + (1− α)2 ‖x′‖22 + 2α(1− α) ‖x‖2 ‖x

′‖2

= (α ‖x‖2 + (1− α) ‖x′‖2)2,

also‖αx + (1− α)x′‖2 ≤ α ‖x‖2 + (1− α) ‖x′‖2

mit Gleichheit dann und nur dann, wenn x = x′ ist45.

2. Fur y ∈ Rm \ Ω gibt es genau ein x∗ ∈ Ω, so daß46

‖y − x∗‖2 < ‖y − x‖2 , x ∈ Ω \ x∗ .Die Existenz eines x ∈ Ω, so daß

‖y − x‖2 = minx′∈Ω‖y − x‖2 (2.14)

folgt aus der Abgeschlossenheit von Ω, was interessant ist, ist die Eindeutigkeit! Gabe esaber zwei verschiedene “Losungen” x1 6= x2 von (2.14), dann setzen wir x := 1

2x1 +

12x2 ∈ Ω und erhalten daß,

‖y − x‖2 =

∥∥∥∥y − 1

2x1 +

1

2x2

∥∥∥∥2

=

∥∥∥∥1

2(y − x1) +

1

2(y − x2)

∥∥∥∥2

<1

2(‖y − x1‖2 + ‖y − x2‖2) = min

x′∈Ω‖y − x‖2 ,

und das kann ja nun wirklich nicht sein.43Was naturlich deutlich vornehmer klingt.44Hier sollen zwei Bucher angegeben werden, ein preiswertes und ein gutes Standardwerk.45Dies folgt aus Cauchy–Schwarz!46Das ist nun wieder ein Resultat, das sich auch der Approximationstheorie zuordnen lasst, die Grenzen sind

also fließend.

Page 28: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

26 2 ZWEIPERSONEN–NULLSUMMENSPIELE

3. Der Bestapproximant aus Teil 2 zeichnet sich dadurch aus, daß fur alle x ∈ Ω

0 < ‖y − x‖22 − ‖y − x∗‖2

2

= ‖y‖22 − 2yTx + ‖x‖2

2 − ‖y‖22 + 2yTx∗ − ‖x∗‖2

2

= ‖x‖22 − ‖x

∗‖22 + 2yT (x∗ − x) = (x + x∗)T (x− x∗)− 2yT (x− x∗)

= [(x− y) + (x∗ − y)]T (x− x∗)

Da Ω konvex ist, gilt das auch, wenn wir x durch die Konvexkombination αx+(1−α)x∗

ersetzen, 0 < α < 1, was dann

0 < [α (x− y) + (2− α) (x∗ − y)]T α (x− x∗)

liefert. Dividieren wir diesen Ausdruck durch 2α und lassen dann α → 0 gehen, dannerhalten wir, daß

0 ≤ (x∗ − y)T (x− x∗) , x ∈ Ω, (2.15)

sein muß. Diese Abschatzung bezeichnet man als Kolmogoroff–Kriterium47 und sie cha-rakterisiert sogar den Bestapproximanten, siehe z.B. [24], aber auch [20, 16.3, S. 134–138].

So, wenn man all diese “bekannten” Fakten mal zur Verfugung hat, dann ist der eigentlichBeweis einfach, siehe Abb. 2.3: Zu y ∈ Rm \ Ω bestimmen wir den Bestapproximanten aus Ωund sehen uns die affine Funktion

a(x) = vTx + c′, v = (x∗ − y) , c′ = −vTx∗,

an, fur die nach (2.15) die Ungleichungen

a(y) = −‖x∗ − y‖22 < 0 = a (x∗) ≤ a(x), x ∈ Ω

gelten. Damit legen v und c = c′ − 12a(y) die gesuchte Trennhyperebene fest.

Schließlich noch eine Aussage uber Matrizen, die auch im Kontext der Optimierung auftaucht48,siehe z.B. [28].

Lemma 2.23 (Alternativensatz fur Matrizen) Zu jeder Matrix A ∈ Rm×n gibt es entwederx ∈ Sm, so daß49 xTA > 0 ist, oder ein y ∈ Sn, so daß Ay ≤ 0 ist und diese beidenMoglichkeiten schließen einander aus.

47Man muss naturlich fair sein und berucksichtigen, daß das Kolmogoroff–Kriterium erst 1948 in [14] ange-geben wurde – dafur gilt es aber auch nicht nur fur endlichdimensionale Raume, sondern ebenfalls fur Funktio-nenraume, insbesondere fur Polynome. Die Sprechweise hat sich dann erst spter eingeburgert.

48Das ist nicht so verwunderlich, denn viele Argumente in der “theoretischen Optimierung” stammen tatsachlichaus der konvexen Analysis.

49Was wieder einmal komponentenweise zu verstehen ist: x ≥ y bedeutet xj ≥ yj fur alle Indizes j.

Page 29: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

2.3 Das Minimax–Theorem 27

a(x) = 0

a(x) = a(y)/2

Ω

y x*

Abbildung 2.3: Konstruktion der Trennhyperebene: Zuerst findet man den Extremalpunkt,dann liefert (2.15) bereits, daß die durch x∗ gehende Gerade, die senkrecht auf y−x∗ steht,eine “schwache” Trennfunktion hat: Mindestens ein Punkt von Ω, namlich x∗ liegt nochauf dieser Hyperebene – aber der Punkt ist auch eindeutig, wenn die Menge Ω strikt konvexist. Schieben wir sie nun ein bißchen in Richtung y – der Wert 1

2 war hier total willkurlich– dann sind beide Ungleichungen der Trennung so strikt wie in (2.13) gefordert.

Beweis: Unter Verwendung der Spaltenvektoren a1, . . . ,an ∈ Rm der Matrix A, d.h. mitA = [a1, . . . ,an], betrachten wir die abgeschlossene konvexe Menge

Ω := [[a1, . . . ,an, e1, . . . , em]] = [A | I] Sm+n ⊆ Rm.

Diese Menge enthalt entweder den Nullpunkt oder sie tut es nicht!

1. Ist 0 ∈ Ω, dann gibt es u ∈ Sm+n, so daß

0 =n∑j=1

ujaj +m∑j=1

un+jej =⇒ 0 6= u = (uj : j = 1, . . . , n) . (2.16)

Da 0 ≤ u und u 6= 0 ist, folgt also auch 0 < u := u1 + · · ·+un und mit y := u/u sowie(2.16) erhalten wir, daß

Ay =n∑j=1

yjaj =1

u

n∑j=1

ujaj = −1

u

m∑j=1

un+jej ≤ 0

ist, was gerade den zweiten Teil unserer Behauptung darstellt.

Page 30: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

28 2 ZWEIPERSONEN–NULLSUMMENSPIELE

2. Ist hingegen 0 6∈ Ω, dann gibt es nach Proposition 2.22 einen Vektor v ∈ Rm und c ∈ R,so daß

c = vT0 + c < 0 < vTa + c, a = [A | I] u ∈ Ω.

Damit gilt fur alle u ∈ Sm+n die Ungleichung 0 < vT [A | I] u und wir erhalten insbe-sondere fur u = ej , j = 1, . . . ,m+ n, daß

0 < vT [A | I] ej =[vTA |vT

]ej =

(yTA

)j, j = 1, . . . , n

vj−n, j = n+ 1, . . . , n+m,

also ist vTA > 0 wie auch v > 0 und somit ist x := v/ |v| ∈ Sm in diesem Fall dergesuchte Alternativvektor.

Daß sich die beiden Alternativen ausschließen, das sieht man sehr einfach: Gabe es namlich xund y, dann erhielten wir

0 < xTA ⇒ 0 < xTAy und Ay ≤ 0⇒ xTAy ≤ 0,

was einen soliden Widerspruch darstellen wurde: 0 < 0!

So, damit haben wir alle Bausteine beisammen, die wir brauchen, um das Minimax–Theoremzu beweisen, also wollen wir das auch tun.Beweis von Satz 2.16: Wegen (2.8) ist

v1 = maxp∈Sm

minq∈Sn

a (p, q) = maxp∈Sm

mink=1,...,n

(pTA

)k

und nach (2.9) entsprechend

v2 = minq∈Sn

maxp∈Sm

a (p, q) = minq∈Sn

maxj=1,...,m

(Aq)j

mit v1 ≤ v2. Ware nun v1 < v2, dann konnen wir A durch A′ := A− 12

(v2 − v1) 11T ersetzen,was uns die Auszahlungsfunktion

a′ (p, q) = a (p, q) +v1 − v2

2pT1︸︷︷︸

=1

1Tq︸︷︷︸=1

= a (p, q) +v1 − v2

2

liefert, die ihre Minimaxe immer noch an derselben Stelle wir a hat, fur die aber nun v′1 < 0 <v′2 gilt. Doch das kann nicht sein! Denn nach Lemma 2.23 gibt es entweder ein x ∈ Sm mitxTA′ > 0, also

v′1 = maxp∈Sm

mink=1,...,n

(pTA′

)k≥ min

k=1,...,n

(xTA′

)k> 0,

oder aber ein y ∈ Sn mit

v′2 = minq∈Sn

maxj=1,...,m

(A′q)j ≤ maxj=1,...,m

(A′y)j ≤ 0,

aber keinesfalls kann v′1 < 0 < v′2 sein.

Page 31: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

2.4 Struktur der Optimallosungen 29

2.4 Struktur der OptimallosungenDas Minimax–Theorem beschreibt also die Existenz von Optimalstrategien und ordnet gleich-zeitig jedem Spiel seinen eindeutigen Wert zu. Nur beim Auffinden der optimalen Strategienkommen wir so naturlich noch nicht wirklich weiter. Trotzdem ist es sicherlich sinnvoll, sichzu uberlegen, welche Struktur die Menge der Optimallosungen50 hat – schließlich kann unsdas ja auch helfen, die Optimallosungen zu finden! Die erste Beobachtung ist eine einfacheCharakterisierung der Optimalstrategien.

Korollar 2.24 Sei A ∈ Rm×n eine Auszahlungsmatrix zu einem Spiel mit Wert v. Dann sindp ∈ Sm und q ∈ Sn jeweils genau dann optimale Strategien, wenn51

pTA ≥ v 1T , bzw. Aq ≤ v1 (2.17)

ist.

Beweis: Nach Lemma 2.21 ist fur jede Optimalstrategie p

v = maxp′∈Sm

minq∈Sn

a (p′, q) = mink=1,...,n

(pTA

)k

⇒(pTA

)k≥ v,

und somit pTA ≥ v1T , und die zweite Ungleichung folgt ganz analog.Gilt umgekehrt pTA ≥ v1T , dann ist

minq∈Sn

maxp′∈Sm

a (p′, q) ≥ minq∈Sn

pTAq ≥ minq∈Sn

v 1Tq︸︷︷︸=1

= v

und p ist eine Optimalstrategie fur Spieler 1, denn ganz egal, wie Spieler 2 seine gemischteStrategie wahlt ist die erwartete Auszahlung mindestens v. Analog liefert Aq ≤ v1T , daß

maxp∈Sm

minq′∈Sn

a (p, q′) ≤ maxp∈Sm

pTAq ≤ maxp∈Sm

v pT1︸︷︷︸=1

= v,

und jetzt hangt Spieler 1 unterhalb von v fest.

Korollar 2.25 Die Mengen P∗ ⊆ Sm und Q∗ ⊆ Sn der Optimalstrategien fur Spieler 1 bzw.Spieler 2 sind konvex.

Beweis: Sind p1, . . . ,pk ∈ P∗ optimale Strategien und α ∈ Sk, dann setzen wir p = α1p1 +· · ·+ αkpk, erhalten dank Korollar 2.24, daß

pTA =

(k∑j=1

αj pk

)T

A =k∑j=1

αj pTkA ≥k∑j=1

αj(v1T

)= v1T ,

50Zur Struktur gehort auch die Frage, ob diese Menge einelementig ist oder nicht, ob der Plural hier also berech-tigt ist oder nicht.

51Eine kleine Warnung: Die 1–Vektoren, die in (2.17) auftauchen, haben normalerweise unterschiedliche Lange,namlich n bzw. m.

Page 32: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

30 2 ZWEIPERSONEN–NULLSUMMENSPIELE

und wiederum Korollar 2.24 sagt uns, daß p ∈P∗ ist. Einen expliziten Beweis fur Q∗ erwartethoffentlich niemand.

Nun gibt es aber ein Vielzahl von konvexen Mengen, beispielsweise Kreise und Kugeln, aberauch konvexe Polyeder, die sich dadurch auszeichnen, daß sie Durchschnitte von Halbraumensind, also Durchschnitte von Mengen der Form

x : aTx ≥ b

. Schreibt man all diese Bedin-

gungen in Matrixform zusammen, dann erklart sich die nachste Definition.

Definition 2.26 Eine Menge Ω ⊂ Rn heißt konvexes Polyeder, wenn es eine Matrix A ∈ Rm×n

und einen Vektor b ∈ Rm gibt, so daß

Ω = x ∈ Rn : Ax ≥ b .

Das Polyeder wird als endlich oder kompakt bezeichnet, wenn es kompakt ist52, also wenn eseine beschrankte53 Menge ist:

supx∈Ω‖x‖ <∞.

Bemerkung 2.27 Am “konvex” in Definition 2.26 konnte man sich etwas storen, aber da so einPolyeder ein Durchschnitt von Halbraumen ist, die ihrerseits immer konvex sind, muß es haltauch wieder konvex sein.

Ubung 2.3 Zeigen Sie: Sind Ω,Ω′ ⊆ Rn konvex, dann ist auch Ω ∩ Ω′ konvex. ♦

Aus Korollar 2.24 bzw. (2.17) erhalten wir dann sofort die folgenden Beobachtung.

Korollar 2.28 Die optimalen Strategien P∗ bzw. Q∗ bilden konvexe Polyeder.

Was sind nun eigentlich unsere Unbekannten im Minimax–Theorem 2.16? Es sind ja nichtnur die magischen Optimalstrategien p∗ und q∗, sondern auch noch der Wert v des Spiels!Wurden wir den Wert kennen, dann mussten wir nur die Ungleichungssysteme ATp∗ ≥ v1bzw. −Aq∗ ≥ −v1 losen54, um an Optimalstrategien zu kommen. Nun ist aber v ebenfallsunbekannt, also behandeln wir es wie eine anstandige Unbekannte und erhalten, daß p∗, q∗ undv das Ungleichungssystem

ATp∗ − 1v ≥ 0,

−Aq∗ + 1v ≥ 0,

mit p∗ ∈ Sm und q∗ ∈ Sn losen mussen. Codieren wir die Bedingung 1Tp∗ = 1 in 1Tp∗ ≥ 1und −1Tp∗ ≥ −1, dann suchen wir nur noch nach v ∈ R, p∗ ∈ Rm und q∗ ∈ Rn, die das

52Das uberrascht nun niemanden so richtig.53Abgeschlossen sind “unsere” konvexen Polyeder wegen des “≥” ja immer.54Beziehungsweise Halbraume schneiden.

Page 33: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

2.4 Struktur der Optimallosungen 31

Ungleichungssystem

ATp∗ − 1v ≥ 0,

−Aq∗ + 1v ≥ 0,

1Tp∗ ≥ 1,

−1Tp∗ ≥ −1,

1Tq∗ ≥ 1,

−1Tq∗ ≥ −1,

p∗ ≥ 0,

q∗ ≥ 0,

also in Matrixschreibweise

Bx :=

AT −1−A 1

1T

−1T

1T

−1T

II

p∗

q∗

v

001−11−100

(2.18)

erfullt. Jede Losung dieses Ungleichungssystems ist eine optimale Strategie und die numerischeBestimmung von optimalen Strategien und damit auch des Wertes eines Spiels besteht alsoin der numerischen Losung des Ungleichungssystems. Allerdings ist das Ungleichungssystemhochgradig uberbestimmt: Den m+n+1 Variablen p∗, q∗ und v stehen insgesamt 2m+2n+4Ungleichungen gegenuber.

Im Falle eines symmetrischen Spiels ist das alles viel einfacher, denn da ist v = 0 und dieRollen von p und q vollkommen vertauschbar, so daß sich das Ungleichungssystem auf die vieleinfachere Form

Bx :=

AT

1T

−1T

I

p∗ ≥

01−10

(2.19)

reduziert; die optimale Strategie fur Spieler 2 ist dann naturlich q∗ = p∗.

Korollar 2.29 Eine gemischte Strategie p ∈ Sm ist genau dann optimal fur ein symmetrischesSpiel zu Matrix A = −AT , wenn ATp ≥ 0 ist.

Beispiel 2.30 (Stein, Schere, Papier, mit oder ohne Brunnen) Die Optimalitat der Strategi-en p =

[13, 1

3, 1

3

]T bzw. p′ =[0, 1

3, 1

3, 1

3

]T fur die Variante mit Brunnen sieht man dank Korol-lar 2.29 nun sofort aus

ATp =

0 −1 11 0 −1−1 1 0

1/31/31/3

= 0,

Page 34: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

32 2 ZWEIPERSONEN–NULLSUMMENSPIELE

und

A′Tp′ =

0 −1 1 11 0 −1 1−1 1 0 −1−1 −1 1 0

01/31/31/3

=

1/3000

≥ 0.

Page 35: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

33

Der große Kunstgriff, kleineAbweichungen von der Wahrheit fur dieWahrheit selbst zu halten, worauf dieganze Differentialrechnung gebaut ist, istzugleich der Grund unserer witzigenGedanken, wo oft das Ganze hineinfallenwurde, wenn wir die Abweichungen ineiner philosophischen Strenge nehmenwrden.

Lichtenberg

Bestimmung optimalergemischter Strategien 3

In diesem Abschnitt wollen wir der naheliegenden Frage nachgehen, wie man denn nun bitte dieoptimalen Strategien aus dem Minimax–Theorem 2.16 berechnen konnen, denn bisher habenwir ja keinen systematisch Zugang, sondern konnten lediglich ein paar Probleme durch ge-schicktes Raten erledigen. Und diese Frage fuhrt uns ganz automatisch in die Welt der linearenOptimierung und des Simplexalgorithmus.

3.1 Polyeder, Ecken und KantenIn Korollar 2.28 haben wir ja festgestellt, daß die optimalen Strategiemengen konvexe Polyederbilden55 und so ein konvexes Polyeder Ω besteht ja aus verschiedenen Typen von Punkten:

Innere Punkte x ∈ Ω haben die Eigenschaft daß zusammen mit x auch die Kugeln

Bε(x) := y ∈ Rm : ‖y − x‖2 ≤ ε , ε > 0,

fur hinreichend kleines ε zu Ω gehoren,

Randpunkte x ∈ Ω \ Ω bilden den “traurigen Rest” und

Eckpunkte x sind gerade diejenigen, die sich nicht als echte Konvexkombination zweier Punk-te bilden lassen:

x = αy + (1− α) y′, α ∈ (0, 1) ⇒ y = y′. (3.1)

Die Menge aller Eckpunkte von Ω bezeichnen wir mit56 V (Ω).55Fur die, die’s noch nicht gemerkt haben: einpunktige Mengen sind trivialerweise konvexe Polyeder, obwohl

Monoeder wohl angebrachter ware.56“V” wie vertex!

Page 36: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

34 3 BESTIMMUNG OPTIMALER GEMISCHTER STRATEGIEN

Es leuchtet intuitiv ein, daß die Ecken Extremalpunkte eines jeden konvexen Polyeders sind unddaß sich zumindest endliche konvexe Polyeder auch vollstandig durch ihre Eckpunkte beschrei-ben lassen. Daß das fur unendliche nicht ausreichen kann, sieht man schon in Abb. 3.1. Aber

Abbildung 3.1: Ein endliches (links) und ein unendliches (rechts) konvexes Polyeder.

zuerst beschreiben wir einmal die Ecken eines konvexen Polyeders57

Ω = Ω (A, b) = x ∈ Rn : Ax ≥ b , A ∈ Rm×n, b ∈ Rm. (3.2)

Damit das ein “vernunftiges”, zumindest aber endliches Polyeder ergeben kann, sollte das Un-gleichungssystem schon uberbestimmt sein. Um weitere Pathologien auszuschließen, wollenwir außerdem annehmen, daß das Polyeder nicht entartet ist, also in einerm−1–dimensionalenHyperebene des Rm liegt. Das ware der Fall, wenn die Spalten von A linear abhangig waren,wenn es also einen Vektor x ∈ Rn gibt, so daß Ax = 0 ist.

Ubung 3.1 Zeigen Sie: Ist Ω = Ω (A, b) ein endliches Polyeder, A ∈ Rm×n, dann muß m ≥ nsein und das Polyeder ist nicht entartet. ♦

Ubung 3.2 Zeigen Sie, daß die inneren Punkte von Ω die Ungleichung aus (3.2) strikt erfullenmussen:

Ω = x ∈ Rn : Ax > b .♦

Lemma 3.1 Sei Ω = Ω (A, b) ⊂ Rn, A ∈ Rm×n, b ∈ Rm, ein endliches konvexes Polyeder.Dann ist x ∈ Ω genau dann eine Ecke von Ω, wenn es eine Indexmenge J ⊂ 1, . . . ,m,#J = n, gibt, so daß

AJx = (Ax)J = bJ , d.h. (Ax)j = bj, j ∈ J. (3.3)

57Die Rollen von A und b sind die aus Definition 2.26.

Page 37: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

3.1 Polyeder, Ecken und Kanten 35

unddet Aj 6= 0, AJ = [ajk : j ∈ J, k = 1, . . . , n] . (3.4)

Beweis: Beginnen wir mit “⇐”. Ist det AJ 6= 0 und58 x ∈ Ω so, daß AJx = bJ , dannist x = A−1

J bJ naturlich ein Randpunkt59 von Ω. Ware außerdem x = αy + (1 − α)y′ fury 6= y′ ∈ Ω, dann ist

bJ = AJx = AJ (αy + (1− α)y′) = αAJy︸︷︷︸≥bJ

+(1− α) AJy′︸ ︷︷ ︸

≥bJ

≥ bJ ,

also bJ = AJy = AJy′ und damit haben wir den Widerspruch y = A−1

J bJ = y′ erhalten.Fur die Umkehrung fixieren wir eine Ecke x von Ω, fur die die Indexmenge

J = J(x) =j : (Ax)j = bj

⊂ 1, . . . ,m

nichtleer sein muß, da jeder Eckpunkt auch ein Randpunkt ist, und betrachten die Matrix AJ .Gabe es nun ein y, so daß AJy = 0 ist, dann werden wir feststellen, daß x keine Ecke seinkann! Dazu setzen wir

0 < ε := minj 6∈J

(Ax)j − bj

und bemerken, daß fur |η| ≤ η0 := ε ‖Ay‖∞ die Beziehungen

AJ (x + ηy) = bJ , [A (x + ηy)]j ≥ bj, j 6∈ J

gelten, also insgesamt A (x + ηy) ≥ b, |η| ≤ η0, also ist

x + ηy : η ∈ [−η0, η0] ⊂ Ω

aber eben auchx =

1

2(x + ηy) +

1

2(x− ηy) ,

weswegen x dann plotzlich keine Ecke mehr ware. Hat aber AJ nur einen trivialen Kern60, dannist #J ≥ n, die Zeilen von A sind linear unabhangig61 und daher finden sich darunter auch nlinear unabhangige Zeilen, was wieder einer Teilmenge J ′ ⊆ J entspricht, so daß

#J ′ = n und det AJ ′ 6= 0

ist – und genau darauf wollten wir ja hinaus.

Was aber bringt uns nun dieses Lemma 3.1 fur unsere Spieltheorie? Ganz einfach: Anstatt unsdie gesamte konvexe Menge der Optimalstrategien anzusehen, reicht es, wenn wir uns auf die

58Achtung: Hier mussen wir annehmen, daß x zu Ω gehort! Das ist Teil der Annahme in diesem Lemma!59In allen zu J gehorigen Indizes herrscht Gleichheit, siehe auch Ubung 3.2.60So bezeichnet man den Teilraum der Vektoren x, fur die Ax = 0 ist.61Ist #J > n, dann spricht man von einer entarteten Ecke, das ist eine Ecke, in der sich unwahrscheinlicher-

weise mehr als n Hyperebenen schneiden. Derartige Ecken sind auch beim Simplexalgorithmus sehr unbeliebt undkonnen dort zu sogenannten Zyklen fuhren.

Page 38: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

36 3 BESTIMMUNG OPTIMALER GEMISCHTER STRATEGIEN

Ecken dieser konvexen Polyeder beschranken, und das ist nur eine endliche Menge, so daß wirmit etwas Arbeit immer die optimale Strategie finden konnen. Das zu betrachtende Polyeder istfur ein asymmetrisches Spiel durch

Bx ≥ b, x =

p∗

q∗

v

,gegeben, wobei B und b durch (2.18) festgelegt sind, fur symmetrische Spiele hingegen istx = p∗ und B und b haben die wesentlich einfachere Form aus (2.19). Daß wir Lemma 3.1auch wirklich anwenden konnen, das liegt an der speziellen Struktur der Matrizen B.

Ubung 3.3 Zeigen Sie, daß die Matrizen B aus (2.18) bzw. (2.19) maximalen Rang m+ n+ 1bzw. m haben. ♦

Und jetzt kommt Lemma 3.1 ins Spiel: Jeder Ecke des konvexen Polyeders Ω (B, b), B ∈RM×N ist eine Indexmenge J ⊂ 1, . . . ,M, #J = N , zugeordnet, so daß det BJ 6= 0 ist. Furso eine Teilmenge setzen wir dann einfach x = B−1

J bJ und haben unsere Ecke gefunden. Schonwars! Der Punkt B−1

J bJ ist nur ein Kandidat fur eine Ecke, aber leider kann es vorkommen,daß

BB−1J bJ 6≥ b

ist!

Beispiel 3.2 Fur das Polyeder Ω (A, b) mit den Parametern

B =

1 00 1−2 −1−1 −2

, b =

00−2−2

liefern alle sechs zweielementigen Teilmengen J von 1, 2, 3, 4 invertierbare Mengen AJ . Al-lerdings liefert J = 1, 2 die korrekte Ecke x = 0, wahrend J = 1, 3 zum Gleichungssystem

[1 0−2 −1

]x =

[0−2

]⇒ x =

[02

]⇒ Bx =

02−2−4

6≥ b

und somit zu keiner Ecke fuhrt. Wie man in Abb. 3.2 sieht, fuhren vier der Mengen J zu Eckendes Polyeder, zwei allerdings zu Schnittpunkten von Begrenzungshyperebenen, die außerhalbvon Ω liegen, also in diesem Sinne irrelevant sind.

Mit anderen Worten: Die Indexmengen J mit det AJ 6= 0 markieren nur Kandidaten fur Ecken,nicht notwendigerweise aber Ecken, ganz abgesehen von der Tatsache, daß die Feststellung, ob

Page 39: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

3.1 Polyeder, Ecken und Kanten 37

Abbildung 3.2: Das konvexe Polyeder aus Beispiel 3.2. Die vier “guten” Ecken sind weißmarkiert, die vier “schlechten” Ecken schwarz.

die Determinante62 einer Matrix Null ist oder nicht von Haus aus eher heikel ist. Da die mei-sten Auszahlungsmatrizen ganzzahlige oder rationale Eintrage habenm konnte man naturlichauch symbolisch rechnen, aber das ist auch nicht ohne, da muss man sich schon ranhalten,um uberhaupt polynomiale Komplexitat zu bekommen, siehe [8, 23]. Trotzdem empfehlen diemeisten der popularwissenschaftlichen Bucher zur Spieltheorie, insbesondere [22, 30], gera-de diese Vorgehensweise, namlich die Losung von Gleichungssystemen. Das funktioniert beikleinen Auszahlungsmatrizen noch halbwegs, vor allem dann, wenn man das Problem durchDominanzen vereinfachen kann, fur einen methodischen oder gar systematischen Zugang istder Ansatz allerdings total ungeeignet.

Beispiel 3.3 Fur “Stein, Schere, Papier, Brunnen” wird die Optimallosung durch das “allge-

62An dieser Stelle sei die Frage gestattet: Wie berechnet man eigentlich numerisch eine Determinante? Wer’snicht weiss geht direkt zu eine Numerik–Veranstaltung, geht nicht uber Los und zieht auch nichts ein.

Page 40: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

38 3 BESTIMMUNG OPTIMALER GEMISCHTER STRATEGIEN

meine” Ungleichungssystem

0 −1 1 1 0 0 0 0 −11 0 −1 1 0 0 0 0 −1−1 1 0 −1 0 0 0 0 −1−1 −1 1 0 0 0 0 0 −10 0 0 0 0 −1 1 1 10 0 0 0 1 0 −1 1 10 0 0 0 −1 1 0 −1 10 0 0 0 −1 −1 1 0 11 1 1 1 0 0 0 0 0−1 −1 −1 −1 0 0 0 0 00 0 0 0 1 1 1 1 00 0 0 0 −1 −1 −1 −1 01 0 0 0 0 0 0 0 00 1 0 0 0 0 0 0 00 0 1 0 0 0 0 0 00 0 0 1 0 0 0 0 00 0 0 0 1 0 0 0 00 0 0 0 0 1 0 0 00 0 0 0 0 0 1 0 00 0 0 0 0 0 0 1 0

p∗

q∗

v

000000001−11−100000000

festgelegt, das uns bereits

(209

)= 167960 mogliche Indexmengen zur Verfugung stellt – viel

Spass beim Ausprobieren!

3.2 Lineare Optimierung und DualitatLineare Optimierung oder Lineare Programmierung befasst sich mit der Optimierung linearerFunktionen unter linearen Nebenbedingungen, die Linearitat tritt also zweimal auf. In unserer“Kurzfassung” hier orientieren wir uns im wesentlichen am Buch von Karlin63 [13], ein nettes“Bilderbuch” zum Thema lineare Optimierung ist daruber hinaus [7]. Das primale Problem derlinearen Optimierung zu vorgegebene Großen A ∈ Rm×n, c ∈ Rn, b ∈ Rm, ist nun

maxx

z(x) := cTx, Ax ≤ b, x ≥ 0, (3.5)

das duale Problem hingegen

minyz′(y) := bTy, yTA ≥ c, y ≥ 0. (3.6)

Definition 3.4 Ein Punkt x ∈ Rn bzw y ∈ Rm heißt zulassig, wenn er die Nebenbedingungenin (3.5) bzw. (3.6) erfullt.

Daß sich jedes beliebige lineare Optimierungsproblem wahlweise in primaler oder dualer Formschreiben laßt, das kann man als halbwegs bekannt voraussetzen, was uns hier aber mehr inter-essieren soll, ist die Tatsache, daß selbst fur feste A, b und c die beiden Probleme aquivalentsind! Und das ist der Satz der linearen Optimierung.

63Dort werden Spieltheorie und Optimierung “aus einer Hand” dargeboten.

Page 41: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

3.2 Lineare Optimierung und Dualitat 39

Satz 3.5 (Dualitatssatz) Hat das primale Optimierungsproblem (3.5) eine Losung x∗, dannhat auch das duale Optimierungsproblem (3.6) eine Losung y∗ und umgekehrt. Die beidenLosungen erfullen

cTx∗ = bTy∗. (3.7)

Wir bitte – lineare Optimierungsprobleme konnen auch keine Losung haben? Aber naturlich!Man nehme nur A = 0, dann hat das Problem (3.5) fur b ≥ 0 keine Losung, weil der zulassigeBereich unbeschrankt ist und cTx uber alle Grenzen wachsen wird64, fur b < 0 hingegen gibtes keine Losung, weil es gar keine zulassigen Punkte gibt. Generell gilt wegen (3.7) außerdem,daß

cTx ≤ maxx

cTx = cTx∗ = bTy∗ = miny

bTy ≤ bTy,

also fur jedes zulassige Paar x,y

0 ≤ g(x,y) := bTy − cTx =[−cT | bT

] [ xy

](3.8)

ist. Die Funktion g bezeichnet man auch als Dualitatslucke von x und y und nach Satz 3.5 sindx,y genau dann optimal, wenn g (x,y) = 0 ist.

Der Beweis von Satz 3.5 verwendet die Lagrangeschen Formen

Φ (x,y) = cTx + yT (b−Ax) bzw. Ψ (x,y) = −bTy +(ATy − c

)Tx, (3.9)

zum primalen bzw. dualen Optimierungsproblem. Tatsachlich liefern uns diese Funktionen auchwieder einen Bezug zur Spieltheorie, namlich uber Sattelpunkte.

Definition 3.6 Ein Punkt (x∗,y∗) heißt Sattelpunkt von Φ, wenn

Φ (x,y∗) ≤ Φ (x∗,y∗) ≤ Φ (x∗,y) , x ≥ 0, y ≥ 0. (3.10)

Satz 3.7 Ein Punkt x∗ ist genau dann eine Losung des primalen Problems (3.5) wenn es einenVektor y∗ gibt, so daß (x∗,y∗) ein Sattelpunkt von Φ ist.

Ganz ohne Arbeit, also ganz ohne ein technisches Hilfsresultat65, geht es naturlich nicht. Dies-mal brauchen wir die folgende Aussage.

Lemma 3.8 Sei Ω ⊂ Rm+n ein abgeschlossenes konvexes Polyeder mit den folgenden beidenEigenschaften:

1. Zu jedem z =

[pq

]∈ Ω mit der Eigenschaft, daß p ≥ 0 und q 6= 0 ist, gibt es

mindestens ein 1 ≤ j ≤ m, so daß qj < 0 ist.

64Vorausgesetzt naturlich, daß c 6= 0 ist!65Wieder mal aus der konvexen Analysis, aber wen uberrascht das hier noch?

Page 42: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

40 3 BESTIMMUNG OPTIMALER GEMISCHTER STRATEGIEN

2. Ω enthalt mindestens einen Punkt z =

[pq

]mit p ≥ 0 und q ≥ 066.

Dann gibt es Vektoren u ∈ Rn und v ∈ Rm, so daß u ≥ 0, v > 0 und

uTp + vTq ≤ 0,

[pq

]∈ Ω. (3.11)

Beweis: Eigentlich muss man sich nur uberlegen, was Lemma 3.8 geometrisch bedeutet, umzu sehen, welches Hilfsmittel wir benutzen konnen und sollten: Das konvexe Polyeder Ω hatmit dem ebenfalls konvexen positiven Orthanten

Γ := Rm+n+ =

z ∈ Rm+n : z ≥ 0

hochstens eine Teilmenge der n–dimensionalen Ebene mit y = 0 gemeinsam, die eine Seitedes Orthanten darstellt, aber auf keinen Fall einen Punkt mit der ebenfalls konvexen Menge

Γ := Γε :=

[pq

]: p ≥ 0, q ≥ ε1

⊂ Rm+n

+ .

Die beiden Mengen kann man nun durch eine Hyperebene voneinander trennen – das ist der“eigentliche” Trennhyperebenensatz, den wir auch gleich noch als Satz 3.10 beweisen werden.Es gibt also eine affine Funktion hε, so daß

hε (Ω) < 0 < h (Γε) , hε(z) = wTε z + cε, wε =

[uε

].

Aus der Unbeschranktheit von Γε folgt dann sofort, daß wε ≥ 0 erfullt zu sein hat und da derPunkt 0 zu Γ gehort, muß außerdem

c := limε→0

cε ≥ 0

sein. Die Funktion

h(z) = limε→0

hε(z) = wTz + c, w ≥ 0, c ≥ 0, w =

[uvb

],

trennt nun Ω von Inneren von Γ und strikt von der offenen Seite

Θ :=

z =

[pq

]: p = 0, q ≥ 0

\ 0 ⊂ ∂Γ,

das heißt,h (Ω) ≤ 0 < h(z), z ∈ Γ ∪Θ.

66Und nach Bedingung 1 heißt das, daß q = 0 ist!

Page 43: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

3.2 Lineare Optimierung und Dualitat 41

Andererseits gibt es aber nach Voraussetzung 2 den “magischen” Punkt z ∈ Ω ∩ Γ, der uns

0 = h(z) =[uT vT

] [ p0

]︸ ︷︷ ︸

≥0

+c ⇒ c ≤ 0 ⇒ c = 0

liefert. Zusammengefasst erhalten wir dann fur zj =

[0ej

], j = 1, . . . ,m, daß

wTΩ ≤ 0 < h (zj) =[uT vT

] [ 0ej

]= vj, ⇒ v > 0,

was genau das ist, was wir behauptet haben.

Bemerkung 3.9 1. Eigentlich sagt uns der Beweis von Lemma 3.8 sogar noch ein bißchenmehr: Fur jeden Punkt z ∈ Ω ∩ Γ, mit den Komponenten p, q und jedes j ∈ 1, . . . , nmit pj > 0 muß uj = 0 sein! In den “Anwendungen” des Lemmas wird p = b − Axsein und die von Null verschiedenen Komponenten dieses Vektors fur ein x sind nungerade die nicht aktiven Nebenbedingungen; die Unterscheidung zwischen aktiven undnicht aktiven Nebenbedingungen ist aber nun andererseits wieder ein zentrales Konzeptin der Optimierung, insbesondere bei den allseits beliebte Kuhn–Tucker–Bedingungen,siehe z.B. [21, 25].

2. Karlin [13] beweist das Lemma ubrigens uber ein Bidualitatsargument fur konvexe Kegel– nur musste man dafur halt noch ein wenig tiefer in die konvexe Analysis einsteigen.

Satz 3.10 (Trennhyperebenensatz fur konvexe Mengen) Zu disjunkten, abgeschlossenen undkonvexen Teilmengen Ω,Ω′ von Rm gibt es v ∈ Rm und c ∈ R, so daß

vTΩ + c < 0 < vTΩ′ + c (3.12)

ist.

Beweis: Wir wahlen y ∈ Ω und y′ ∈ Ω′ so, daß

‖y − y′‖2 = ‖Ω− Ω′‖2 = min ‖z − z′‖2 : z ∈ Ω, z′ ∈ Ω′ > 0,

und betrachten den Fehlervektor w = ± (y − y′). Wie wir beim Beweis des Trennhypereben-satzes, Proposition 2.22, gesehen haben, liegt nun Ω auf der einen Seite der Hyperebene, diedurch h1(x) = wTx−wTy bestimmt wird, und y′ auf der anderen, also:

h1 (Ω) ≤ h1 (y) < h1 (y′) .

Mit genau derselben Argumentation gilt dann fur h2(x) = wTx−wTy′, daß

h2 (Ω′) ≥ h2 (y′) > h2 (y) ,

Page 44: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

42 3 BESTIMMUNG OPTIMALER GEMISCHTER STRATEGIEN

weswegen fur die affine Funktion h = 12

(h1 + h2), also h(x) = wTx− 12wT (y + y′), dann

h (Ω) ≤ h (zΩ) < h (zΓ) ≤ h (Γ) (3.13)

gelten muß.

So, aber jetzt an die Arbeit, schließlich wollen ja auch noch die Satze bewiesen sein.Beweis von Satz 3.7: Sei x∗ eine Losung von (3.5); wir betrachten die konvexe Menge

Ω =

[b

−cTx∗

]−[

A−cT

]Rn

+ =

[b−Ax

cT (x− x∗)

]: x ≥ 0

⊂ Rm+1,

die auch ein konvexes Polyeder ist. Setzen wir insbesondere x = x∗, dann erhalten wir, daß

0 ≤ z :=

[b−Ax∗

0

]=

[b−Ax∗

cT (x∗ − x∗)

]∈ Ω

ist. Damit konnen wir Lemma 3.8 anwenden und erhalten so einen Vektor67 0 ≤ y∗ ∈ Rm, sodaß fur alle z ∈ Ω die Ungleichung

0 ≥[y∗T 1

]z = y∗T (b−Ax) + cTx− cTx∗ = Φ (x,y∗)− cTx∗ (3.14)

gilt, aus der insbesondere

0 ≥ y∗T (b−Ax∗)︸ ︷︷ ︸≥0

⇒ y∗T (b−Ax∗) = 0

und somitΦ (x∗,y∗) = cTx∗ + y∗T (b−Ax∗) = cTx∗

folgt. Nochmals (3.14) ergibt dann fur x ≥ 0 und y ≥ 0

Φ (x,y∗) ≤ cTx∗ = Φ (x∗,y∗) ≤ Φ (x∗,y∗) + yT (b−Ax∗) = Φ (x∗,y) ,

weswegen x∗,y∗ ein Sattelpunkt ist.Ist umgekehrt x∗,y∗ ein Sattelpunkt von Φ, dann folgt direkt aus der zweiten Ungleichung

von (3.10), daß fur jedes y ≥ 0

0 ≤ Φ (x∗,y)− Φ (x∗,y∗) = cTx∗ + yT (b−Ax∗)− cTx∗ − y∗T (b−Ax∗)

= (y − y∗)T (b−Ax∗)

sein muß. Wenn wir nun y = y∗ + λej fur großes λ wahlen, dann liefert uns diese Unglei-chung, daß b − Ax∗ ≥ 0 sein muß, also ist x∗ schon einmal zulassig, und y∗ ≥ 0 erzwingty∗T (b−Ax∗) ≥ 0. Setzen wir aber y = 0 in die Ungleichung ein, dann ergibt sich, daß

67In diesem Vektor normieren wir die strikt positive letzte Komponente zu 1!

Page 45: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

3.3 Der Simplexalgorithmus 43

auch y∗T (b−Ax∗) ≤ 0 zu sein hat, also sogar y∗T (b−Ax∗) = 0 zu gelten. Die ersteUngleichung von (3.10) hingegen liefert, daß

0 ≥ Φ (x,y∗)− Φ (x∗,y∗) = cTx + y∗T (b−Ax)− cTx∗ − y∗T (b−Ax∗)

= (x− x∗)T(c−ATy∗

),

und so ist fur jedes zulassige x mit b−Ax ≥ 0

cTx∗ ≥ cTx− y∗TA (x− x∗) = cTx + y∗T (b−Ax)︸ ︷︷ ︸≥0

−y∗T (b−Ax∗)︸ ︷︷ ︸=0

≥ cTx.

Mit anderen Worten: x∗ ist eine Losung!

Beweis von Satz 3.5: Ist x∗ ∈ Rn eine Losung des primalen Problems, dann gibt es nachSatz 3.768 auch y∗ ∈ Rm, so daß x∗,y∗ ein Sattelpunkt der Lagrangefunktion69

Φ (x,y) = cTx + yTb− yTAx = yTb− (Ay − c)T x = −Ψ (x,y) ,

also ist x∗,y∗ auch ein Sattelpunkt70 von Ψ und damit hat eben auch das duale Problem eineLosung.

Der letzte Beweis zeigt uns schon, wie dicht Spiele und lineare Optimierung wirklich miteinan-der verwandt sind; insbesondere ist Dualitat eigentlich nichts anderes, als ein Perspektivwechselder Spieler.

3.3 Der SimplexalgorithmusNach all der Theorie wird es aber jetzt wirklich Zeit fur die Praxis, namlich die Bestimmungder Optimallosung(en)71 eines linearen Optimierungsproblems. Der dazugehorige Algorithmusist ein echter Klassiker, Nummer 2 unter den numerischen Verfahren72, wird als Simplexalgo-rithmus bezeichnet und geht auf Dantzig zuruck [3], der selbst daruber gesagt hat73:

The tremendous power of the simplex method is a constant surprise to me.

Die Idee ist eigentlich ganz einfach: Eine lineare Funktion ist gleichzeitig konvex und konkavund muß daher, siehe Ubung 3.4, sowohl ihr Minimum als auch ihr Maximum74 in einer Eckedes zulassigen Bereichs an. Da sich ein “Absuchen” der Ecken mit brutaler Gewalt schon aus

68Und den haben wir inzwischen tatsachlich bewiesen!69Der Ubergang von primal zu dual dreht also nur das Vorzeichen um – das sollte uns aus der Spieltheorie

irgendwie bekannt vorkommen!70Nur mit vertauschten Rollen von Auf- und Abstieg, aber das ist klar, denn wir sehen das Spiel ja jetzt aus der

Perspektive des anderen Spielers!71Eigentlich reicht im Normalfall ja eine!72Ubertroffen nur von allgegenwartigen FFT, der schnellen Fouriertransformation.73Beziehungsweise gesagt haben soll, denn ich habe das Zitat auch nur aus einem Buch.74Und deswegen brauchen wir auch keine große Unterscheidung von primalen und dualen Problemen zu ma-

chen.

Page 46: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

44 3 BESTIMMUNG OPTIMALER GEMISCHTER STRATEGIEN

Komplexitatsgrunden verbietet, siehe Beispiel 3.3, sollte man es etwas geschickter machen.Wenn man schon einmal in einer Ecke “sitzt”, dann interessiert man sich zu diesem Zeitpunktnicht fur alle anderen Ecken, sondern fur die viel leichter zu bestimmenden Nachbarecken undwahlt unter diesen dann diejenige aus, die fur den großten Gewinn bei der Zielfunktion sorgt.Und so hupft der Simplexalgorithmus dann von Ecke zu Ecke und erreicht irgendwann einmaldie Optimallosung.

Ubung 3.4 Zeigen Sie: Ein konvexe Funktion nimmt auf einem konvexen und kompakten Po-lyeder ihr Maximum in einer Ecke an. ♦Wir wollen den Simplexalgorithmus hier nicht im Detail herleiten oder beweisen, das ist Stoffvon Optimierungsvorlesungen und kann in fast beliebig volkstumlicher Form in der Literaturgefunden werden, naturlich in [13], aber auch in [9], da sogar im Zusammenhang mit Spieltheo-rie, den reinen Formalismus als Kochrezept ohne storende Mathematik findet man beispielswei-se in [30, 7].

Um die Idee zu verstehen, halten wir zuerst einmal fest, daß die Menge Ω der zulassigenPunkte des primalen Problems (3.5) durch das Ungleichungssystem[

A−I

]x ≤

[b0

](3.15)

charakterisiert wird, in das wir die Zusatzbedingung x ≥ 0 ganz einfach mit hineincodierthaben. Als nachstes nehmen wir der Einfachheit halber an, das Optimierungsproblem warenichtdegeneriert75, das heißt, es ist

det BJ 6= 0, J ⊂ 1, . . . ,m+ n, #J = n, B =

[A−I

], (3.16)

so daß die potentiellen Ecken von Ω gerade den n–elementigen Teilmengen von 1, . . . ,m+nentsprechen. Und weil wir gerade bei den vereinfachenden Annahmen sind, fordern wir auchnoch, daß b ≥ 0 sein soll, so daß 0 ∈ Ω ist, auch wenn bereits ein kurzer Blick auf (2.18) zeigt,daß wir damit nun wahrlich nicht rechnen sollten.

Ist aber 0 eine Ecke von Ω, dann hat die eine schone einfache Struktur: Die Ecke ist mitihren Nachbarecken durch die Kanten λ ej , j = 1, . . . , n, λ ≥ 0, verbunden und diese Kantenkonnen wir entlanglaufen solange

0 ≤ y = y(λ) := b− λAej, λ ≥ 0,

ist, und beim “maximalen” λ hat mindestens eine Komponente von y den Wert Null, sieheAbb. 3.3. Um das machen zu konnen, muß naturlich (Aej)k = 0 sein wann immer bk = 0 ist,denn sonst gibt es entlang ej keinen Weg aus der Ecke 0. Fur jedes j bekommen wir so aberauf jeden Fall ein λ∗j ≥ 0, so daß λ∗jej die nachstgelegene Nachbarecke ist, und zwar als

λ∗j = min

bkakj

: akj > 0

. (3.17)

75Wie man sich leicht vorstellen kann, sind degenerierte Probleme immer etwas unerfreulich, man kann sie aberalgorithmisch handhaben, und zwar ohne allzu großen Aufwand.

Page 47: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

3.3 Der Simplexalgorithmus 45

y1 = x1/2 + x2y2 = x1 + x2/2b1 = b2 = 1

21

1

2

y2 = 0

y1 = 0

x2=0

x1=0

x1=y2=0

x1=y1=0

x1=x2=0

y1=y2=0

x2=y2=0 x2=y1=0

Abbildung 3.3: Ein einfaches Beispiel fur die Ecke x = 0 und die Bestimmung der Nach-

barecken uber[

yx

]J

= 0 mit n–elementigen Teilmengen J , hier fur n = 2.

Ist die Menge auf der rechten Seite leer weil die j–Spalte aj von A nichtpositiv ist, 0 6= aj ≤ 0,dann konnen wir λj so groß wahlen, wie wir wollen – der zulassige Bereich ist dann unbe-schrankt, eine weitere Degenerierung des Problems, uber die wir großzugig hinwegsehen wol-len. Kennt man all diese λj , dann wahlt man die Nachbarecke, also den Parameter j, naturlichso, daß die Zielfunktion so groß wie moglich wird, das heißt, man interessiert sich fur

maxj=1,...,n

cTλ∗jej = maxj=1,...,n

λ∗jcj = maxj=1,...,n

mink=1,...,m

cjbkakj

,

wobei die letzte Identitat76 naturlich nur fur A > 0 korrekt ist – dafur sieht sie aber auch ziem-lich nach Sattelpunkt aus77. Diese “Entscheidungsfindung”ist nochmals in Abb. 3.4 dargestellt.Und jetzt haben wir es praktisch geschafft! Ist der obige Maximalwert < 0, dann war x = 0bereits die Optimallosung, andernfalls wandern wir in die Nachbarecke λ∗jej , bei der nun furein passendes k ∈ 1, . . . ,m die Bedingung yk = 0 erfullt sein muß, so daß man die Rollenvon xj und yk vertauschen kann. Dazu drucken wir xj “einfach” als Linearkombination dieserParameter aus, indem wir

yk = eTk (b−Ax) = bk −∑`6=j

eTka`x` + akj xj

76Mit dem “inversen Hadamard–Produkt” cbT −1 AT , siehe [16, 11]. Das Hadamard–Produkt ist einfach daskomponentenweise Produkt zweier Matrizen und hat die schone Eigenschaft, kommutativ zu sein sowie aus positiv(semi)definiten Faktoren auch ein positiv (semi)definites Ergebnis zu basteln.

77Wenn man anfangt, sich mit Spieltheorie zu befassen, dann sieht man offensichtlich uberall Sattelpunkte.

Page 48: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

46 3 BESTIMMUNG OPTIMALER GEMISCHTER STRATEGIEN

x1=y1=0

x1=x2=0 x2=y2=0

?

?

Abbildung 3.4: In welche Nachbarecke von x = 0 gewandert wird, das hangt naturlichvom Verhalten der Zielfunktion ab.

nach

xj = −bk + yk −∑` 6=j

ak` x` = −eTk

(b− Ax

), x =

x1...

xj−1

ykxj+1

...xn

auflosen – und siehe da, x = 0 ist nun genau die Ecke, in die wir gerade gewandert sind.

Das war auch schon der Simplexalgorithmus “in a nutshell”. Naturlich muß man bei derImplementierung und bei einigen Details schon noch ein klein wenig aufpassen, gerade dieUnbeschranktheit kann einem schon ein wehtun. Wir werden das spater noch sehen.

3.4 Transport, zwei Phasen und Spiele

Bei aller Bedeutung des Simplexalgorithmus stellt sich doch schon langsam die Frage: “Was hatdas alles mit uns tun und vor allem was mit Spieltheorie?” Der Bezug ist naturlich die Suchenach zulassigen Punkten, denn das war bisher vielleicht die massivste Einschrankung, die beiunserem simplen Simplexalgorithmus gemacht haben, namlich, daß b ≥ 0 verlangt wurde, unddiese Forderung ist nicht einmal in der Optimierung haltbar!

Beispiel 3.11 (Transportproblem) In den Rangierbahnhofen A und B stehen 18 bzw. 12 leereWaggons, in den Bahnhofen X, Y und Z werden 11, 10 und 9 Waggons benotigt. Die Distanzenzwischen den Bahnhofen betragen

Page 49: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

3.4 Transport, zwei Phasen und Spiele 47

X Y ZA 5 4 9B 7 8 10

Welche Verteilung der Waggons minimiert die gefahrene Kilometerzahl78?Um dieses Problem mathematisch darzustellen, sei x die Anzahl der Wagen, die von A nach Xfahren und y die Anzahl der Wagen, die von A nach y fahren. Dann lassen sich alle Wagenbe-wegungen durch x und y ausdrucken und zwar

Strecke # WagenA→ X xA→ Y yA→ Z 18− x− yB→ X 11− xB→ Y 10− yB→ Z x+ y − 9

und alle diese Großen mussen selbstverstandlich positiv sein. Die Gesamtzahl der gefahrenKilomter ist

5x+ 4y + 9 (18− x− y) + 7 (11− x) + 8 (10− y) + 10 (x+ y − 9) = −x− 3y + 229,

und dieser Wert muß unter den obigen Nebenbedingungen minimiert werden, so daß wir dasprimale Problem

max 229− x− 3y,

1 11 00 1−1 −1

[ xy]≤

181110−9

erhalten, bei dem x = 0 nicht zulassig ist: wenn man keine Wagen bewegt, dann kommt haltauch nichts in X, Y oder Z an. Die Nebenbedingungen sind in Abb. 3.5 grafisch dargestellt.

Nur um das klarzustellen: x = 0 erfullt immer noch die Bedingung aus Lemma 3.1 mitJ = m + 1,m + 2, aber der Punkt gehort halt leider nicht zum zulassigen Bereich Ω,und wir mussen schauen, daß wir irgendwie zu einer zulassigen Ecke kommen! Doch auchdafur konnen wir wieder den Simplexalgorithmus verwenden, was zur sogenannten Zweipha-senmethode fuhrt. Und auch diese basiert wieder auf einem sehr einfachen Trick: Ist namlichb∗ = minj bj negativ, dann betrachtet man das Hilfsproblem

maxbx z (x) = x0 + b∗, [1 |A]

[x0

x

]︸ ︷︷ ︸

=:bx≤ b∗ := b− b∗1, (3.18)

fur das man leicht zwei Beobachtungen machen kann:78Auch hier handelt es sich eigentlich wieder um ein Problem aus der Ganzzahloptimierung, aber wieder einmal

wird, rein zufallig, die kontinuierliche Optimallosung ganzzahlig sein.

Page 50: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

48 3 BESTIMMUNG OPTIMALER GEMISCHTER STRATEGIEN

2 4

2

4

Abbildung 3.5: Der zulassige Bereich fur das Transportproblem aus Beispiel 3.11; der Null-punkt ist offensichtlich “abgeschnitten” worden.

1. Da nun b∗ ≥ 0 ist, ist x eine zulassige Ecke fur das Optimierungsproblem, von der ausman den Simplexalgorithmus starten kann.

2. Ist fur irgendein x einmal z (x) = x0 + b∗ ≥ 0, dann ist

Ax = [1 |A] x− x0 1 ≤ b∗ − x0 1 = b− b∗1− x0 1 = b− (x0 + b∗)︸ ︷︷ ︸≥0

≤ b

und wir haben unseren heißbegehrten zulassigen Punkt gefunden.

Und das war’s auch schon: wir mussen lediglich das modifizierte Problem (3.18) so lange mitdem Simplexalgorithmus beackern bis die Zielfunktion zum ersten Mal bei einem nichtnegati-ven Wert angekommen ist. Die Optimierer entfernen dann, beispielsweise beim Transportpro-blem, die Variable x0 und machen mit dem “normalen” Simplexalgorithmus weiter, das heißtdann Phase II, wir hier im Kontext der Spieltheorie sind dann einfach fertig und haben unse-ren zulassigen Punkt gefunden. Naturlich mussen wir noch wissen, wie man diesen aus demSimplextableau abliest, aber das findet man dort, wo auch der Simplexalgorithmus und dessenpraktische Durchfuhrung diskutiert werden.Zur Bestimmung der Optimalstrategie gibt es ein Octave–Programm79 GameOptStrat.m,das zu einer vorgegebenen Auszahlungsmatrix die Optimalstrategien fur beide Spieler und denWert des Spieles bestimmt.

Beispiel 3.12 (Stein, Schere, Papier, Brunnen) Fur unser Spiel “Stein, Schere, Papier, Brun-nen” aus Beispiel erhalten wir den folgenden Ablauf

79Da herunterzuladen, wo es auch dieses Skript gibt.

Page 51: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

3.4 Transport, zwei Phasen und Spiele 49

octave> A = [ 0 1 -1 -1; -1 0 1 -1; 1 -1 0 1; 1 1 -1 0 ];octave> [p,q,v] = GameOptStrat ( A )p =

0.000000.333330.333330.33333

q =

0.000000.333330.333330.33333

v = 0

und das ist genau das, was wir inzwischen von den optimalen Strategien und dem Wert diesesSpiels erwarten konnen.

Beispiel 3.13 (Daiquiri–Spiel) Erinnern wir uns an das Daiquiri–Spiel aus [30], Ubung 1.280

mit der Auszahlungsmatrix

A =

[5.5 11 11

]und sehen wir uns an, was Optimalstrategien und Wert dieses Spiels sind, namlich

octave> A = [ 5.5 1 ; 1 11 ];octave> [p,q,v] = GameOptStrat ( A )p =

0.689660.31034

q =

0.689660.31034

v = 4.1034

und das ist auch genau das, was wir in [30] finden und was wir fur dieses 2 × 2–Spiel auch“zu Fuß” hatten ausrechnen konnen. Etwas verbluffender wird das Ganze aber, wenn wir uns

80Hat jemand sich mit dieser Ubung beschaftigt?

Page 52: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

50 3 BESTIMMUNG OPTIMALER GEMISCHTER STRATEGIEN

die Sache aus der Sicht von Olaf ansehen, also die optimale Strategie fur −AT berechenen(lassen), denn dann erhalten wir plotzlich

octave> [p,q,v] = GameOptStrat ( -A’ )p =

-0.222221.22222

q =

10

v = 0

was ja nun absolut keinen Sinn ergibt! Ist unser Programm defekt?

Beispiel 3.13 zeigt uns, daß wir vor lauter Begeisterung uber die Zweiphasenmethode beinaheein wichtiges Detail ubersehen hatten81: Die zulassigen Punkte, die wir so bestimmen liegen impositiven Orthanten, das ist in den Simplexalgorithmus, auch in seine erste Phase, eingebaut.Mit anderen Worten, es muß p∗

q∗

v

≥ 0 (3.19)

sein. Das ist unproblematisch, solange v ≥ 0 ist82, bricht allerdings zusammen, wenn v < 0 ist,denn in diesem Fall kann die Phase 1 den Optimalpunkt gar nicht finden.

Beispiel 3.14 Daß das Spiel zur Matrix

A =

[5.5 −1−1 11

]nicht ganz fair ist, sondern einen positiven Wert, namlich 3.2162, hat ist vielleicht nicht soschwer nachzuvollziegen, aber nun liefert uns die Octave–Routine das Ergebnis

octave> A = [ 5.5 -1; -1 11 ]; [p,q,v] = GameOptStrat ( -A’ )p =

0.153850.84615

81Selbstverstandlich ist es nicht ubersehen worden, sondern dieser Aufbau wurde bewusst und gezielt gewahlt,um dezidiert einen besonderen didaktischen Spannungsbogen aufzubauen!

82Also insbesondere fur alle fairen Spiele!

Page 53: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

3.4 Transport, zwei Phasen und Spiele 51

## GameSolve.m (Spieltheorie)## --------------------------------------------------------## Optimale gemischte Strategien## Eingabe:## A Auszahlungsmatrix des Spiels## Ausgabe:## p Strategie fuer Spieler 1## q Strategie fuer Spieler 2## v Wert des Spiels

function [p,q,v] = GameSolve( A )[p1,q1,v1] = GameOptStrat( A );[q2,p2,v2] = GameOptStrat( -A’ );

if ( v2 > 0 )p = p2; q = q2; v = v2;

elsep = p1; q = q1; v = v1;

end

Programm 3.1 GameSolve.m: Berechnung der optimalen Strategien – unter Verwendungvon GameOptStrat.m eine ganz einfache Geschichte.

q =

10

v = 0

die auf den ersten Blick recht harmlos und korrekt aussieht!

Allerdings ist das Problem recht leicht gelost: Wir berechnen einfach die optimalen Strategienzu A und −AT . Hat eines dieser beiden Spiele positiven Wert, so musste das andere negati-ven Wert haben, was zu einer nicht korrekten Losung mit Wert Null fuhrt, die wir dann haltverwerfen. Das Octave–Programm hierzu findet sich in Programm 3.1.

Damit sind wir aber auch in der Lage, alle optimalen Strategien eines Spielers zu bestim-men, indem wir zuerst mit GameSolve eine optimale Strategie fur Spieler 1, eine fur Spieler283 und vor allem den Wert des Spieles bestimmen! Kennen wir einmal den Wert des Spieles,

83Die werden wir ihm naturlich nicht verraten, er soll gefalligst selbst draufkommen

Page 54: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

52 3 BESTIMMUNG OPTIMALER GEMISCHTER STRATEGIEN

dann sind ja nach Korollar 2.24 die Optimalstrategien von Spieler 1 gerade die Losungen desUngleichungssystems −AT

1T

−1T

p ≤

−v11−1

, p ≥ 0,

das genau die richtige Form hat, um als Nebenbedingung eines primalen Problems aufgefasst zuwerden. Außerdem kennen wir mit p∗ bereits eine Ecke des zugehorigen Polyeders Ω, die manin einem ersten Schritt mittels Austauschschritten in den Nullpunkt transformiert. In der Praxiswurde man das nicht so machen, sondern einfach mit dem Ergebnis von Phase 1 weiterrechnen,indem man die Zeilen und Spalten streicht, die zu q∗ und v gehoren. Danach kann man mit derVorgehensweise von (3.17) systematisch alle Ecken des zulassigen Bereichs aufsuchen. Undhat man einmal alle Ecken, dann hat man auch alle Losungen . . .

Ubung 3.5 Implementieren Sie in Octave ein Programm, das alle Optimallstrategien furSpieler 1 bestimmt. ♦

Ubung 3.6 Zeigen Sie: Jedes beschrankte konvexe Polyeder ist konvexe Hulle seiner Ecken. ♦

Beispiel 3.15 (“Skin Game”, siehe Beispiel 2.18) Mit dieser Methodik konnen wir auch das“Skin Game” mit der Auszahlungsmatrix

A =

1 −1 −2−1 1 12 −1 0

angehen und erhalten

octave> [p,q,v] = GameSolve( [ 1 -1 -2; -1 1 1; 2 -1 0 ] )p =

0.000000.600000.40000

q =

0.400000.600000.00000

v = 0.20000

das heißt, die optimale Strategie von Spieler 1 ist(0, 3

5, 2

5

)und bringt ihm einen erwarteten

Gewinn von 15

pro Runde! Fair ist offenbar etwas anderes.

Page 55: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

3.4 Transport, zwei Phasen und Spiele 53

Wir beenden dieses Kapitel mit einem weiteren Bei-Spiel, in dem man die Optimalstrategienicht so einfach sieht und ohne unsere Octave–Programmchen auch ganz schon arbeiten muß,oder, wie in [30, S. 164] zu lesen ist:

A flash of genius is a useful thing at this point, because straight calculation is wret-ched.

Das Spiel selbst wird ubrigens nicht nur in [30] diskutiert, sondern auch in den “seriosen”,mathematisch substantiellen Buchern [13] und [20].

Beispiel 3.16 (Morra) Jeder Spieler streckt (verdeckt) einen, zwei oder drei Finger aus und ratgleichzeitig, wieviele Finger sein Gegner ausstreckt84. Rat ein Spieler richtig, so wird ihm dieGesamtzahl an angezeigten Fingern ausbezahlt85, andernfalls endet das Spiel unentschieden,was insbesondere der Fall ist, wenn beide Spieler richtig raten, ganz egal, wer mehr Fingerangezeigt hat.

Bei Morra ist also ein Strategie ein Paar (a, r) ∈ 1, 2, 32 und die Auszahlungstabelle hat dieForm

(1, 1) (1, 2) (1, 3) (2, 1) (2, 2) (2, 3) (3, 1) (3, 2) (3, 3)

(1, 1) 0 2 2 -3 0 0 -4 0 0(1, 2) -2 0 0 0 3 3 -4 0 0(1, 3) -2 0 0 -3 0 0 0 4 4(2, 1) 3 0 3 0 -4 0 0 -5 0(2, 2) 0 -3 0 4 0 4 0 -5 0(2, 3) 0 -3 0 0 -4 0 5 0 5(3, 1) 4 4 0 0 0 -5 0 0 -6(3, 2) 0 0 -4 5 5 0 0 0 -6(3, 3) 0 0 -4 0 0 -5 6 6 0

Was man schon sieht, ist die Tatsache, daß das Zeigen vieler Finger den potentiellen Gewinn,aber auch den potentiellen Verlust vergroßert, daß die Spieler so also das Risiko kontrollierenkonnen. Und siehe da – die Bestimmung einer Optimalstrategie ist jetzt ein Klacks, denn mitHilfe einer kleinen Funktion MorraMat zur automatischen Bestimmung der Auszahlungsma-trix erhalten wir

octave> [p,q,v] = GameSolve ( MorraMat( 3 ) )p =

0.000000.000000.42553

84Nachdem die meisten Leute zwei Hande haben, kann man die eine zum Anzeigen, die andere zum Ratenverwenden. Alternativ konnte man die Zahlen auf ein Blatt Papier schreiben oder mit zwei Wurfeln “einstellen”.

85Naturlich nicht in Fingern, sonst ist das ein sehr kurzlebiges, wenn auch vielleicht kurzweiliges Spiel.

Page 56: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

54 3 BESTIMMUNG OPTIMALER GEMISCHTER STRATEGIEN

0.000000.319150.000000.255320.000000.00000

q =

-0.000000.000000.425530.000000.31915-0.000000.25532-0.000000.00000

v = 0

und das etwas verbluffenden Resultat, daß die Optimalstrategie nur die drei Strategien (1, 3),(2, 2) und (3, 1) verwendet, bei denen vier Finger auf dem Spiel stehen. Und jetzt haben wirauch ein Spiel, bei dem die Optimalstrategie nicht eindeutig ist, denn die Losung mit den vonNull verschiedenen Wahrscheinlichkeiten 5

12, 1

3, 1

4tut’s ganz genauso:

octave> p2 = [ 0 0 5 0 4 0 3 0 0 ]’ / 12p2 =

0.000000.000000.416670.000000.333330.000000.250000.000000.00000

octave> A’*p2ans =

0.166670.00000

Page 57: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

3.4 Transport, zwei Phasen und Spiele 55

0.000000.083330.000000.083330.000000.000000.16667

Dieser Vektor ist ≥ 0 und da Morra ein faires Spiel ist86 ist auch das eine Optimalstrategie furSpieler 1, siehe Korollar 2.24. Auffallig ist auch, daß die Strategie, die mit dem großten Risikoverbunden ist, mit der geringsten Wahrscheinlichkeit gespielt wird – Feigheit scheint also eindurchaus rationales Verhalten zu sein.

Ubung 3.7 Schreiben Sie ein Octave–Programm, das alle optimalen Strategien eines gege-benen Spiels ermittelt, indem es alle Ecken des zugehorigen konvexen Polyeders bestimmt87.♦

Ubung 3.8 Bestimmen Sie alle Optimalstrategien fur Morra. ♦

Ubung 3.9 Bestimmen Sie alle Optimalstrategien fur das Funf–Finger–Morra. ♦

86Dazu hatten wir nicht erst v = 0 errechnen lassen mussen, jede Morra–Matrix ist schiefsymmetrisch!87Und schicken Sie den Code an mich.

Page 58: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

56 4 VERHANDLUNGSSPIELE, GLEICHGEWICHTE UND DIE NUTZENFRAGE

Contrariwise, [. . . ] if it was so, it mightbe; and if it were so, it would be; but as itisn’t, it ain’t. That’s logic.

L. Carroll, Through the looking glass

Verhandlungsspiele,Gleichgewichte und die

Nutzenfrage 4Jetzt wird es aber langsam Zeit, sich in das Reich der Mehrpersonenspiele aufzumachen. Daman ja jedes n–Persponen–Nichtnullsummenspiel auch als n + 1–Personen–Nullsummenspielschreiben kann, ist es sicherlich ein sehr vernunftiger erster Schritt, Nichtnullsummenspiele furzwei Spieler zu betrachten und sich einmal anzusehen, was hier an neuen Konzepten auftritt.

4.1 Verhandlungen und die Vorteile der Kooperation

Wir betrachten jetzt also Zweipersonen–Spiele, die auf zwei Auszahlungsmatrizen A1,A2 ∈Rm×n basieren, welche nicht mehr unbedingt die Nullsummenbedingung A1 = −A2 erfullen88;spielen die beiden Spieler nun ihre gemischten Strategien p, q, dann ist die zu erwartende Aus-zahlung der Vektor

a (p, q) :=

[pTA1qpTA2q

]. (4.1)

Die Ziele der Spieler sind jetzt nicht mehr automatisch gegenlaufig, denn Spieler 1 will a1 (p, q)moglichst groß machen, Spieler 2 hingenen a2 (p, q). Zur Illustration eignet sich das folgendeBeispiel aus [15] sehr gut.

Beispiel 4.1 Wir betrachten das Spiel zu den Auszahlungsmatrizen

A1 =

[2 −1−1 1

], A2 =

[1 −1−1 2

],

die wir auch zur Auszahlungstabelle

A =

[(2, 1) (−1,−1)

(−1,−1) (1, 2)

]kombinieren konnen.

88Wir wollen das nicht a priori ausschließen, eine vernunftige Erweiterung der Theorie sollte die Nullsummen-spiele naturlich enthalten.

Page 59: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

4.1 Verhandlungen und die Vorteile der Kooperation 57

Die beiden Spieler konnen sich nun zuerst einmal auf den Standpunkt stellen, daß sie un-abhangig voneinander gemischte Strategien p, q spielen und diese unabhangig voneinander op-timieren konnten. Damit kann dann eine bestimmte Menge von Auszahlungen erzielt werden.

Definition 4.2 Der Gewinnbereich Γ ⊂ R2 zum Spiel (A1,A2) ist die Menge

Γ = Γ(A) = Γ (A1,A2) =

[STmA1SnSTmA2Sn

]=

[pTA1qpTA2q

]: p ∈ Sm, q ∈ Sn

.

Versuchen wir doch einmal, den Gewinnbereich Γ(A) zu Beispiel 4.1 zu bestimmen. Fur p =(p, 1− p) und q = (q, 1− q) erhalten wir dann die Punkte[

2pq − [p(1− q) + q(1− p)] + (1− p)(1− q)pq − [p(1− q) + q(1− p)] + 2(1− p)(1− q)

]=

[5pq − 2p− 2q + 15pq − 3p− 3q + 2

]Mit anderen Worten: Γ ist das Bild des Einheitsquadrats [0, 1]2 unter der bilinearen Abbildung

f(x, y) =

[55

]xy −

[23

](x+ y) +

[12

],

die die vier Randkurven auf

f(x, 0) = −[

23

]x+

[12

]f(0, y) = −

[23

]y +

[12

]f(x, 1) =

[32

]x−

[11

]f(1, y) =

[32

]x−

[11

]abbildet. Das sind nur zwei Randkurven von Γ, namlich die Streckenzuge, die (−1,−1) mit(2, 1) und (1, 2) verbinden; die verbleibende Randkurve bekommen wir89 durch

f(x, x) =

[55

]x2 −

[46

]x+

[12

], x ∈ [0, 1],

eine Parabel, die (1, 2) mit (2, 1) verbindet und deren Mittelpunkt, x = 12, zur Auszahlung

1

4

[55

]− 1

2

[46

]+

[12

]=

[1414

]gehort. Der zugehorige Gewinnbereich Γ(A) ist in Abb. 4.1 zu sehen und er ist offensichtlich

89Das ist ein “educated guess”, aber geometrisch nicht so ganz abwegig, wenn man bedenkt, daß die beidenKanten zu [x, 0] und [0, y] aufeinander gefaltet werden.

Page 60: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

58 4 VERHANDLUNGSSPIELE, GLEICHGEWICHTE UND DIE NUTZENFRAGE

-1

-0.5

0

0.5

1

1.5

2

-1 -0.5 0 0.5 1 1.5 2

line 1line 2line 3

Abbildung 4.1: Der Gewinnbereich Γ(A) zu Beispiel 4.1.

keine konvexe Menge. Trotzdem spielt Konvexitat naturlich auch hier wieder eine wesentlicheRolle, und um uns daruber klarzuwerden, werfen wir einmal einen Blick auf den allgemeinenFall.

Schreiben wir generell A` =[a`jk : j, k

], ` = 1, 2, dann bemerken wir zuerst einmal,

daß fur jedes p ∈ Sm und q ∈ Sn der Punkt a(p, q) eine Konvexkombination der Punkte

ajk =

[a1jk

a2jk

], j = 1, . . . ,m, k = 1, . . . , n, ist:

a (p, q) =m∑j=1

n∑k=1

[a1jk

a2jk

]pjqk =:

m∑j=1

n∑k=1

ajk αjk (4.2)

mit αjk ≥ 0 und

m∑j=1

n∑k=1

αjk =m∑j=1

n∑k=1

pj qk =m∑j=1

pj︸ ︷︷ ︸=1

n∑k=1

qk︸ ︷︷ ︸=1

= 1.

Definition 4.3 Die konvexe Hulle [[Ω]] einer Menge Ω ⊂ Rm ist definiert als

[[Ω]] :=∞⋃n=2

⋃x1,...,xn∈Ω

[[x1, . . . ,xn]]. (4.3)

Lemma 4.4 Fur A1,A2 ∈ Rm×n, A` =[a`jk : j, k

], ` = 1, 2, ist

[[Γ (A1,A2)]] =

[[[a1jk

a2jk

]:j = 1, . . . ,m

k = 1, . . . , n

]]=: Ω(A). (4.4)

Page 61: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

4.1 Verhandlungen und die Vorteile der Kooperation 59

Beweis: Die Inklusion ⊆ haben wir bereits in (4.2) gezeigt und da mit p = ej , q = ek auchajk ∈ Γ(A) ist, folgt mit

[[Γ(A)]] ⊇ [[ajk : j, k]]

auch die umgekehrte Inklusion.

Fassen wir zusammen: Γ(A) ist immer eine Teilmenge des konvexen Polyeders Ω(A) = [[Γ(A)]],aber im allgemeinen wir Γ(A) 6= Ω(A) gelten, siehe Abb. 4.1. Insbesondere enthalt Ω(A) \Γ(A) Punkte, die fur beide Spieler gleichzeitig sehr akzeptable Auszahlungswerte darstel-len, insbesondere den Punkt (3/2, 3/2), siehe Abb. 4.2. Und genau diesen Punkt kann man

Abbildung 4.2: Der Gewinnbereich Γ(A) und seine konvexe Hulle Ω(A). Ein beson-ders “interessanter” Punkt dieser konvexen Hulle ist offenbar der eingezeichnete Punkt(3/2, 3/2).

mit Verhandlungen erreichen: Beide Spieler einigen sich vor dem Spiel darauf, die Strategienp = 0, q = 1 oder p = 1, q = 0 mit jeweils Wahrscheinlickeit 1

2zu spielen und entscheiden dann

beispielsweise durch einen gemeinsamen Munzwurf, welche der beiden Strategien zu spielenist. Der Erwartungswert dieser kooperativen Methode ist dann

1

2

[21

]+

1

2

[12

]=

[3232

],

und das ist wesentlich besser, als wenn beide Spieler die Strategie p = q = 12

spielen wurden,was ja nur die Auszahlung

(14, 1

4

)lieferte.

Definition 4.5 Ein Verhandlungsergebnis besteht aus einer endlichen Anzahl von Strategien(pj, qj

)∈ Sm × Sn, j = 0, . . . , N und einem Wahrscheinlichkeitsvektor α ∈ SN , was zu der

erwarteten Auszahlung

a∗ =n∑j=0

αj

[pTj A1qjpTj A2qj

]∈ Ω (A)

Page 62: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

60 4 VERHANDLUNGSSPIELE, GLEICHGEWICHTE UND DIE NUTZENFRAGE

fuhrt.

Mit Hilfe von Verhandlungsergebnissen konnen wir also fur unsere weitere Theorie immer an-nehmen, daß beide Spieler ihre Auszahlungen immer in Ω(A) suchen konnen, denn jeder Punktaus der konvexen Hulle Ω(A) = [[Γ(A)]] entspricht ja nun einem Verhandlungsergebnis. Nungibt es aber auch noch ein nettes Resultat, das uns sagt, daß wir gar nicht so viele Strategienbrauchen.

Satz 4.6 Zu jedem Punkt a ∈ Ω(A) ⊂ R2 gibt es drei reine90 Strategien p0,p1,p2 ∈ Sm undq0, q1, q2 ∈ Sm, sowie α ∈ S3, so daß

a =2∑j=0

αj

[pTj A1qjpTj A2qj

]

ist.

Was sich hinter diesem Resultat verbirgt, ist eine kleine Beobachtung aus der konvexen Analy-sis.

Proposition 4.7 Fur Ω ⊂ Rn kann jeder Punkt x ∈ [[Ω]] in der Form

x =r∑j=0

αj xj, xj ∈ Ω, α ∈ Sr, r ≤ n, (4.5)

geschrieben werden.

Bemerkung 4.8 Zwei Dinge sind bei dieser Proposition wichtig: Jeder Punkt aus [[Ω]] kann alsstrikte Konvexkombination91 von hochstens n + 1 Punkten geschrieben werden, wobei n dieRaumdimension ist.

Beweis: Nach der Definition (4.3) der konvexen Hulle konnen wir x als

x = [x0 . . .xr]α =r∑j=0

αj xj, α ∈ Sr, (4.6)

fur ein r ∈ N geschrieben werden. Als erstes lassen wir mal alle Punkte mit αj = 0 weg underhalten so eine strikte Konvexkombination, α ∈ Sr . Gibt es verschiedene Moglichkeiten, xin der Form (4.6) darzustellen, dann wahlen wir eine Darstellung, bei der r minimal wird undbehaupten, daß r ≤ n sein muß!

90Jede von diesen Strategien entspricht also einem Einheitsvektor.91Also als Konvexkombination, bei der alle Komponenten strikt positiv sind.

Page 63: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

4.2 Nash–Gleichgewicht 61

Ware namlich r > n, dann sind die r > n Vektoren yj := xj − x0, j = 1, . . . , r, linearabhangig und es gibt β ∈ Rr \ 0, so daß

0 = [y1 . . .yr] β =r∑j=1

βj yj =r∑j=1

βj (xj − x0) =r∑j=1

βj xj −

(r∑j=1

βj

)x0

=:n∑j=0

γj xj = [x0 . . .xr] γ,r∑j=0

γj = 0,

und es ist γj 6= 0 fur mindestens ein j ∈ 0, . . . , n. Fur jedes λ ∈ R ist dann aber

x = [x0 . . .xr] (α + λγ) =: [x0 . . .xr]α′,

und mit λ = −αj

γjist α′j = 0, also hat α′ echt weniger von Null verschiedene Komponenten als

α, was der Minimalitat von r widerspricht.

Beweis von Satz 4.6: Da Ω(A) die konvexe Hulle der ajk sind, die man uber die reinenStrategien ej, ek erhalt, brauchen wir nur noch Proposition 4.7 anzuwenden, um zu sehen, daßwir maximal drei dieser Punkte benotige, um a zu kombinieren.

4.2 Nash–GleichgewichtWenn wir jetzt also unsere Verhandlungen durchfuhren, was wird dann wohl die Losung sein?Auf welchen Punkt sollen sich die beiden Spieler einigen, was ist die “faire” Verhandlungs-losung? Ein Vorschlag dafur wurde 1950 von Nash [17] gemacht. Dieser Ansatz, entnommenaus [15] beginnt mit einem “Status quo” a0 = (u0, v0) ∈ Ω = Ω(A) und basiert auf dernaheliegenden Idee, daß beide Spieler den Status quo verwerfen werden, wenn es a = (u, v) ≥a0 gibt, denn in diesem Fall konnten sich ja beide Spieler simultan verbessern und es gibt keinenrationalen Grund92, warum sie auf a0 beharren sollten.

Definition 4.9 Die “Nash–Losung” a∗ = (u∗, v∗) ≥ a0 des Verhandlungsproblems ist definiertdurch

(u∗ − u0) (v∗ − v0) ≥ (u− u0) (v − v0) , a0 ≤ a = (u, v) ∈ Ω(A). (4.7)

Die Nash–Losung hat aber auch eine interessante geometrische Interpretation: Die Niveauliniender Funktion (u− u0) (v − v0) lassen sich ja als

v = v0 +c

u− u0

= f(u), u ≥ u0,

parametrisieren und stellen so Hyperbeln dar. Wahlt man den Parameter c groß genug, dannwird diese Hyperbel keinen Punkt mehr mit Ω(A) gemeinsam haben, wahlt man ihn kleingenug, dann wird ein ganzer Hyperbelbogen in Ω(A) verlaufen. Und irgendwo dazwischenliegt eine Hyperbel, die Ω(A) gerade in einem Punkt beruhrt93, siehe Abb. 4.3. und genaudieser Beruhrpunkt ist die Nash–Losung. Jetzt aber zu mathematischen Eigenschaften, die dieNash–Losung charakterisieren.

92Was andere Grunde wie Eitelkeit, Dummheit, Streit- und Rachsucht allerdings nicht ausschliesst.93Die Flache unter der Hyperbel ist konkav, deswegen kann es nicht mehrere Schnittpunkte geben!

Page 64: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

62 4 VERHANDLUNGSSPIELE, GLEICHGEWICHTE UND DIE NUTZENFRAGE

-1

-0.5

0

0.5

1

1.5

2

2.5

-1 -0.5 0 0.5 1 1.5 2 2.5

line 1line 2line 3line 4line 5

Abbildung 4.3: Die Menge Ω(A) zu Beispiel 4.1 und einige Hyperbeln, inclusive derBeruhrhyperbel.

Satz 4.10 (Nash–Losung) Die Nash–Losung a∗ aus (4.7) ist eindeutig und hat die folgendenEigenschaften:

1. Ist Ω1 = DΩ + y und a1 = Da0 + y fur eine Diagonalmatrix D ∈ R2+ und einen

Verschiebungsvektor y ∈ R2, dann ergibt sich die zu Ω1 gehorige Nash–Losung als a∗1 =Da∗ + y.

2. Ist a ∈ Ω(A) und a ≥ a∗, dann ist a = a∗.

3. Ist Ω′ ⊆ Ω(A) konvex und gehort zu einem Status Quo a0 ∈ Ω′ die Nash–Losung a∗

auch zu Ω′, dann ist a∗ auch Nash–Losung in Ω′.

4. Ist Ω(A) symmetrisch94 und ist u0 = v0, dann ist auch u∗ = v∗.

Außerdem ist die Nash–Losung die einzige Losungsfunktion95, die alle oben aufgefuhrten Ei-genschaften besitzt.

Den Beweis teilen wir in mehrere Teilresultate auf, bei denen wir dann die entsprechendenAspekte ein wenig genauer interpretieren wollen. Die erste Beobachtung ist uns sogar eineformale Aussage wert.

Lemma 4.11 Die Nash–Losung ist eindeutig.

Beweis: Angenommen, wir hatten zwei Nash–Losungen, a∗,a† ≥ a0, dann ist

(u∗ − u0) (v∗ − v0) =(u† − u0

) (v† − v0

)= max

(u,v)≥(u0,v0)(u− u0) (v − v0) =: M,

94Das heißt, daß a = (u, v) ∈ Ω auch a′ = (v, u) ∈ Ω impliziert.95Als Funktion, die jedem Polyeder und jedem Startwert (Status quo) eine Losung zuordnet.

Page 65: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

4.2 Nash–Gleichgewicht 63

und somit auchu∗ − u0

u† − u0

=v† − v0

v∗ − v0

=: w > 0. (4.8)

Außerdem gehort naturlich der Mittelpunkt a = 12

(a∗ + a†

)auch zur konvexen Menge Ω(A)

und erfullt a ≥ a0, sowie, unter Verwendung von (4.8)

(u− u0) (v − v0) =

(u∗ − u0

2+u† − u0

2

)(v∗ − v0

2+v† − v0

2

)=

1

4(u∗ − u0) (v∗ − v0)

(1 +

u† − u0

u∗ − u0

)(1 +

v† − v0

v∗ − v0

)=M

4

(1 + w−1

)(1 + w)

Nun ist aber fur jedes w > 0,(1 + w−1

)(1 + w) = 1 +

w2 + 1

w+ 1 = 4 +

w2 − 2w + 1

w= 4 +

(w − 1)2

w≥ 4 (4.9)

und somit ist entweder w = 1, also a∗ = a† oder es gilt die strikte Ungleichung in (4.9), diesofort zum Widerspruch

(u− u0) (v − v0) > M = max(u,v)≥(u0,v0)

(u− u0) (v − v0)

fuhrt.

Die als 1 aufgelistete Invarianz unter Umskalierung des Nutzens96 sieht man ganz einfach ein:Ist a∗ ≥ a0 die Nash–Losung, dann gehort naturlich

a∗1 = Da∗ + y =

[c 00 d

] [u∗

v∗

]+

[xy

]=

[cu∗ + xdv∗ + y

]zu Ω1, erfullt a∗1 ≥ a1 und außerdem ist fur jedes a = (cu+ x, du+ y) ∈ Ω1 die Ungleichung

(c u+ x− u1) (d v + y − v1)

= (c u+ x− c u0 − x) (d v + y − d v0 − y) = cd (u− u0) (v − v0)

≤ cd (u∗ − u0) (v∗ − v0) = (c u∗ + x− c u0 − x) (d v∗ + y − d v0 − y)

= (u∗1 − u1) (v∗1 − v1)

erfullt, weswegen a∗1 die Nash–Losung zu Ω1 und a1 sein muss.Eigenschaft 2 aus Satz 4.10 bezeichnet man als Pareto–Optimalitat und besagt, daß es

“rechts oben” von der Nash–Losung a∗ keinen weiteren Punkt mehr geben kann. Anders ge-sagt: Wurde man eine Verhandlung mit a∗ als Status quo beginnen, dann kann man sich dasgenauso gut sparen. Bewiesen ist sie ganz einfach: da a ≥ a∗ ≥ a0 ist

(u− u0)︸ ︷︷ ︸≥u∗−u0

(v − u0)︸ ︷︷ ︸≥v∗−u0

≥ (u∗ − u0) (v∗ − v0)

96Denn nichts anderes beschreibt diese Transformation: Die Werte u bzw. v, die den Nutzen beschreiben, dendie Spieler jeweils aus einer Konfiguration ziehen, werden affin transformiert, also auf relativ einfache Weiseumskaliert.

Page 66: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

64 4 VERHANDLUNGSSPIELE, GLEICHGEWICHTE UND DIE NUTZENFRAGE

und Lemma 4.11 liefert sofort, daß a∗ = a sein muss.Daß man “uberflussige” Teile von Ω(A) nicht zu berucksichtigen braucht, ist die Aussage

von Eigenschaft 3, die sofort aus der Tatsache folgt, daß in

(u∗ − u0) (v∗ − v0) = maxa0≤(u,v)∈Ω

(u− u0) (v − v0)

≥ maxa0≤(u,v)∈Ω′

(u− u0) (v − v0) ≥ (u∗ − u0) (v∗ − v0)

uberall Gleichheit gelten muss.Um unsere Liste der Eigenschaften der Nash–Losung zu vervollstandigen, mussen wir nur

noch Punkt 4, die Symmetrie der Losung fur symmetrische Spiele, nachweisen. Sei a∗ Nash–Losung, also insbesondere (u∗, v∗) ≥ (u, u), u = u0 = v0. Setzen wir nun a] := (v∗, u∗), dannist wegen der Symmetrie a] ∈ Ω und es gelten trivialerweise

a] ≥ (u, u) sowie (u∗ − u) (v∗ − u) = (v∗ − u) (u∗ − u) ,

also ist a] ebenfalls eine Nash–Losung, die wegen der Eindeutigkeit, Lemma 4.11, gleich a∗

sein muß. Und somit ist eben u∗ = v∗.Wie man sieht war die Verifikation der Eigenschaften doch gar nicht so schlimm. Was jetzt

noch fehlt, ist die Tatsache, daß es genau eine Losungsfunktion a∗ = F (Ω,a0) mit den obi-gen Eigenschaften gibt, die dann naturlich die Nash–Losung sein muß. Um das zu beweisen,beginnen wir mit einem beliebigen konvexen Ω ⊂ R2 und einem Status quo a0, fur den

a ∈ Ω : a ≥ a0 6= a0

ist97, und sei a∗ die zugehorige Nash–Losung, also das Optimum aus (4.7). Nun skalieren wirdas Problem so zu Ω1, um, daß a1 = 0 und a∗1 := Da∗ + y = (1, 1) ist, indem wir

D = [diag (u∗ − u0, v∗ − v0)]−1 , y = −Da0 ⇒ Da∗ + y = D (a∗ − a0) =

[11

]wahlen. Kein Punkt a ∈ Ω1 \ (1, 1) kann ≥ (1, 1) sein, denn fur einen solchen Punkt warea = D−1 (a− y) ein Punkt in Ω, der

(u− u0) (v − v0) > (u∗ − u0) (v − v0)

erfullen wurde. Als nachstes symmetrisieren wir Ω1 zu Ω2:

Ω2 = Ω1 ∪ (v, u) : a = (u, v) ∈ Ω1

und halten fest, daß (1, 1) ∈ Ω2 liegt, aber daß es keinen Punkt a aus Ω2 geben kann, sodaß a ≥ (1, 1) ist, denn ware u ≥ 1 und v ≥ 1, dann ist sowohl (u, v) ≥ (1, 1) als auch(v, u) ≥ (1, 1) und mindestens einer der beiden Punkte gehort zu Ω1. In Ω2 ist also (1, 1)ein Pareto–optimaler Punkt (Eigenschaft 2) und da der Status quo (0, 0) war, muß nach Eigen-schaft 4 auch die Optimallosung ein symmetrischer Punkt sein, also ist (1, 1) = F (Ω2,0). Nach

97Der Status quo soll nicht schon Pareto–optimal sein!

Page 67: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

4.2 Nash–Gleichgewicht 65

Eigenschaft 3 ist die Symmetrisierung irrelevant und somit ist auch (1, 1) = F (Ω1,0) und dieRucktransformation liefert im Zusammenspiel mit Eigenschaft 1, daß

a∗ = F (Ω,a0) ,

wie behauptet. Damit ist Satz 4.10 dann auch vollstandig bewiesen.

Beispiel 4.12 Kehren wir zu unserem Beispiel 4.1 zuruck und suchen dort nach dem Nash–Gleichgewicht, der Einfachheit halber mit dem Status quo (0, 0) ∈ Γ(A). Wegen der Symmetriedes Bereichs Ω(A) brauchen wir nur entlang der Linie x = y zu maximieren und da die Funk-tion x2 monoton steigend ist, ist die Nash–Losung selbstverstandlich gerade der in Abb. 4.2eingezeichnete Punkt

(32, 3

2

).

Man kann nun trefflich daruber streiten, ob die Nash–Losung wirklich fair ist, oder man kannsich auf den mathematischen Standpunkt stellen und eine “faire” Losung ganz einfach als Nash–Losung definieren. Letzteres hat den Vorteil, daß man eine konsistente und widerspruchsfreieDefinition erhalt, aber den Nachteil, daß diese Definition manchmal ein klein wenig dem wi-derspricht, was man sich intuitiv unter Fairness vorstellt. Andererseits ist es aber nie garantiert,daß intuitive Begriffe in sich konsistent und widerspruchsfrei sind, siehe [2] fur ein besonders“eindrucksvolles” Beispiel.

Kritikpunkte an Nashs Konzept sind bereits in [15] aufgefuhrt, manche davon eher obskurerNatur, manche durchaus interessanter.

Beispiel 4.13 (Zwei Rauber) Zwei Rauber, nennen wir sie Roller und Spiegelberg, siehe [27],sollen die Beute von 100 Dukaten untereinander aufteilen – wenn sie es nicht schaffen, dannbekommt keiner von beiden was. Da es sich um 100 Munzen handelt, hat jeder von den beidenSpielern 101 Strategien zur Verfugung, je nachdem, wie viele Munzen er fur sich einfordert. DerAuszahlungsbereich Γ(A) besteht dann aus diesen 101 Punkten (j, 100 − j), j = 0, . . . , 100,sowie dem Punkt (0, 0) und die konvexe Hulle davon ist das Dreieck, das von den drei Punkten(0, 0), (0, 100) und (100, 0) gebildet wird, siehe Abb. 4.4.

Die Nash–Losung zu Beispiel 4.13 ist nicht schwer zu erraten, es ist die gerechte Teilung(50, 50). Der erste Einwand ist, daß die Rollen nicht fair sein mussen, daß beispielsweise Rollerreich und gierig ist und lieber die Sache platzen lasst, bevor er nicht deutlich mehr als Spiegel-berg bekommt, daß andererseits Spiegelberg uber alles froh ist, was er bekommt. Oder aber diegerechte Teilung konnte fur Spiegelberg nutzlos sein, weil er mindestens 60 Dukaten braucht,um seine Schulden zuruckzuzahlen; ansonsten musste er ein Pfund Fleisch abgeben98. Trotzdemist der Einwand vergleichsweise unbegrundet, denn eigentlich ist hier schlichtweg die Nutzen-funktion falsch modelliert. Wenn ein Spieler mit einer Auszahlung u < 60 nichts anfangenkann, dann ist sein Nutzen halt 0 und der Wert u = 0 ware viel angebrachter.

Beim zweiten Beispiel aus Abb. 4.4 hat die Nash–Losung den Wert (50, 12.5) und nunfuhlen sich beide Spieler unfair behandelt:

98Was jetzt aber mit Schiller weniger zu tun hat, bei dem Nathan schließlich der Weise und nicht der Kaufmannvon Mannheim war.

Page 68: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

66 4 VERHANDLUNGSSPIELE, GLEICHGEWICHTE UND DIE NUTZENFRAGE

100

100

100

25

Abbildung 4.4: Die Bereiche Ω(A) zu Beispiel 4.13 und dessen Variante. Der Auszah-lungsbereich besteht nur aus der blauen Linie und dem Nullpunkt, erst durch die konvexeHulle gewinnt er wirklich “Dimension”.

• Spieler 1 beklagt, daß er auf 50 Einheiten verzichten muß wahrend Spieler 2 nur 12.5Einheiten abgeben muß.

• Spieler 2 jammert, daß Spieler 1 viel mehr bekommt als er, er mochte die Auszahlung diebeiden genau die gleiche Auszahlung liefert.

Man sieht: Was fair ist, liegt immer im Auge des Betrachters! Allerdings ist die Nash–Losungauch nicht unfair: Beide erhalten die Halfte der zur erreichenden Maximalauszahlung.

Diese Fairnessdiskussion legt es nahe, vielleicht doch einmal einen kleinen Exkurs in dieWelt des axiomatischen Nutzens zu machen – was ist der denn eigentlich?

4.3 Nutzen und Nutzenfunktionen

Eine Frage, die sich bei der Nash–Losung ganz naturlich stellt ist, wie man den Begriff des“Nutzens” eigentlich mathematisch modellieren soll, und welche Operationen da uberhauptvernunftig sind. Das ist sicherlich einer der Punkte, der eine Spieltheorie angreifbar macht:Einerseits muß so ein Nutzenbegriff eindeutig und konsistent definiert sein, sonst kann manmathematisch nichts damit anfangen, andererseits aber bringt das immer Vereinfachungen mitsich, an denen man “intuitiv” herummakeln kann – wie wir beim Nash–Gleichgewicht bereitsgesehen haben.

Die folgenden Axiome zur Festlegung eines Nutzenbegriffs, im Original “utility”, stammenaus [20]; was fast interessanter ist, ist die Diskussion bzw. “Verteidigung” dieses Begriffs aufden Seiten 15–31.

Page 69: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

4.3 Nutzen und Nutzenfunktionen 67

Ein Nutzen ist ein Element aus einer Menge N , die mit einer totalen Ordnung99 “>” verse-hen ist, und auf der die Operation

u, v ∈ N 7→ αu+ (1− α) v ∈ N , α ∈ [0, 1], (4.10)

definiert ist, die auch das tun, was man von Addition und Multiplikation erwartet:

αu+ (1− α) v = (1− α) v + αu,

β (αu+ (1− α) v) + (1− β)v = αβ u+ (1− αβ) v

Klar, die Moglichkeit der Konvexkombination braucht man, um einen erwarteten Nutzen

N 3 pTa =n∑j=0

pj aj, a ∈ N n, p ∈ Sn,

verwenden und berechnen zu konnen, der ja auch die Grundlage unserer gemischten Strategiendargestellt hat. Außerdem sollen die Operation und die Ordnung noch miteinander verbundensein:

u < v =⇒ u < αu+ (1− α) v < v, α ∈ (0, 1). (4.11)

Das heißt nichts anderes als daß der Nutzen dadurch vergroßert wird, wenn es eine gewis-se Wahrscheinlichkeit gibt, etwas nutzlicheres zu erwischen und verkleinert, wenn die Wahr-scheinlichkeit besteht, etwas weniger nutzliches abzubekommen. Das letzte Axiom ist eine ge-wisse “Stetigkeit” des zu erwartenden Nutzens: zu u < w < v gibt es α, β ∈ (0, 1), so daß

u < αu+ (1− α) v < w < β u+ (1− β) v < v. (4.12)

Mit anderen Worten: Liegt w vom Nutzen her strikt zwischen u und v, dann gibt es auch (sehrgroße) Werte α und (sehr kleine) Werte β, daß w auch zwischen diesen beiden Nutzen liegt.

Ubung 4.1 Zeigen Sie, daß der Rn+ mit den beiden folgenden totalen Ordnungen

1. x <` y falls xj = yj , j = 1, . . . , k − 1, xk < yk fur ein k ∈ 1, . . . , n,

2. x <g y falls |x|1 < |y|1 oder |x|1 = |y|1 und x >` y

Nutzenmenge ist. ♦Das ist die Schnellversion des Nutzensbegriffs – man kann nun eine Nutzenfunktion ν : N →R definieren, die naturlich monoton sein und die Eigenschaft

ν (αu+ (1− α) v) = α ν (u) + (1− α) ν (v)

haben sollte, also eine affine Funktion auf N ist. Sind nun ν, µ zwei Nutzenfunktionen und seiφ so, daß φ µ = ν, φ : µ(N )→ ν(N ), ist100, dann ist φ ebenfalls monoton,

u < v ⇒ µ(u) < µ(v) ⇒ φ (µ(u)) = ν(u) < ν(v) = φ (µ(v))

99Im Gegensatz zu einer Halbordnung sind bei einer totalen Ordnung alle Elemente vergleichbar, d.h., fur a 6= bgilt entweder a < b oder a > b.

100Wir machen hier keinerlei Annahmen an Stetigkeit oder dergleichen.

Page 70: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

68 4 VERHANDLUNGSSPIELE, GLEICHGEWICHTE UND DIE NUTZENFRAGE

und es ist

φ (αµ(u) + (1− α)µ(v)) = (φ µ) (αu+ (1− α) v)

= ν (αu+ (1− α) v) = α ν (u) + (1− α) ν (v) = α (φ µ) (u) + (1− α) (φ µ) (v)

= αφ (µ(u)) + (1− α)φ (µ(v)) .

Vorausgesetzt, daß #µ(N ) ≥ 2 ist101, heißt dies nun aber, daß φ : R→ R eine affine Funktionsein muß, also

φ(x) = ax+ b, a, b ∈ R,

und alle Nutzenfunktionen weichen also nur durch die Skalierung a und den “Grundnutzen” bvoneinander ab.

Was wir bisher ganz unterschlagen haben war die Frage, ob es sich bei dem Nutzen um denindividuellen Nutzen eines einzelnen Spielers handelt, oder aber um einen universellen Nutzen,auf dem die Entscheidungen aller Spieler basieren. Daß der Ubergang von individuellen zuuniversellen Praferenzen allerdings nicht nur schwer, sondern sogar unmoglich ist, das ist dieLektion, die wir im nachsten Kapitel lernen werden.

4.4 Der Satz vom DiktatorEiner der faszinierendsten und am leichtesten missinterpretierbarsten Satze, die mir personlichuntergekommen sind, ist der Satz von Arrow, [1], der auch gerne als Paradoxon bezeichnet wird.Andererseits belegt er eigentlich nur die alte Weisheit “Man kann’s nicht allen recht machen”.Im Beweis dieses Satzes folgen wir dem Buch von Jacobs [12], das eine nette Sammlung voninteressanten mathematischen Einzelproblemen102 darstellt, die im engeren oder weiteren Sinnemit Kombinatorik zu tun haben.

Mathematisch gesehen103 besteht das Problem, das wir untersuchen wollen, in der Frage,ob und wie man aus individuellen Praferenzen eine universelle Praferenzordnung konstruierenkann, die gewissen “demokratischen” Spielregeln genugt.

Beispiel 4.14 Eine Reisegruppe aus n Personen will bei einer Stadtbesichtigung k Ziele be-sichtigen und soll sich uber die Besuchsreihenfolge einigen. Dazu hat jeder Reisende an seinemPlatz ein kleines Kastchen, in dem er oder sie die Reihenfolge eintippen kann, ein Compu-ter104 bestimmt dann mit einem entsprechend cleveren Programm die Reihenfolge, in der dieSehenswurdigkeiten abgeklappert werden.

Was bedeutet das nun mathematisch? Jede der n Personen definiert auf der Menge

Nm := 1, . . . ,m = 1 + Zm, 0, . . . ,m− 1 = Zm ' Z/mZ101Aber das wollen wir nun doch schon mal annehmen, denn sonst haben wir ein Problem mit “<”!102Unter anderem findet man dort auch den “Heiratssatz”, Codierungstheorie, Schubfachprinzip fur Fortgeschrit-

tene (Ramsey–Theorie) und noch einiges mehr.103Und darum geht es uns ja eigentlich.104Ware es ein Raumschiff, so hieße der naturlich HAL.

Page 71: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

4.4 Der Satz vom Diktator 69

eine totale Ordnung ≺j , das heißt, eine Ordnung, bei der fur zwei Alternativen a 6= b ∈ Nk

entweder a ≺j b oder b ≺j a gilt: Alle Paare von Elementen sind vergleichbar. Und die Aufgabebesteht nun darin, aus diesen n totalen Ordnungen ≺j , j ∈ Nn eine universelle Ordnung ≺ aufNk zu konstruieren, die naturlich auf vernunftige Art und Weise die individuellen Praferenzenmit einbezieht. Wir konnen Praferenzen aber auch noch anders interpretieren, namlich als Per-mutationen der Menge Nk, also Bijektionen σj : Nk → Nk, wobei σj(a) < σj(b) genau danngilt, wenn a ≺j b ist. Die Menge aller Permutationen von Nk bezeichnen wir mit P (Nk). Wirwerden σj und ≺j mehr oder weniger synonym verwenden, je nachdem, welches von beidenuns gerade sympatischer ist bzw. nutzlicher oder anschaulicher erscheint.

Definition 4.15 (Soziale Entscheidungsfunktion) Eine totale Ordnung≺ auf Nm heißt sozia-le Entscheidungsrelation zu den Ordnungen105 ≺j , j ∈ Nn, wenn sie die folgenden beidenBedingungen erfullt:

1. (Einstimmigkeit)a ≺j b, j ∈ Nn =⇒ a ≺ b

2. (Unabhangigkeit) Sind ≺j und ≺′j , j ∈ Nn, zwei Satze von individuellen Ordnungsrela-tionen mit

j : a ≺j b =j : a ≺′j b

, a 6= b,

und ≺, ≺′ die zugehorigen sozialen Entscheidungsrelationen, dann gilt

a ≺ b ⇔ a ≺′ b.

Eine Abbildung d : Pn (Nk)→P (Nk), σ = d (σ1, . . . , σn), heißt soziale Entscheidungsfunk-tion, wenn ≺ fur alle ≺1, . . . ,≺n eine soziale Entscheidungsrelation zu ≺1, . . . ,≺n ist.

Kommentieren wir noch schnell die beiden Axiome. Einstimmigkeit ist naheliegend: Wennallen a lieber ist b, dann sollte sich das naturlich auch in der universellen Vorliebe niederschla-gen. Die Unabhangigkeit hingegen ist ein wenig kniffliger, aber trotzdem nicht abwegig: DieEntscheidung wird ja demokratisch getroffen, und wenn eine Teilmenge J ⊂ Nn sich mit derEntscheidung a ≺ b durchsetzt, dann gehen wir davon aus, daß dies nach einem wohluberlegtendemokratischen Prozeß erfolgt ist, und dieser Prozess soll immer dasselbe Ergebnis liefern, so-lange diese Mehrheit nur die Alternative a der Entscheidung b vorzieht – wie groß der Abstandzwischen den beiden ist und was die anderen machen, das soll keinen Einfluß haben.

Ist man einmal von der Vernunftigkeit der beiden Axiome in Definition 4.15 uberzeugt, dannkommt schnell die Enttauschung, denn es gibt nicht viele soziale Entscheidungsfunktionen unddie sind obendrein nicht sonderlich sozial.

Satz 4.16 (Satz vom Diktator, Arrow) Ist d : Pn (Nm) → P (Nm) eine soziale Entschei-dungsfunktion und m > 2, dann gibt es ein j ∈ Nn, so daß

d (σ1, . . . , σn) = σj, (4.13)

105Die Bedeutung dieser Ordnung soll, in Anlehnung an Beispiel 4.14, “kommt vor” sein, aber nicht eine Nut-zenrelation. Alle, denen das nicht passt, sollen die Relation halt im Geiste umdrehen.

Page 72: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

70 4 VERHANDLUNGSSPIELE, GLEICHGEWICHTE UND DIE NUTZENFRAGE

das heißt,≺=≺j und die unverselle Praferenz entsteht durch Auswahl eine individuellen Prafe-renz.

Bemerkung 4.17 (Diktaturen sind demokratisch) Fur j ∈ Nn definiert (4.13) eine sozialeEntscheidungsfunktion.

Beweis: Ist a ≺k b, k ∈ Nn, dann ist naturlich auch a ≺j b und somit a ≺ b – Einstimmigkeitist gewahrleistet. Andererseits ist aber fur beliebige a 6= b

a ≺ b ⇔ j ∈ J = k ∈ Nn : a ≺k b

unda ≺′ b ⇔ j ∈ J ′ = k ∈ Nn : a ≺′k b

und solange J = J ′ ist, gehort j zu beiden oder zu keiner der Mengen, weswegen auch dieUnabhangigkeit erfullt ist.

Um zu zeigen, daß fur soziale Entscheidungsfunktionen tatsachlich nur Diktaturen ubrigblei-ben, mussen wir naturlich ein bißchen mehr Arbeit investieren. Beginnen wir mit einem wei-teren Begriff, der uberhaupt nur dank der Unabhangigkeitsregel sinnvoll ist, ansonsten aberziemlich einleuchtend.

Definition 4.18 (Mehrheit) Eine Menge J ⊂ Nn heißt Mehrheit fur106 a, b ∈ Nm bezuglichder sozialen Entscheidungsfunktion d, wenn

a ≺j b, j ∈ J,b ≺j a, j ∈ Nn \ J

⇒ a ≺ b.

Lemma 4.19 (Mehrheiten sind Mehrheiten) Ist J ⊂ Nn eine Mehrheit fur ein Paar a, b ∈Nm von Alternativen, dann ist J eine Mehrheit fur alle x, y ∈ Nm

Beweis: Ist m = 2, dann gibt es uberhaupt nur den eine Vergleich zwischen a und b undLemma 4.19 gilt trivialerweise.

Im interessanten Fall m ≥ 3 wahlen wir drei verschiedene Elemente a, b, c ∈ Nm undwahlen σ1, . . . , σn so, daß107 σj (a, b, c) = 1, 2, 3 und

a ≺j b ≺j c, j ∈ J, und b ≺j c ≺j a, j 6∈ J.

Nach der Einstimmigkeitsregel folgt dann sofort, daß

b ≺ c und a, b, c ≺ Nm \ a, b, c,

und da J eine Mehrheit fur a, b ist, folgt auch a ≺ b, also insgesamt

a ≺ b ≺ c ≺ Nm \ a, b, c. (4.14)

106Achtung, die Reihenfolge spielt hier eine Rolle!107Mit andern Worten: a, b, c sind auf jeden Fall die drei kleinsten, also beliebtesten Elemente fur alle Individuen.

Page 73: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

4.4 Der Satz vom Diktator 71

Nach der Unabhangigkeitsregel konnen wir nun aber die absoluten Reihungen von a, b, c be-liebig verandern, solange nur ihre relativen Reihenfolgen beibehalten werden, also gilt immernoch, daß

a ≺j b ≺j c, j ∈ J,b ≺j c ≺j a, j 6∈ J

⇒ a ≺ b ≺ c.

Betrachten wir hier nur das Auftreten von a, c, und ignorieren wir b ganz einfach108, dann sehenwir, daß J auch eine Mehrheit (bzgl. d) fur a, c ist. Ganz analog zeigt man auch, daß

c ≺j a ≺j b, j ∈ J,a ≺j b ≺j c, j 6∈ J

⇒ c ≺ a ≺ b

und erhalt, daß J auch eine Mehrheit fur c, b ist. Mit anderen Worten: Ist J eine Mehrheit fura, b und ist c 6= a, b, dann ist J auch eine Mehrheit fur a, c und c, b, wir konnen also jedes derbeiden Elemente durch jedes andere ersetzen. Durch den Austausch

a, b→ a, y → x, y

kommen wir also in zwei Schritten von a, b zu jedem anderen Paar, fur das J ebenfalls eineMehrheit sein muß.

Was wir jetzt noch zeigen mussen, ist daß aufgrund der Axiome jede Mehrheit einelementigsein muß, also jeder Mafia einen Paten hat, der allein den Gang der Dinge bestimmt. Dazuwieder einen mathematischen, diesmal mengentheoretischen Begriff109.

Definition 4.20 (Filter) Ein System F von Teilmengen von X 6= ∅ heißt Filter in X , wenn

1. ∅ 6∈ F ,

2. F 3 A ⊆ B ⊆ X ⇒ B ∈ F ,

3. A,B ∈ F ⇒ A ∩B ∈ F ,

und Ultrafilter in X , wenn außerdem fur jedes A ⊆ X entweder A oder X \ A zu F gehort.

Diesen eher abstrakten Begriff konnen wir nun sofort mit Leben versehen, denn wir kennenbereits einen Ultrafilter.

Lemma 4.21 (Mehrheiten sind Ultrafilter) Das System aller Mehrheiten zu einer sozialenEntscheidungsfunktion d bildet einen Ultrafilter.

Beweis: Daß die leere Menge im Gegensatz zu Nn keine Mehrheit bildet, das leuchtet unmit-telbar ein und verifiziert obendrein Bedingung 1 aus Definition 4.20.

108Es ist wieder die Unabhangigkeitsregel, die uns das gestattet.109Der laut [12] “jedem gebildeten Mathematiker vertraut” sein sollte.

Page 74: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

72 4 VERHANDLUNGSSPIELE, GLEICHGEWICHTE UND DIE NUTZENFRAGE

Ist J eine Mehrheit und K ⊇ J , dann betrachten wir fur a, b, c ∈ Nm ein Meinungsbild, beidem

a ≺j b ≺j c, j ∈ J,b ≺j a ≺j c, j ∈ K \ J,b ≺j c ≺j a, j 6∈ K.

Weil J eine Mehrheit ist und a ≺j b, j ∈ J , sowie b ≺j a, j 6∈ J gilt, erhalten wir, daß a ≺ b,und die Einstimmigkeitsregel liefert außerdem b ≺ c, also a ≺ b ≺ c. Weil aber damit b ≺j c,j ∈ K, und c ≺j b, j 6∈ K, gilt, ist K ebenfalls eine Mehrheit, zuerst fur b, c, dann aber nachLemma 4.19 auch fur alle Alternativen.

Um zu zeigen, daß auch der Durchschnitt zweier Mehrheiten110 J,K eine Mehrheit bildet,setzen wir

a ≺j b ≺j c, j ∈ J ∩K,c ≺j a ≺j b, j ∈ J \K,b ≺j c ≺j a, j ∈ K \ J,c ≺j b ≺j a, j 6∈ J ∪K.

Das alte Spiel liefert, daß J eine Mehrheit fur a, b und K eine Mehrheit fur b, c ist, also a ≺b ≺ c sein muß. Weil aber auch

a ≺j c, j ∈ J ∩K, sowie c ≺j a, j 6∈ J ∩K,

erfullt sind, ist J∩K eine Mehrheit fur a, c und somit eine generelle Mehrheit, und damit bildendie Mehrheiten einen Ultrafilter.

Der Schlussel zum Diktator–Theorem ist nun der folgende Satz, der laut [12] auch schon Arrowbekannt war und von ihm verwendet wurde, und der besagt, daß in endlichen Mengen jederUltrafilter durch genau ein Element festgelegt wird.

Satz 4.22 Ist X endlich und F ein Ultrafilter in X , dann gibt es genau ein x ∈ X , so daß

F = A ⊆ X : x ∈ A .

Beweis: Da X endlich ist, ist auch F endlich und #F ≤ 2#X . Da Ultrafilter unter Durch-schnittbildung abgeschlossen sind, ist ⋂

A∈F

A =: A∗ ∈ F

und insbesondere A∗ 6= ∅. Hatte aber A∗ zwei oder mehr Elemente, dann wahlen wir einesvon diesen, nennen es a und stellen fest, daß entweder a oder X \ a zu F gehoren muß.Im ersten Fall ist dann aber A∗ = A∗ ∩ a = a einelementig, im zweiten Fall hingegen

110Und das ist eigentlich der Knackpunkt der ganzen Geschichte: Durchschnitte von Mehrheiten sollten irgend-wann nur noch Minderheiten sein!

Page 75: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

4.5 Das Gesetz des Schweigens 73

A∗ = A∗ ∩ (X \ a) = A∗ \ a, was in beiden Fallen ein Widerspruch ware. Also istA∗ = x und das ist genau das, was behauptet wurde.

Beweis von Satz 4.16: Da die Menge der Mehrheiten einen Ultrafilter bildet F , insbesonderealso nicht leer ist, muß es nach Satz 4.22, ein j ∈ Nn geben, so daß J genau dann eine Mehrheitist, wenn j ∈ J ist. Und das ist unser Diktator.

Bemerkung 4.23 Was ist nun das besondere Problem, das zum Diktatortheorem fuhrt? Ganzeinfach: Die Unabhangigkeitsregel fuhrt dazu, daß plotzlich der Durchschnitt zweier Mehrhei-ten wieder zur Mehrheit, und zwar zu universellen Mehrheit fur alle Alternativen wird, und daßentweder eine Menge oder deren Komplement Mehrheit sein muß. Den Ultrafilter als solchenbrauchen wir eigentlich nicht, aber wenn man was fur seine mathematische Allgemeinbildungtun kann, dann sollte man das tun.

4.5 Das Gesetz des SchweigensZum Abschluss besuchen wir nun noch einmal das Gefangendilemma, siehe Beispiel 1.1, dies-mal aber mit der “normalen” Auszahlungsmatrix111

A =

[(−3,−3) (6,−4)(−4, 6) (5, 5)

],

aus [15], die mittels

A =

[(6, 6) (6, 6)(6, 6) (6, 6)

]+ 10

[(−0.9,−0.9) (0,−1)

(−1, 0) (−0.1,−0.1)

]︸ ︷︷ ︸

=:A′

aus der Auszahlungsmatrix A′ der anteiligen Gefangnisstrafen112 hervorgeht. Sowohl in [15]als auch in [4] wird darauf hingewiesen, daß dieses Beispiel auf A. W. Tucker zuruckgeht, dieAuszahlungsfunktionen sind aber in den beiden Buchern unterschiedlich.

Der Auszahlungsbereich Γ(A) ist also jetzt das Bild des Einheitsquadrats unter der bilinea-ren Abbildung

f(x, y) =

[−3−3

]xy +

[6−4

]x(1− y) +

[−46

](1− x)y +

[55

](1− x)(1− y)

=

[1−9

]x+

[−91

]y +

[55

]=

[1 −9−9 1

] [xy

]+

[55

],

also ein gedrehtes und gestrecktes konvexes Viereck mit den Ecken[55

],

[6−4

],

[−46

],

[−3−3

].

Der konvexe Bereich Ω(A) ist aber die konvexe Hulle derselben Punkte, siehe Abb. 4.5, das111Strategie 1 ist hier “gestehen”.112Das lasst Raum fur eine individuelle Bewertung der Schwere des Vergehens.

Page 76: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

74 4 VERHANDLUNGSSPIELE, GLEICHGEWICHTE UND DIE NUTZENFRAGE

Abbildung 4.5: Der Auszahlungsbereich Γ(A) = Ω(A) zum “offiziellen” Gefangenendi-lemma.

heißt, Verhandlung der beiden Spieler besteht bestenfalls in der Absprache uber gemischte Stra-tegien und fur jeden symmetrischen Status quo muß das Nash–Gleichgewicht das Maximumauf der Gerade x = y, also der Punkt (5, 5) sein, der nun wieder zum Strategieepaar “Omerta”gehort. Mit anderen Worten: Ohne auch nur noch ein Wort daruber verlieren zu mussen, bestehtdie Optimalstrategie der beiden Gefangenen113 darin, zusammezuhalten und nicht auszusagen.

Daß dem so ist, das hat naturlich ein klein wenig mit der Auswahl der Zahlen zu tun, dennsolange die Summe der Diagonalwerte mit der Summe der Nebendiagonalwerte ubereinstimmt,fallt immer der bilineare Teil weg: Ist bei einem symmetrischen Spiel

A =

[(a, a) (b, c)(c, b) (d, d)

], a+ d = b+ c,

dann ist

f(x, y) =

[a+ d− b− ca+ d− b− c

]xy +

[b− dc− d

]x+

[c− db− d

]y +

[dd

]=

[b− dc− d

]x+

[c− db− d

]y +

[dd

]und das entsprechende Viereck hat die Ecken[

dd

],

[bc

],

[cb

],

[b+ c− db+ c− d

]=

[aa

].

In all diesen Fallen ist Verhandlung unnotig, da Γ(A) = Ω(A) bereits von Haus aus konvex ist.

113Sofern man nur das Nash–Gleichgewicht als faire Losung akzeptiert.

Page 77: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

4.5 Das Gesetz des Schweigens 75

Das Gefangenendilemma zeigt auch, daß die Nash–Losung durchaus vom Status quo ab-hangt. Starten wir namlich mit

a∗ =

[5 + ε

0

], 0 < ε <

1

2,

dann ist die Nash–Losung das Maximum von

(u− 5− ε) v, u > 5 + ε, v > 0, v ≤ 50− 9u,

das naturlich auf der Geraden v = 50− 9u angenommen wird und somit das Maximum von

p(u) = − (u− 5− ε) (9u− 50) = −9u2 + (95 + 9ε)u− 50 (5 + ε) ,

was naturlich an der Stelleu =

95 + 9ε

18, v =

5− 9ε

2,

angenommen wird, und die entspricht nun einer wirklichen gemischten Strategie.

Bemerkung 4.24 Die Anbhangigkeit des Nash–Gleichgewichts vom Status quo ist einerseitsvielleicht plausibel, wenn man bedenkt, daß das Verhandlungsergebnis oftmals vom Ausgangs-punkt abhangt, andererseits aber ein echter Kritikpunkt, weil es, wie im Beispiel des Gefange-nendilemmas nicht wirklich die Losung gibt, wenn nicht klar ist, von welchem Punkt aus die“Verhandlungen” starten.

Page 78: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

76 5 MEHRPERSONENSPIELE

Hundred years ago, the Art of War hadbeen formulated. It was a book of rules[. . . ] There were rules of position, oftactics, of the enforcement of discipline,of the correct organization of supplylines. The Art laid down the optimumcourse to take in every conceivableeventuality. It meant that warfare [. . . ]consisted of short periods of activityfollowed by long periods of people tryingto find things in the index.

T. Pratchett, Interesting times

Mehrpersonenspiele 5Es wird langsam Zeit fur die Theorie der Mehrpersonenspiele. Naturlich reicht es eigentlich,sich auf Nullsummenspiele zu beschranken, da sich ja jedes Nicht–Nullsummenspiel ganz ein-fach dadurch in ein Nullsummenspiel verwandeln lasst, indem man einen weiteren Spielereinfuhrt, der keine Strategien zur Verfugung hat, sondern nur die Gewinne der anderen Spielerkompensiert.

5.1 Einfache Dreipersonenspiele

Fangen wir einfach an, namlich mit einem Dreipersonen–Nullsummenspiel; wir wir schon wis-sen, besteht der große Unterschied zum Zweipersonenspiel in der Moglichkeit der Koalition,also beginnen wir doch einfach mit einem Spiel, das sich nur mit diesem Aspekt befasst.

Beispiel 5.1 (Mehrheit) Jeder Spieler wahlt die Nummer eines anderen Spielers. Wahlen sichzwei Spieler gegenseitig, bilden also eine Koalition oder Mehrheit, dann erhalten sie die Aus-zahlung 1

2, die der alleingelassene Spieler aufbringen muß, andernfalls erhalt keiner etwas.

Die Strategiemengen fur das Bei–Spiel 5.1, wie sie in Definition 2.1 eingefuhrt wurden, sindnun

S1 = 2, 3, S2 = 1, 3, S3 = 1, 2,

und die Auszahlungen sinda (2, 3, 1) = a (3, 1, 2) = 0

Page 79: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

5.1 Einfache Dreipersonenspiele 77

bzw.

a (2, 1, ·) =

1/21/2−1

, a (3, ·, 1) =

1/2−11/2

, a (·, 3, 2) =

−11/21/2

.Das Spiel ist offensichtlich symmetrisch und intuitiv fair. Eine Art, das Spiel zu spielen,

bestunde nun darin, daß jeder Spieler eine Munze wirft und je nach Ausgang die erste oderzweite Strategie wahlt. Das fuhrt zu insgesamt acht Moglichkeiten; die zugehorigen Auszah-lungen sind dann

(2,1,1) (2,1,2) (2,3,1) (2,3,2) (3,1,1) (3,1,2) (3,3,1) (3,3,2)Spieler 1 1/2 1/2 0 -1 1/2 0 1/2 -1Spieler 2 1/2 1/2 0 1/2 -1 0 -1 1/2Spieler 3 -1 -1 0 1/2 1/2 0 1/2 1/2

was fur alle drei Spieler den Erwartungswert 0 liefert, der sich auch durch andere Strategiennicht verbessern laßt. Und doch gibt es eine Alternative zum unabhangigen Spiel, namlich daßsich zwei Spieler vor dem Spiel darauf einigen, sich gegenseitig zu wahlen und den drittenSpieler außen vor zu lassen – das liefert ihnen dann einen sicheren Gewinn von jeweils 1

2.

Dieses Vorgehen ist von den Spielregeln nicht verboten, aber Verhandlungen bzw. Koaliti-onsbildung sind Aktionen, die außerhalb des eigentlichen Spiels mit seiner Auszahlungsfunk-tion stattfinden. Das ist nichts neues: Genau dasselbe Konzept hatten wir auch in Abschnitt 4.1,wo es genau darum ging, einen Vorteil zu erzielen, der sich “innerhalb” des Spiels, also mitunabhangigen Strategien nicht erzielen ließ!

Aber es gibt noch einen zweiten Aspekt der Dreipersonenspiele, namlich Kompensationen.Nehmen wir an, Spieler 1 bekame fur eine Koalition mit Spieler 2 die Auszahlung 1

2+ ε, 0 <

ε < 12, so daß fur Spieler 2 nur noch 1

2− ε ubrigbleibt, wahrend sich alle anderen Koalitionen

die Beute gerecht teilen. Das ist ein Dilemma fur Spieler 1, denn die beiden Strategien sind ja

• Koalition mit Spieler 2: Das ist zwar fur Spieler 1 sehr gut, aber Spieler 2 wird dieseKoalition nie eingehen, da er damit ja immer schlechter fahren wurde, als wenn er mitSpieler 3 koaliert.

• Koalition mit Spieler 3: Aus der Sicht von Spieler 1 ist das immer die schlechtere Wahl,also dominiert eigentlich die andere Strategie.

Wollen wir also die Methoden aus dem Zweipersonenspiel nicht komplett aufgeben, insbeson-dere das Konzept der dominanten Strategien114, dann muss es Spieler 1 erlaubt sein, bei denVerhandlungen im Vorfeld Spieler 2 einen gewissen Betrag anzubieten, beispielsweise die Zah-lung von ε.

Bemerkung 5.2 Mehrpersonenspiele beinhalten also Verhandlungen außerhalb der eigentli-chen Spielregeln, die somit auch nicht in der Auszahlungsfunktion widergegeben sind, und dieseVerhandlungen umfassen zwei Aspekte:

114Mit dem man so schon und elegant das Spiel “Stein, Schere, Papier, Brunnen” auflosen konnte.

Page 80: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

78 5 MEHRPERSONENSPIELE

1. Koalitionen,

2. Kompensationen.

Daß dies durchaus der Realitat entspricht sieht man immer wieder beim Postengeschacher inden sogenannten “Koalitionsverhandlungen”, die auch außerhalb des vom Gesetzgeber be-stimmten einfachen Mehrheitsspiels “Demokratie” stattfinden.

Im nachsten Schritt beschaftigen wir uns mit einer etwas komplexeren Version des einfachenMehrheitsspiels, namlich dem Fall unterschiedlicher Auszahlungen. Dieses Spiel kann mannoch vollstandig analysieren und genau das wurde auch in [20] gemacht; nachdem das ziemlichillustrativ ist, wollen wir’s uns mal im Detail ansehen.

Beispiel 5.3 (Mehrheit mit variabler Auszahlung) Kooperieren Spieler 1 und 2, so erhaltenSie von Spieler 3 den Betrag c, Spieler 1 und 3 zusammen erhalten den Betrag b und Spieler 1muß, wenn er in der Minderheit ist, den Betrag a herausrucken. Naturlich ware a, b, c > 0 einevernunftige Annahme, aber auch diese wollen wir im Moment nicht machen!

Wir betrachten die Situation aus der Perspektive115 von Spieler 1, der zwei Moglichkeiten hat:Koalition mit Spieler 2 und Koalition mit Spieler 3. Nehmen wir an, Spieler 1 mochte einenGewinn von x erzielen116, dann kann Spieler 2 bei einer Koalition mit Spieler 1 mit dem Betragc − x und Spieler 3 bei einer entsprechenden Koalition mit dem Betrag b − x rechnen. Wenndie Summe der beiden Betrage kleiner als a ist, dann waren Spieler 2 und Spieler 3 schlechtberaten, wenn sie mit Spieler 1 koalieren wurden, denn dann konnten sie ja zusammen spielenund sich a passend aufteilen. Mit anderen Worten, es sollte auf jeden Fall

(b− x) + (c− x) ≥ a ⇒ x ≤ −a+ b+ c

2(5.1)

gelten. Sind also nun x, y, z die Betrage, die die drei Spieler mindestens erreichen wollen, dannsollten die die Ungleichungen

x ≤ −a+ b+ c

2

y ≤ a− b+ c

2

z ≤ a+ b− c2

erfullen, um Koalitionen uberhaupt erst einmal moglich zu machen. Dasselbe gilt mit Gleichheitfur die maximalen “fairen” Auszahlungen α, β, γ, die andererseits auch wieder

α + β = c, α + γ = b, β + γ = a, (5.2)115Das reicht naturlich vollig, denn bis auf die konkreten Zahlen, die wir ja in keinster Weise angeordnet haben,

ist dieses einfache Mehrheitsspiel vollkommen symmetrisch.116Keine Voraussetzungen an das Vorzeichen von x!

Page 81: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

5.1 Einfache Dreipersonenspiele 79

erfullen mussen – schließlich handelt es sich ja um ein Nullsummenspiel. Damit es sich fur dieSpieler lohnt, eine Koalition einzugehen, sollte naturlich

0 ≤

α− (−a)β − (−b)γ − (−c)

=

α + aβ + bγ + c

= (α + β + γ) 1,

also0 ≤ α + β + γ =

−a+ b+ c

2+a− b+ c

2+a+ b− c

2=a+ b+ c

2=:

δ

2(5.3)

sein.

Lemma 5.4 Im Falle eines Nullsummenspiels ist δ ≥ 0.

Beweis: Eine Koalition aus den Spielern 1 und 2 kann von Spieler 3 den Betrag c gewinnenund nicht mehr. Andererseits ist der garantierte Mindestgewinn von Spieler 1 der Wert −a(namlich wenn er mit niemandem koaliert) und, analog, kann Spieler 2 ohne Hilfe von außen−b bekommen; zusammen ergibt das also −a− b und dieser Wert muß ≤ c sein117, also ist

c ≥ −(a+ b) ⇒ a+ b+ c ≥ 0,

wie behauptet.

Tatsachlich spielt diese Große δ eine ganz bedeutende Rolle: Ist namlich δ = 0, dann ist

α =−a+ b+ c

2=a+ b+ c

2− a =

δ

2− a = −a, β = −b, γ = −c,

und jeder Spieler erhalt denselben zu erwartenden Betrag, ganz egal ob er koaliert oder nicht.Umgekehrt ist die “Motivation” fur die Spieler, eine Koalition einzugehen, gerade der Betragδ/2, und zwar fur alle Spieler derselbe. Betrachtet man die modifizierten Auszahlungen

a′ = −a+δ

3= α− δ

6, b′ = −b+

δ

3= β − δ

6, c′ = −c+

δ

3= γ − δ

6,

dann istδ′ = a′ + b′ + c′ = −(a+ b+ c) + δ = 0

und wir konnen folgendes festhalten.

Bemerkung 5.5 Das Spiel hat fur die Spieler die einfachen Werte118 a′, b′, c′ und der Gewinndurch Koalitionen betragt δ/6. Umgekehrt verliert der Spieler, der von der Koalition ausge-schlossen wird, den Betrag δ/3. Dieser Wert ist derselbe fur alle Spieler.

Nochmals: Die Bildung von Koalitionen lohnt sich nach den obigen Uberlegungen genau dann,wenn sich durch die Koalitionen mehr erreichen lasst als durch Einzelspiel, also genau dann,wenn δ > 0 ist. Deswegen heißt ein Spiel wesentlich119, wenn δ > 0 ist und unwesentlich120 furδ = 0. Das wird eine zentrale Unterscheidung von Mehrpersonenspielen werden.

117Denn mehr ruckt Spieler 3 ja nicht raus.118Im Original [20] als basic values bezeichnet.119Im Original “essential”.120Welche Uberraschung: “inessential”.

Page 82: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

80 5 MEHRPERSONENSPIELE

5.2 Drei Personen und der volle FormalismusSchon langsam werden wir noch etwas mutiger und sehen uns jetzt einmal den “vollstandigen”Fall eines Dreipersonenspiels an. Dabei haben wir jetzt die drei Strategiemengen S1, S2, S3 unddie Auszahlungsfunktion a : S1×S2×S3 → R3 mit 1Ta = 0. Fur ein Strategiepaar s1, s2 undeine “Gegenstrategie” s3 erhalt dann eine Koalition aus den Spielern 1 und 2 von Spieler 3 denBetrag

a1 (s1, s2, s3) + a2 (s1, s2, s3) = −a3 (s1, s2, s3) ,

und wie die beiden den untereinander aufteilen, das ist eine Frage der Koalitionsbildung, diewieder “außerhalb” des eigentlichen Spiels geregelt werden muß. Eine gemischte Strategie derKoalition K = 1, 2 ist nun, eine gemeinsame gemischte Strategie fur jedes Strategiepaar(s1, s2) ∈ S1 × S2

pK =(pKj,k : 1 ≤ j ≤ m1, 1 ≤ k ≤ m2

)∈ Sm1m2 .

Die Auszahlung dieser gemischten Strategien ist nun fur eine gemischte Strategie von Spieler 3aus der Sicht der Koalition der Wert

a(pK ,p3

)=

m1∑k1=1

m2∑k2=1

m3∑k3=1

[a1 (k1, k2, k3) + a2 (k1, k2, k3)] pKk1,k2 pk3 .

Diese Formel konnen wir ubrigens auch schon wieder als ein Zweipersonenspiel auffassen, beidem die Koalition K gegen Spieler 3 spielt, und erhalten so, daß

c = maxpK

minp3

a(pK ,p3

)= min

p3

maxpK

a(pK ,p3

)sein muss. Die anderen beiden Werte, a und b leitet man analog aus dem Spiel ab, kann dann δund auch den potentiellen Gewinn aus dem Spiel berechnen.

Ein Wort noch zu den “gemeinsamen” gemischten Strategien pK der Koalition121: Sie erful-len ja per definitionem pKjk ≥ 0 und

m1∑j=1

m2∑k=1

pKj,k = 1,

und naturlich ist jedes

pK = p1 ⊗ p2 d.h.122 pKjk = p1jp

2k

auch so eine gemeinsame Strategie; das ist wieder der unabhangige Fall. Da die Ecken desSimplex Sm1m2 von den Punkten ejk = ej ⊗ ek gebildet werden, ist auch jede gemeinsameStrategie als Konvexkombination von unabhangigen Strategien darstellbar – und das ist nunwieder gerade das Konzept der Kooperation aus Abschnitt 4.1. Genauer sehen wir uns das dannan, wenn wir zu den Mehrpersonenspielen kommen.

121Ob diese Koalition willig, unwillig oder uberhaupt freiwillig ist, ist nicht uberliefert.

Page 83: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

5.3 Mehrpersonenspiele und Koalitionen 81

5.3 Mehrpersonenspiele und KoalitionenJetzt aber endlich zum allgemeinen Fall, einem n–Personenspiel mit Strategiemengen S1, . . . , Snund Auszahlungsfunktion a mit 1Ta ≡ 0.

Definition 5.6 Eine Koalition K ist eine Teilmenge von Nn; als Gegenkoalition bezeichnen wirihr Komplement K := Nn \K. Zu einer Koalition K seien

SK :=⊗j∈K

Sj und mK :=∏j∈K

mj

die Strategiemenge der Koalition und deren Machtigkeit. Eine (gemeinsame) Strategie derKoalition ist ein Vektor σ ∈ SK und eine gemischte Strategie ein Vektor pK =

(pKσ : σ ∈ SK

),

fur denpKσ ≥ 0,

∑σ∈SK

pKσ = 1.

gilt.

Da #SK = mK ist, konnten wir die gemischten Strategien auch in SmKansiedeln, und in der

Tat ist das wieder eine Multiindizierung pKσ , nur fassen wir die Eintrage von σ dann halt nichtnur als Strategien, sondern auch als Indizes von Strategien auf. Die Strategien, die die Spielerunabhangig voneinander, also ohne Absprache, erreichen konnen, sind von der Form

pKσ =∏j∈K

pjσj, pj =

(pj1, . . . , p

jmj

)(5.4)

und bilden zuerst einmal nur eine echte Teilmenge ImKvon SmK

.

Beispiel 5.7 Mit K = 1, 2 und m1 = m2 = 2, also p1 = (α, 1− α) und p2 = (β, 1− β)erhalten wir, daß

p11

p12

p21

p22

=

αβ

α (1− β)(1− α) β

(1− α) (1− β)

⇒ p11

p12

=p21

p22

1− β

und diese Eigenschaft haben naturlich nicht alle p ∈ S4.

Aber naturlich hilft uns hier wieder die Kooperation.

Ubung 5.1 Zeigen Sie, daß sich nicht alle gemischten Strategien pK ∈ SmKin der Form (5.4)

darstellen lassen.Hinweis: Es genugt bereits, den einfachsten Fall #K = 2 und m1 = m2 = 2 zu betrachten. ♦

Lemma 5.8 Jede gemischte Strategie der Koalition lasst sich durch Kooperation bilden, ge-nauer: [[ImK

]] = SmK.

Page 84: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

82 5 MEHRPERSONENSPIELE

Beweis: Die Idee ist die altbekannte: Fur jede reine Strategie σ gibt es eine zugehorige ge-mischte Strategie

pσ =

#K⊗j=1

ejσj

und dann istpK =

∑σ∈SK

pKσ pσ

eine Konvexkombination dieser Strategien, die sich durch vorherige Verhandlung und ein ge-meinsames Zufallsexperiment erreichen lasst.

Fur eine Koalition K und Gegenkoalition K wird das Spiel dann zum Zweipersonenspiel zwi-schen diesen Koalitionen, mit Auszahlungen123

a(σ, τ), σ ∈ SK , τ ∈ SK .

Um die Auszahlungen auch noch zu einer Zahl zu machen betrachten wir den charakteristischenVektor cK zu K, der definiert ist durch

(cK)j = χK(j) =

1, j ∈ K,0, j 6∈ K,

und erhalten die Auszahlung aus Sicht von K als

cTK a(σ, τ) = −cTK

a(σ, τ). (5.5)

Die Auszahlungsmatrix ist also

AK =[cTKa(σ, τ) : σ ∈ SK , τ ∈ SK

], (5.6)

und die erwartete Auszahlung fur (gemeinsame) gemischte Strategien

aK (pK ,pK) = pTKAK pK . (5.7)

Der nachste Begriff ist nur dank der Zweipersonentheorie, genauer dank des Minimaxtheo-rems 2.16, vernunftig definiert.

Definition 5.9 (Wert einer Koalition) Der Wert einer Koalition K ⊂ Nn ist der Wert des vonK und K gebildeten Zweipersonenspiels, also

v(K) = maxpK

minpK

a (pK ,pK) = minpK

maxpK

a (pK ,pK) . (5.8)

Die Funktion v : P (Nn) → R heißt auch charakteristische Funktion des Spiels; hierbeibezeichnet P(X) die Potenzmenge von X , also die Menge aller Teilmengen von X .

123Wenn es jemand braucht naturlich nach passender Umnumerierung der Spieler.

Page 85: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

5.3 Mehrpersonenspiele und Koalitionen 83

Die Aufteilung des Gewinns innerhalb einer Koalition ist immer noch eine ungeklarte Frage undwird es auch noch etwas bleiben. Hier wollen wir uns zuerst einmal ein paar Eingenschaftendes Wertes eines Spiels ansehen.

Proposition 5.10 Der Wert von Koalitionen hat die folgenden Eigenschaften:

1. v (∅) = v (Nn) = 0.

2. v(K) = −v(K).

3. Sind K,K ′ ⊂ Nn mit K ∩K ′ = ∅, dann ist124

v (K ∪K ′) ≥ v(K) + v (K ′) . (5.9)

4. Sind K1, . . . , Kk eine Partition von Nn, das heißt,

K1 ∪ · · · ∪Kk = Nn, Kj ∩Kj′ = ∅, j 6= j′,

dann istk∑j=1

v (Kj) ≤ 0. (5.10)

Beweis: Die leere Menge enthalt niemanden und kann daher auch nur Auszahlung 0 bekom-men. Andererseits ist fur K = Nn auch cK = 1 und damit

v (K) = maxp∈SmK

∑σ∈SK

pKσ 1Ta(σ)︸ ︷︷ ︸=0

= 0,

womit 1) bewiesen ist. Um 2) zu verifizieren setzt man (5.5) via (5.6) in (5.7) ein und erhaltdie Auszahlungsfunktion a

(pK ,pK

)aus der Sicht von K als −a

(pK ,pK

). Sei K = Nn \

(K ∪K ′) die Gegenkoalition zu K ∪ K ′ und seien pK∗ bzw. pK′∗ die Optimalstrategien fur K

gegen K ′ ∪K bzw. fur K ′ gegen K ∪K. Dann ist

v(K) + v (K ′) = minpK′∪K

cTK a(pK∗ ,p

K′∪K)

+ minpK∪K

cTK′ a(pK

∗ ,pK∪K

)≤ min

pK

cTK a(pK∗ ,p

K′

∗ ,pK)

+ minpK

cTK′ a(pK∗ ,p

K′

∗ ,pK)

= (cK + cK′)T︸ ︷︷ ︸

=cTK∪K′

minpK

a(pK∗ ,p

K′

∗ ,pK)

≤ maxpK∪K′

minpK

cTK∪K′ minpK

a(pK∪K

∗ ,pK)

= v (K ∪K ′) ,124. . . das Ganze mehr als die Summe seiner Teile!

Page 86: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

84 5 MEHRPERSONENSPIELE

wie behauptet. Der Beweis von 4) ist wieder einfacher und zeigt durch Iteration von (5.9) undVewendung von 1), daß

k∑j=1

v (Kj) ≤ v (K1 ∪ · · · ∪Kk) = v (Nn) = 0,

wie behauptet.

Bemerkung 5.11 Fur j ∈ Nn spielen die Großen

vj := v(j) = v (j) = maxpj∈Smj

minpK∈SmK

aj(pj,pK

), K := Nn \ j, (5.11)

eine ganz besondere Rolle, denn das ist die Mindestauszahlung, die Spieler j garantiert erhalt,selbst wenn sich alle anderen gegen ihn verbunden und die fur ihn schlechteste Strategie spielen,und die er erreichen kann, indem er unabhangig von seinen Mitspielern125 eine Strategie p∗ ∈Smj

wahlt.

Fur jeden der Spieler lohnt es sich also nur dann, einer Koalition beizutreten, wenn ihm dieseKoalition gegenuber dem Einzelspiel einen Vorteil bringt. Da das fur jeden Spieler gilt, wirdeine Koalition nur dann eingegangen werden, wenn

v(K) ≥∑j∈K

v(j)

ist, denn sonst bekommt mindestens ein Spieler weniger, als wenn er allein spielen wurde. DieBedingung oben ist aber automatisch erfullt, denn sie folgt direkt aus (5.9) – die einelementigeMengen sind trivialerweise disjunkt. Eine “gute” Koalition ist aber mit Sicherheit eine, dieden Spielern im Vergleich zum Einzelspiel einen “Mehrwert” bietet, bei der also die obigeUngleichung strikt gilt.

Definition 5.12 (Gewinnkoalition) Eine Koalition K ⊆ Nn heißt Gewinnkoalition, wenn sie

v(K) >∑j∈K

v(j) (5.12)

erfullt. Dies bezeichnet man126 auch als “Konvexitat” der Menge K, Mengen mit v(K) =∑j∈K v(j) werden flach genannt.

Addiert man zur Auszahlungsfunktion a (s1, . . . , sn) einen von allen Strategien unabhangigenWert b, dann ist das resultierende Spiel zur Auszahlungsfunktion a′ = a + b naturlich genaudann ein Nullsummenspiel, wenn

0 = 1Ta′ = 1T (a + b) = 1Tb

125Das klingt freundlicher als “Gegner”.126Genauer: [20].

Page 87: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

5.3 Mehrpersonenspiele und Koalitionen 85

ist. Fur j ∈ Nn ist dannv′(j) := v′ (j) = v(j) + bj

und die Wahl

bj = −v(j) +1

n

n∑k=1

v(k), j ∈ Nn, (5.13)

sorgt dafur, daß

v′(j) =1

n

n∑k=1

v(k) und 1Tb = −n∑k=1

v(k) +n∑k=1

v(k) = 0, j ∈ Nn. (5.14)

Andererseits ist das Spiel zu a′ aber aquivalent zu a und daher sind optimale Strategien deseinen auch optimale Strategien des anderen. Mit anderen Worten: Unter allen “strategisch aqui-valenten” Varianten des Spiels haben wir so diejenige gewahlt, bei der alle Spieler als “Ein-zelkampfer” denselben Gewinn bzw. Verlust erreichen konnen, was naturlich auch wieder eineForm von Symmetrie ist.

Definition 5.13 (Reduziertes Spiel) Das Spiel basierend auf a′ bzw. die Wertfunktion v′ heißenreduzierte Form von a bzw. von v, wenn

v′(1) = · · · = v′(n) =: −γ. (5.15)

ist.

Der Wert γ hangt nun wirklich nur vom Spiel ab und bildet daher eine wichtige Beschreibungs-große des Spiels. Daß dem so ist, das folgt aus der Tatsache, daß wir die Forderungen

v′(j) = v′(j + 1) ⇔ bj − bj+1 = v(j + 1)− v(j), j = 1, . . . , n− 1

und 1Tb = 0 in das lineare Gleichungssystem1 −1

. . . . . .1 −1

1 . . . 1 1

b =

v(2)− v(1)

...v(n)− v(n− 1)

0

“codieren” konnen, und die Determinante der zugehorigen Matrix ist n. Damit gibt es genaueine reduzierte Form des Spiels und auch die Zahl γ ist eindeutig und wohldefiniert.

Ubung 5.2 Zeigen Sie, daß

det

−1 1

. . . . . .−1 1

1 . . . 1 1

= n

ist. ♦

Page 88: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

86 5 MEHRPERSONENSPIELE

Lemma 5.14 Die Große γ aus (5.15) erfullt γ ≥ 0 und es gilt

−k γ ≤ v′(K) ≤ (n− k) γ, k = #K. (5.16)

Ist #K = 1, dann ist v′(K) = −γ, ist hingegen v′(K) = n − 1, dann ist v′(K) = γ. In denbeiden Extremalfallen tritt also einmal Gleichheit bei der unteren und einmal Gleichheit bei deroberen Abschatzung ein.

Die Beobachtung γ ≥ 0 hat eine interessante Konsequenz: In der ausgegelichenen reduzier-ten Form eines Spiels kann kein Spieler allein wirklich etwas gewinnen, in diesem Fall sindKoalitionen zum Gewinnen notig!Beweis: Nach (5.9) und Eigenschaft 1 von Proposition 5.10 ist

−n γ =n∑j=1

v(j) ≤ v (Nn) = 0,

also in der Tat γ ≥ 0. Analog ist

v′(K) ≥∑j∈K

v′(j) = −#K γ

und schliesslich auch

v′(K) = −v′(K)≤ −

∑j∈K

v′(j) = (n−#K) γ.

Daß v′(K) = −γ ist wenn #K = 1 ist, das ist einfach die Definition von γ, ist hingegen#K = n− 1, also K = Nn \ j, dann ergibt Eigenschaft 2) aus Proposition 2, daß

v′(K) = −v′ (Nn \K) = −v′(j) = γ

sein muss.

Noch einmal, weil es so wichtig ist:

Das Spiel und seine reduzierte Form sind, was die Strategien angeht, vollkommenaquivalent. Es genugt also fur die Untersuchung eines Spiels eigentlich immer, diereduzierte Variante des Spiels zu betrachten.

Definition 5.15 Das Spiel heiß wesentlich127, wenn γ > 0 ist und unwesentlich, wenn γ = 0ist.

Und die Begriffe sind tatsachlich sinnvoll gewahlt, denn die Quintessenz des Ganzen ist dieTatsache, daß unwesentliche Spiele keine Gewinnkoalitionen haben.

127Im Original “essential” und “inessential”

Page 89: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

5.3 Mehrpersonenspiele und Koalitionen 87

Proposition 5.16 Ein Spiel mit n > 2 Spielern ist genau dann unwesentlich, wenn

v (K ∪K ′) = v(K) + v (K ′) , K,K ′ ⊆ Nn, K ∩K ′ = ∅. (5.17)

Beweis: Nach (5.14) ist

γ = −v′(j) =1

n

n∑k=1

v(k), j ∈ Nn.

Außerdem gilt fur alle K ⊆ Nn

v′(K) = maxpK

minpK

∑σ∈SK

∑τ∈SK

cTKa′(σ, τ)pKσ pKτ

= maxpK

minpK

∑σ∈SK

∑τ∈SK

cTK (a(σ, τ) + b) pKσ pKτ

= v(K) + cTKb = v(K) +∑j∈K

bj = v(K) +∑j∈K

(−v(j) +

1

n

n∑k=1

v(k)

)= v(K)−

∑j∈K

v(j) + #K γ,

alsov′(K)−#K γ = v(K)−

∑j∈K

v(j). (5.18)

Ist das Spiel nun unwesentlich, also γ = 0, dann ist wegen (5.16) auch v′(K) = 0 fur alleK ⊆ Nn und somit ist

0 = v(K)−∑j∈K

v(j) ⇒ v(K) =∑j∈K

v(j), (5.19)

woraus (5.17) unmittelbar folgt. Ist umgekehrt (5.17) und damit auch (5.19) erfullt, dann liefert(5.18) fur alle K ⊆ Nn, daß v′(K) −#K γ = 0 sein muß. Wahlen wir speziell K als n − 1–elementige Teilmenge, dann ist nach Lemma 5.14 v′(K) = γ, also

0 = v′(K)−#K γ = γ − (n− 1)γ = (2− n) γ

und da wir es es mit einem Mehrpersonenspiel zu tun haben und somit n > 2 ist, folgt γ = 0.

Bemerkung 5.17 (Wesentlichkeit)1. Ein wesentliches Spiel muss mindestens drei Spieler haben. Diese intuitiv klare Aussa-

ge128 folgt aus der Tatsache, daß wir fur n = 2 und #K = 1 vor einer Koalition miteinem und n− 1 Teilnehmern stehen, die laut Lemma 5.14 die Bedingungen

−γ = v′(K) = γ ⇒ γ = 0

erfullem muss – das Spiel ist unwesentlich.128Wie bitte sollen bei einem Zweipersonen–Nullsummenspiel Koalitionen etwas bringen? Die einzige Koope-

ration bestunde darin, es bleiben zu lassen (also keiner gewinnt etwas und keiner verliert etwas) und lieber einenKaffee zu trinken.

Page 90: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

88 5 MEHRPERSONENSPIELE

−nγ

+nγ

0 1 2

nn−1n−2

Abbildung 5.1: Die “Bandbreite” fur v′(K) in Abhngigkeit von #K gemaß (5.16).

2. Reduzierte Dreipersonenspiele sind durch γ bereits vollstandig determiniert: Von Hausaus ist v′ (∅) = v′(K) = 0, per Definitionem v′(j) = −γ und fur jede Koalition K auszwei Spielern gilt

v′(K) = −v′(j) = γ, K = N3 \ j,

weswegen

v′(K) =

0, #K = 0, 3,−γ, #K = 1,γ, #K = 2,

sein muss.

3. So richtig beginnt der Spass also erst bei Vierpersonenspielen, bei denen zwar immernoch

v′(K) =

0, #K = 0, 4,−γ, #K = 1,γ, #K = 3,

zu sein hat, aber bei den Zweipersonenkoalitionen wird es jetzt interessant, denn diekonnen nun wirklich beliebige Werte zwischen −2γ und 2γ annehmen.

4. Fazit: Die n–Personen–Theorie beginn eigentlich erst bei n = 4.

5.4 Das Aufteilen der BeuteWahrend wir uns bisher uber die “inneren” Aspekte des Spiels Gedanken gemacht haben, alsodas, was durch die “Spielregeln”, das heißt, durch die Auszahlungsfunktion, festgelegt wurde,

Page 91: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

5.4 Das Aufteilen der Beute 89

wird es jetzt auch einmal Zeit, sich die “außeren” Aspekte anzusehen, bei denen es darum geht,welche Koalitionen gebildet werden sollen. Auch hier erst einmal etwas Terminologie.

Definition 5.18 (Aufteilungen) Ein Vektor α ∈ Rn heißt Aufteilung129, wenn

α ≥ v :=

v(1)...

v(n)

und 1Tα =n∑j=1

αj = 0 (5.20)

ist. Eine Koalition K ⊆ Nn ist wirksam fur α, wenn

v(K) ≥ cTKα =∑j∈K

αj (5.21)

gilt.

Eine Aufteilung gibt also fur jede Koalition, die fur sie wirksam ist, eine Moglichkeit an, denerreichten Gewinn (bzw. Verlust) so aufzuteilen, daß jeder Spieler mindestens das bekommt,was ihm durch Spiel “allein gegen alle” garantiert ist. Wir sind sogar großzugig, denn es mussnoch nicht einmal der gesamte Gewinn aufgeteilt werden, es steht ja nur “≥” in (5.21).

Definition 5.19 (Dominanz) Eine Aufteilung α dominiert eine Aufteilung β, in Zeichen α β,wenn es eine Koalition K 6= ∅ gibt, die fur α wirksam ist und fur die

αj > βj, j ∈ K, (5.22)

gilt.

Vorsicht! Dominanz ist keine Ordnungsrelation, es fehlt ihr namlich an der Transititivitat. Sokann es durchaus vorkommen, daß gleichzeitig α β und β α erfullt sind, ganz einfach,indem (5.22) fur unterschiedliche K erfullt ist. Ware nun die Dominanz transitiv, dann ware

α β α ⇒ α α

und es gabe eine nichtleere Koalition K, so daß αj > αj fur alle j ∈ K ist – ein ziemlicherWiderspruch.

Ubung 5.3 Finden Sie ein Paar α, β von Aufteilungen und eine charakteristische Funktion v,so daß gleichzeitig α β und β α erfullt sind. ♦

Definition 5.20 (Losung) Eine Menge L von Aufteilungen heißt Losung des Spiels, wenn

1. es zu keinem β ∈ L ein α ∈ L mit α β gibt,

2. es zu jedem β 6∈ L ein α ∈ L mit α β gibt.

129Im Original [20] “Imputation”, was laut www.quickdic.org mit “Beschuldigung” zu ubersetzen ist.

Page 92: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

90 5 MEHRPERSONENSPIELE

Eine Losung dominiert also alle beliebigen Auteilungen, aber keine Aufteilung in einer Losungwird von einer anderen Aufteilung in der Losung130 dominiert wird.

Bemerkung 5.21 Losungen sind die Aufteilungen, nach denen man suchen sollten und fur diesich die Spieler entscheiden sollten. Sie stellen den “Status quo” da, mit dessen Hilfe sichKoalitionen bilden sollten. Denn fur jede andere Aufteilung kann man eine Aufteilung in derLosung finden, die fur eine wirksame Koalition besser ist, so daß es fur die Angehorigen dieserKoalition besser ist, sich fur die Aufteilung aus der Losung zu entscheiden. In diesem Sinne istdie Losung die Menge aller “guten” Aufteilungen, fur die man sich entscheiden kann und sollte.

Nach so vielen Definitionen und Begriffen wird es langsam Zeit, diese ein wenig mit Leben zuversehen.

Proposition 5.22 Fur ein unwesentliches Spiel gibt es genau eine Aufteilung, namlich α = v,fur ein wesentliches Spiel einen (n−1)–dimensionales Kontinuum von Aufteilungen, der v nichtenthalt.

Beweis: Sei β = v + δ eine Auzsahlung, dann ist wegen (5.20) δ = β − v ≥ 0 und

1T δ = 1T (β − v) = 1Tβ︸︷︷︸=0

−n∑j=1

v(j)︸ ︷︷ ︸=−nγ

= n γ.

Ist das Spiel unwesentlich, also γ = 0, dann folgt aus δ ≥ 0 und 1T δ = 0 auch δ = 0, isthingegen γ > 0, dann wahlen wir δ1, . . . , δn−1 ≥ 0 so, daß

0 ≤ δn = nγ −n−1∑j=1

δj

erhalten bleibt. v + δ ist dann die gewunsche Aufteilung und muss wegen δ 6= 0 auch von vverschieden sein.

Korollar 5.23 Jede Losung L erfullt L 6= ∅.

Beweis: Es gibt mindestens eine Aufteilung, namlich v, und entweder haben wir es mit einemunwesentlichen Spiel zu tun, dann ist die eine Losung, oder das Spiel ist wesentlich, dann mussv durch ein α ∈ L dominiert werden.

Fur den Rest dieses Kapitels wollen wir uns auf die Suche nach Spielen machen, bei denen esdie Losung gibt, bei denen die Losung also nur aus einem einzigen Element besteht. Allerdingsist die Antwort auch wieder enttauschend131.

130Was aber nicht ausschließt, daß es außerhalb der Losung eine dominierende Aufteilung gibt, die nun aber ih-rerseits wieder von einer Aufteilung aus der Losung dominiert wird – Dominanz ist halt nun einmal nicht transitiv!

131Oder eben auch nicht – in dem Sinne, daß Leben und Spiel nun einmal komplex sind und es halt nicht diePatentlosung gibt.

Page 93: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

5.4 Das Aufteilen der Beute 91

Satz 5.24 Ein Spiel besitzt genau dann eine einelementige Losung, wenn es unwesentlich ist.

Auf dem Weg dahin wollen wir gleich noch ein paar andere Fakten sammeln, die uns auch wie-der etwas uber wesentliche und unwesentliche Spiele sagen werden und wie deren Aufteilungenaussehen.

Proposition 5.25 Ist das Spiel wesentlich und α eine Aufteilung, dann existiert immer eineAufteilung β, so daß β α, aber nicht α β gilt.

Beweis: Da das Spiel wesentlich ist, muß α 6= v sein, es gibt also mindestens einen Index j,und ε > 0, so daß

αj = v(j) + ε

ist. Wir setzen

βk =

αj − ε = v(j), j = k,αj + ε/(n− 1), j 6= k,

(5.23)

und behaupten, daß β eine Aufteilung ist. Tatschlich ist β ≥ v und

1Tβ = αj − ε+∑k 6=j

(αj +

ε

n− 1

)= 1Tα = 0.

Außerdem ist jede (n − 1)–elementige Koalition, insbesondere K = Nn \ j, wirksam furjede Auszahlung δ, insbesondere fur β, da sich nach der Komplementaritatsregel 2 aus Propo-sition 5.10 ∑

k∈K

δk = −δj ≤ −v(j) = v(K)

ergibt. Da außerdem trivialerweise K 6= 0 und nach Konstruktion in (5.23) βk > αk, k ∈ K,gilt, erhalten wir, daß β α. Ware nun auch α β, dann bedeutet das nach (5.23), daß wir die“entscheidende” Koalition K nur als j wahlen konnen, nur ist die leider nicht wirksam132 furα weil ja

v(K) = v(j) ≤ βj < αj =∑k∈K

αk

gelten muß.

Die Beobachtungen aus dem Beweis sammeln wir noch einmal gesondert auf.

Korollar 5.26 Koalitionen aus n− 1 Personen sind wirksam fur alle Aufteilungen, einelemen-tige Koalition sind in Sachen Dominanz bedeutungslos.

Und jetzt fehlen uns nur noch ein paar einfache Folgerungen aus Proposition 5.25 um mitSatz 5.24 ins Reine zu kommen.

132Zur Erinnerung: Die Koalition muß fur die dominierende Aufteilung wirksam sein.

Page 94: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

92 5 MEHRPERSONENSPIELE

Korollar 5.27 Eine undominierbare Aufteilung α, das heißt,

β ∈ Rn : β α = ∅

existiert genau dann, wenn das Spiel unwesentlich ist.

Beweis: Ist das Spiel unwesentlich, dann gibt es nach Proposition 5.22 ohnehin nur eine Auf-teilung, un das ist v – wer soll die dann noch dominieren. Ist hingegen das Spiel wesentlich,dann sagt uns Proposition 5.25, daß jede Aufteilung dominiert werden kann.

Korollar 5.28 Ein Spiel mit #L = 1 ist unwesentlich.

Beweis: Sei L = α. Weil L eine Losung ist, wird jedes β 6∈ L durch ein Element von Ldominiert und da #L = 1 ist, kann dieses dominante Element nur α sein, also:

β 6= α ⇒ β 6∈ L ⇒ α β.

Ware das Spiel nun wesentlich, dann gibt es aber, wieder nach Proposition 5.25, ein β, das nichtvon α und damit auch nicht von L dominiert wird.

Beweis von Satz 5.24: Ist #L = 1, dann ist das Spiel unwesentlich, siehe Korollar 5.28, ist dasSpiel unwesentlich, dann gibt es genau die eine Aufteilung v und L = v ist trivialerweisedie gewunschte einelementige Losung.

5.5 DreipersonenspieleUm ein wenig ein Gefuhl fur die Struktur von Losungen zu bekommen, wollen wir uns alsnachstes einmal die Situation im allereinfachsten Fall ansehen, und zwar bei einem reduzier-ten Dreipersonenspiel, bei dem wir der Einfachheit halber auch noch die Normierung γ = 1verwenden wollen. Der Wert von Koalitionen ist dann also

v(K) =

0, #K = 0, 3,−1, #K = 1,

1, #K = 2,

und es stellt sich die Frage, welche Struktur nun Losungen haben und wie uberhaupt Dominanzso aussieht. Eine Aufteilung α = (α1, α2, α3) muß also nun die Bedingungen

αj ≥ −1, α1 + α2 + α3 = 0

erfullen, was automatisch auch die Schranke αj ≤ 2 liefert. Außerdem haben wir es hier ja nurmit einer zweiparametrigen Menge zu tun, da sich aus den Nebenbedingungen ja α3 = −α1−α2

ergibt. Dies drei “Achsen” kann man naturlich in ein zweidimensionales Koordinatensystemeintragen und erhalt so schnell eine schone Darstellung des “zulassigen Bereichs” der Auftei-lungen, siehe Abb. 5.2. Fur einen Punkt α aus diesem Dreieck konnen wir uns nun mal alldiejenigen β ansehen, fur die α β gilt, und das ist bei Dreipersonenspielen eben noch sehr

Page 95: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

5.5 Dreipersonenspiele 93

α

β

γ

Abbildung 5.2: Die Nebenbedingung fur (α, β, γ), insbesondere die Bereiche, auf denen γkonstant ist (links) und der zulassige Bereich (rechts) fur die Aufteilungen – man sieht, esist wieder einmal ein Dreieck.

einfach: Nach Korollar 5.26 sind die einelementigen Koalitionen bedeutungslos, aber die zwei-elementigen mussen berucksichtigt werden, also

α β ⇔

α1 > β1, α2 > β2,α1 > β1, α3 > β3,α2 > β2, α3 > β3,

Diese Bereiche sind in Abb. 5.3 dargestellt. Ist andererseits keine der obigen Bedingungenerfullt und stimmen α, β in keiner Komponente uberein133, dann ist entweder α oder β in zweider Komponenten uberlegen und damit automatisch in der dritten unterlegen. Mit anderen Wor-ten:

αj 6= βj, j = 1, 2, 3, ⇒ α β oder β α.

Damit zerfallt also fur jedes α das Dreieck im wesenlichen in zwei Teile: Diejenigen Aufteilun-gen, die von α dominiert werden und diejenigen, die α dominieren.

Wie aber sieht nun eine Losung aus? Nachdem L 6= ∅, gibt es sicherlich ein α ∈ L ,das dann also irgendwie so wie in Abb. 5.3. Da sich Elemente der Losung nicht gegenseitigdominieren durfen, also

L ∩ β : α β = L ∩ β : β α = ∅

gelten muß, sind die schraffierten Bereiche aus Abb. 5.3 bereits tabu, und dasselbe gilt auch furdie nicht–schraffierten Bereiche, von denen ja α dominiert wird. Andererseits kann die Losungaber nicht nur aus α selbst bestehen, denn es muß ja zu jeder Aufteilung auch ein Element der

133Wenn sie in zwei Komponenten ubereinstimmen, dann naturlich auch in allen dreien und damit waren sieidentisch, und wenn sie in genau einer ubereinstimmen, dann liegen sie auf den farbigen Linien in Abb. 5.3.

Page 96: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

94 5 MEHRPERSONENSPIELE

α αβ

Abbildung 5.3: Links: Die von α dominierten Aufteilungen sind genau die schraffiertenBereiche; alle anderen Aufteilungen dominieren ihrerseits α. Nur die Punkte, die auf denfarbigen Linien liegen, sind nicht mit α vergleichbar, das heisst, weder dominieren sie α,noch werden sie von α dominiert.

Rechts: Jeder Punkt β α wird seinerseits wieder durch Punkte auf einer der farbigenLinien dominiert. Das sind die Schnittbereiche bzw. “Schatten” der gelben Zonen (in denennun wieder β dominiert wird) mit den farbigen Linien.

Losung geben, das diese Aufteilung dominiert. Nach unseren obigen Uberlegungen durfen wirdie anderen Elemente von L nun aber nur noch auf den drei farbigen Linien suchen, auf denenjeweils ein αj konstant ist, siehe Abb. 5.3, rechts.

Nehmen wir einmal an, daß wie im Bild β1 > α1 und β2 > α2 ist, also β3 < α3, dann sinddie dominanten Punkte auf der Linie von der Form

(α1, α2 + ε, α3 − ε) , ε ∈ [β2 − α2, α3 − β3] ,

bzw.(α1 + ε, α2, α3 − ε) , ε ∈ [β1 − α1, α3 − β3] ,

und daß diese Intervalle nichtleer sind, sieht man daran, daß

α3 − β3 − (β2 − α2) = α3 − β3 − β2 + α2 = β1 − α1 > 0

und entsprechend

α3 − β3 − (β1 − α1) = α3 − β3 − β1 + α1 = β2 − α2 > 0

ist. Und fur jedes β mit βj > αj , j = 1, 2, muss mindestens einer Punkt aus diesem Intervallebenfalls zu L gehoren. Wir sehen also: so einfach ist die Sache nicht mit den Losungen.

Page 97: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

5.5 Dreipersonenspiele 95

Gehen wir die Sache also etwas systematischer an. Das Spiel ist wesentlich, also bestehtdie Losung nach Satz 5.24 mindestens zwei Losungen, α 6= α′. Da die beiden Losungen ein-ander nicht dominieren durfen, mussen sie auf einer achsenparallelen Geraden im Dreieck derzulassigen Auflßungen liegen; ohne Einschrankung konnen wir annehmen, daß es sich hierbeium eine senkrechte Gerade handelt, daß also α1 = α′1 ist und weiterhin α2 < α′2 gilt134. Nun

αα’

αα’

β

β

Abbildung 5.4: Links: Die beiden Punkte α, α′ und der Bereich, den sie dominieren bzw.von dem sie beide dominiert werden. Wahrend man die beiden “weißen” Bereiche nochdadurch loswerden kann, daß man α ganz nach unten und α′ ganz nach oben schiebt, istder blaue Zwischenbereich unvermeidbar.

Rechts: Die beiden einzig moglichen Punkte β, β′ außerhalb der gemeinsamen Geradenvon α und α′.

konnen α und α′ zusammen keine Losung bilden, denn jeder Punkt δ der Form

δ =1

2(α + α′) +

(ε,−ε

2,−ε

2

), 0 < ε < min α′2 − α2, α3 − α′3 (5.24)

erfulltδ1 > α1 = α′1, α2 < δ2 < α′2 und α′3 < δ3 < α3,

also insbesondere

δ1 > α1, δ2 > α2 sowie δ1 > α′1, δ3 > α′3

und dominiert sowohl α als auch α′ ohne selbst von einem der beiden Punkte dominiert zuwerden, weswegen L = α, α′ keine Losung nicht sein kann. Diese Punkte sind gerade derhellblaue Bereich in Abb 5.4.

134Im Falle von Gleichheit waren sie ja auch schon wieder identisch.

Page 98: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

96 5 MEHRPERSONENSPIELE

Weitere Punkte der Losung konnen nun entweder auf der Geraden duch α und α′ liegen,oder aber nicht. Beginnen wir mit letzterem Fall, also mit der Existenz eine weiteren Losungs-elements β, das nicht β1 = α1 = α′1 erfullt. Da dieser Punkt weder α noch α′ dominieren darf,noch von einem der beiden dominiert werden darf, muß β auf den beiden anderen achsenparal-lelen Linien durch die beiden Punkten liegen – es gibt also maximal zwei weitere Punkte in L ,namlich

β = (α1 + α′2 − α2, α2, α3 − α′2 + α2) , β′ = (α1 − α′2 + α2, α′2, α3 + α′2 − α2) , (5.25)

siehe wiederum Abb. 5.4. Damit das gutgeht muß allerdings

α′2 − α2 < α3 + 1 bzw. α′2 − α2 < α1 + 1

sein – die beiden Punkte durfen also, relativ zur Position von α, nicht zu weit auseinanderlie-gen. Beide Punkte, β und β′, dufen aber nun auch wieder nicht zu L gehoren, denn sie sindnicht durch eine achsenparallele Gerade verbunden, das heißt, einer von beiden dominiert denanderen; und in der Tat ist

β′ − β = (α′2 − α2) (−2, 1, 2) ⇒ β′ β.

Nun ist aber L = α, α′, β auch wieder keine Losung, weil der Punkt δ aus (5.24) auch von

αα’

βα

α

β

Abbildung 5.5: Links: Der Punkt β aus (5.25) ist keine hilfreiche Erweiterung von α undα′, da der hellblaue Bereich immer noch undominiert bleibt.

Rechts: Die Auswahl β′ stimmt schon optimistischer, allerdings bleiben im allgemeinennoch drei kleine Dreiecke weiß, aber das kann man ja beheben, indem man α ganz nachunten, α′ ganz nach oben und β ganz nach rechts bewegt.

β nicht dominiert wird, da

δ − β =

(α1 + ε,

α2 + α′2 − ε2

,α3 + α′3 − ε

2

)− (α1 + α′2 − α2, α2, α3 − α′2 + α2)

Page 99: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

5.5 Dreipersonenspiele 97

=

(ε+ α2 − α′2,−

ε+ α2 − α′22

, α′2 − α2 −ε+ α′3 − α3

2

)= (−,+,+)

ist. Das sieht man ja auch in Abb. 5.5. Die andere Wahl, also β′, ist da schon vielversprechen-der135, aber es bleiben trotzdem mal erst noch drei kleine Dreiecke ubrig, die L = α, α′, βdominieren – es sein denn, wir schieben α ganz nach unten, α′ ganz nach oben und β ganz nachlinks, fordern also, daß, wieder mit (5.25),

α = (α1, α2, α3) = (α1,−1, 1− α1)

α′ = (α1, α′2, α

′3) = (α1, 1− α1,−1)

β′ = (2α1 − 2, 1− α1, 1− α1) = (−1, β2, β3)

sein muß, was genau fur α1 = 12

und somit

α =

(1

2,−1,

1

2

)α′ =

(1

2,1

2,−1

)β =

(−1,

1

2,1

2

)erfullt ist. Die von diesen drei Punkten gebildete Menge ist eine Losung und es ist die einzigedreipunktige, denn vertauscht man die Rolle der Geraden, entlang derer α und α′ ubereinstim-men sollen, dann vertauscht man nur einen der beiden Punkte mit β. Und diese Losung kommtuns sehr bekannt vor: Die Gewinnkoalition “zwei gegen einen” teilt die Beute jeweils fair auf,das ist genau die “naturliche” Losung, die man sich so naiv vorstellen wurde.

Bleibt noch ein Fall, namlich der, daß alle Punkte der Losung auf der Geraden ` durch αund α′ liegen. Nachdem kein Punkt dieser Geraden ` = β : β1 = α1 von L ⊆ ` dominiertwird136, aber jeder nicht zu L gehorige Punkt von einem Element aus L dominiert sein muß,bleibt uns nur eines ubrig:

L = ` = α : α1 = c fur ein c ∈ [−1, 2] .

Anstatt jetzt formal an die Sache heranzugehen, sehen wir uns einfach Abb. 5.6: Wenn c < 12

ist, dann dominiert die Linie tatsachlich alles, ist c = 12, dann sind wir im Fall der drei Punkte

und die Linie ist verboten, ist hingegen c > 12, dann zeigt die rechte Zeichnung in Abb. 5.6, daß

es immer ein nichtdominiertes Areal gibt, die Linie also keine Losung sein kann.

Satz 5.29 Das reduzierte und normalisierte Dreipersonenspiel besitzt genau die folgenden Los-ungen:

L =

(1

2,1

2,−1

),

(1

2,−1,

1

2

),

(−1,

1

2,1

2

)(5.26)

135Vielleicht ist das auch schon deswegen nicht so abwegig, weil ja β′ die dominante der beiden Auswahlen ist.136OK, es dominiert auch kein Punkt von ` die Losung L , es gibt immer Unvergleichbarkeit.

Page 100: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

98 5 MEHRPERSONENSPIELE

Abbildung 5.6: Schließlich noch der Fall, daß alle Losungen auf einer senkrechten Linie `liegen, also α1 = c ist.

Links: Der Wert von c ist hinreichend klein und die Linie dominiert alles. Um die Auftei-lungen links von ` “kummern” sich die beiden Extremalpunkte, alles was rechts von ` liegt,wird von einem der Zwischenpunkte dominiert.

Rechts: Ist der Wert von c so groß, daß die Linie rechts vom Dreieck der “naturlichenLosungen” liegt, dann kann das blaue Dreieck auf der linken Seite nicht mehr dominiertwerden, die Linie ist keine Losung.

undL = α : αj = c , j = 1, 2, 3, −1 ≤ c <

1

2. (5.27)

Bleibt noch die Interpretation der Losungen in (5.27). Beschranken wir uns wieder auf den Fallj = 1, dann ist also

L = (c, d,−d− c) : −1 ≤ d ≤ 1− c , −1 ≤ c <1

2.

Das heißt, daß in diesem Falle Spieler 2 und 3, die die Gewinnkoalition bilden, beschließenkonnnen, wieviel sie aus “Großzugigkeit” an Spieler 1, der an sich unterlegen ist, abgebenwollen. Die Art und Weise, wie dieses Almosen untereinander aufgeteilt wird, und genau dasist der zweite freie Parameter d, ist hierbei vollig frei. Oder, wie es in [20, 33.1.1, S. 289] erklartwird:

Since the excluded player is absolutely “tabu”, the threat of the partner’s desertionis removed from each participant of the coalition. There is no way of determiningany definite division of the spoils.

Incidentially: It is quite instructive to see how our concept of a solution as a set ofimputations is able to take care of this situation also.

Dem ist nichts mehr hinzuzufugen.

Page 101: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

99

Die Majoritat hat viele Herzen, aber einHerz hat sie nicht

O. von Bismarck

Einfache Spiele undMehrheiten 6

Zum Abschluß befassen wir uns jetzt noch mit Mehrpersonenspielen, bei denen es im Wesent-lichen auf die Struktur der Koalitionen und eben nicht auf die Auszahlungsfunktion ankommt.Eine ganz besondere Rolle spielen hierbei die sogenannten “einfachen Spiele”.

6.1 Gewinnkoalitionen, Verlustkoalitionen und einfache Spiele

Erinnern wir uns zuerst einmal an das Konzept eine Gewinnkoalition137 K ∈ K := P (Nn)von Definition 5.12, namlich, daß

v(K) >∑j∈K

v(j) (6.1)

gelten soll. Dieser Begriff ist naturlich nur fur wesentliche Spiele sinnvoll, bei unwesentlichenSpielen sind ja alle Koalitionen flach und es gibt insbesondere gar keine Gewinnkoalitionen.Nun bezeichnen wir mit G ⊂ K die Menge aller Gewinnkoalitionen, mit V ⊂ K hingegendie Menge aller Verlustkoalitionen. Das fuhrt sofort zu ersten einfachen Beobachtungen.

Proposition 6.1 (Gewinnkoalitionen) Fur ein wesentliches Spiel gilt:

1. G ∩ V = ∅, K = G ∪ V .

2. Ist K ∈ V , dann ist K ∈ G und umgekehrt.

3. Ist K ∈ G und K ⊆ K ′, dann ist K ′ ∈ G .

4. Ist K ∈ V und K ⊇ K ′, dann ist K ′ ∈ V .

5. K ∈ V wann immer #K ≤ 1 ist.

137Bei dieser “Definition im Vorubergehen” verwenden wir ab jetzt also “K ” fur die Menge aller Koalitionen,also die Menge aller Teilmengen von Nn, was wiederum nichts anderes ist als P (Nn).

Page 102: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

100 6 EINFACHE SPIELE UND MEHRHEITEN

Beweis: 1) ist offensichtlich, denn entweder gilt in (6.1) “>” oder “=”, aber nicht beidesgleichzeitig. Fur 2) nehmen wir an, daß K ∈ V ware. Dann ist

v(K) = −v(K)

= −∑j∈K

v(j) = −n∑j=1

v(j) +∑j∈K

v(j) = −n∑j=1

v′(j)︸ ︷︷ ︸=−nγ

+∑j∈K

v(j)

=∑j∈K

v(j) + nγ >∑j∈K

v(j),

und fur die Umkehrung mussen wir nur die Rollen von K und K vertauschen. Zum Beweis vonAussage 3) berechnet man

v (K ′) ≥ v (K) + v (K ′ \K) ≥ v (K) +∑

j∈K′\K

v(j) >∑j∈K

v(j) +∑

j∈K′\K

v(j) =∑j∈K′

v(j),

und 4) ganz analog durch

v (K ′) ≤ v (K)− v (K \K ′) ≤ v (K)−∑

j∈K\K′v(j) =

∑j∈K

v (j)−∑

j∈K\K′v(j)

=∑j∈K′

v (j) ≤ v (K ′)

wegen Proposition 5.10; also muß uberall Gleichheit gelten und K ′ ist eine Verlustkoalition.Punkt 5) ist trivial138.

Was uns der Beweis von Proposition 2 allerdings nicht liefert, ist daß das Komplement einerGewinnkoalition automatisch eine Verlustkoalition ware. Und das hat seinen Grund: Das mußgar nicht sein!

Beispiel 6.2 Wir betrachten ein reduziertes Vierpersonenspiel mit γ = 1, also

v(K) =

0, #K = 0, 4−1, #K = 1

1, #K = 3,

und legen fur zweieelementige Mengen außerdem

v(K) =

1, 1 ∈ K,−1, 1 6∈ K,

fest es gewinnt also139 bei den Zweierkoalitionen immer die, in der Spieler 1 sitzt. Diese Situa-tion entspricht einem Gremium, in dem der “Prasident” bei Stimmengleichheit den Ausschlaggibt140. Dann ist aber jede Zweierkoalition immer noch eine Gewinnkoalition, da fur j, k ∈ N4

v (j, k) ≥ −1 > −2 = v(j) + v(k)

gilt.138Im wirklichen Sinne des Wortes! Es folgt direkt aus der Definition.139Nur aus Grunden der Einfachheit!140Beispielsweise in Fachbereichsraten, wo bei Stimmengleichheit der Dekan entscheidet.

Page 103: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

6.1 Gewinnkoalitionen, Verlustkoalitionen und einfache Spiele 101

Es besteht also ein Unterschied zwischen Koalitionen, die gewinnen und Koalitionen, derenGegner verlieren; diesen Unterschied wollen wir auch in der Sprechweise zum Ausdruck brin-gen.

Definition 6.3 Eine Koalition K ∈ K heißt strikte Gewinnkoalition, wenn K eine Verlust-koalition ist, und die Menge aller strikten Gewinnkoalitionen soll mit G ∗ ⊂ K bezeichnetwerden.

Proposition 6.1, 2) sorgt nun dafur, daß diese Terminologie auch wirklich sinnvoll ist, das heißt,daß G ∗ ⊆ G gilt, bzw., daß jede strikte Gewinnkoalition auch immer eine Gewinnkoalition ist.Die nachste Beobachtung ist wie folgt.

Proposition 6.4 Das Spiel ist genau dann wesentlich, wenn G ∗ ∩ V = ∅ ist und fur jedesunwesentliche Spiel ist G ∗ ∪ V = K .

Beweis: Fast schon zu einfach: Ist das Spiel wesentlich, dann ist nach Proposition 6.1 G ∩V =∅ und die Behauptung folgt sofort aus der Tatsache, daß G ∗ ⊂ G ist. Ist hingegen das Spielunwesentlich, dann ist sowieso

v(K) =∑j∈K

v(j), K ∈ K , ⇒ V = K , G ∗ = ∅,

und was wollen wir mehr.

Definition 6.5 (Einfaches Spiel) Ein (wesentliches) Spiel heißt einfach, wenn G ∗ = G ist,wenn also alle Gewinnkoalitionen strikte Gewinnkoalitionen sind.

Beispiel 6.6 Das Dreipersonenspiel ist einfach! Nehmen wir die reduzierte Variante, dann sagtuns Bemerkung 5.17 ja, daß das Spiel eindeutig durch γ bestimmt ist, namlich

v(K) =

0, #K = 0, 3,−γ, #K = 1,γ, #K = 2.

Gewinnkoalitionen sind also die Dreierkoalition und alle Zweierkoalitionen. Die leere Menge,als Komplement der Dreierkoalition, erfullt naturlich

0 = v (∅) =∑j∈∅

v(j) = 0

trivialerweise141, die Zweierkoalitionen hingegen haben als Komplemente einelementige Men-gen die ebenfalls trivialerweise zu V gehoren. Also sind alle Gewinnkoalitionen Komplementevon Verlustkoalitionen, das Spiel ist einfach!

141Der Wert der leeren Summe ist auf 0 festgelegt!

Page 104: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

102 6 EINFACHE SPIELE UND MEHRHEITEN

6.2 MehrheitenEs gibt eine ganze Klasse, von einfachen Spielen, namlich die Mehrheitsspiele, bei denen es nurdarauf ankommt, die großere Koalition zu bilden. Und wenn man, im Gegensatz zu Beispiel 6.2,die charakteristische Funktion “richtig” definiert, dann wird das Spiel auch tatsachlich einfach.

Fur ungerades n = 2ν + 1 ist die Sache mit den Mehrheiten ja klar: K ∈ V genau dann,wenn #K < n/2 bzw. #K ≤ ν. Die Auszahlungen sind dann naturlich

v(K) =

(n−#K) γ, #K > n/2,−#K γ, #K < n/2,

γ > 0,

und dieses Nullsummenspiel ist wesentlich und einfach142, denn das Komplement einer Ge-winnkoalition ist immer eine “flache” Verlustkoalition. Fur gerades n geht das naturlich nichtso einfach, aber man kann ja immer noch gewichtete Mehrheiten einfuhren. Dazu verwendetman einen Vektor w = [wj : j ∈ Nn] ∈ Rn von nichtnegativen Zahlen, wj ≥ 0, j ∈ Nn, unddefiniert

G =

K ∈ K :∑j∈K

wj >∑j∈K

wj

, V =

K ∈ K :∑j∈K

wj <∑j∈K

wj

. (6.2)

Das klassische Mehrheitsspiel fur ungerades n ist dann naturlich nichts anderes als w = 1.Damit das Spiel nun einfach ist, muß die charakteristische Funktion v′ des reduzierten Spielsden Wert

v′(K) =

−#Kγ, K ∈ V ,

(n−#K) γ, K ∈ G ,(6.3)

haben, was auch jedes v bis auf strategische Aquivalenzen bzw. einen spielunabhangigen kon-stanten Geldfluß b festlegt.

Bemerkung 6.7 Wir haben uns inzwischen ganz unauffallig angewohnt, Mehrpersonenspie-le nur noch durch ihre charakteristische Funktion zu beschreiben, ohne uns wirklich Gedankendaruber zu machen, ob so etwas uberhaupt noch in den bisherigen Kontext eines Spiels mit Aus-zahlungsfunktion und gemischten Strategien und so weiter passt. Denn eigentlich ist ja bisherdie charakteristische Funktion eine Konsequenz der Auszahlungsfunktion und nicht umgekehrt.Glucklicherweise ist das aber kein Problem und in [20, 26, S. 243–245] wird auch beschrieben,wie man zu jeder gegebenen charakteristischen Funktion ein passendes Spiel konstruieren kann.

Damit die in (6.3) definierten Mengen V und G wirklich K erzeugen, muß naturlich w gewisseEigenschaften, denn im Fall n = 2ν und w = 1 gibt es ja Pattsituationen und alle K ∈ K mit#K = n/2 gehoren weder zu G noch zu V . Da außerdem die einelementigen Koalitionen jaimmer Verlustkoalitionen sein sollen, bedeutet dies, daß der Vektor w genau die Bedingungen

0 ≤ wj <1

21Tw,

∑j∈K

wj 6=1

21Tw, K ∈ K , (6.4)

142Und symmetrisch, die Rolle der Spieler ist vertauschbar; generell hangt bei symmetrischen Spielen (die manuber Permutationsgruppen definieren kann) der Wert einer Koalition nur von der Anzahl ihrer Mitglieder ab, siehe[20, p. 255–260].

Page 105: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

6.3 Losungen fur einfache Spiele 103

erfullen muss, um zwischen Gewinn- und Verlustkoalitionen entscheiden zu konnen.

Ubung 6.1 Bestimmen Sie den Gewichtsvektor w fur gerades n = 2ν und die Vereinbarung,daß Spieler 1 bei Stimmengleichheit entscheidet. ♦

6.3 Losungen fur einfache Spiele

Jetzt wollen wir uns schließlich noch mit der Frage auseinandersetzen, wie denn dann dieLosungen einfacher Spiele aussehen, nehmen also von nun an immer an, daß wir es stets miteinem einfachen Spiel zu tun haben. Zuerst rekapitulieren wir einmal, was wir bisher so heraus-gefunden haben:

Jedes einfache Spiel ist durch G bzw.143 V bis auf strategische Aquivalenzen fest-gelegt.

Da bei einfachen Spielen K ∈ G und K ∈ V aquivalent sind, hat das reduzierte Spiel immerdie durch (6.3) festgelegte Form und damit ist jedes dazu verwandte Spiel ist ja strategischaquivalent. Fur die Beschreibung von Gewinn oder Verlust braucht man aber jetzt nicht mehralle Koalitionen, sondern nur die, die keinen unnotigen Verlierer mitschleppen!

Definition 6.8 Eine Gewinnkoalition K ∈ G heißt minimal, wenn ihre Teilmengen Verlustko-alitionen sind:

K ′ ⊂ K ⇒ K ′ ∈ V .

Die Menge aller minimalen Gewinnkoalitionen bezeichnen wir mit Gm.

Proposition 6.9 Jede Gewinnkoalition K ∈ G besitzt (mindestens) eine Teilmenge K ⊇ Km ∈Gm.

Beweis: Einfach! Einelementige Teilmengen sind sichere Verlierer, also sehen wir nach, obirgendeine zweielementige Teilmenge K ′ ⊆ K eine Gewinnkoalition ist. Wenn ja, dann istsie minimal, denn all ihre Teilmengen sind Verlierer, wenn nein, dann sehen wir uns eben diedreielementigen Teilmengen an und so weiter. Da K selbst Gewinnkoalition ist, finden wirirgendwann Teilmengen mit minimaler Kardinalitat, die ebenfalls Gewinnkoalitionen sind, undgenau diese sind die minimalen Gewinnkoalitionen zu K.

Es ist intuitiv klar, daß die minimalen Gewinnkoalitionen die entscheidende Rolle bei den ein-fachen Spielen spielen werden, denn warum sollte man einen weiteren Looser in der Koalitionmitschleppen und außerdem ist der zur verteilende Gewinn eine Koalition im reduzierten Spielja nach (6.3) der Betrag #K γ, was nichts anderes als “Viel Feind – viel Ehr’ ” bedeutet.

Machen wir uns also wieder an die Aufteilungen, aber “nur” fur das reduzierte Spiel. EinMitglied der Gewinnkoalition K wird den Betrag −γ + ξj , j ∈ K, fur sich beanspruchen

143Die beiden Mengen sind Komplemente voneinander, K = G ∪ V , G ∩ V = ∅. Kennt man also die eine, sokennt man auch die andere.

Page 106: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

104 6 EINFACHE SPIELE UND MEHRHEITEN

konnen, ein Spieler aus der Gruppe der Verlierer wird wohl −γ einbringen mussen144, so daßsich insgesamt

α = v + ξ, v = −γ1, ξ ≥ 0, 0 =[ξj : j ∈ K

]=: ξK , (6.5)

ergibt. Dieses α ist genau dann ein Aufteilung, wenn

0 = 1Tα = −nγ +∑j∈K

ξj ⇔∑j∈K

ξj = nγ

ist, wobei nγ genau der “Mehrwert” fur die Koalition K ist: Ihr Gewinn als Solisten ware−#Kγ, aber die Auszahlung an die Koalition ist ja laut (6.3) gerade der Wert (n−#K) γ,also ein Zugewinn um n γ, der uber ξK an die Koalition “ausgeschuttet” wird.

Auszahlungen der Form (6.5) sind nun gute Kandidaten fur Losungen, vor allem dann, wennwir es uns noch ein wenig einfacher machen. Tatsachlich werden wir ein System U ⊆ Gm vonminimalen Gewinnkoalitionen betrachten, einen Vektor ξ mit

ξ ≥ 0, 1T ξK = nγ, K ∈ U

suchen und jedem K ∈ U eine Aufteilung

αK = v + ξK , d.h. αKj =

−γ, j 6∈ K,

−γ + ξj, j ∈ K, (6.6)

zuordnen und schließlich die Losung als L = L (U ) =αK : K ∈ U

ansetzen. Bleibt nur

noch die Frage: Wann ist dieses L denn auch wirklich eine Losung und wie sieht diese aus?Um diese Frage zu beantworten, mussen wir nochmals ein wenig Mathematik betreiben.

Definition 6.10 Fur U ⊆ Gm definieren wir

U ∗ :=⋃K∈U

⋃K′⊇K

K ′ und U + :=K ∈ K : K 6∈ U ∗ . (6.7)

Mit anderen Worten: U + enthalt alle Obermengen von Koalitionen145 in U , insbesondere auchU selbst, die Menge U + hingegen besteht aus allen Koalitionen, die nicht Verlustkoalitionengegen eine der Koalitionen aus U ∗ sind.

Lemma 6.11 Die Operationen “∗” und “+” haben die folgenden Eigenschaften:

1. U ⊂ U ∗ und U ⊂ U +.

2. Ist U = Gm, dann ist U ∗ = U + = G .

144Der Gesamt“gewinn” von K betragt −#K γ und da kein Spieler seinen zu erwartenden Maximalverlust −γunterschreiten, also mehr verlieren, will, ist dies die kanonische Aufteilung.

145Ist also der Abschluß von U unter Bildung von Obermengen!

Page 107: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

6.3 Losungen fur einfache Spiele 105

3. Sie sind monoton bzw. antiton, d.h.

U1 ⊆ U2 ⇒ U ∗1 ⊆ U ∗

2 ,U +

1 ⊇ U +2 .

4. Fur jedes U ⊆ Gm ist U ∗ ⊆ G ⊆ U +.

5. Mit jeder Menge K sind auch alle Obermengen K ′ ⊇ K in U ∗ bzw. U + enthalten.

Beweis: Die erste Halfte von 1) ist trivial. Ist außerdem K ∈ U , dann ist K eine Verlust-koalition und kann daher keine Obermenge einer Koalition aus U sein, denn die sind ja alle(minimale) Gewinnkoalitionen. Das heißt aber nichts anderes als K 6∈ U ∗, also K ∈ U +, undda das fur alle K ∈ U der Fall ist, ist U ⊆ U +.

2): Fur U = Gm sagt und Proposition 6.9, daß U ∗ = G ist, also ist besteht U + aus allenMengen, deren Komplemente keine Gewinnkoalitionen sind, und weil das Spiel einfach ist,sind das die Komplemente aller Verlustkoalition, ergo alle Gewinnkoalitionen, und somit istU + = G .

3): Die Monotonie von ∗ ist klar und die Antitonie von + folgen daraus, daß wir es ja mitKomplementen von ∗ zu tun haben.

4): Jedes K ∈ U ∗ ist Obermenge einer minimalen Gewinnkoalition, also selbst wiedereine Gewinnkoalition und gehort deswegen zu G ; das Komplement K jeder GewinnkoalitionK ∈ G ist aber wegen der Einfachheit des Spiels eine Verlustkoalition und kann deswegen nichtObermenge einer minimalen Gewinnkoalition sein. Also ist K 6∈ U ∗ und folglich K ∈ U +.

Auch Aussage 5) ist fur U∗ trivial. Ist andererseits K ⊆ K ′ und K ∈ U +, dann bedeutetdas, daß

U ∗ 63 K ⊇ K ′

sein muß und ware nun K ′ 6∈ U +, also K ′ ∈ U ∗, dann ware auch K ∈ U ∗, also K 6∈ U +,was einen Widerspruch liefert.

Proposition 6.12 Eine Aufteilung β ist genau dann von L (U ) undominiert, wenn

U + 3 j ∈ Nn : βj ≥ −γ + ξj =: RU (β) =: R(β). (6.8)

Beweis: Wir drehen die Frage einfach um und fragen, wann β von einem αK , K ∈ U , domi-niert wird. Dazu brauchen wir eine fur αK wirksame Koalition J ∈ K , so daß αKJ > βJ ist.Als erstes bemerken wir, daß J ⊆ K sein muß, denn fur j ∈ K ist nach (6.6)

αKj = −γ ≤ βj,

da ja αK und β beide Aufteilungen und somit ≥ v = −γ1 sind. Ist hingegen J ⊂ K eineechte Teilmenge von K, dann ist J keine Gewinnkoalition mehr, denn K war eine minimaleGewinnkoalition und weil das Spiel einfach ist, muß also J eine Verlustkoalition sein146 und

146Hier haben wir wirklich alle Voraussetzungen in einem Satz verbraten: Einfachheit des Spiels und Minimalitatder Gewinnkoalition K – die Voraussetzungen braucht man also schon, um letztendlich zu einfachen Losungen zukommen.

Page 108: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

106 6 EINFACHE SPIELE UND MEHRHEITEN

daher−#J γ =

∑j∈J

v(j) = v(J)

erfullen. Daß J fur αK wirksam ist, bedeutet aber andererseits zusammen mit ξK ≥ 0, daß

−#J γ = v(J) ≥∑j∈J

αKj =∑j∈J

−γ + ξKj = −#J γ + 1T ξJ ⇒ ξJ = 0

sein muß, weswegen wieder αKJ = βJ = −γ 1 zu sein hat – wieder nichts mit Dominanz.Anders gesagt: Die Dominanz αK β ist aquivalent dazu, daß die zugehorige wirksame

Menge genau K ist und es muß αKK = v + ξK > βK gelten, was insbesondere auch ξK > 0liefert. Oder nochmals umformuliert:

αK β ⇔ R(β) ⊆ K ⇔ R(β) ⊇ K.

Also wird β genau dann durch irgendein αK mit K ∈ U dominiert, wenn R(β) ∈ U ∗ liegtund ist undominiert durch L (U ) wenn R(β) 6∈ U ∗, also R(β) ∈ U + ist.

Wenn wir schon mal beim Umformulieren sind, dann konnen wir Proposition nochmals andersschreiben und so die einfachen Losungen fur einfache Spiele charakterisieren.

Korollar 6.13 L (U ) ist genau dann eine Losung, wenn

α ∈ L (U ) ⇔ R(α) ∈ U +. (6.9)

Beweis: Ist wirklich eine direkte Konsequenz aus Proposition 6.12: Jedes β 6∈ L (U ) muß vonL (U ) dominiert werden, also muß R(β) 6∈ U + sein, jedes α ∈ L (U ) darf hingegen nichtvon L (U ) dominiert werden, muß also R(α) ∈ U + erfullen.

Satz 6.14 L (U ) ist genau dann eine Losung, wenn

1T ξK = nγ, K ∈ U , und 1T ξK > nγ, K ∈ U + \U . (6.10)

Beweis: Wir wahlen K ∈ U + und sehen uns alle Aufteilungen α an, die R(α) ∈ U + erfullen,denn die Gesamtheit dieser Aufteilungen muß ja nach Korollar 6.13 die Losung ausmachen. Furjedes solche K betrachten wir nun die Zahl

yK := 1TαK =∑j 6∈K

(−γ) +∑j∈K

(γ + ξj) = −nγ + 1T ξK

und unterscheiden die drei Falle, daß yK positiv, negativ oder gleich Null ist.

yK > 0: Da fur jedes α mit R(α) = K die Ungleichung

0 = 1Tα =∑j∈K

αj +∑j 6∈K

αj ≥∑j∈K

(−γ + ξj) +∑j 6∈K

(−γ) = yK (6.11)

gilt, kann es in diesem Fall kein α mit R(α) = K geben. Damit sind also alle K ∈ U +

mit yK > 0 fur die Losung irrelevant und brauchen nicht weiter berucksichtigt zu werden.

Page 109: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

6.3 Losungen fur einfache Spiele 107

yK < 0: In diesem Fall gibt es unendlich viele Moglichkeiten, α so zu wahlen, daß 1Tα = 0ist und αK ≥ −γ1 + ξK sowie αK = −γ1 erfullt ist, namlich αK = αKK + δK , δ ≥ 0,1T δ ≤ −yK ; fur alle solchen α ist R(α) ∈ U +, also α ∈ L (U ), weswegen die Losungebenfalls unendlich viele Elemente haben musste, was aber Definition aus (6.6), nach derL (U ) nur aus #U <∞ Elementen bestehen kann.

Also kann nur yK = 0, das heißt, 1T ξK = nγ gelten, wenn wir uberhaupt ein Element derLosung mit R(α) = K haben wollen.

Ist nun α ∈ L (U ), das heißt, es gibt ein K ∈ U , so daß α = αK ist, dann ist

R(α) = K ∪j ∈ K : ξj = 0

⊃ K,

und da K ∈ U ⊆ U ∗ ⊆ U +, siehe Lemma 6.11, 1) und 4), und da U + unter Obermengenbil-dung abgeschlossen ist, ist auch K ∈ U +. Außerdem ist∑

j∈R(α)

ξj =∑j∈K

ξj = 1T ξK = n γ,

was die erste Halfte von (6.10) liefert und alle α ∈ L (U ) erledigt. Sei umgekehrt K ∈ U +

eine Koalition mit 1T ξK = nγ; wenn wir K durch

K ′ = K ∪j ∈ K : ξj = 0

ersetzen, dann ist ebenfalls K ′ ∈ U + und 1T ξK′ = nγ. Jede Aufteilung β mit R(β) = K ′

erfullt βK′ ≥ −γ1 + ξK′ und β ≥ −γ1 und daher ist wieder

0 = 1Tβ = 1TβK′ + 1TβK′ ≥ −γ#K ′+ 1T ξK′ − γ (n−#K ′) = −nγ+ 1T ξK′ = 0, (6.12)

was nur mit

βj =

−γ, j 6∈ K ′,

−γ + ξj, j ∈ K ′, ⇒ β = αK′

(6.13)

zu erreichen ist, denn jedes “>” wurde auch in (6.12) zu “>” fuhren und damit den Widerspruch0 > 0 produzieren. Hat umgekehrt eine Aufteilung β die Form wie in (6.13), dann ist R(β) ∈U + und nach Korollar 6.13 muß β ∈ L (U ), also β = αK , K ∈ U . Also:

Eine Koalition K ∈ U + erfullt genau dann 1T ξK′ = nγ, wenn αK ∈ L (U ) ist.

Damit ist der Beweis vollstandig.

Bemerkung 6.15 1. Wir haben bei der Formulierung von Satz 6.14 ein wenig gemogelt unddie j mit ξj = 0 unter den Tisch fallen lassen, die Sache ein wenig unhandlicher machen,da sie die Aufteilungen unverandert lassen. Diese Indizes entsprechen Spielern, fur die esvollig irrelevant sind, ob sie eine Koalition angehoren oder nicht. Diese Effekt wird auchin [20] angefuhrt, allerdings findet sich in einer Fußnote die Aussage uber diese j

These j constitute a slight complication which is further agrravated by the factthat we have no example of a game in which they actually occur. It may be thatthey never exist . . .

Page 110: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

108 6 EINFACHE SPIELE UND MEHRHEITEN

2. Besonders einfach wird die Struktur, wenn wir U = Gm, also die Menge aller minimalenGewinnkoalition wahlen, denn dann mussen wir ξ so “nur” so wahlen, daß∑

j∈K

ξj = nγ, K ∈ Gm,

ist.

Beispiel 6.16 (Einfache Mehrheiten)

1. Im einfachen Dreipersonen–Mehrheitsspiel sind die Gewinnkoalitionen (1, 2), (1, 3) und(2, 3) und ξ muss damit eine positive Losung des Gleichungssystems 1 1 0

1 0 10 1 1

ξ1

ξ2

ξ3

=

3γ3γ3γ

sein, also ξj = 3

2γ – alles voll total symmetrisch und wieder mal unsere Standardlosung

“Halbe–Halbe”.

2. Bei funf Spielern gibt es nun schon(

53

)= 10 minimale Gewinnkoalitionen und das zu-

gehorige Gleichungssystem

1 1 1 0 01 1 0 1 01 1 0 0 11 0 1 1 01 0 1 0 11 0 0 1 10 1 1 1 00 1 1 0 10 1 0 1 10 0 1 1 1

ξ1

ξ2

ξ3

ξ4

ξ5

=

5γ5γ5γ5γ5γ

ist zwar uberbestimmt, hat aber trotzdem die positive Losung ξj = 53γ.

3. Wann immer man n = 2m + 1 Spieler hat und einfache Mehrheiten aus m + 1 Spielernbestehen, ist ξj = 2m+1

m+1γ ein Vektor, aus dem man einfache Losungen konstruieren kann.

6.4 Einfache Losungen fur gewichtete MehrheitenBeispiel 6.16 legt schon nahe, daß es einen engen Bezug zwischen ξ und dem Gewichtungsvek-tor des Mehrheitsspiels geben sollte. Sei also 0 ≤ w ∈ Rn ein Gewichtungsvektor, der ohneEinschrankung so normiert sein soll, daß 1Tw = 1 ist.

Definition 6.17 Die einfache Hauptlosung eines (Mehrheits-)Spiels ist L (Gm), also die Losung,die gerade durch die minimalen Gewinnkoalitionen definiert wird.

Page 111: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

6.4 Einfache Losungen fur gewichtete Mehrheiten 109

Die Bedingung an ξ ergibt sich in diesem Fall dann als∑j∈K

ξj = nγ, K ∈ U = Gm. (6.14)

Eine minimale Gewinnkoalition zeichnet sich hingegen dadurch aus, daß ihr Gewicht > 121Tw

ist, aber wenn auch nur ein Teilnehmer abspringt, dann ist das nicht mehr der Fall:

K ∈ Gm ⇔ 1

2<∑j∈K

wj <1

2+ min

j∈Kwj. (6.15)

Zu einem K ∈ Gm konnen wir also die “Starke” von K als sK := 1TwK definieren undden Anteil von Spieler j zu dieser Koalition als wj/sK , j ∈ K. Im Falle eines homogenenSpiels, namlich dann, wenn sK = s, K ∈ Gm, fur ein festes s > 0, stimmen ξ und w bis aufNormierung uberein:

ξ =nγ

sw.

Beispiel 6.18 (Homogene Spiele)

1. Alle einfachen Mehrheitsspiele mit n = 2m + 1 Spielern und w = 1 haben s = m + 1und sind damit homogen.

2. Das “Fachbereichsratsspiel” mit n = 2m und w = [1 + α, 1, . . . , 1], 0 < α ≤ 1, istgenau dann homogen, wenn α = 1 ist, da die minimalen Gewinnkoalitionen entwederaus m Spielern inclusive Spieler 1 oder m + 1 Spielern ohne Spieler 1 bestehen und diezugehorigen Starken m+ α bzw. m+ 1 sind. Ist also α = 1, dann ergibt sich ξ als

ξ1 =4m

m+ 1γ, ξ2 = · · · = ξn =

2m

m+ 1γ,

der Dekan ist also doppelt so viel wert wie alle anderen!

3. Ein anderes Extremspiel basiert auf w = [n− 2, 1, . . . , 1] und ist homogen, da die mi-nimalen Gewinnkoalitionen entweder von der Form (1, j), j ∈ Nn \ 1 oder Nn \ 1sind147, und damit Starke n − 1 haben. Die einfachen Losungen basieren dann also aufdem Vektor ξ mit

ξ1 =n(n− 2)

n− 1γ, ξ2 = · · · = ξn =

n

n− 1γ.

Das ist aber nur eine Losung – dieses Spiel wird in [20, 55, S. 473–503] genauer unter-sucht.

Aber ein Beispiel haben wir noch, und zwar eines, bei dem ein Spieler mehr oder weniger“ausgeschlossen” wird und zwar so, daß man fur ihn jedes beliebige ξj wahlen kann.

147Also entweder schleimt sich einer beim “starken” Spieler ein, oder aber es geht alle gegen einen.

Page 112: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

110 6 EINFACHE SPIELE UND MEHRHEITEN

Beispiel 6.19 (Alle gegen einen) Wir wahlen n = 4 und erklaren eine Zweierkoalition zur Ge-winnkoalition, wenn ihr Spieler 1 nicht angehort und zur Verlustkoalition, wenn Spieler 1 dabeiist – das ist also das “Inverse” des Fachbereichsrats. Dann enthalt jede Dreierkoalition einezweielementige Gewinnkoalition, und zwar:

(1,2,3), (1,2,4), und jede zweielementige Teilmenge von (2,3,4),

die minimalen Gewinnkoalitionen sind also (2, 3), (2, 4) und (3, 4) und die Bedingung an ξ mitU = Gm sind

ξ2 + ξ3 = ξ2 + ξ4 = ξ3 + ξ4 = 4γ,

was sich mit ξ2 = ξ3 = ξ4 = 2γ leicht erledigen lasst. Der Wert von ξ1 hingegen kann absolutfrei gewahlt werden, insbesondere auch als ξ1 = 0. Ob das eine Antwort auf Bemerkung 6.15ist?

Man sieht also: Eine allgemeine Theorie der Mehrpersonenspiele ist eine außerst komplexeAngelegenheit, und auch wenn wir jetzt die wesentlichen Grundbegriffe kennengelernt haben,sind wir weit davon entfernt, diese Theorie wirklich durchschaut zu haben. Aber es hilft allesnichts: Irgendwann ist so ein Semester halt vorbei. Das Schlußwort uberlasse ich daher anderen.

Manches sagt ich,mehr noch wollt ich,

ließe zur RedeRaum das Geschick.Die Stimme weicht,Wunden schwellen:Wahres sprach ich;

will nun enden.(Die Edda, Das jungere Sigurdlied)

Page 113: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

LITERATUR 111

Uns ist in alten mærenwunders viel geseitvon Helden lobebærenvon grozer arebeit

Das Nibelungenlied

Literatur 6[1] K. J. Arrow, Social choice and individual values, Wiley, 1951.

[2] V. F. Birkenbihl, Komplexitat. Gehirn–gerechte Einfuhrung in das Thema Komplexitat,Videovortrag, 2003, PLS-Gabal.

[3] G. B. Dantzig, Linear programming and extensions, Pinceton University Press, 1963.

[4] M. D. Davis, Game theory. a nontechnical introduction, Basic Books, 1983, Dover Reprint1997.

[5] Ph. des Pallieres and H. Marly, Die werwolfe von dusterwald, Pro Ludo, 2002.

[6] G. Fischer, Lineare Algebra, Vieweg, 1984.

[7] S. I. Gass, An illustrated guide to linear programming, McGraw–Hill, 1970, Republishedby Dover, 1990.

[8] J. von zur Gathen and J. Gerhard, Modern computer algebra, Cambridge University Press,1999.

[9] A. M. Glicksman, An introduction to linear programming and the theory of games, JohnWiley & Sons, 1963, Dover Reprint 2001.

[10] H. Heuser, Lehrbuch der Analysis. Teil 1, 3. ed., B. G. Teubner, 1984.

[11] R. A. Horn and C. R. Johnson, Matrix analysis, Cambridge University Press, 1985.

[12] K. Jacobs, Einfuhrung in die Kombinatorik, de Gruyter, 1983.

[13] S. Karlin, Mathemtical methods and theory in games, programming and economics, DoverPhoenix Editions, Addison–Wesley, 1959, Dover Reprint 2003.

[14] A. N. Kolmogoroff, A remark on the polynomials fo Chebyshev, deviating at least from agiven function, Ushepi 3 (1948), 216–221, Probably in Russian.

Page 114: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

112 LITERATUR

[15] R. D. Luce and H. Raiffa, Games and decisions. introduction and a critical survey, JohnWiley & Sons, 1957, Dover Reprint 1989.

[16] M. Marcus and H. Minc, A survey of matrix theory and matrix inequalities, Prindle, Weber& Schmidt, 1969, Paperback reprint, Dover Publications, 1992.

[17] J. Nash, The bargaining problem, Econometrica 18 (1950), 155–162.

[18] J. von Neumann, Zur Theorie der Gesellschaftsspiele, Math. Annalen 100 (1928), 295–320.

[19] , The computer and the brain, Yale University Press, 1985.

[20] J. von Neumann and O. Morgenstern, Theory of games and economic behavior, sixthpaperback printing, 1990 ed., Princeton University Press, 1944.

[21] J. Nocedal and S. J Wright, Numerical optimization, Springer Series in Operations Rese-arch, Springer, 1999.

[22] A. Rapoport, Two–person game theory, The University of Michigan Press, 1966, DoverReprint 1999.

[23] T. Sauer, Computeralgebra, Vorlesungsskript, Justus–Liebig–Universitat Gießen, 2001,http://www.math.uni-giessen.de/tomas.sauer.

[24] , Approximationstheorie, Vorlesungsskript, Justus–Liebig–Universitat Gießen,2002, http://www.math.uni-giessen.de/tomas.sauer.

[25] , Optimierung, Vorlesungsskript, Justus–Liebig–Universitat Gießen, 2002,http://www.math.uni-giessen.de/tomas.sauer.

[26] M. Schacht, Knatsch, Abacus Spiele, 2001.

[27] F. Schiller, Die rauber, Frankfurt und Leipzig, 1781, Geschrieben in der Ostermesse.

[28] P. Spellucci, Numerische Verfahren der nichtlinearen Optimierung, Internationale Schrif-tenreihe zu Numerischen Mathematik, Birkhauser, 1993.

[29] W.-H. Steeb, Kronecker product of matrices and applications, BI–Wiss.–Ver., 1991.

[30] J.D. Williams, The complete strategyst. being a primer on the theory of games on strategy,Dover Publications, 1986, Reprint. Originally Mc–Graw–Hill, 1966.

Page 115: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

Index 6AL CAPONE, 3Alle gegen einen, 109Analysis

konvexe, 24Approximationstheorie, 25ARROW, K., 67Aufteilung, 88–90, 102

dominierende, siehe Dominanz 88undominierbare, 91undominierte, 104

Auszahlungerwartete, 6, 21, 23, 81Funktion, 3, 6, 13Matrix, 13, 81Tabelle, 3

Baum, 15Bidualitat, 40Blatt, 15Bridge, 10

Cauchy–Schwarz, 25

DANTZIG, G. B., 42Dekan, 99Diktator, 68Dominanz, 88, 90–92, 104Draw Poker, 15Dreipersonenspiel, 4, 75, 76, 79, 91–97, 100

Aufteilung, 91Losung, 96reduziertes, 87, 96

Dualitatslucke, 38Duell, 11

Einheitssimplex, siehe Simplex 7Einstimmigkeit, 68

Fachbereichsrat, 99Feigheit, 54Filter, 70Fixpunktsatz, 23Funktion

bilineare, 72charakteristische, 81konkave, 42konvexe, 42lineare, 37, 42

Gefangenendilemma, 3, 72Gewinnbereich, 56, 56

Hadamard–Produkt, 44Halbzug, 10Hyperbel, 60Hyperebene, 24

Trenn-, 24, 40Hulle

konvexe, 24, 57, 58, 59, 72

Imputation, siehe Aufteilung 88Information, 14

unvollstandige, 10vollstandige, 10, 14, 20

Kante, 43KARLIN. S., 2Koalition, 4, 76, 80, 81, 83, 85

Gegen-, 80Gewinn-, 83, 98, 100, 102

minimale, 102strikte, 100

Strategie, siehe Strategie, gemeinsame 80Strategiemenge, 80Verlust-, 99, 100Wert, 81, 82

113

Page 116: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

114 INDEX

wirksame, 88Kolmogoroff, 26Kolmogoroff–Kriterium, 26Kombinatorik, 67Kompensation, 76Komplexitat

polynomiale, 36Konvexkombination, 57, 59, 66Kooperation, 58Kuhn–Tucker–Bedingungen, 39

LagrangeFormen, 38Funktion, 41

Lineare Optimierung, 37Lineare Programmierung, 37LORIOT, 4

MatrixDominanz, 17, 18schiefsymmetrische, 14, 22

Mehrheit, 69, 72, 75einfache, 107variable Auszahlung, 77

Mehrpersonenspiel, 55Menge

flache, 83konvexe, 24, 29, 30, 34, 56, 83

Merhpersonenspiel, 75Mindestauszahlung, 83Mindestgewinn, 19Minimax–Theorem, 7, 22, 28, 30, 32, 81

Nachbarecke, 43, 44NASH, J., 60Nash–Gleichgewicht, siehe Nash–Losung 64Nash–Losung, 60, 60, 61–65, 73, 74Nebenbedingung

lineare, 37Niveaulinie, 60Norm

euklidische, 25Nullsummenspiel, 2, 7, 13, 16, 18, 21, 55, 75,

78, 83

Nutzen, 65-funktion, 66

Omerta, 73Optimierungsproblem

ganzzahliges, 45Ordnung

totale, 65, 68Orthant, 38, 48

Pareto–Optimalitat, 62Parteien, 4Passen, 16Pattsituation, 101Poker, 10Polyeder

Ecke, 33–35endliches, 30kompaktes, 30konvexes, 29, 30, 38, 58

Problemduales, 37Minimax–, 5nichtdegeneriertes, 42primales, 37, 38, 42, 49Stop-, 11Transport-, 45

Praferenz, 68Psychologie, 4Punkt

Eck-, siehe Polyeder, Ecke 32innerer, 32Rand-, 32zulassiger, 37, 42, 46

Russisch Roulette, 10, 16Rauber, 64

Sattelpunkt, 5, 8, 19, 19, 20, 21, 38, 38, 44Schach, 10, 20Schafkopf, 10Simplex, 7

-algorithmus, 32, 42, 45Eckpunkte, 23

Page 117: Spieltheorie - Fakultät für Informatik und Mathematik - … · 2014-09-02 · 2 1 GRUNDIDEEN DER SPIELTHEORIE – BEI–SPIELE Sicher konnen Computer Probleme l¨ ¨osen, Informationen

INDEX 115

Skat, 10Skin Game, 22, 51Soziale Entscheidungsfunktion, 68Spiel

Daiquiri–, 9, 47einfaches, 98, 100, 101–109endliches, 14faires, 9, 22, 23, 76homogenes, 108Losung, 88, 90, 96, 105

Haupt-, 107Mehrheits-, 101–102Morra, 52Nullsummen-, siehe Nullsummenspiel 2reduziertes, 84, 85symmetrisches, 22, 23, 31, 76unwesentliches, siehe Spiel, wesentliches 85Wert, 9, 22, 28wesentlichens, 89wesentliches, 85, 86, 90, 91, 98, 100, 101Zweipersonen-, siehe Zweipersonenspiel 4

Spielerirrelevanter, 106

Spielzug, 14erster Ordnung, 14zweiter Ordnung, 14

Status quo, 60, 73, 74Stein, Schere, Papier, 2, 5, 6, 14, 19, 31Stein, Schere, Papier, Brunnen, 18, 36, 47Strategie, 3

Aquivalenz, 84Bestimmung, 50gemeinsame, 79, 80, 80, 81gemischte, 6, 8, 21, 31, 80optimale, 9, 19, 22, 28–31, 34, 47, 84redundante, 18reine, 6, 19unabhangige, 55, 76, 80unabhanigige, 79

Strategiemenge, 13Symmetrie, 84

Theorem

Alternativensatz, 26Arrow, 68Diktator–, siehe Theorem, Arrow 71Minimax–, siehe Minimax–Theorem 7Trennhyperebenensatz, 24, 39, 40

TUCKER, A. W., 72

Ultrafilter, 70, 71Unabhangigkeit, 68, 72Ungleichungssystem, 31

uberbestimmtes, 33Universalrechner, 13, 20

V. NEUMANN, J., 13, 20Verhandlungsergebnis, 58Verhandlungsproblem, 60Vierpersonenspiel, 99Volleyball, 2

Zweipersonenspiel, 4, 7, 13, 18, 20, 21, 55, 81Zweiphasenmethode, 46, 48