ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ -...

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΜΑΘΗΜΑΤΙΚΑ ΜΟΝΤΕΛΑ

ΣΥΓΚΡΟΥΣΗΣ ΚΑΙ ΣΥΝΕΡΓΑΣΙΑΣ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΚΩΝΣΤΑΝΤΙΝΟΥ Α. ΜΗΛΟΛΙ∆ΑΚΗΑναπληρωή Καθηγητή του Πανεπιστηµίου Αθηνών

Εκδόσεις Σοφία

Αθήνα 2009

ΠΕΡΙΕΧΟΜΕΝΑ

Πρόλογος xiv

1 Εισαγωγή 1

1.1 Θεωρία Παιγνίων – ∆υό Λόγια για το Αντικείµενο . . . . . . . . 1

1.2 Μερικά Ιστορικά Στοιχεία . . . . . . . . . . . . . . . . . . . . . 3

1.3 ΄Ενα Παράδοξο Παιχνίδι . . . . . . . . . . . . . . . . . . . . . . 4

2 Παιχνίδια σε Εκτεταµένη Μορφή 11

2.1 ∆ύο Παραδείγµατα . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2 Ορισµός ενός Πεπερασµένου Παιχνιδιού σε Εκτεταµένη Μορφή 14

2.3 ΄Ενα Παιχνίδι Πόκερ και ένα Παιχνίδι Αναζήτησης . . . . . . . 16

2.4 Τέλεια Πληροφόρηση και Τέλεια Ανάµνηση, Πλήρης Πληροφό-

ϱηση . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.5 Η ΄Εννοια της Στρατηγικής . . . . . . . . . . . . . . . . . . . . 23

2.6 Παραδείγµατα . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.7 Η Συνάρτηση Πληρωµής Πάνω στο Χώρο των Στρατηγικών Κατα-

στάσεων . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.8 Πινακοπαιχνίδια και ∆ι-πινακοπαιχνίδια . . . . . . . . . . . . . 30

2.9 Απλοποιήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.10 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3 Προσπαθώντας να Λύσουµε ένα Παιχνίδι : Σηµείο

Στρατηγικής Ισορροπίας, Κανονική Μορφή και Μεικτή

Επέκταση ενός Παιχνιδιού 41

3.1 ∆υναµικός Προγραµµατισµός . . . . . . . . . . . . . . . . . . 41

3.2 Το Σηµείο Στρατηγικής Ισορροπίας ή Σηµείο Nash . . . . . . . 46

3.3 Παραδείγµατα και Συζήτηση των Ιδιοτήτων του ΣΣΙ . . . . . . 47

3.4 ΄Υπαρξη ΣΣΙ για Παιχνίδια Τέλειας Πληροφόρησης . . . . . . . 50

3.5 Η Κανονική Μορφή Ενός Παιχνιδιού και η Μεικτή του

Επέκταση . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

vii

viii ΠΕΡΙΕΧΟΜΕΝΑ

3.5.1 Η Κανονική Μορφή . . . . . . . . . . . . . . . . . . . . 56

3.5.2 Μεικτές Στρατηγικές . . . . . . . . . . . . . . . . . . . . 58

3.5.3 Η Μεικτή Επέκταση ενός Παιχνιδιού σε Κανονική

Μορφή . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

3.6 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

4 Παιχνίδια 2-παικτών 0-αθροίσµατος 69

4.1 Επίπεδο Ασφάλειας και Σηµείο Στρατηγικής Ισορροπίας . . . . 69

4.2 Το Θεώρηµα Minimax . . . . . . . . . . . . . . . . . . . . . . 79

4.3 Απλοποιήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

4.4 Πινακοπαιχνίδια µε ∆ύο Γραµµές είτε ∆ύο Στήλες . . . . . . . . 88

4.5 Εξισωτικές Στρατηγικές . . . . . . . . . . . . . . . . . . . . . . 95

4.6 Τα Βήµατα για την Επίλυση ενός π.π. . . . . . . . . . . . . . . 98

4.7 Παραδείγµατα . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

4.8 Χαρακτηρισµός των Βέλτιστων Στρατηγικών µέσω Εξισωτικών

Στρατηγικών . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

4.9 Μη Πεπερασµένα Παιχνίδια 2-παικτών 0-αθροίσµατος . . . . . 113

4.9.1 Τιµή και ε-ϐέλτιστες Στρατηγικές . . . . . . . . . . . . . 113

4.9.2 Συνεχή Παιχνίδια Πάνω σε Συµπαγή Σύνολα . . . . . . . 121

4.10 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

5 Ειδικές Κατηγορίες Παιχνιδιών 2-παικτών 0-αθροίσµατος 137

5.1 Συµµετρικά Παιχνίδια . . . . . . . . . . . . . . . . . . . . . . 137

5.2 Παιχνίδια σε Στάδια . . . . . . . . . . . . . . . . . . . . . . . . 139

5.2.1 Συµπεριφορικές Στρατηγικές . . . . . . . . . . . . . . . 139

5.2.2 Πεπερασµένα Αναδροµικά Παιχνίδια . . . . . . . . . . . 142

5.2.3 Αναδροµικά Παιχνίδια µε ΄Απειρο Αριθµό Κινήσεων . . . 153

5.2.4 Στοχαστικά Παιχνίδια . . . . . . . . . . . . . . . . . . . 159

5.3 Κυρτά Παιχνίδια στο Μοναδιαίο Τετράγωνο . . . . . . . . . . . 169

5.4 Παιχνίδια Εναντίον της Φύσης . . . . . . . . . . . . . . . . . . 178

5.5 Στατιστική Θεωρία Αποφάσεων . . . . . . . . . . . . . . . . . . 183

5.5.1 Εκτιµήτριες Bayes . . . . . . . . . . . . . . . . . . . . . 189

5.6 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

6 Πεπερασµένα Παιχνίδια 2-παικτών Μη Μηδενικού

Αθροίσµατος 201

6.1 ∆ιπινακοπαιχνίδια 2 × 2 – Γραφική Επίλυση . . . . . . . . . . 201

6.2 Ο Αλγόριθµος Lemke-Howson . . . . . . . . . . . . . . . . . . 204

6.2.1 Οι Ταµπέλες . . . . . . . . . . . . . . . . . . . . . . . . 204

6.2.2 Σχέση ΣΣΙ και Ταµπέλων . . . . . . . . . . . . . . . . . 210

ΠΕΡΙΕΧΟΜΕΝΑ ix

6.2.3 Το διάγραµµα Lemke-Howson . . . . . . . . . . . . . . 211

6.2.4 Σκιαγράφηµα της Αριθµητικής Επίλυσης . . . . . . . . . 220

6.3 Απλοποιήσεις σε δ.π.π. . . . . . . . . . . . . . . . . . . . . . . 223

6.4 Συµµετρικά δ.π.π. και Εξελικτικά Ευσταθή Σηµεία

Στρατηγικής Ισορροπίας . . . . . . . . . . . . . . . . . . . . . 229

6.4.1 Εξελικτικά Ευσταθές ΣΣΙ . . . . . . . . . . . . . . . . . 231

6.5 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235

7 Θεωρήµατα ΄Υπαρξης Σηµείου Στρατηγικής Ισορροπίας 243

7.1 Εισαγωγικά . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243

7.2 Το Θεώρηµα Nash - Πρώτη Απόδειξη . . . . . . . . . . . . . . 244

7.3 Το Θεώρηµα Nash - ∆εύτερη Απόδειξη . . . . . . . . . . . . . . 248

7.4 Κοίλα Παιχνίδια . . . . . . . . . . . . . . . . . . . . . . . . . . 249

7.5 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252

8 Πρότυπα Μη Πεπερασµένων Παιχνιδιών n-Παικτών.

Εφαρµογές στα Οικονοµικά 255

8.1 Πρότυπα Ολιγοπωλίων . . . . . . . . . . . . . . . . . . . . . . 255

8.1.1 Το Ολιγοπώλιο του Cournot . . . . . . . . . . . . . . . . 255

8.1.2 Το Ολιγοπώλιο του Bertrand . . . . . . . . . . . . . . . 262

8.1.3 Το Ολιγοπώλιο του Stackelberg . . . . . . . . . . . . . . 267

8.2 Παιχνίδια σε Στάδια . . . . . . . . . . . . . . . . . . . . . . . . 269

8.2.1 Εξακολουθητική ∆ιαπραγµάτευση (Παζάρι) . . . . . . . . 269

8.2.2 ∆ιεθνής Ανταγωνισµός και ∆ασµοί . . . . . . . . . . . . . 272

8.2.3 Συστήµατα Αποζηµίωσης Βασισµένα σε ∆ιαγωνισµούς . . 276

8.3 Παιχνίδια σε Συνθήκες Ελλιπούς Πληροφόρησης . . . . . . . . 282

8.3.1 Μια Αλυσίδα Ανεφοδιασµού σε Συνθήκες Αβεβαιότητας . 283

8.3.2 Αγοραπωλησία Μέσω Σφραγισµένων Προσφορών . . . . . 286

8.3.3 Μπεϋζιανά Παιχνίδια . . . . . . . . . . . . . . . . . . . 297

8.4 Παιχνίδια Αγορών: Σηµεία Ανταλλακτικής Ισορροπίας και

Σηµεία Στρατηγικής Ισορροπίας . . . . . . . . . . . . . . . . . 301

8.4.1 Η Κλασική Θεωρία της Γενικής Ανταγωνιστικής

Ισορροπίας . . . . . . . . . . . . . . . . . . . . . . . . . 303

8.4.2 Η Καθαρά Ανταλλακτική Οικονοµία ως Παιχνίδι

Χωρίς Συνεργασία . . . . . . . . . . . . . . . . . . . . . 308

8.5 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319

Μέρος 2 326

x ΠΕΡΙΕΧΟΜΕΝΑ

9 Συντονισµός των Κινήσεων των Παικτών 329

9.1 Συσχετισµένες Στρατηγικές . . . . . . . . . . . . . . . . . . . . 329

9.2 Συσχετισµένη Ισορροπία . . . . . . . . . . . . . . . . . . . . . 333

9.2.1 Συζήτηση . . . . . . . . . . . . . . . . . . . . . . . . . . 334

9.2.2 Ορισµός της Συσχετισµένης Ισορροπίας . . . . . . . . . 337

9.2.3 Παραδείγµατα . . . . . . . . . . . . . . . . . . . . . . . 340

9.3 Ιδιότητες των Συσχετισµένων Στρατηγικών σε Κατάσταση

Ισορροπίας . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344

9.4 Παιχνίδια µε Επικοινωνία - Η Αρχή της Αποκάλυψης για

Παιχνίδια σε Κανονική Μορφή . . . . . . . . . . . . . . . . . . 346

9.5 Επαναλαµβανόµενα Παιχνίδια - Πεπερασµένος Αριθµός

Επαναλήψεων . . . . . . . . . . . . . . . . . . . . . . . . . . . 353

9.5.1 ΣΣΙ Τέλειο ως προς τα Υποπαιχνίδια . . . . . . . . . . . 354

9.5.2 Επαναλαµβανόµενα Παιχνίδια µε Μοναδικό ΣΣΙ . . . . . 357

9.5.3 Επαναλαµβανόµενα Παιχνίδια µε Περισσότερα από

΄Ενα ΣΣΙ . . . . . . . . . . . . . . . . . . . . . . . . . . 359

9.6 Επαναλαµβανόµενα Παιχνίδια - ΄Απειρος Αριθµός Επανα-

λήψεων . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364

9.6.1 Η Συνάρτηση Πληρωµής . . . . . . . . . . . . . . . . . . 364

9.6.2 Μεικτές και Συµπεριφορικές Στρατηγικές . . . . . . . . 366

9.6.3 ∆ηµόσιοι Τυχαίοι Μηχανισµοί και Σηµεία Συντονι-

σµού . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368

9.6.4 Τα Λαϊκά Θεωρήµατα . . . . . . . . . . . . . . . . . . . 370

9.6.5 Παραδείγµατα . . . . . . . . . . . . . . . . . . . . . . . 374

9.6.6 Παραπέρα Συζήτηση . . . . . . . . . . . . . . . . . . . . 378

9.7 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379

10 Παιχνίδια σε Συµµαχική Μορφή 385

10.1 Η Χαρακτηριστική Συνάρτηση Ενός Παιχνιδιού . . . . . . . . . 387

10.2 Παραδείγµατα . . . . . . . . . . . . . . . . . . . . . . . . . . . 392

10.2.1 Η Καθαρά Ανταλλακτική Οικονοµία ως Παιχνίδι . . . . . 395

10.3 Κανονικοποίηση . . . . . . . . . . . . . . . . . . . . . . . . . . 396

10.4 Ιδιότητες και Ιδιαίτερες Κατηγορίες Παιχνιδιών . . . . . . . . . 399

10.5 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406

11 Ο Πυρήνας Ενός Παιχνιδιού σε Συµµαχική Μορφή 411

11.1 Το Σύνολο των Αποδόσεων . . . . . . . . . . . . . . . . . . . . 412

11.2 Ο Πυρήνας του Παιχνιδιού : Ορισµός και Παραδείγµατα . . . . 412

11.3 Ο Πυρήνας για Ειδικές Κατηγορίες Παιχνιδιών . . . . . . . . . 416

ΠΕΡΙΕΧΟΜΕΝΑ xi

11.4 Χαρακτηρισµός των Παιχνιδιών n-παικτών µε µη Κενό

Πυρήνα . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422

11.5 Ο Πυρήνας στα Παιχνίδια Αγοράς . . . . . . . . . . . . . . . . 427

11.5.1 Αγορές µε Ωφέλεια που Μπορεί να Μεταφερθεί :

Σηµεία Ανταλλακτικής Ισορροπίας και Πυρήνας . . . . . 434

11.6 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438

12 Σηµειακές Λύσεις: Πυρηνίσκος και Τιµή Shapley 443

12.1 Ο Πυρηνίσκος . . . . . . . . . . . . . . . . . . . . . . . . . . . 444

12.2 Ορισµός και Αξιώµατα για την Τιµή Shapley . . . . . . . . . . 448

12.3 ΄Υπαρξη, Μοναδικότητα και Μαθηµατικοί Τύποι της Τιµής

Shapley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451

12.4 Ιδιότητες της Τιµής Shapley . . . . . . . . . . . . . . . . . . . 458

12.5 Παραδείγµατα Υπολογισµού της Τιµής Shapley . . . . . . . . . 460

12.6 Εφαρµογές της Τιµής Shapley σε Πραγµατικά Προβλήµατα.

Κριτική της Εφαρµοσιµότητας της Τιµής Shapley . . . . . . . . 465

12.6.1 Αυτοδιοίκηση Β΄ Βαθµού της Κοµητείας Nassau στην

Πολιτεία της Ν. Υόρκης (ΗΠΑ) . . . . . . . . . . . . . . 467

12.6.2 ∆ιαχείρηση των Αποθεµάτων Νερού της Περιοχής

Καναγκάβα στην Ιαπωνία . . . . . . . . . . . . . . . . . 468

12.6.3 Κατανοµή Πυροσβεστικών Αντλιών στους Πυροσβε-

στικούς Σταθµούς ανά την Ελλάδα . . . . . . . . . . . . 472

12.7 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475

Παράρτηµα Α 493

Παράρτηµα Β 519

Παράρτηµα Γ 541

Παράρτηµα ∆ 555

Παράρτηµα Ε 565

Ευρετήριο και Επεξηγήσεις Συµβόλων 569

Απαντήσεις σε Ασκήσεις 577

Βιβλιογραφία 579

ΕΥΡΕΤΗΡΙΟ ΕΛΛΗΝΙΚΩΝ ΟΡΩΝ 591

xii ΠΕΡΙΕΧΟΜΕΝΑ

ΕΥΡΕΤΗΡΙΟ ΞΕΝΟΓΛΩΣΣΩΝ ΟΡΩΝ 595

Τώρα, τί µπορώ να πω για το ίδιο το ϐιβλίο και τον καλύτερο τρόπο για να

διαβαστεί; Θα ξεκινήσω µε ένα ιδιαίτερα υπεροπτικό αίτηµα, να διαβαστεί

όχι µία αλλά δύο ϕορές. ΄Ενα αίτηµα που δε χρειάζεται να παρθεί υπόψη,

ϕυσικά, αν κάποιος έχει ϐαρεθεί από την πρώτη ανάγνωση.

Thomas Mann

Πρόλογος

Το ϐιβλίο που κρατά ο αναγνώστης στα χέρια του έχει σαν πυρήνα του τις

σηµειώσεις από ένα εξαµηνιαίο προπτυχιακό µάθηµα Θεωρίας Παιγνίων που

διδάσκουµε εδώ και είκοσι χρόνια τουλάχιστον, αρχικά στο Πολυτεχνείο Κρήτης

και στη συνέχεια στο Τµήµα Μαθηµατικών του Πανεπιστηµίου Αθηνών. ΄Οµως

η µετεξέλιξη των σηµειώσεων σε ϐιβλίο οδήγησε στη δραστική επέκταση και

εµπλουτισµό τους µε στόχο να καλυφθεί το κενό που υπάρχει στην ελληνική

ϐιβλιογραφία.

Οι ϕιλοδοξίες (και εποµένως και το ϱίσκο) της παρούσας έκδοσης είναι µε-

γάλες. Η κεντρική ιδέα που διαπερνά την παρουσίαση των ϑεµάτων είναι η

κάλυψη µεγάλου εύρους µε τρόπο συνεκτικό, ακριβή αλλά και προσπελάσιµο.

΄Ετσι απευθύνεται σε µεγάλο εύρος αναγνωστών όσον αφορά τις γνώσεις τους :

∆εν προϋποθέτει καµιά προηγούµενη επαφή µε την περιοχή και προϋποθέτει

λίγα από άλλες περιοχές (κυρίως ένα ϐασικό µάθηµα στη Θεωρία Πιθανοτήτων,

µε ό,τι αυτό προϋποθέτει, καθώς και κάποιες ϐασικές γνώσεις Πραγµατικής

Ανάλυσης, αρκούν για τα περισσότερα εδάφια). ΄Ολες οι προαπαιτούµενες πε-

ϱιοχές καλύπτονται εκτεταµένα σε σχετικά Παραρτήµατα στο τέλος του ϐιβλί-

ου. Κάθε έννοια που εισάγεται δουλεύεται µέσω αρκετών παραδειγµάτων και

εφαρµογών, µε αποτέλεσµα η δοµή του κειµένου να διαφέρει κάπως από τα

καθιερωµένα σε ϐιβλία µαθηµατικών. Παρουσιάζονται πλήθος από παιγνιοθε-

ωρητικά µοντέλα, ϑεωρητικές προσεγγίσεις και εφαρµογές, που ενδιαφέρουν

σπουδαστές ή ερευνητές της επιστήµης των Οικονοµικών. Ταυτόχρονα ασχο-

λούµαστε µε ϑέµατα που αφορούν την Επιχειρησιακή ΄Ερευνα, τη Μαθηµατική

Στατιστική, τις Πολιτικές Επιστήµες και την Εξελικτική Βιολογία. Φιλοδοξούµε

το παρόν να τραβήξει την προσοχή µελετητών απ΄ όλα τα παραπάνω πεδία.

Το µεγάλο εύρος δεν αφορά όµως µόνον το κοινό στο οποίο απευθυνόµα-

xiv Πρόλογος

στε, αλλά αφορά και τα ϑέµατα που καλύπτονται µε στόχο την εξοικείωση του

αναγνώστη µε το µεγαλύτερο εύρος της ϐασικής Θεωρίας Παιγνίων, κλασικής

και σύγχρονης. Αυτό µοιάζει µε ακατόρθωτη αποστολή, επειδή η Θεωρία Παι-

γνίων είναι µία εξαιρετικά ϱευστή επιστηµονική περιοχή που η εικόνα της αλ-

λάζει ϱιζικά κάθε δεκαετία. Θέµατα που πριν τριάντα χρόνια ‘‘έκαιγαν’’ τους

ερευνητές µπορεί σήµερα να τους αφήνουν αδιάφορους και αντίστροφα, κανείς

δεν ξέρει πόσο ενδιαφέρον ϑα προσελκύουν οι ϑερµές περιοχές της παρούσας

εποχής µετά από τριάντα χρόνια. Κατά τη γνώµη µας, δεν υπάρχει ακόµη

ένα παγκοσµίως αποδεκτό ϐασικό σύγγραµµα στη Θεωρία Παιγνίων, όπως αν-

τίστοιχα υπάρχει για τις διάφορες περιοχές της Μαθηµατικής Ανάλυσης ή των

Μακροοικονοµικών.

Κι ερχόµαστε έτσι στη δεύτερη µεγάλη ϕιλοδοξία του παρόντος : τη συνεκτι-

κότητα. ΄Εχει γίνει µεγάλη προσπάθεια η ύλη να διέπεται από κεντρικές ιδέες

και ενιαίους ϑεωρητικούς άξονες, µακριά από την εκλεκτικιστική πολυσυλλε-

κτική παράταξη µοντέλων και περιοχών. Η επιλογή της σειράς των ϑεµάτων, ο

τρόπος που εισάγουµε τον αναγνώστη στη Θεωρία Παιγνίων και ο ϱυθµός µε τον

οποίο εµβαθύνουµε υπηρετούν τον κεντρικό στόχο της συνεκτικότητας. Η προ-

σπάθεια αυτή ϑα ήταν λειψή αν δεν συνοδευόταν από την απαραίτητη ακρίβεια

στην παράθεση ιδεών και αποδείξεων. Αν και το ϐιβλίο δε µοιάζει µε τα κλασικά

µαθηµατικά συγγράµµατα, παρόλ΄ αυτά είναι απολύτως ακριβές στις µαθηµα-

τικές αποδείξεις και απολύτως σαφές στους ορισµούς. ∆ε διστάσαµε σε κάποια

σηµεία να προχωρήσουµε σε κάποιο µαθηµατικό ϐάθος, αν και πάντα προ-

σπαθήσαµε να κρατηθούµε στα πλαίσια που είχαµε ϑέσει εξ αρχής (εύρος και

συνεκτικότητα). Αποφύγαµε τη σηµείωση µε αστερίσκο των σχετικών εδαφίων,

επειδή κατά τη γνώµη µας δεν υπάρχει κάποια διαχωριστική γραµµή που να

χωρίζει τους αναγνώστες σε ειδήµονες και µή και ακόµη επειδή αισθητικά κάτι

τέτοιο έµοιαζε αντίθετο µε τη διαφάνεια του οικοδοµήµατος και τη σαφήνεια των

χρησιµοποιούµενων εργαλείων.

Και ϕτάνουµε εδώ στο αίτηµά µας : Ο αναγνώστης που ϑα ϐρει το ϐιβλίο αυτό

ενδιαφέρον καλείται να το ... ξαναδιαβάσει. Η δεύτερη και τρίτη ανάγνωση

πιστεύουµε ότι ϑα ϕωτίσει µε νέο ϕώς ό,τι αυτός έχει ήδη αποκοµίσει από

το παρόν. Ιδιαίτερα αυτό ισχύει αν ο αναγνώστης είναι ενεργός σπουδαστής

ή ερευνητής σε κάποια από τις συναφείς περιοχές (µαθηµατικά, οικονοµικά,

επιχειρησιακή έρευνα, στατιστική, πολιτικές επιστήµες, κ.λπ.).

Η προσέγγιση που ακολουθήσαµε έχει κάποια πρωτοτυπία αλλά ταυτόχρο-

να έχει δοκιµαστεί, τουλάχιστον εν µέρει, πάνω από είκοσι έτη στις αίθουσες

διδασκαλίας. Στο προπτυχιακό µάθηµα που διδάσκουµε, ϑεωρητικής διάρ-

κειας περίπου 40 διδακτικών ωρών, καλύπτονται τα Κεφάλαια 1 έως και 4 (µε

εξαίρεση τα συνεχή παιχνίδια 2-παικτών 0-αθροίσµατος), µικρό µέρος του 5ου

Πρόλογος xv

και του 6ου Κεφαλαίου, το 7ο Κεφάλαιο, καθώς και το 10ο, µέρος του 11ου

(µέχρι το Θεώρηµα Bondareva) και το 12ο. ΄Εχουµε επίσης διδάξει, πιστεύ-

ουµε µε επιτυχία, µεταπτυχιακό µάθηµα µε ύλη περίπου τη συµπληρωµατική

του προπτυχιακού (συν το Κεφάλαιο 7 µείον οτιδήποτε αφορά παιχνίδια µέσω

χαρακτηριστικής συνάρτησης).

Μέσα στην αίθουσα διδασκαλίας, στην παρουσίαση των παιχνιδιών σε ε-

κτεταµένη µορφή αποφεύγουµε την υπερβολική ενασχόληση µε ϕορµαλισµούς

(που στο γραπτό κείµενο είναι αναπόφευκτοι), επειδή οι αντίστοιχες έννοιες εί-

ναι διαισθητικά εύληπτες και γρήγορα γίνονται κατανοητές από τους ϕοιτητές.

Η ιδιοµορφία της Θεωρίας Παιγνίων είναι ότι έχει µία συνεκτική ‘‘ϕιλοσοφική’’

οπτική. ΄Ετσι, οι αρχικές δυσκολίες του εισαγόµενου στην περιοχή δεν οφείλον-

ται στο µαθηµατικό ϐάθος (όπου σε πρώτη προσέγγιση τα πράγµατα µοιάζουν

απλά) αλλά στην ιδιοµορφία των εννοιών που πρέπει να αφοµοιωθούν µε πει-

ϑαρχηµένο τρόπο σκέψης. Εποµένως, η πρώτη µας προσπάθεια είναι η σωστή

εισαγωγή στις νέες, κεντρικές έννοιες της περιοχής. Αυτό επιδιώκουµε να γίνε-

ται µε αρκετή συζήτηση και πληθώρα παραδειγµάτων.

΄Ετσι στο παρόν δώσαµε ιδιαίτερο ϐάρος στην έννοια του συνόλου πληρο-

ϕόρησης, στην έννοια της στρατηγικής και στη µετατροπή από την εκτεταµένη

στην κανονική µορφή, επειδή σ΄ αυτά τα τρία σηµεία παρουσιάζεται κάποια

δυσκολία κατανόησης στους πρωτοεισαγόµενους στην περιοχή. ΄Ενας τρόπος

παράκαµψης των δυσκολιών αυτών είναι η απ΄ ευθείας εισαγωγή στην κανονι-

κή µορφή, αλλά διαφωνούµε µε την προσέγγιση αυτή επειδή, κατά τη γνώµη

µας, έρχεται σε αντίθεση µε τον κεντρικό µας στόχο της συνεκτικής ϑεώρησης

µεγάλου εύρους της Θεωρίας Παιγνίων.

Συνοπτικά, προσπαθήσαµε να δηµιουργήσουµε ακριβώς το ϐιβλίο που ϑα

ϑέλαµε να είχαµε στα χέρια µας όταν πρωτοµπήκαµε στη Θεωρία Παιγνίων,

αλλά και αυτό στο οποίο ϑα µπορούσαµε να ανατρέχουµε καθώς κάναµε έρευνα

στην περιοχή.

Βέβαια οι περιορισµοί µεγέθους µας ανάγκασαν να µην επεκταθούµε σε

κάποιες ενότητες. Η πιο σηµαντική µας επιλογή εδώ ήταν να επικεντρωθούµε

στα παιχνίδια µε πλήρη πληροφόρηση, δηλαδή να ασχοληθούµε λίγο µε τα

λεγόµενα Μπεϋζιανά Παιχνίδια (Bayesian Games). Κατ΄ αρχήν, είναι ασαφές

τι ακριβώς συνιστά ένα παιχνίδι µε ελλιπή πληροφόρηση (αν και τέτοια παι-

χνίδια ασφαλώς υπάρχουν) καθώς τα Μπεϋζιανά Παιχνίδια τελικά ‘‘επιλύονται’’

µέσω της µετατροπής τους, ουσιαστικά, σε συνήθη παιχνίδια. ΄Οταν αυτό δε

συµβαίνει, τότε το ϑεωρητικό πλαίσιο εργασίας είναι ασαφές και οι χειρισµοί

πολύ δύσκολοι. Τα προηγούµενα κάθε άλλο παρά σηµαίνουν ότι απαξιώνουµε

τα Μπεϋζιανά παιχνίδια ή τα παιχνίδια ελλιπούς πληροφόρησης. Αντίθετα, οι

πλούσιες εφαρµογές τους, (π.χ. δηµοπρασίες) καθώς και το γεγονός ότι πρα-

xvi Πρόλογος

κτικά κάθε παιχνίδι στην πραγµατική Ϲωή διαθέτει χαρακτηριστικά ελλιπούς

πληροφόρησης, κάνουν επιτακτική την ενασχόληση µε αυτά. Το Ϲήτηµα εί-

ναι αν το υπάρχον ϑεωρητικό πλαίσιο για περιπλοκές στην πληροφόρηση των

παικτών ουσιαστικά διαφοροποιεί τα Μπεϋζιανά παιχνίδια ως περιοχή από τα

υπόλοιπα ή αν απλώς τα εντάσσει, ασφαλώς µε πιο περίπλοκο τρόπο, στις ήδη

γνωστές περιοχές. Η γνώµη µας είναι ότι συµβαίνει το δεύτερο και εποµένως

ότι τα παιχνίδια αυτά απλά πρέπει να είναι αντικείµενο ενός συγγράµµατος πιο

προχωρηµένου από το δικό µας.

Επίσης, η έµφασή µας δόθηκε κυρίως στα πεπερασµένα παιχνίδια, αν και σε

αρκετά σηµεία επεκταθήκαµε, χωρίς όµως ανάπτυξη πέρα από τα ϐασικά, και

σε συνεχή παιχνίδια. Καλύψαµε επίσης αρκετές περιοχές, που κρίνουµε ση-

µαντικές για µια αρχική προσέγγιση στη Θεωρία Παιγνίων, παιχνιδιών άπειρης

διάρκειας. Στο ∆εύτερο Μέρος παραλείψαµε τα παιχνίδια µη µεταφερόµενης

ωφέλειας (NTU games) και ακόµη δεν αναφερθήκαµε καθόλου στα διαφορικά

παιχνίδια (differential games), που ουσιαστικά συνιστούν προβλήµατα ελέγχου.

∗ ∗ ∗

∆ύο λόγια σχετικά µε την ορολογία και τη διάρθρωση του ϐιβλίου αυτού.

Προτιµήσαµε, µε εξαίρεση τον τίτλο, τον όρο ‘‘παιχνίδι’’, αντί ‘‘παίγνιο’’.

Η εντύπωσή µας είναι ότι στην καθοµιλουµένη η λέξη ‘‘παίγνιο’’ δηµιουργεί

αντηχήσεις µε την κακόηχη λέξη ‘‘µπαίγνιο’’ καταπιέζοντας την υποσυνείδητη

ευχαρίστηση (ανάµικτη µε πρόκληση) που γεννά η λέξη ‘‘παιχνίδι’’. Αλλά όµως,

η ϑεωρία που εµείς γνωρίζουµε έχει ακριβώς αυτά τα δεύτερα χαρακτηριστικά

και, κατά τη γνώµη µας, είναι αµαρτία να τα απωθούµε.

Πολλοί όροι έχουν µεταφραστεί από εµάς ελλείψει δοκιµασµένης στο χρόνο

άλλης µετάφρασης (π.χ. ο όρος ‘‘στρατηγική κατάσταση’’). Πάντως, όταν πρω-

τοεµφανίζεται στο κείµενο κάποιος όρος, παραθέτουµε σε παρένθεση και τον

αντίστοιχο αγγλικό για διευκόλυνση του αναγνώστη (και πιθανόν µελλοντικού

µεταπτυχιακού ϕοιτητή στο εξωτερικό). Τέλος, ορισµένοι όροι χρησιµοποιήθη-

καν όπως έχουν ήδη καθιερωθεί στην ελληνική ϐιβλιογραφία, αν και διαφωνού-

µε µε αυτούς (π.χ. ‘‘αποπληθωρισµένος’’ τρόπος υπολογισµού της πληρωµής).

Τα κεφάλαια χωρίζονται σε εδάφια. Η αρίθµηση ορισµών, ϑεωρηµάτων,

προτάσεων, σχέσεων, ασκήσεων, κ.λπ. είναι κατά κεφάλαιο και εδάφιο. ΄Ετσι

για παράδειγµα, Θεώρηµα 5.2.1 σηµαίνει το πρώτο ϑεώρηµα του δεύτερου ε-

δαφίου του πέµπτου κεφαλαίου. Η αρίθµηση κατά κατηγορία είναι ξεχωριστή

(δηλ. µπορεί να υπάρχει ταυτόχρονα Θεώρηµα 5.2.1, Ορισµός 5.2.1 και Πρό-

ταση 5.2.1). Σε ορισµένα κεφάλαια υπάρχουν και υποεδάφια. ΄Ετσι το Εδάφιο

5.2.3 είναι το τρίτο υποεδάφιο του δεύτερου εδαφίου του πέµπτου κεφαλαίου.

Στο τέλος κάθε κεφαλαίου δίνονται ασκήσεις, που συστήνουµε ιδιαίτερα

στον αναγνώστη να ασχοληθεί µαζί τους, αφού χωρίς την επίλυση ασκήσεων η

Πρόλογος xvii

αφοµοίωση της ϑεωρίας είναι αδύνατη. ΄Εγινε προσπάθεια η κάθε άσκηση να

συνεισφέρει κάτι διαφορετικό και να αποφευχθεί η επανάληψη. Αρκετές από

αυτές αλληλεπιδρούν µε το κυρίως κείµενο (αλλά µε διάφανο τρόπο). Η δυσκο-

λία τους ποικίλει, αν και γενικά αποφύγαµε τις ιδιαίτερα δύσκολες. Σε αρκετές

δίνεται υπόδειξη ή απάντηση. Η γκάµα τους είναι µεγάλη: από µοντελοποίηση

µέχρι υπολογιστική επίλυση µέχρι ϑεωρητικές αποδείξεις.

΄Οπως στα παραδείγµατα έτσι και στις ασκήσεις, συχνά το ίδιο µοντέλο εµ-

ϕανίζεται σε πολλά διαφορετικά κεφάλαια. Επικεντρώνεται έτσι η προσοχή στο

εκάστοτε συζητούµενο τεχνικό ϑέµα, αλλά αν ο αναγνωστης επιθυµεί µια ολο-

κληρωµένη εικόνα του µοντέλου, τότε οφείλει να πραγµατοποιήσει τη σύνθεση

µόνος του. ΄Οµως, η σύνθεση αυτή ποτέ δεν είναι δύσκολη και διευκολύνεται

µε κατάλληλες παραποµπές.

Στη ϐιβλιογραφία παραθέτουµε αποκλειστικά πηγές στις οποίες γίνεται ανα-

ϕορά στο κυρίως κείµενο. ΄Οµως, επειδή τα Παραρτήµατα Α, Β και Γ αφορούν

‘‘γενικές γνώσεις’’, ϑεωρήσαµε σκόπιµο σε κάθε ένα από αυτά να δώσουµε χωρι-

στή ϐιβλιογραφία, η οποία έχει γενικό χαρακτήρα παραποµπής στις αντίστοιχες

περιοχές.

∗ ∗ ∗

Στη γωνία από την οποία ϐλέπουµε τη Θεωρία Παιγνίων και στον τρόπο που

έχουµε καταλήξει ότι µας αρέσει να διδάσκεται αυτή επηρεαστήκαµε σε µεγάλο

ϐαθµό από τον Lloyd Shapley (αν και δεν είναι απαραίτητο ο ίδιος να συµφωνεί

µε το τελικό αποτέλεσµα). Επίσης, το παρόν ϐιβλίο έχει επηρεαστεί από τον

ξεχωριστό τρόπο του Tom Ferguson, στον οποίο οφείλουµε πολλά. Και ακόµη,

όπως είναι ϕυσικό, έχει επηρεαστεί ιδιαίτερα από αρκετά έτη ϕοιτητών µας,

από τις απορίες και τις παρατηρήσεις τους κατά τη διδασκαλία του αντίστοιχου

µαθήµατος. Οι κύριες και ϐασικές ευχαριστίες µας απευθύνονται σε αυτούς.

Η συγγραφή αυτού του ϐιβλίου ξεκίνησε το ϕθινόπωρο του 2006 και κράτησε

περίπου τρία χρόνια. Στο χρονικό αυτό διάστηµα µας δόθηκε ϐοήθεια και

συµπαράσταση από πολλές πλευρές. Καταρχήν, ευχαριστούµε το Πανεπιστήµιο

Αθηνών που µέσω εκπαιδευτικής άδειας κατά το πρώτο εξάµηνο του 2006-2007

έκανε δυνατό να ξεκινήσει η συγγραφή. Περισσότερο από το ένα τρίτο του

ϐιβλίου γράφηκε εκείνο το εξάµηνο, περίπου επιβεβαιώνοντας το γνωµικό ότι ‘‘η

αρχή είναι το ήµισυ του παντός’’. Η προσπάθειά µας ενισχύθηκε ακόµη από τις

απρόσµενες δυνατότητες χρόνου που πρόσφεραν οι καταλήψεις του δεύτερου

εξαµήνου του 2006-2007 και του πρώτου εξαµήνου του 2008-2009, αλλά δε

γνωρίζουµε ποιόν ϑα έπρεπε να ευχαριστήσουµε γι΄ αυτό∗.

∗Είναι γεγονός ότι κάτω από κανονικές συνθήκες διδασκαλίας, για µας τουλάχιστον, είναι

αδύνατο να επιτευχθεί η συγκέντρωση και ‘‘ϐύθιση’’ στο αντικείµενο, η οποία απαιτείται από τη

xviii Πρόλογος

Τα τελευταία τρία χρόνια αρκετοί συνάδελφοι και ϕίλοι ϐοήθησαν µε διορ-

ϑώσεις και σχόλια πάνω στα χειρόγραφα. Ξεχωριστή, ανάµεσά τους, ήταν η

ϐοήθεια του κ. Απόστολου Μπουρνέτα. Είναι απίστευτη η ποσότητα και η

ποικιλία των λαθών που έπιασε η τσιµπίδα του. Τον ευγνωµονώ για το χρόνο

που αφιέρωσε και ελπίζω ότι η πολύτιµη ϐοήθειά του ϑα δικαιωθεί από το α-

ποτέλεσµα. ∆ιορθώσεις ακόµη συνεισέφεραν οι κ.κ. Αντώνης Οικονόµου και

∆ηµήτρης Ζήσης τους οποίους ευχαριστώ ϑερµά.

Στα σχήµατα ήταν µεγάλη η ϐοήθεια της κας Πόπης Μπολιώτη, που δυστυ-

χώς δεν είναι πια µαζί µας. Τη δακτυλογράφηση ανέλαβε η κα Ρόζα Γαρδέρη

που µε υποµονή και µαστοριά έγραψε και διόρθωσε κάθε κεφάλαιο ξανά και

ξανά. Τις ευχαριστώ πολύ. Ιδιαίτερα, ακόµη, ευχαριστώ τον κ. Γιώργο Αφένδρα

για την πολύτιµη ϐοήθειά του, χωρίς την οποία η τελική εµφάνιση του ϐιβλίου

ϑα ήταν πολύ διαφορετική.

Οφείλω επίσης ξεχωριστές ευχαριστίες στον επίτιµο καθηγητή, κ. Θεόφιλο

Κάκουλλο, που µου µίλησε για το απόσπασµα του Θουκυδίδη που κοσµεί την

προµετωπίδα του ϐιβλίου∗ και στο ϕιλόλογο κ. ΄Αγγελο Ματθαίου που σχολίασετο πιο πάνω απόσπασµα και την απόδοσή του στη νεοελληνική (ϐλ. Εδάφιο

4.1).

Το απόσπασµα του Thomas Mann προέρχεται από διάλεξη που είχε δώσει

στο Πανεπιστήµιο του Princeton µε ϑέµα το ‘‘Μαγικό Βουνό’’ το 1939†.

Αθήνα, Ιούνιος 2009

συγγραφή ενός σοβαρού έργου. ΄Ετσι, εκτός από τις παραπάνω περιόδους, η κυρίως συγγραφή

γινόταν µε πολύ µεγαλύτερη ένταση κατά τις περιόδους διακοπών.∗Το απόσπασµα είναι από το Βιβλίο 1, Κεφάλαιο 84 της Ιστορίας του Πελοποννησιακού Πο-

λέµου. Εντοπίστηκε και συνδέθηκε µε τη Θεωρία Παιγνίων από τον E. Rubin (1971). Ο Θ.

Κάκουλλος (1995) αναφέρεται σε αυτό σε οµιλία του µε ϑέµα έννοιες από τις περιοχές των πιθα-

νοτήτων, της στατιστικής και της ϑεωρίας αποφάσεων, όπως αυτές υπάρχουν σε κείµενα αρχαίων

Ελλήνων συγγραφέων.†Η διάλεξη αυτή δόθηκε απευθείας στα αγγλικά, είναι δηµοσιευµένη µε τίτλο ‘‘The Making

of The Magic Mountain’’ στο περιοδικό The Atlantic Monthly, τόµος 191 (1953) και αναδηµο-

σιεύεται στην αµερικανική έκδοση του Μαγικού Βουνού από τον A. Knopf (1953), µετάφραση

Lowe-Porter. Στα ελληνικά υπάρχει στην έκδοση του Μαγικού Βουνού από τον Εξάντα (1995).

Κεφάλαιο 1

Εισαγωγή

1.1 Θεωρία Παιγνίων – ∆υό Λόγια για το Αντικείµενο

Η ‘‘Θεωρία Παιγνίων’’ (Game Theory) ανήκει στους κλάδους των Εφαρ-

µοσµένων Μαθηµατικών που γνώρισαν την ανάπτυξή τους κυρίως µετά το Β΄

Παγκόσµιο Πόλεµο και που ως αντικείµενό τους έχουν την ανάλυση διαφόρων

‘‘δυνατοτήτων αποφάσεων’’ και την αξιολόγησή τους σύµφωνα µε κάποιο κριτή-

ϱιο. Τέτοιοι κλάδοι, για παράδειγµα, είναι ο Μαθηµατικός Προγραµµατισµός

(γραµµικός, µη γραµµικός, δυναµικός, κ.λπ.), η Στατιστική Θεωρία Αποφάσε-

ων, η Πολυκριτήρια Ανάλυση, κ.ά. Αυτού του είδους τα µαθηµατικά γεννήθη-

καν από τις ανάγκες που προκάλεσε η εµφάνιση των Επιστηµών Οργάνωσης

της Παραγωγής και ∆ιοίκησης την ίδια περίοδο καθώς και από τις ανάγκες α-

νάπτυξης ποσοτικών µεθόδων ανάλυσης σε πιο παραδοσιακές επιστήµες (π.χ.

Οικονοµικά, Πολιτικές Επιστήµες). Η ωρίµανση αυτών των περιοχών των ε-

ϕαρµοσµένων µαθηµατικών οδήγησε σε ευρύτατες εφαρµογές στα ϑεωρητικά

και εφαρµοσµένα οικονοµικά, στη διοίκηση επιχειρήσεων, στην οργάνωση και

διαχείριση δικτύων ανεφοδιασµού, µεταφορών και επικοινωνιών, στις πολιτικές

επιστήµες, στη στρατηγική ‘‘τέχνη’’. Εφαρµογές έχουµε και σε πιο τεχνολογικές

περιοχές, όπως στην επεξεργασία σήµατος και εικόνας, στη χηµική ϐιοµηχανία,

κ.ά. ή και σε καθαρά ϑεωρητικές περιοχές, όπως π.χ. στη ϑεωρητική ϐιολογία,

στη ϑεωρητική πληροφορική, κ.ά.

Συγγενέστερη στη ϑεωρία παιγνίων, για κάποιον εξοικειωµένο µε τα µα-

ϑηµατικά, εµφανίζεται αρχικά η περιοχή του µαθηµατικού προγραµµατισµού.

Γενικά, το πρόβληµα που εξετάζει ο µαθηµατικός προγραµµατισµός είναι η

µεγιστοποίηση (ή ελαχιστοποίηση) κάποιας συνάρτησης (π.χ. το κέρδος ή το

κόστος) κάτω από περιορισµούς. Αυτός που µεγιστοποιεί (ή ελαχιστοποιεί) την

συνάρτηση λέγεται ‘‘ελεγκτής’’ και οι µεταβλητές, που τις τιµές τους αυτός επι-

λέγει ώστε να πετύχει το στόχο του, λέγονται ‘‘µεταβλητές ελέγχου’’. Ανάλογα µε

2 Κεφάλαιο 1

το είδος της συνάρτησης και το είδος των περιορισµών έχουµε διάφορες εκδοχές

µαθηµατικού προγραµµατισµού.

Στη ϑεωρία παιγνίων το πρόβληµα είναι ανάλογο, όµως τώρα έχουµε τουλά-

χιστον δύο διαφορετικούς ελεγκτές, οι οποίοι στη ϑεωρία παιγνίων ονοµάζονται

‘‘παίκτες’’. Τώρα, η πληρωµή (ή το κόστος) κάθε παίκτη δίνεται από διαφορετική

συνάρτηση (µία για κάθε παίκτη), η οποία όµως εξαρτάται από πολλές µετα-

ϐλητές ελέγχου. Ο πρώτος παίκτης ελέγχει την πρώτη µεταβλητή, ο δεύτερος τη

δεύτερη, κ.ο.κ. Εποµένως, η πληρωµή κάθε παίκτη εξαρτάται όχι µόνο από τις

δικές του αποφάσεις, αλλά και από τις αποφάσεις όλων των υπολοίπων. ΄Ετσι,

το όφελος ενός παίκτη µπορεί να είναι σε κάποιο ϐαθµό ή και ολοκληρωτικά σε

σύγκρουση µε το όφελος κάποιου άλλου παίκτη. Ας σκεφτούµε ένα πολύ απλό

παράδειγµα: ∆ύο ανταγωνίστριες εταιρείες, η A και η B, παράγουν ένα όµοιο

προϊόν, του οποίου η τιµή στην αγορά διαµορφώνεται από τη σχέση προσφοράς

- Ϲήτησης. Ας πούµε ότι µεταβλητή απόφασης για την κάθε εταιρία είναι τα

κοµµάτια προϊόντος που ϑα παράξει, ενώ το κέρδος της ϑα είναι το γινόµενο

των κοµµατιών που πούλησε επί το κέρδος ανά κοµµάτι. Αλλά το κέρδος ανά

κοµµάτι εξαρτάται από την τιµή πώλησης, η οποία εξαρτάται από τα κοµµάτια

του προϊόντος που διοχετεύθηκαν στην αγορά. ΄Αρα το κέρδος της εταιρίας A

είναι συνάρτηση και των δύο µεταβλητών απόφασης (κοµµάτια που παρήγαγε

η A αλλά και κοµµάτια που παρήγαγε η B).

Σαν αποτέλεσµα αυτής της αλληλεπίδρασης οδηγούµαστε σε µαθηµατικά

‘‘παράδοξα’’. Αποφάσεις που µοιάζουν λογικές µπορεί να οδηγήσουν σε κατα-

στροφή έναν παίκτη. Η ίδια η έννοια της ‘‘λύσης’’ του προβλήµατος µπορεί να

ποικίλει (κάτι ασυνήθιστο στα µαθηµατικά), µπορεί οι διάφορες λύσεις να είναι

αντιφατικές µεταξύ τους και ανάλογα µε την πραγµατικότητα που απεικονίζει

το µοντέλο, άλλη ‘‘λύση’’ να γίνεται δεκτή και άλλη να απορρίπτεται. Συχνά

οι λύσεις µας δεν είναι ικανοποιητικές από την άποψη της ϑεωρίας, αφού τους

λείπουν ιδιότητες που ϑα περιµέναµε ‘‘ϕυσιολογικά’’ να είχαν.

Η Θεωρία των Παιγνίων προσπαθεί λοιπόν να αντιµετωπίσει µε µαθηµατικές

µεθόδους µοντέλα σύγκρουσης και συνεργασίας. Για το σκοπό αυτό χρη-

σιµοποιεί έννοιες του είδους : πλήρες σχέδιο δράσης (στρατηγική), στρατηγική

ισορροπία, επικοινωνία πριν την επιλογή στρατηγικής, απειλή και ανταπόδοση,

εµπιστοσύνη και αυτοδέσµευση. Συχνά οι λύσεις που προτείνονται έχουν το

µειονέκτηµα να απαιτούν από τους παίκτες να είναι µε κάποιο τρόπο ‘‘λογικοί’’

και/ή να γνωρίζουν τις εναλλακτικές λύσεις που έχουν στη διάθεσή τους και/ή

το πως εκτιµούν οι αντίπαλοι και/ή οι συνεργάτες τους τα κέρδη ή τις Ϲηµιές

από το παιχνίδι.

Η ϑεωρία παιγνίων παραµένει πλουραλιστική στην ανάπτυξή της, µε ασαφή

το ϑεωρητικό της σκελετό, ίσως ακριβώς επειδή προσπαθεί να διερευνήσει µια

1.2 Μερικά Ιστορικά Στοιχεία 3

πραγµατικότητα που είναι καθεαυτή πλουραλιστική ή και αντιφατική. Βέβαια

κατά καιρούς εµφανίζονται απόψεις που υποστηρίζουν ότι η ϑεωρία παιγνίων

είναι ένα είδος υπερ-ϑεωρίας που ενοποιεί τις κοινωνικές επιστήµες, ότι η τάδε

ή η δείνα παιγνιοθεωρητική έννοια λύνει ‘‘µια για πάντα’’ το Ϲήτηµα της ϑεωρη-

τικής ανάλυσης αποφάσεων που παίρνονται ανεξάρτητα αλλά αλληλοεπιδρούν,

κ.λπ. Τέτοιες απόψεις οδηγούν στην απογοήτευση, καθώς τα προσδοκόµενα

ϑαύµατα δεν εµφανίζονται στις κοινωνικές και οικονοµικές επιστήµες. Τέτοια

ϕαινόµενα είχαµε στα τέλη της δεκαετίας του 1960, που οδήγησαν στη συρρί-

κνωση του ενδιαφέροντος, τότε, για την περιοχή. Στις µέρες µας όµως η ϑεωρία

παιγνίων γνωρίζει πρωτοφανή άνθηση. Το ασφαλές συµπέρασµα είναι ότι, πα-

ϱά τις διακυµάνσεις στο ενδιαφέρον που τραβά, η ϑεωρία παιγνίων έχει πλέον

περάσει στη ϕάση της ώριµης ανάπτυξης.

1.2 Μερικά Ιστορικά Στοιχεία

Εκ των υστέρων αναγνωρίζουµε ότι κάποια δηµοσιευµένα προβλήµατα του

19ου ή και των αρχών του 20ου αιώνα ήταν παιχνίδια, όπως το ολιγοπώλιο του

Cournot ή το Nim. Τον 20ο αιώνα, στις αρχές της δεκαετίας του ΄20, ο Emil

Borel ασχολήθηκε συστηµατικά πρώτος µε παιχνίδια δύο παικτών µηδενικού

αθροίσµατος (όπου δηλαδή η πληρωµή του ενός είναι το αντίθετο της πληρωµής

του άλλου παίκτη και εποµένως δεν υπάρχει περιθώριο συνεργασίας

µεταξύ τους) και σ΄ αυτόν κυρίως οφείλουµε την ιδέα της χρήσης ‘‘µεικτών στρα-

τηγικών’’ (δηλαδή τυχαίων µηχανισµών για τη λήψη αποφάσεων) καθώς και την

ιδέα της αναζήτησης ‘‘κοινού επιπέδου ασφάλειας’’ των δύο παικτών ως έννοια

λύσης τέτοιων παιχνιδιών (σχετικά ϐλ. E. Borel (1921, 1924, 1927). Τα άρθρα

αυτά έχουν συλλεγεί στον 21ο τόµο της Econometrica (1953), σελ. 97-117).

Ο Borel δεν κατάφερε να απαντήσει στο ερώτηµα ύπαρξης τέτοιας λύσης για

αυθαίρετο τέτοιο παιχνίδι, αν και έλυσε το πρόβληµα για ειδικές περιπτώσεις.

Στα τέλη της δεκαετίας του ΄20, ο John Von Neumann (1928) (µεγάλη µορ-

ϕή των µαθηµατικών του περασµένου αιώνα) απέδειξε την ύπαρξη της λύσης

µέσω ενός αρκετά ϐαθιού τοπολογικού ϑεωρήµατος, του ϑεωρήµατος σταθερού

σηµείου του Brouwer. Το ϑεώρηµα αυτό ονοµάστηµε Θεώρηµα Minimax. Η

απόδειξη του Von Neumann δεν πρόσφερε µέθοδο επίλυσης (ήταν, όπως λέµε,

‘‘υπαρξιακή’’) και χρειάστηκε να περάσουν γύρω στα είκοσι-πέντε χρόνια µέχρις

ότου γίνει αριθµητική επίλυση µέσω της µεθόδου Simplex του G. Dantzig. Στα

τέλη της δεκαετίας του ΄60 ο G. Owen (1967) ανακάλυψε µια στοιχειώδη α-

πόδειξη του Θεωρήµατος Minimax, η οποία αν είχε ϐρεθεί από τους Borel -

Von Neumann πιθανό να είχε ϕρενάρει τη µεγάλη µεταγενέστερη ανάπτυξη της

ϑεωρίας παιγνίων. Ο Von Neumann καταπιάστηκε και µε αρκετά άλλα ϑέ-


µατα προσπαθώντας να δηµιουργήσει µία ενιαία ϑεωρία. Καρπός των κοινών

εργασιών του µε τον οικονοµολόγο Oscar Morgenstern ήταν το διάσηµο πλέον

ϐιβλίο ‘‘Θεωρία Παιγνίων και Οικονοµική Συµπεριφορά’’ (Theory of Games and

Economic Behavior (1944)), του οποίου η δηµοσίευση ϑεωρείται ότι σηµαδεύει

το πέρασµα της ϑεωρίας παιγνίων από την προϊστορία στην ιστορία. Παρ΄ όλα

αυτά, οι έννοιες επίλυσης που εισηγήθηκε ο Von Neumann για παιχνίδια µη

µηδενικού αθροίσµατος (τα περισσότερα πραγµατικά µοντέλα είναι τέτοια), δεν

‘‘περπάτησαν’’. Με την έλευση της δεκαετίας του ΄50, ο John Nash (1950) ει-

σηγήθηκε µία γενίκευση του Θεωρήµατος Minimax που έµελλε να τον κάνει

διάσηµο λόγω της αναπάντεχα επιτυχηµένης εφαρµοσιµότητας που συνάντησε

στις επιστήµες εκτός των µαθηµατικών (κυρίως στα οικονοµικά). Λέγεται ότι ο

Von Neumann δεν έδωσε σηµασία στον (µεταπτυχιακό ϕοιτητή τότε) Nash, όταν

εκείνος πήγε για να του πει την ιδέα του, ακριβώς επειδή δεν αντιλαµβανόταν

όχι την µαθηµατική προσέγγιση της γενίκευσής του, αλλά την εφαρµοσιµότητά

της.

Σήµερα η ϑεωρία παιγνίων αποτελεί ϐασικό εργαλείο των ϑεωρητικών, αλ-

λά και των εφαρµοσµένων οικονοµικών. Παιγνιοθεωρητικοί έχουν ϐραβευθεί

επανειληµµένα µε το ϐραβείο Nobel στα Οικονοµικά. Αποτελέσµατά της δη-

µοσιεύονται συνεχώς σε όλα τα σηµαντικά διεθνή επιστηµονικά περιοδικά των

Οικονοµικών, της Επιχειρησιακής ΄Ερευνας, της ∆ιοίκησης Επιχειρήσεων (Ma-

nagement), αλλά και των Πιθανοτήτων, της Στατιστικής, της Βιολογίας, της Μα-

ϑηµατικής Λογικής, της Πληροφορικής, κ.ά. Στις µέρες µας η ϑεωρία παιγνίων

διδάσκεται σε προπτυχιακό και µεταπτυχιακό επίπεδο σε αντίστοιχα τµήµατα

(µαθηµατικών, οικονοµικών, διοίκησης επιχειρήσεων, στατιστικής, κ.λπ.) και

ανάµεσα στις διάφορες περιοχές των σύγχρονων µαθηµατικών είναι µάλλον ε-

κείνη που έχει τραβήξει το ενδιαφέρον των άλλων επιστηµών περισσότερο από

οποιαδήποτε άλλη.

1.3 ΄Ενα Παράδοξο Παιχνίδι

Η ϱευστότητα της ίδιας της έννοιας της λύσης ενός παιχνιδιού (πρόβληµα

που δεν παρουσιάζεται στο µαθηµατικό προγραµµατισµό) µπορεί να γίνει αν-

τιληπτή κατά ‘‘διασκεδαστικό’’ τρόπο από το παράδειγµα που ακολουθεί (πρω-

τοδηµοσιεύτηκε από τους L. Shapley και M. Shubik (1972), αλλά υπάρχει και

στο Shubik M. (1982), Εδάφιο 2.2.2).

Τρεις παίκτες, οι A, B και C, διαθέτουν από ένα µπαλόνι και παίζουν το εξής

παιχνίδι. Στην αρχή µε κλήρο (πιθανότητα 1/3 για τον κάθε ένα να κληρωθεί)

επιλέγεται ο παίκτης που ϑα πυροβολήσει πρώτος. Αυτός αποφασίζει ποιό από

τα µπαλόνια των άλλων δύο ϑα πυροβολήσει. Αν αστοχήσει το παιχνίδι αρχί-

1.3 ΄Ενα Παράδοξο Παιχνίδι 5

Ϲει από την αρχή (µε πιθανότητα 1/3 κληρώνεται αυτός που ϑα πυροβολήσει,

κ.ο.κ.). Αν επιτύχει, τότε το παιχνίδι ξαναρχίζει µεταξύ των δύο παικτών µε

ανέπαφο µπαλόνι. ΄Ενας από τους δύο κληρώνεται τότε (πιθανότητα επιλογής

για τον κάθε ένα 1/2), πυροβολεί το µπαλόνι του άλλου, κ.λπ. Νικητής είναι ο

παίκτης που ϑα κρατήσει το µπαλόνι του ανέπαφο.

Ζητάµε τη ‘‘ϐέλτιστη επιλογή’’ ενός παίκτη, αν αυτός κληρωθεί, προκειµένου

να µεγιστοποιήσει την πιθανότητά επιβίωσής του. Θα υποθέσουµε ότι η ευστοχία

των A, B, C δίνεται από αριθµούς a, b, c, 0 ≤ a, b, c ≤ 1, όπου a = πιθανότητα οA να επιτύχει το στόχο που πυροβολεί (και οµοίως για b και c). Θα υποθέσουµε

ότι οι ευστοχίες είναι γνωστές σε όλους τους παίκτες, σταθερές σε όλη τη διάρκεια

του παιχνιδιού και ότι a > b > c (δηλαδή ο A είναι ο καλύτερος σκοπευτής και

ο C ο χειρότερος).

Ας ονοµάσουµε Γ το παιχνίδι αυτό και ας ονοµάσουµε ΓAB (ΓBC, ΓAC) τα

υποπαιχνίδια όπου ο C έχει ϕύγει από τη µέση (αντίστοιχα ο A, ο B). Στα

υποπαιχνίδια ΓAB, ΓBC, ΓAC η επιλογή που έχει να κάνει ένας παίκτης όταν

κληρωθεί είναι προδιαγεγραµµένη : ϑα πυροβολήσει το µπαλόνι του άλλου.

Αυτό όµως δεν συµβαίνει στο Γ , όπου εκεί ο παίκτης που ϑα κληρωθεί έχει να

κάνει µία στρατηγική επιλογή : οφείλει να επιλέξει ποιόν από τους άλλους δύο

ϑα πυροβολήσει.

Για να λύσουµε το πρόβληµα (εύρεση λύσης για τη στρατηγική επιλογή η ο-

ποία ϑα µεγιστοποιεί την πιθανότητα επιβίωσης), ϑα είναι απαραίτητο καταρχήν

να ϐρούµε τις πιθανότητες επιβίωσης κάθε παίκτη στα υποπαιχνίδια.

΄Εστω PAB η πιθανότητα επιβίωσης του A στο ΓAB (εποµένως η PBA ϑα ορίζεται

συµµετρικά και ϑα ισχύει PBA = 1 − PAB, αφού το ΓAB τελειώνει µε πιθανότητα1).

Για να υπολογίσουµε την PAB δεσµεύουµε ως προς το ποιός παίκτης ϑα

κληρωθεί και ως προς το αν αυτός που κληρωθεί ϑα πετύχει το στόχο. Υπάρχουν

τρία, ξένα µεταξύ τους, ενδεχόµενα :

(i) Στην αρχή κληρώνεται ο A και αυτός πετυχαίνει το στόχο, που συµβαίνει

µε πιθανότητα1

2a. Κάτω από αυτό το ενδεχόµενο η πιθανότητα επιβίωσης

του A είναι 1.

(ii) Στην αρχή κληρώνεται ο B και αυτός πετυχαίνει το στόχο, που συµβαίνει

µε πιθανότητα1

2b. Κάτω από αυτό το ενδεχόµενο η πιθανότητα επιβίωσης

του A είναι 0.

(iii) Ο παίκτης που κληρώνεται αστοχεί και το παιχνίδι αρχίζει πάλι από την

αρχή, που συµβαίνει µε πιθανότητα 1 − 12

a − 12

b. Κάτω από αυτό το

ενδεχόµενο η πιθανότητα επιβίωσης του A είναι PAB.


Σχηµατικά

��

��

��

PAB

XXXXXX

1

HHHHHH��

PAB

XXXXXX

0

qq

q

1/2

1/2

a

1 − a

b

1 − b

Σχήµα 1.3.1

Εποµένως η πιθανότητα επιβίωσης του A στο ΓAB, PAB, ως ολική πιθανότητα ϑα

ικανοποιεί τη σχέση

PAB =1

2a(1) +

1

2b(0) +

(1 − 1

2a − 1

2b)(PAB).

Λύνοντας την εξίσωση ως προς PAB παίρνουµε

PAB =a

a + b.

Οµοίως παίρνουµε τα PBC, PCA κ.ο.κ.(π.χ. PBC =

b

b + c

).

Ας εξετάσουµε τώρα το παιχνίδι µε 3 παίκτες, το Γ , και ας ονοµάσουµε PA,

PB, PC τις πιθανότητες επιβίωσης των A, B, C αντίστοιχα σε αυτό. Οι πιθανότητες

αυτές µπορούν να υπολογιστούν όπως πριν µονάχα αφού απαντήσουµε στο πρό-

ϐληµα της στρατηγικής επιλογής : Εάν κάποιος παίκτης κληρωθεί, ποιόν στόχο

να πυροβολήσει από τους δύο διαθέσιµους προκειµένου να µεγιστοποιήσει την

πιθανότητα επιβίωσής του; Υπενθυµίζουµε ότι 1 ≥ a > b > c ≥ 0.΄Εστω ότι ο παίκτης αυτός είναι ο A. Εάν κληρωθεί, µία πολύ λογική σκέψη

που µπορεί να κάνει είναι η εξής : ΄Οποιον στόχο κι αν προτιµήσω να πυροβολή-

σω η πιθανότητα επιτυχίας µου δεν αλλάζει (a). Αν αποτύχω, το παιχνίδι αρχίζει

από την αρχή και η παρούσα επιλογή µου δεν έχει σηµασία στα περαιτέρω. Αν

όµως επιτύχω, τότε στο επόµενο στάδιο η πιθανότητα επιβίωσής µου ϑα είναι ή

PAB =a

a + bή PAC =

a

a + c. Αφού

a

a + b<

a

a + c, µε συµφέρει στο επόµενο

στάδιο να αντιµετωπίσω τον C. ΄Αρα η λύση στο πρόβληµα της στρατηγικής µου

επιλογής ϑα είναι να πυροβολήσω το στόχο του B.

Με το ίδιο σκεπτικό, ο B όταν κληρώνεται στο Γ ϑα πυροβολεί τον A. Οµοίως

ο C ϑα πυροβολεί τον A.


Ας υπολογίσουµε τώρα την PA. ∆ουλεύοντας ανάλογα µε τους υπολογισµούς

για την εύρεση της PAB, ϑα έχουµε

PA =1

3aPAC +

1

3(1 − a)PA +

1

3(1 − b)PA +

1

3(1 − c)PA

=1

3aPAC +

1

3(3 − a − b − c)PA.

Σχηµατικά

��

��

��

��

PA

XXXXXX

PAC

��

PA

XXXXXX

0

@@

@@

@@��

��

PA

XXXXXX

0

q

q

q

q

1/3

1/3

1/3

a

1 − a

b

1 − b

c

1 − c

Σχήµα 1.3.2

Λύνοντας παίρνουµε

PA =aPAC

a + b + c=

a2

(a + c)(a + b + c).

Εργαζόµενοι ανάλογα έχουµε για τον B

PB =1

3bPBC +

1

3cPBC +

1

3(1 − a)PB +

1

3(1 − b)PB +

1

3(1 − c)PB.

΄Αρα

PB =(b + c)PBC

a + b + c=

b

a + b + c.

Και για τον C

PC =1

3aPCA +

1

3bPCB +

1

3cPCB +

1

3(1 − a)PC +

1

3(1 − b)PC +

1

3(1 − c)PC.

΄Αρα

PC =aPCA + bPCB + cPCB

a + b + c=

c(2a + c)

(a + c)(a + b + c).


Η λύση που δώσαµε µοιάζει απολύτως λογική. Αν όµως υπολογίσουµε τις

πιθανότητες επιβίωσης PA, PB, PC ϑα δούµε ότι για ένα µεγάλο εύρος τιµών των

a, b, c ισχύει PA < PB < PC, δηλ. η πιθανότητα επιβίωσης των παικτών έχει

αντίστροφη διάταξη από την σκοπευτική τους δεινότητα. Για παράδειγµα, αν

a = 0.8, b = 0.6 και c = 0.4 ϑα πάρουµε PA = 0.296, PB = 0.333, PC = 0.370.

Αν και από τον A προσδοκούµε διπλάσιες επιτυχίες απ΄ ότι από τον C, εντούτοις

ο A έχει πολύ µικρότερη πιθανότητα επιβίωσης από τον C.

Τί συνέβη; ΟA και ο B, ακολουθώντας τη λογική ανάλυσή τους, καταλήγουν

να πολεµάνε µεταξύ τους προς µεγάλη ευχαρίστηση του C.

Ας υποθέσουµε τώρα ότι οι κανόνες του παιχνιδιού (δηλαδή το κοινωνικό

περιβάλλον αυτού του µοντέλου σύγκρουσης και συνεργασίας) επιτρέπει στους

παίκτες να συνεννοηθούν και να δεσµευτούν από πριν (π.χ. µε συµβόλαια) για

τις ενέργειές τους.

΄Εστω λοιπόν ότι τότε οι A και B συµµαχούν εναντίον του C και κάθε ϕορά

που κληρώνονται τον πυροβολούν (µία στρατηγική που µοιάζει παράλογη: ένω-

ση των ισχυρών εναντίον του πλέον αδύνατου). Ας ϑεωρήσουµε ότι ο C συνεχίζει

να πυροβολεί τον A όποτε κληρωθεί (έτσι κι αλλιώς αν οι άλλοι συµµαχήσουν

εναντίον του, αυτό είναι το καλύτερο που µπορεί να κάνει). Ανάλογοι µε πριν

υπολογισµοί δίνουν τις πιθανότητες επιβίωσης P′A, P′B, P

′C

P′A =a

a + b + c

P′B =b(b + 2c)

(b + c)(a + b + c)

P′C =c2

(b + c)(a + b + c).

Τώρα για a = 0.8, b = 0.6, c = 0.4 παίρνουµε αντίστοιχα P ′A = 0, 444, P′B =

0.467, P′C = 0.089. Οι A και B αύξησαν σηµαντικά την πιθανότητα επιβίωσήςτους, ενώ η πιθανότητα επιβίωσης του C µειώθηκε εξίσου σηµαντικά. Παρ΄ όλα

αυτά ο B εξακολουθεί να πλεονεκτεί του A αν και πολύ χειρότερος σκοπευτής.

Η προηγούµενη ‘‘παράλογη’’ απόφαση των A και B οδήγησε σε πιό ‘‘λογικό’’

αποτέλεσµα, αλλά έχει το µειονέκτηµα ότι η συµφωνία των δύο παικτών πρέπει

να τηρηθεί µέσω κάποιου µηχανισµού. Επίσης δεν είναι σαφές ότι ο A ϑα είναι

ευχαριστηµένος από αυτό το αποτέλεσµα.

Ας υποθέσουµε λοιπόν ότι το κοινωνικό περιβάλλον του µοντέλου µας επι-

τρέπει τη δηµόσια ανταλλαγή µηνυµάτων πριν την έναρξη του παιχνιδιού. Τότε

ο A ϑα µπορούσε να ανακοινώσει δηµόσια (έτσι ώστε να γίνει γνωστή στους άλ-

λους παίκτες) την εξής απειλή : ‘‘∆εσµεύοµαι ότι ϑα πυροβολώ πάντα τον στόχο

του C εάν αυτός µε πυροβολήσει έστω και µία ϕορά (και αποτύχει). Μέχρι να


συµβεί αυτό ϑα πυροβολώ πάντα το στόχο του B’’. Ο C, κάτω από την απειλή του

A, ϑα ϐρει τότε ότι τον συµφέρει να αλλάξει στόχο και να πυροβολεί τον B κάτω

από οποιαδήποτε επιλογή του B. Τέλος ο B, κάτω από τις δοσµένες στρατηγικές

του A και του C, ϑα εξακολουθήσει να ϐρίσκει ότι τον συµφέρει να πυροβολεί

τον A.

Οι υπολογισµοί µας τώρα ϑα δώσουν

P′′A =a

a + b + c

P′′B =b2

(b + c)(a + b + c)

P′′C =c(2b + c)

(b + c)(a + b + c)

και εποµένως

P′′A = 0.444, P′′B = 0.200, P

′′C = 0.356.

Και αυτό το αποτέλεσµα επιδέχεται κριτική αφού ανατρέπει την σχέση µεταξύ

του B και του C. Κλειδί τώρα για την αλλαγή των πιθανοτήτων επιβίωσης στά-

ϑηκε η δυνατότητα του A να απειλήσει µε µία ‘‘παράλογη’’ πράξη (η εκδίκηση

του A είναι παράλογη επειδή αν πραγµατοποιηθεί ϑα ϐλάψει τον ίδιο. Βέβαια,

αν η απειλή του A κάνει τον C να αντιδράσει λογικά, η απειλή αυτή δε ϑα

πραγµατοποιηθεί).

Η πρώτη και η τρίτη λύση που είδαµε έχουν την εξής ελκυστική ιδιότητα που

ϑα συζητήσουµε αναλυτικά στα επόµενα κεφάλαια : ∆εδοµένων των στρατηγικών

των δύο άλλων παικτών, ο κάθε παίκτης συµπεριφέρεται ϐέλτιστα. ΄Οπως ϑα

δούµε, τέτοιες λύσεις ονοµάζονται Σηµεία Στρατηγικής Ισορροπίας ή Σηµεία

Nash.

΄Οπως παρατηρούν οι L. Shapley και M. Shubik το συµπέρασµα από το

παράδειγµά µας είναι ότι παιχνίδια µε τρεις ή περισσότερους παίκτες δε µπο-

ϱούν να αναλυθούν σωστά έως ότου αποκτήσουµε επαρκή πληροφόρηση για το

κοινωνικό περιβάλλον µέσα στο οποίο εξελίσσονται. Ιδιαίτερα ενδιαφέρουν οι

δυνατότητες επικοινωνίας, αποζηµίωσης, ανάληψης δεσµευτικών συµφωνιών,

εµπιστοσύνης, κ.ο.κ. Η επιλογή της κατάλληλης λύσης ή ακόµη και της κα-

τάλληλης έννοιας λύσης µπορεί να γίνει µόνον όταν το περιβάλλον αυτό έχει

αποσαφηνισθεί.

Η συζήτηση, µέσω διάφορων ιστοριών, ϑα µπορούµε να συνεχιστεί. Παρα-

τηρήστε ότι κάτω από την τρίτη εκδοχή ο C ϑα προτιµούσε να πυροβολεί στον

αέρα στο πρώτο στάδιο του παιχνιδιού ϐελτιώνοντας έτσι την πιθανότητα επι-

ϐίωσής του. Βεβαίως τότε ο A ϑα µπορούσε να τροποποιήσει την απειλή του

ανάλογα.

Μέρος 1

Παιχνίδια Χωρίς Συνεργασία µε

Πλήρη Πληροφόρηση

Στο Μέρος 1 του παρόντος υποθέτουµε ότι οι παίκτες δε µπορούν να συν-

εννοηθούν µεταξύ τους µε σκοπό να συντονίσουν τις κινήσεις τους, ούτε τους δί-

νεται η δυνατότητα υπογραφής δεσµευτικών συµβολαίων που ϑα κατοχυρώνουν

την τήρηση οποιωνδήποτε συµφωνιών. Με άλλα λόγια, οι παίκτες δεν επιτρέπε-

ται να συνεργαστούν και ο κάθε ένας ϑα κάνει τις κινήσεις του µόνος του. Τα

παιχνίδια αυτά ονοµάζονται ‘‘χωρίς συνεργασία’’ (non cooperative).

Υποθέτουµε ακόµη ότι όλοι οι παίκτες είναι λογικοί, δηλαδή ότι οι προτιµή-

σεις τους υπακούουν στα αξιώµατα της Θεωρίας Ωφέλειας - ϐλ. Παράρτηµα ∆.

Τέλος υποθέτουµε ότι όλοι γνωρίζουν τους κανόνες του παιχνιδιού που παί-

Ϲουν και τις κατανοµές πιθανότητας των τυχαίων κινήσεων που µπορεί να συµ-

ϐούν, ότι όλοι γνωρίζουν τις προτιµήσεις όλων των παικτών και ότι όλοι πληρο-

ϕορούνται τις πληρωµές όλων όταν το παιχνίδι που παίζουν λήξει. Υποθέτουµε

ακόµη ότι όλοι γνωρίζουν ότι όλοι γνωρίζουν τα παραπάνω. Υποθέτουµε α-

κόµη ότι όλοι γνωρίζουν ότι όλοι γνωρίζουν ότι όλοι γνωρίζουν τα παραπάνω,

κ.ο.κ. επ΄ άπειρον.∗ Οι υποθέσεις µας αυτές συνοψίζονται στο ότι ασχολούµαστεµε παιχνίδια ‘‘πλήρους πληροφόρησης’’ (complete information). Σχετικά ϐλ.

Εδάφιο 2.4.

∗Λέµε τότε ότι η υπόθεση της ‘‘κοινής γνώσης’’ (common knowledge) ικανοποιείται.

Κεφάλαιο 2

Παιχνίδια σε Εκτεταµένη Μορφή

2.1 ∆ύο Παραδείγµατα

Παράδειγµα 2.1.1. ‘‘Ρώσικη Ρουλέτα’’. ∆ύο παίκτες ϱίχνουν Ϲάρια µε τον εξής

τρόπο. Αρχικά κάθε ένας ποντάρει από ένα ευρώ. Κατόπιν ο παίκτης I ϱίχνει το

Ϲάρι. Αν το αποτέλεσµα της ϱήψης είναι 1, ο I χάνει (τα χρήµατα τα παίρνει ο

II ) και το παιχνίδι τελειώνει. Αν το αποτέλεσµα είναι 2, 3, 4, 5 ή 6, τότε έρχεται

η σειρά του παίκτη II (λέµε ότι ο I ‘‘πέρασε’’). Προσθέτουµε τον κανόνα ότι ο I

µπορεί να αποφύγει να ϱίξει το Ϲάρι (και πιθανόν να χάσει) αν προσθέσει ένα

ακόµη ευρώ στο τραπέζι, οπότε τότε αυτόµατα περνάει.

Στη συνέχεια ο παίκτης II µπορεί να κάνει ό,τι ακριβώς και ο I. ∆ηλαδή

µπορεί ή να ϱίξει Ϲάρι ή να ποντάρει και αυτός επί πλέον ένα ευρώ και να

περάσει. Τα αποτελέσµατα της ϱίψης του Ϲαριού από τον II είναι συµµετρικά

(αν ο II ϕέρει 1, τότε τα χρήµατα τα παίρνει ο I, διαφορετικά ο II περνάει).

Το παιχνίδι τελειώνει αν κάποιος παίκτης χάσει ή αν περάσουν και οι δύο

παίκτες. Στην τελευταία περίπτωση τα χρήµατα που έχουν µέχρι τότε ποντάρει

οι παίκτες µοιράζονται ανάµεσά τους.

Μια ιδέα για να αναπαραστήσουµε αυτό το παιχνίδι είναι µέσω ενός

‘‘δένδρου’’ στο οποίο ϑα απεικονίσουµε τις δυνατές ‘‘διαδροµές’’ ή ‘‘ιστορίες’’

που µπορεί να πραγµατοποιηθούν. Ας δούµε τα χαρακτηριστικά του δένδρου

(ϐλ. Σχήµα 2.1.1).

Από την αρχική κορυφή του εκπορεύεται η πρώτη κίνηση του παιχνιδιού,

δηλαδή η απόφαση του I να ϱίξει το Ϲάρι (‘‘ρζ ’’) ή να ποντάρει (‘‘π’’). Γενικά οι µη

τερµατικές κορυφές του δένδρου ή ελέγχονται από έναν από τους παίκτες και

αντιπροσωπεύουν σηµεία στην ιστορία του παιχνιδιού που ο παίκτης έχει την

κίνηση (δηλ. πρέπει να πάρει απόφαση) ή αντιπροσωπεύουν σηµεία στα οποία

εκτελείται ένα τυχαίο πείραµα. Στην τελευταία περίπτωση (τυχαίο πείραµα)

λέµε ότι η κίνηση ανήκει στη ‘‘ϕύση’’. Οι κορυφές που ελέγχονται από έναν

παίκτη χαρακτηρίζονται (‘‘ταµπελώνονται’’) από το όνοµά του, ενώ οι κορυφές


που ελέγχονται από τη ϕύση παραµένουν ανώνυµες. Παράδειγµα κορυφής

στην οποία η κίνηση ανήκει στη ϕύση είναι η επόµενη της αρχικής κορυφή

στην οποία ϑα ϐρεθούµε εάν ο I αρχικά αποφασίσει να ϱίξει το Ϲάρι (‘‘ρζ ’’). Αν

όµως ο I αρχικά αποφασίσει να ποντάρει (‘‘π’’), τότε ϑα ϐρεθούµε σε κορυφή

που ελέγχεται από τον II (η κίνηση δηλαδή ανήκει στον II ), κ.ο.κ.

��

��

��

�

@@

@�

��

@@

@�

��

@@

@

QQ

QQQ

@@

@

��

�@

@@

��

�

qmI

qmIIqmII

qq

q

ρζ π

π ρζ

π ρζ5/6 1/6

1/6 5/6

1/6 5/6

(1/2,−1/2)

(−1, 1) (0, 0)

(1,−1) (−1/2, 1/2)

(1,−1) (0, 0)

Σχήµα 2.1.1

Από κάθε µη τερµατική κορυφή έπονται κλάδοι οι οποίοι αντιπροσωπεύ-

ουν τις κινήσεις που έχει στη διάθεσή του ο παίκτης (αν η κορυφή ελέγχεται

από παίκτη) ή τα δυνατά αποτελέσµατα του τυχαίου πειράµατος (αν η κορυ-

ϕή ελέγχεται από τη ϕύση). Οι κλάδοι που αντιπροσωπεύουν κινήσεις παίκτη

χαρακτηρίζονται από µία ταµπέλα που περιγράφει την κίνηση αυτή (π.χ. ‘‘ρζ ’’

είναι η ταµπέλα της κίνησης όπου ο παίκτης ϱίχνει το Ϲάρι), ενώ οι κλάδοι που

αντιπροσωπεύουν αποτέλεσµα ενός τυχαίου πειράµατος χαρακτηρίζονται από

την πιθανότητα πραγµατοποίησης του συγκεκριµένου αποτελέσµατος (π.χ. 5/6

είναι η πιθανότητα να ‘‘περάσει’’ ο παίκτης).

Τέλος στο δένδρο υπάρχουν και οι τερµατικές κορυφές που αντιστοιχούν σε

διάφορες πραγµατοποιήσεις τερµατίσµατος του παιχνιδιού. Εκεί σηµειώνεται

σε διανυσµατική µορφή η πληρωµή κάθε παίκτη, δηλαδή στην i-ϑέση σηµειώ-

νεται η πληρωµή του i-παίκτη. Για παράδειγµα, η πρώτη αριστερά τερµατική

κορυφή (µε πληρωµή (1/2,−1/2)), αντιπροσωπεύει την κατάληξη της ιστο-ϱίας : ‘‘Ο I αποφασίζει να ϱίξει το Ϲάρι, δεν ϕέρνει 1 και εποµένως περνά, και

τέλος ο II αποφασίζει να ποντάρει’’. Η πληρωµή προφανώς τότε ϑα είναι 1/2

ευρώ για τον I και −1/2 ευρώ για τον II, αφού τ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ -...

Documents

Transcript of ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ -...