Game Theory

237
1 1 Θεωρία Παιγνίων Γιάννης Ρεφανίδης 2 Γενικά Web site: http://macedonia.uom.gr/~yrefanid/Courses/GameTheory/ Βασικό σύγγραμμα: Σημειώσεις "Strategies and Games, Theory and Practice", Prajit K. Dutta, MIT Press, 1999. Το βιβλίο αυτό υπάρχει στην δεσμευμένη συλλογή της βιβλιοθήκης, με ταξινομικό αριθμό HB144.D88. Προαιρετικές εργασίες θα δοθούν κατά τη διάρκεια του εξαμήνου. Ηλεκτρονική λίστα μαθήματος

Transcript of Game Theory

Page 1: Game Theory

1

1

Θεωρία ΠαιγνίωνΓιάννης Ρεφανίδης

2

ΓενικάWeb site:

http://macedonia.uom.gr/~yrefanid/Courses/GameTheory/

Βασικό σύγγραµµα:Σηµειώσεις"Strategies and Games, Theory and Practice", Prajit K. Dutta, MIT Press, 1999.

Το βιβλίο αυτό υπάρχει στην δεσµευµένη συλλογή της βιβλιοθήκης, µε ταξινοµικό αριθµό HB144.D88.

Προαιρετικές εργασίες θα δοθούν κατά τη διάρκεια τουεξαµήνου.Ηλεκτρονική λίστα µαθήµατος

Page 2: Game Theory

2

3

ΕισαγωγήΗ Θεωρία Παιγνίων εστιάζει στην αλληλεξάρτηση τωναποφάσεων οµάδων ανθρώπων, όπου η απόφαση καθενόςεπηρεάζει τους υπόλοιπους.

Κανένας άνθρωπος δεν είναι µόνος του

Μερικά από τα ερωτήµατα που τίθενται σε τέτοιεςκαταστάσεις είναι τα ακόλουθα:

Τι ενέργειες µπορεί να εκτελέσει κάθε άνθρωπος.Ποια είναι τα αποτελέσµατα αυτών των ενεργειών. Είναι τααποτελέσµατα θετικά για όλους τους ανθρώπους;Τι µπορεί να "µαντέψει" κάθε άνθρωπος για τις ενέργειες τωνυπολοίπων;Παίζει ρόλο εάν οι άνθρωποι αλληλεπιδρούν περισσότερες απόµία φορές;Πώς επηρεάζει η γνώση για τα ιδιαίτερα χαρακτηριστικά άλλωνανθρώπων;

4

ΟρισµόςΗ θεωρία παιγνίων είναι ένας συστηµατικός τρόποςδιερεύνησης των παρακάτω στοιχείων:

Οµάδα (group): Σε κάθε παιχνίδι υπάρχουν περισσότερα απόένα άτοµα που λαµβάνουν αποφάσεις (decision makers). Κάθετέτοιο άτοµο ονοµάζεται παίκτης (player).Αλληλεπίδραση (Interaction): Οι "κινήσεις" καθενός παίκτηεπηρεάζουν τους υπολοίπους.Στρατηγική σκοπιµότητα (strategic): Κάθε παίκτης επιλέγειτις ενέργειές του µε βάση την ερµηνεία των αλληλεπιδράσεων.Ορθολογικότητα (rationality): Η ενέργεια που επιλέγει ναεκτελέσει κάθε παίκτης είναι η καλύτερη δυνατή για αυτόν.

Page 3: Game Theory

3

5

Παράδειγµα: Παιχνίδι Γνώσεων (1/6)Έστω ένα τηλεοπτικό παιχνίδι γνώσεων. Λίγο πριν από τοτέλος του παιχνιδιού έχουµε κερδίσει ένα ποσό Α1 και πρέπεινα στοιχηµατίσουµε ένα ποσό Β1<Α1 για µια τελευταίαερώτηση (την οποία δεν γνωρίζουµε ακόµη). Εάν απαντήσουµε σωστά, το ποσό Β1 προστίθεται στο Α1, αλλιώς αφαιρείται.Έστω Ν συνολικά οι παίκτες, κάθε ένας από τους οποίουςκερδίζει µέχρι στιγµής ποσό Ai και καλείται να στοιχηµατίσειποσό Bi<Ai.

6

Παράδειγµα: Παιχνίδι Γνώσεων (2/6)Μετά την ολοκλήρωση των ερωτήσεων, ο παίκτης που έχεισυγκεντρώσει το µεγαλύτερο ποσό Ai+Bi κερδίζει και παίρνειτα χρήµατά του, ενώ οι υπόλοιποι δεν παίρνουν τίποτα.Το ερώτηµα που τίθεται είναι το εξής: Ποιο πρέπει να είναιτο ποσό Bi για κάθε παίκτη i, έτσι ώστε να µεγιστοποιήσειτην πιθανότητα να φύγει νικητής και µάλιστα µε όσο τοδυνατόν περισσότερα χρήµατα;

Page 4: Game Theory

4

7

Παράδειγµα: Παιχνίδι Γνώσεων (3/6)Το πρόβληµα έχει όλα τα χαρακτηριστικά των προβληµάτωνπου εξετάσει η θεωρία παιγνίων:

Υπάρχει µια οµάδα ανθρώπων.Οι επιµέρους αποφάσεις τους επηρεάζουν ολόκληρη την οµάδα.Για κάθε παίκτη υπάρχουν αποφάσεις που δεν έχουν ειδικόνόηµα, οπότε δεν χρειάζεται να τις εξετάσει καν.Προφανώς κάθε παίκτης θα αποφασίσει µε τέτοιον τρόπο, ώστενα µεγιστοποιήσει (κατά την εκτίµησή του) την πιθανότητα νακερδίσει το παιχνίδι.

8

Παράδειγµα: Παιχνίδι Γνώσεων (4/6)Για παράδειγµα, έστω ότι εµείς κερδίζουµε µέχρι στιγµής10.000€ και ο µοναδικός µας αντίπαλος 7.500€.

Εάν στοιχηµατίσουµε 5.001€ εξασφαλίζουµε ότι, στηνπερίπτωση που απαντήσουµε σωστά, θα είµαστε σίγουρα οινικητές, ανεξαρτήτως τι θα απαντήσει ο αντίπαλος.Ωστόσο, το ίδιο στοίχηµα µας οδηγεί στο να χάσουµε, εάν οαντίπαλος στοιχηµατίσει λιγότερα από 2.500€ (ακόµη και αναπαντήσει λάθος).Θα µπορούσαµε να µην στοιχηµατίσουµε τίποτα, οπότε σε αυτήτην περίπτωση εξασφαλίζουµε ότι θα κερδίσουµε στηνπερίπτωση που ο αντίπαλος στοιχηµατίσει λιγότερα από2.500€, ακόµη και αν απαντήσει σωστά.

Page 5: Game Theory

5

9

Παράδειγµα: Παιχνίδι Γνώσεων (5/6)(συνέχεια...)

Φυσικά πάντα υπάρχει το ενδεχόµενο και για τους δύο παίκτεςνα στοιχηµατίσουν όλα τα κέρδη τους, ελπίζοντας ταυτόχρονανα τα διπλασιάσουν και να κερδίσουν το παιχνίδι.

Οι παραπάνω είναι µερικές από τις κινήσεις που έχουνιδιαίτερη στρατηγική σκοπιµότητα στο συγκεκριµένοπαιχνίδι.

10

Παράδειγµα: Παιχνίδι Γνώσεων (6/6)Το τι θα πράξει ο κάθε παίκτης εξαρτάται από τη γνώση πουέχει για τις δυνατότητές του και τις δυνατότητες τουαντιπάλου.Με άλλα λόγια, κάθε παίκτης προσπαθεί να µαντέψει τηναπόφαση και τις δυνατότητες του αντιπάλου του και, λαµβάνοντας υπόψη και τις δικές του ικανότητες, αποφασίζει τη δική του βέλτιστη κίνηση (ορθολογικότητα).

Page 6: Game Theory

6

11

Παραδείγµατα από την καθηµερινή ζωή (1/2)

Συµµετοχή σε µια οµαδική εργασία: Μια οµάδα φοιτητώνέχει αναλάβει ένα project.

Εάν ένας φοιτητής δεν εργάζεται αρκετά, κάποιος άλλος πρέπεινα εργαστεί περισσότερο (αλληλεπίδραση).Κάθε φοιτητής πρέπει να αποφασίσει αν και σε ποια οµάδα θαµπει (εκτιµώντας τις δυνατότητες των συµφοιτητών του).Η ορθολογικότητα έχει να κάνει µε την απόφαση του χρόνουπου θα αφιερωθεί στην εργασία σε σχέση µε τον βαθµό πουαναµένεται να πάρουν οι φοιτητές.

12

Παραδείγµατα από την καθηµερινή ζωή (2/2)

Τυχαίος έλεγχος για αναβολικά: Κάθε αθλητής πρέπει νααποφασίσει αν θα χρησιµοποιήσει ή όχι αναβολικές ουσίες.

Εάν χρησιµοποιήσει, αυξάνει τις πιθανότητές του να κερδίσει, ταυτόχρονα όµως ρισκάρει να ανιχνευθεί και να αποβληθεί απόσχετικές διοργανώσεις για µεγάλο χρονικό διάστηµα, καθώςεπίσης και να θέσει σε κίνδυνο την υγεία του.Εάν δεν χρησιµοποιήσει, µειώνει τις πιθανότητές του ναδιακριθεί, εφόσον άλλοι αθλητές χρησιµοποιήσουν και δενανακαλυφθούν.

Page 7: Game Theory

7

13

Παραδείγµατα από την οικονοµία (1/3)

Επένδυση σε έρευνα και ανάπτυξη για τις φαρµακευτικέςεταιρείες:

Κάθε φαρµακευτική εταιρεία επενδύει ένα ποσό στην ανάπτυξηνέων φαρµάκων.Η πρώτη εταιρεία που αναπτύσσει ένα φάρµακο έχει τοδικαίωµα να το εκµεταλλεύεται αποκλειστικά για κάποια χρόνια(αλληλεπίδραση).Οι εταιρείες λοιπόν πρέπει να αποφασίσουν πού θαδιοχετεύσουν τους πόρους τους για έρευνα, πώς θατιµολογήσουν τα νέα φάρµακα, πώς θα µειώσουν το ρίσκο κατάτην ανάπτυξη ενός νέου φαρµάκου κλπ.Οι αποφάσεις αυτές λαµβάνονται βάσει συµπερασµάτων για τιςαντίστοιχες αποφάσεις των ανταγωνιστριών εταιρειών.

14

Παραδείγµατα από την οικονοµία (2/3)

∆ηµοπρασίες κρατικών οµολόγων:Ανά τακτά χρονικά διαστήµατα οι διάφορες κυβερνήσειςεκδίδουν κρατικά οµόλογα.Οι συµµετέχοντες είναι οι µεγάλες τράπεζες, οι οποίες στησυνέχεια µεταπωλούν τα οµόλογα στους πελάτες τους (π.χ. οµολογιακά αµοιβαία κεφάλαια).Η αλληλεπίδραση έχει να κάνει µε το ότι ο µεγάλοςανταγωνισµός ανεβάζει τις τιµές.Η ορθολογικότητα έχει να κάνει µε την εξισορρόπηση τουποσού που προσφέρει κάθε τράπεζα για να πάρει κάποιαοµόλογα και της πιθανότητας να µην πάρει

Page 8: Game Theory

8

15

Παραδείγµατα από την οικονοµία (3/3)

Νόµος για την πτώχευση στις ΗΠΑ:Στις ΗΠΑ, όταν µια εταιρεία κηρύξει πτώχευση, τα περιουσιακάτης στοιχεία δεν µπορούν πλέον να δεσµευθούν απόανεξάρτητους πιστωτές, αλλά προστατεύονται από το νόµοµέχρι η εταιρεία και οι πιστωτές να καταλήξουν σε κάποιασυµφωνία διαµοιρασµού των.Φυσικά οι πιστωτές µπορούν να διεκδικήσουν τα χρέη τουςδικαστικά πριν η εταιρεία κηρύξει πτώχευση, ωστόσο σε αυτήτην περίπτωση διακινδυνεύουν να κηρύξει τελικά η εταιρείαπτώχευση και να χάσουν τα χρήµατά τους.Κάθε πιστωτής πρέπει να εκτιµήσει τη µελλοντική πορεία τηςεταιρείας καθώς και το πόσο υποµονετικοί µπορεί να είναι οιυπόλοιποι πιστωτές, ώστε να αποφασίσει αν θα διεκδικήσει ταχρήµατά του δικαστικά ή αν θα περιµένει.

16

Άλλα παραδείγµατα (1/2)Συµπεριφορά των ζώων:

Τα ζώα ανταγωνίζονται για δυσεύρετους πόρους όπως τροφή, περιοχή κλπ.Οι παίκτες είναι όλα τα ζώα που έχουν βλέψη για τον ίδιο πόρο.Σε τέτοιες περιπτώσεις, τα ζώα έχουν δύο δυνατότητες: Ναµείνουν και να πολεµήσουν για τον πόρο ή να φύγουν.Έχει διαπιστωθεί ότι η συµπεριφορά των ζώων σε καταστάσειςανταγωνισµού είναι ορθολογική.

Page 9: Game Theory

9

17

Άλλα παραδείγµατα (2/2)Ψηφοφορίες.Χρήση των φυσικών πόρων.Συµπεριφορά στρατιωτών στον πρώτο παγκόσµιο πόλεµο.Καθορισµός τιµών πετρελαίου από τον OPEC.

18

Τι δεν είναι παιχνίδι;Καταστάσεις όπου υπάρχει µόνο ένας παίκτης:

Απόφαση σχετικά µε το αν θα πάω θέατρο ή κινηµατογράφοαπόψε.

Καταστάσεις όπου υπάρχουν πάρα πολλοί παίκτες, έτσι ώστεη επίδραση της απόφασης του ενός παίκτη στο σύνολο ναείναι αµελητέα.

Απόφαση σχετικά µε το αν θα αγοράσω 10 µετοχές του ΟΤΕ.

Page 10: Game Theory

10

19

Ιστορική αναδροµή

20

Ιστορική αναδροµή (1/5)1838: Ο Γάλλος οικονοµολόγος Augustin Cournot ανέλυσεολιγοπωλιακές καταστάσεις µε τρόπο παρόµοιο µε τιςσύγχρονες µεθόδους της θεωρίας παιγνίων (µοντέλοCournot).1881: Ο Άγγλος οικονοµολόγος Francis Edgeworth ασχολήθηκε µε την εφαρµογή των µαθηµατικών στιςκοινωνικές επιστήµες.1913: Ο Γερµανός µαθηµατικός Ernest Zermelo απέδειξε ότιτο σκάκι έχει λύση από οποιαδήποτε κατάσταση

Page 11: Game Theory

11

21

Ιστορική αναδροµή (2/5)1928: Ο John von Neumann απέδειξε ότι µια σηµαντικήκατηγορία παιχνιδιών, τα παιχνίδια µηδενικού αθροίσµατος, έχουν πάντα λύση.1944: Οι John von Neumann και Oskar Morgenstern εξέδωσαν το βιβλίο "Theory of Games & Economic Behavior", όπου:

Όρισαν αξιωµατικά την θεωρία της χρησιµότητας (utility theory)Ανέλυσαν διεξοδικά τις βέλτιστες λύσεις στα παιχνίδιαµηδενικού αθροίσµατος.Εισήγαγαν µια νέα κατηγορία παιχνιδιών, τα συνεργατικάπαιχνίδια (cooperative games).

22

Ιστορική αναδροµή (3/5)1950: Ο John Nash εισήγαγε την έννοια της ισορροπίας, ηοποία είναι η πιο ευρέως χρησιµοποιούµενη έννοια στησύγχρονη θεωρία παιγνίων.

Ισορροπία Nash (Nash equilibrium)Η έννοια της ισορροπίας Nash εφαρµόζεται και στα παιχνίδιαµη-µηδενικού αθροίσµατος.Η εργασία του Nash µπορεί να θεωρηθεί ότι αποτελεί επέκτασητης εργασίας του Cournot.Μοιράστηκε το βραβείο Nobel στα οικονοµικά το 1994.

Με απλά λόγια: Ισορροπία Nash σε ένα παιχνίδι είναι µια κατάσταση από τηνοποία δεν συµφέρει κανέναν παίκτη να ξεφύγει µεµονωµένα.

Page 12: Game Theory

12

23

Ιστορική αναδροµή (4/5)1965, 1975: Ο Reinhard Selten γενίκευσε τις ιδέες του Nash στα δυναµικά παιχνίδια, δηλαδή σε παιχνίδια πουεξελίσσονται στην πορεία του χρόνου.1967-1968: Ο John Harsanyi γενίκευσε τις ιδέες του Nash σε παιχνίδια µη-πλήρους πληροφόρησης σχετικά µε τιςπροτιµήσεις και τις αποφάσεις των άλλων παικτών.Οι Selten και Harsanyi µοιράστηκαν, µαζί µε τον John Nash,το βραβείο Nobel στα οικονοµικά το 1994.

24

Ιστορική αναδροµή (5/5)Ρίξτε µια µατιά στη διεύθυνση:

http://cepa.newschool.edu/het/schools/game.htm

για µια σύντοµη ιστορική αναδροµή σχετική µε τη θεωρίαπαιγνίων, καθώς και βιογραφικά των ανθρώπων πουυπήρξαν συντελεστές στην πρόοδό της.

Page 13: Game Theory

13

25

Τα παιχνίδια Nimκαι Marienbad

26

ΣενάριοΥπάρχουν δύο σωροί από σπίρτα και δύο παίκτες, Α και Β, οιοποίοι παίζουν εναλλάξ (ξεκινά ο Α).Σε µια "κίνηση", κάθε παίκτης µπορεί να αφαιρέσει όσασπίρτα θέλει από έναν από τους σωρούς.Στο παιχνίδι Nim, ο παίκτης που αφαιρεί το τελευταίο σπίρτοκερδίζει.Στο παιχνίδι Marienbad, ο παίκτης που αφαιρεί το τελευταίοσπίρτο χάνει.Μας ενδιαφέρει να βρούµε αν υπάρχει µια στρατηγική γιακάθε παίκτη, η οποία να κερδίζει πάντα.

Page 14: Game Theory

14

27

Ανάλυση του NimΈστω ότι οι δύο σωροί είναι ισορροπηµένοι (έχουν τον ίδιοαριθµό σπίρτων).Σε αυτή την περίπτωση ο παίκτης Β µπορεί να κερδίζειπάντα, αρκεί να "αντιγράφει" τις κινήσεις του παίκτη Α σεδιαφορετικό όµως σωρό.Παρόµοια, αν οι δύο σωροί δεν είναι ισορροπηµένοι, τότε οπαίκτης Α έχει την εξής νικηφόρα στρατηγική:

Πρώτα αφαιρεί µερικά σπίρτα από τον σωρό που έχει ταπερισσότερα, ώστε οι δύο σωροί να ισορροπήσουν.Στη συνέχεια εφαρµόζει την στρατηγική για ισορροπηµένουςσωρούς, όντας τώρα δεύτερος παίκτης!

28

"Αποδείξεις" για το σπίτιΣτο Nim µε τρεις σωρούς:

εάν οι δύο τουλάχιστον έχουν ίδιο αριθµό σπίρτων, ο παίκτης Αέχει νικηφόρα στρατηγική.εάν η αρχική κατανοµή έχει µία από τις µορφές (3,2,p), (3,1,p) ή (1,2,p), µε p>3, τότε ο Α έχει νικηφόρα στρατηγική.

Στο Marienbad µε δύο σωρούς:εάν η αρχική κατανοµή είναι (1,1), κερδίζει ο Α.εάν η αρχική κατανοµή είναι (n,n), n>1, ο Β έχει νικηφόραστρατηγική.εάν η αρχική κατανοµή είναι (m,n), m≠n, ο Α έχει νικηφόραστρατηγική.

Page 15: Game Theory

15

29

Ψηφοφορία σε επιτροπή

30

Σενάριο (1/2)Έστω ότι υπάρχουν 2 εναλλακτικές προτάσεις, Α και Β, καιτρεις ψηφοφόροι.Υπάρχουν τρεις περιπτώσεις: Ή να εγκριθεί η πρόταση Α, ήη πρόταση Β ή τέλος καµία από τις δύο (περίπτωση Ν).Η ψηφοφορία οργανώνεται ως εξής:

Πρώτα γίνεται ψηφοφορία µεταξύ των προτάσεων Α και Β.Στη συνέχεια, η πρόταση που θα προκριθεί τίθεται σεψηφοφορία µε την περίπτωση Ν.

Page 16: Game Theory

16

31

Σενάριο (2/2)Έστω ότι οι προτιµήσεις των τριών ψηφοφόρων είναι οιεξής:

Ψηφοφόρος 1: Α>Ν>ΒΨηφοφόρος 2: Β>Α>ΝΨηφοφόρος 3: Ν>Α>Β

Εάν ψηφίσουν όλοι βάσει των προτιµήσεών τους, τότε θακερδίσει και στις δύο ψηφοφορίες η πρόταση Α.

32

Ανάλυση (1/2)Το αποτέλεσµα Α όµως δεν ευχαριστεί τον ψηφοφόρο 3, οοποίος θα προτιµούσε να µην ψηφιστεί καµία πρόταση.Θα µπορούσε όµως να επιτύχει το δικό του επιθυµητόαποτέλεσµα, απλά ψηφίζοντας Β στην πρώτη ψηφοφορία.Συνειδητοποιώντας όµως αυτό το ενδεχόµενο ο ψηφοφόρος2, θα µπορούσε και αυτός µε τη σειρά του να ψηφίσει Αστην πρώτη ψηφοφορία, ώστε τελικά να περάσει η πρότασηΑ στον δεύτερο γύρο!

•Ψηφοφόρος 1: Α>Ν>Β•Ψηφοφόρος 2: Β>Α>Ν•Ψηφοφόρος 3: Ν>Α>Β

Page 17: Game Theory

17

33

Ανάλυση (2/2)Μια πιο συστηµατική ανάλυση ξεκινά από το δεύτερο γύρο, όπου όλοι ψηφίζουν ειλικρινά.Εάν στον δεύτερο γύρο έχει περάσει η πρόταση Α, τότε αυτήκερδίζει την πρόταση Ν.Εάν στον δεύτερο γύρο περάσει η πρόταση Β, τότε κερδίζειη πρόταση Ν.Άρα ουσιαστικά στον πρώτο γύρο η ψηφοφορία είναι µεταξύΑ και Ν (αντί για Β) και µε βάση αυτή τη λογική ψηφίζουν οιψηφοφόροι.

•Ψηφοφόρος 1: Α>Ν>Β•Ψηφοφόρος 2: Β>Α>Ν•Ψηφοφόρος 3: Ν>Α>Β

34

ΣυµπέρασµαΤο παράδειγµα της ψηφοφορίας κάνει φανερή την ανάγκηγια "στρατηγικές" επιλογές, δηλαδή επιλογές οι οποίεςλαµβάνουν υπόψη τις πιθανές επιλογές των αντιπάλωνπαικτών.

Το σενάριο έχει οµοιότητες (µεταξύ άλλων) µε τηνψηφοφορία στις δηµοτικές/νοµαρχιακές εκλογές, η οποίαγίνεται σε δύο γύρους.

Page 18: Game Theory

18

35

Το δίληµµατων φυλακισµένων

Prisoners' Dilemma

36

Σενάριο (1/2)∆ύο φυλακισµένοι, οι Calvin και Klein, κρατούνται ωςύποπτοι για ένα έγκληµα.Ο ανακριτής µιλάει και στους δύο ξεχωριστά και προσπαθείνα τους πείσει να οµολογήσουν.Υπάρχουν τα παρακάτω ενδεχόµενα:

Να οµολογήσουν και οι δύο.Να µην οµολογήσει κανένας.Να οµολογήσει µόνο ο Calvin.Να οµολογήσει µόνο ο Klein.

Page 19: Game Theory

19

37

Σενάριο (2/2)Στον παρακάτω πίνακα φαίνονται οι ποινές των δύοφυλακισµένων για κάθε µία από τις τέσσερις περιπτώσεις:

1, 115, 0∆εν οµολογεί

0, 155, 5Οµολογεί

∆εν οµολογείΟµολογεί\ KleinCalvin

38

ΑνάλυσηΑν το δούµε συνολικά, το συµφερότερο και για τους δύοµαζί είναι να µην οµολογήσουν.Ωστόσο, αν π.χ. ο Clein πιστεύει ότι ο Kalvin δεν θαοµολογήσει, τότε τον Clein τον συµφέρει να οµολογήσει.

Το ίδιο ισχύει ανάλογα για τον Kalvin.

Γενικότερα, για κάθε επιλογή του Kalvin, τον Clein τονσυµφέρει να οµολογήσει!!Τελικά οµολογούν και οι δύο.

Page 20: Game Theory

20

39

ΣχόλιαΤο παιχνίδι µε τους φυλακισµένους δεν είναι µηδενικούαθροίσµατος.

Υπάρχουν περιπτώσεις όπου και οι δύο παίκτες κερδίζουν, π.χ. όταν δεν οµολογήσουν.

Έχει εφαρµογές στην καθηµερινή ζωή:Κούρσα εξοπλισµών µεταξύ δύο κρατών.Η επιλογή δύο αντιµαχόµενων µερών σε µια αµφισβήτησησχετικά µε το αν θα χρησιµοποιήσουν δικηγόρους ή/και θακαταφύγουν στα δικαστήρια για να λύσουν για την αντιδικίατους.

40

Κανονική µορφήαναπαράστασης παιχνιδιών

Page 21: Game Theory

21

41

Κανονική µορφή αναπαράστασηςΗ κανονική ή στρατηγική (normal ή strategic) µορφήαναπαράστασης παιχνιδιών χρησιµοποιεί πίνακες (όπωςείδαµε στο δίληµµα των φυλακισµένων). Οι επικεφαλίδες των γραµµών και των στηλών του πίνακαονοµάζονται "στρατηγικές" (strategies) των παικτών.Στα κελιά των πινάκων υπάρχουν αριθµοί που δηλώνουν τοόφελος (ή κέρδος ή απολαβή) κάθε παίκτη για κάθεσυνδυασµό στρατηγικών.

42

ΣηµειογραφίαΤο πλήθος των παικτών το συµβολίζουµε µε Ν.Έναν τυχαίο παίκτη τον συµβολίζουµε µε i.Μια τυχαία στρατηγική του παίκτη i την συµβολίζουµε µε si.

Εάν θέλουµε να αναφερθούµε σε περισσότερες στρατηγικές τουπαίκτη i, χρησιµοποιούµε συµβολισµούς όπως si*, si', si# κλπ.

Ένα σύνολο στρατηγικών για όλους τους άλλους παίκτεςεκτός του i το συµβολίζουµε µε s-i.Η συνάρτηση απολαβής (payoff function) του παίκτη i συµβολίζεται µε ui.

π.χ. ui(s1, s2, ..., sN) ή ui(si, s-i)

Page 22: Game Theory

22

43

Συνάρτηση απολαβήςΣυνηθίζεται οι µεγαλύτερες τιµές τις συνάρτησης απολαβήςνα θεωρούνται καλύτερες.Σε περίπτωση που σε κάποιο πρόβληµα συµβαίνει τοαντίθετο, όπως π.χ. στο δίληµµα των φυλακισµένων, µπορείνα οριστεί µια νέα συνάρτηση απολαβής µε αφαίρεση τωναρχικών τιµών από κάποια σταθερά.

1,115,0∆Ο

0,155,5Ο

∆ΟΟKleinCalvin

14,140,15∆Ο

15,010,10Ο

∆ΟΟKleinCalvin

44

Παιχνίδια µε περισσότερουςαπό δύο παίκτες (1/3)

Όταν σε ένα παιχνίδι υπάρχουν περισσότεροι από δύοπαίκτες, η αναπαράσταση του παιχνιδιού µε έναν πίνακακαθίσταται προβληµατική.

Έστω ότι τρεις εταιρείες, Α, Β και Γ, πρέπει να επιλέξουν νααναπτύξουν ένα από δύο ενδεχόµενα προϊόντα, Χ και Υ. Η διαθέσιµη αγορά για κάθε προϊόν είναι 6 µονάδες και αυτήκατανέµεται ισόποσα στις εταιρείες που αποφασίζουν νααναπτύξουν το προϊόν.Η κανονική µορφή αναπαράστασης του παιχνιδιού χρειάζεταιδύο πίνακες, έναν για κάθε στρατηγική της εταιρείας Γ, όπωςφαίνεται στην επόµενη διαφάνεια.

Page 23: Game Theory

23

45

Παιχνίδια µε περισσότερουςαπό δύο παίκτες (2/3)

3,3,66,3,3Υ

3,6,32,2,2Χ

ΥΧΒΑ

Στρατηγική εταιρείας Γ: Χ

2,2,23,6,3Υ

6,3,33,3,6Χ

ΥΧΒΑ

Στρατηγική εταιρείας Γ: Υ

46

Παιχνίδια µε περισσότερουςαπό δύο παίκτες (3/3)

Εναλλακτικά, το παιχνίδι µπορεί να περιγραφείπαραθέτοντας όλους τους συνδυασµούς στρατηγικών τωνπαικτών, µαζί µε τις αντίστοιχες απολαβές:

ΧΧΧ=2,2,2ΥΧΧ=6,3,3ΧΥΧ=3,6,3ΥΥΧ=3,3,6ΧΧΥ=3,3,6ΥΧΥ=3,6,3ΧΥΥ=6,3,3ΥΥΥ=2,2,2

Page 24: Game Theory

24

47

Κυριαρχία στρατηγικών

48

ΚυριαρχίαΜια στρατηγική si* λέγεται ότι κυριαρχεί (dominates) µιαςστρατηγικής si

#, όταν ισχύει:∀ s-i: ui(si*, s-i)>ui(si

#,s-i)

Με άλλα λόγια, µια στρατηγική si* κυριαρχεί µιαςστρατηγικής si

#, εάν για όλους τους συνδυασµούςστρατηγικών των άλλων παικτών η στρατηγική si* έχειµεγαλύτερη απολαβή σε σχέση µε την si

#.Η στρατηγική si

# χαρακτηρίζεται ως κυριαρχούµενηστρατηγική(dominated strategy).

Page 25: Game Theory

25

49

Κυρίαρχη στρατηγικήΜια στρατηγική si* για τον παίκτη i λέγεται κυρίαρχηστρατηγική (dominant strategy), εάν ισχύει:

∀ si≠si*, ∀ s-i: ui(si*, s-i)>ui(si,s-i)

Με άλλα λόγια, µια στρατηγική si* είναι κυρίαρχηστρατηγική, εάν για όλους τους συνδυασµούς στρατηγικώντων άλλων παικτών η στρατηγική αυτή έχει τη µεγαλύτερηαπολαβή σε σχέση µε τις εναλλακτικές στρατηγικές τουπαίκτη i.

Σε µια τέτοια περίπτωση, όλες οι εναλλακτικές στρατηγικές τουπαίκτη i είναι κυριαρχούµενες.

50

Παράδειγµα (1/2)Έστω το δίληµµα των φυλακισµένων:

Η στρατηγική Ο είναι κυρίαρχη για τον παίκτη Calvin (φυσικά και για τον Klein) γιατί:

uCalvin(O,O)>uCalvin(∆Ο,Ο)uCalvin(O,∆O)>uCalvin(∆Ο,∆Ο)

14,140,15∆Ο

15,010,10Ο

∆ΟΟKleinCalvin

Page 26: Game Theory

26

51

Παράδειγµα (2/2)Προφανώς ένας παίκτης που έχει κυρίαρχη στρατηγική, τηνακολουθεί.Όταν κάθε παίκτης έχει µια κυρίαρχη στρατηγική, τότε τοπαιχνίδι έχει λύση κυρίαρχης στρατηγικής.∆εν υπάρχουν πάντα κυρίαρχες στρατηγικές για κάθεπαίκτη.

Είναι δυνατόν να µην έχει κανένας παίκτης κυρίαρχηστρατηγική, να έχουν µερικοί µόνο παίκτες ή τέλος να έχουνόλοι οι παίκτες.

52

Παιχνίδι: Η µάχη των φύλωνΈνας άνδρας και µια γυναίκα πρέπει να αποφασίσουνσχετικά µε το αν θα πάνε στο γήπεδο ή στην όπερα.

Ο άνδρας προτιµά το γήπεδο ενώ η γυναίκα την όπερα, ωστόσο και οι δύο προτιµούν να πάνε κάπου µαζί αντί γιαχώρια

Το παιχνίδι δεν έχει κυρίαρχη στρατηγική:

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓΑ

Page 27: Game Theory

27

53

Ασθενής κυριαρχίαΜια στρατηγική si* λέγεται ότι κυριαρχεί ασθενώς (weakly dominates) µιας στρατηγικής si

#, όταν ισχύει:∀ s-i: ui(si*, s-i)≥ui(si

#,s-i) και∃ s-i': ui(si*, s-i ')>ui(si

#,s-i ')

Με άλλα λόγια, µια στρατηγική si* κυριαρχεί ασθενώς µιαςστρατηγικής si

#, εάν για όλους τους συνδυασµούςστρατηγικών των άλλων παικτών η στρατηγική si* έχει ίση ήµεγαλύτερη απολαβή σε σχέση µε την si

#, ενώ υπάρχειτουλάχιστον ένας συνδυασµός στρατηγικών των άλλωνπαικτών s-i', για τον οποίο η si* αποφέρει µεγαλύτερηαπολαβή από την si

#.Η στρατηγική si

# χαρακτηρίζεται ως ασθενώς κυριαρχούµενηστρατηγική(weakly dominated strategy).

54

Ασθενώς κυρίαρχη στρατηγικήΜια στρατηγική si* για τον παίκτη i λέγεται ασθενώςκυρίαρχη στρατηγική (weakly dominant strategy), εάνισχύει:

∀ si≠si*, ∀ s-i, : ui(si*, s-i)≥ui(si,s-i) και∀ si≠si*, ∃ s-i', ui(si*, s-i ')>ui(si,s-i ')

Με άλλα λόγια, µια στρατηγική si* είναι ασθενώς κυρίαρχηστρατηγική, εάν για κάθε µία από τις εναλλακτικέςστρατηγικές του παίκτη i η si* έχει τουλάχιστον ίση απολαβήγια όλους τους συνδυασµούς στρατηγικών των υπολοίπωνπαικτών και καλύτερη απολαβή για τουλάχιστον ένανσυνδυασµό στρατηγικών των υπολοίπων παικτών.

Σε µια τέτοια περίπτωση, όλες οι εναλλακτικές στρατηγικές τουπαίκτη i είναι ασθενώς κυριαρχούµενες.

Page 28: Game Theory

28

55

ΠαράδειγµαΈστω το παρακάτω υποθετικό παιχνίδι:

Παίκτης Α: Η στρατηγική Top κυριαρχεί ασθενώς της Bottom.Παίκτης Β: Η στρατηγική Left

3, -17, 0Bottom

5, 37, 3Top

RightLeftΒΑ

56

Παράδειγµα: Κοινόχρηστοι χώροι (1/5)

Έστω δύο ένοικοι µιας κατοικίας, Α και Β, οι οποίοι πρέπεινα αφιερώσουν τον ελεύθερό τους χρόνο για καθαριότητατων κοινόχρηστων χώρων.Όσο περισσότερο χρόνο αφιερώσουν συνολικά, τόσο πιοκαθαροί θα είναι οι κοινόχρηστοι χώροι.

Φυσικά, κάθε ένοικος προτιµά να ασχοληθεί µε τηνκαθαριότητα ο έταιρος ένοικος.

Κάθε ένοικος έχει να επιλέξει µεταξύ του να αφιερώσει 0, 1, 2, 3 ή 4 ώρες για την καθαριότητα.

Page 29: Game Theory

29

57

Παράδειγµα: Κοινόχρηστοι χώροι (2/5)

Εάν x είναι οι ώρες που αφιερώνει ο Α και y οι ώρες πουαφιερώνει ο Β.Έστω ότι το όφελος για κάθε έναν από τους ενοίκους είναιαντίστοιχα:

sqrt(x+y)-xsqrt(x+y)-y

Ακολουθεί ο πίνακας του παιχνιδιού:

-1.2, -1.2-1.3, -0.3-1.5, 0.4-1.8, 1.2-2.0, 2.04

-0.3, -1.3-0.5, -0.5-0.8, 0.2-1.0, 1.0-1.3, 1.73

0.4, -1.50.2, -0.80.0, 0.0-0.3, 0.7-0.6, 1.42

1.2, -1.81.0, -1.00.7, -0.30.4, 0.40.0, 1.01

2.0, -2.01.7, -1.31.4, -0.61.0, 0.00.0, 0.00

43210yx

58

Παράδειγµα: Κοινόχρηστοι χώροι (3/5)

Παρατηρώντας τις στρατηγικές του ενοίκου Α (αριστερήστήλη), βλέπουµε ότι η στρατηγική 0 κυριαρχεί ασθενώς τηςστρατηγικής 1 και ισχυρώς όλων των υπολοίπωνστρατηγικών.Άρα η στρατηγική 0 είναι µια ασθενώς κυρίαρχη στρατηγικήγια τον ένοικο Α.

Αντίστοιχα προκύπτουν για τις στρατηγικές του ενοίκου Β(επάνω γραµµή).

Page 30: Game Theory

30

59

Παράδειγµα: Κοινόχρηστοι χώροι (4/5)

Έστω ότι οι απολαβές των δύο ενοίκων δίνονται από τιςπαρακάτω σχέσεις:

2*sqrt(x+y)-x2*sqrt(x+y)-y

Στον πίνακα φαίνεται το νέο όφελος του ένοικου Α:

1.7, 1.71.3, 2.30.9, 2.90.5, 3.50.0, 4.04

2.3, 1.31.9, 1.91.5, 2.51.0, 3.00.5, 3.53

2.9, 0.92.5, 1.52.0, 2.01.5, 2.50.8, 2.82

3.5, 0.53.0, 1.02.5, 1.51.8, 1.81.0, 2.01

4.0, 0.03.5, 0.52.8, 0.82.0, 1.00.0, 0.00

43210yx

60

Παράδειγµα: Κοινόχρηστοι χώροι (5/5)

Με την τροποποιηµένη συνάρτηση απολαβής δεν υπάρχεικαµία κυρίαρχη στρατηγική για κανέναν παίκτη.

Page 31: Game Theory

31

61

Επιλυσιµότητα κυριαρχίας

62

ΓενικάΕάν υπάρχει κυρίαρχη στρατηγική για κάποιον παίκτη, τότεαυτή επιλέγεται.Εάν δεν υπάρχει κυρίαρχη στρατηγική:

Εάν υπάρχουν κυριαρχούµενες στρατηγικές, τότε αυτέςαγνοούνται.Η επιλογή θα γίνει µεταξύ των µη-κυριαρχούµενωνστρατηγικών.Πάντα υπάρχει τουλάχιστον µία µη-κυριαρχούµενη στρατηγική.

Page 32: Game Theory

32

63

Επαναλαµβανόµενη απαλοιφήκυριαρχούµενων στρατηγικώνΕάν δεν υπάρχει κυρίαρχη στρατηγική, τότε µια καλή αρχήείναι να απαλείψουµε τις κυριαρχούµενες στρατηγικές.Η απαλοιφή κυριαρχούµενων στρατηγικών µπορεί ναοδηγήσει στη δηµιουργία νέων κυριαρχούµενωνστρατηγικών, οι οποίες µε τη σειρά τους θα απαλειφθούνκαι αυτές.Η διαδικασία αυτή ονοµάζεται επαναλαµβανόµενη απαλοιφήκυριαρχούµενων στρατηγικών

Iterated Elimination of Dominated Strategies, IEDS.

64

Παράδειγµα:Ανταγωνισµός τιµών (1/3)

Έστω δύο εταιρείες σε µια δυοπωλιακή (duopoly) αγορά, οιοποίες παράγουν ακριβώς το ίδιο προϊόν.Κάθε εταιρεία µπορεί να τιµολογήσει το προϊόν της µε µιααπό τρεις εναλλακτικές τιµές.Η εταιρεία που τιµολογεί φθηνότερα κερδίζει ολόκληρη τηναγορά.Σε περίπτωση ίσης τιµολόγησης, η αγορά µοιράζεται εξίσου.

Page 33: Game Theory

33

65

Παράδειγµα:Ανταγωνισµός τιµών (2/3)

Παρακάτω φαίνεται ο πίνακας του παιχνιδιού:

Η στρατηγική "Υψηλή" κυριαρχείται από τη στρατηγική"Μεσαία" και για τους δύο παίκτες, οπότε απαλείφεται.

4,48,08,0Χαµηλή

0,85,510,0Μεσαία

0,80,106,6Υψηλή

ΧαµηλήΜεσαίαΥψηλήΒ

Α

66

Παράδειγµα:Ανταγωνισµός τιµών (3/3)

Στη συνέχεια, η στρατηγική "Μεσαία" κυριαρχείται από τηστρατηγική "Χαµηλή" (κάτι που δεν συνέβαινε εξαρχής!) οπότε απαλείφεται.

4,48,0Χαµηλή

0,85,5Μεσαία

ΧαµηλήΜεσαίαΒ

Α

4,4Χαµηλή

ΧαµηλήΒ

Α

Page 34: Game Theory

34

67

Παράδειγµα:Ψηφοφορία (1/4)

Έστω το πρόβληµα της ψηφοφορίας µε τις δύο προτάσειςκαι τους τρεις ψηφοφόρους.Κάθε στρατηγική ενός ψηφοφόρου τρία µέρη:

Τι θα ψηφίσει στον πρώτο γύροΤι θα ψηφίσει στον δεύτερο γύρο εάν περάσει η πρόταση Α.Τι θα ψηφίσει στον δεύτερο γύρο εάν περάσει η πρόταση Β.

Για παράδειγµα, µια τέτοια στρατηγική είναι η ΑΑΝ.Συνολικά κάθε ψηφοφόρος έχει 8 διαθέσιµες στρατηγικές.

•Ψηφοφόρος 1: Α>Ν>Β•Ψηφοφόρος 2: Β>Α>Ν•Ψηφοφόρος 3: Ν>Α>Β

68

Παράδειγµα:Ψηφοφορία (2/4)

Έχουµε ήδη εξηγήσει ότι στον δεύτερο γύρο "συµφέρει" κάθε ψηφοφόρο να ψηφίσει ειλικρινά.Έτσι, για τον ψηφοφόρο 1:

Η στρατηγική ΑΑΝ κυριαρχεί επί των ΑΝΝ, ΑΝΒ και ΑΑΒ.Η στρατηγική ΒΑΝ κυριαρχεί επί των ΒΝΝ, ΒΝΒ και ΒΑΒ.

Θα µπορούσαµε να κατασκευάσουµε πίνακες 8x8 για να τοδιαπιστώσουµε.

Παρόµοια, για τον ψηφοφόρο 2:Η στρατηγική ΑΑΒ κυριαρχεί επί των ΑΝΒ, ΑΑΝ και ΑΝΝ.Η στρατηγική ΒΑΒ κυριαρχεί επί των ΒΝΒ, ΒΑΝ και ΒΝΝ.

Τέλος, για τον ψηφοφόρο 3:Η στρατηγική ΑΝΝ κυριαρχεί επί των ΑΑΝ, ΑΝΒ και ΑΑΒ.Η στρατηγική ΒΝΝ κυριαρχεί επί των ΒΑΝ, ΒΝΒ και ΒΑΒ.

•Ψηφοφόρος 1: Α>Ν>Β•Ψηφοφόρος 2: Β>Α>Ν•Ψηφοφόρος 3: Ν>Α>Β

Page 35: Game Theory

35

69

Παράδειγµα:Ψηφοφορία (3/4)

Μπορούµε πλέον να γράψουµε την κανονική µορφή τουπαιχνιδιού, µε τις στρατηγικές που έµειναν, ως εξής:

•Ψηφοφόρος 1: Α>Ν>Β•Ψηφοφόρος 2: Β>Α>Ν•Ψηφοφόρος 3: Ν>Α>Β

0,-1,11,0,0ΒΑΝ

1,0,01,0,0ΑΑΝ

ΒΑΒΑΑΒΨ2

Ψ1

0,-1,10,-1,1ΒΑΝ

0,-1,11,0,0ΑΑΝ

ΒΑΒΑΑΒΨ2

Ψ1

Ψ3: ΑΝΝ Ψ3: ΒΝΝ

70

Παράδειγµα:Ψηφοφορία (4/4)

Βλέπουµε από τους πίνακες ότι:Για τον ψηφοφόρο 1, η ΑΑΝ κυριαρχεί της ΒΑΝ.Για τον ψηφοφόρο 2, η ΑΑΒ κυριαρχεί της ΒΑΒ.Για τον ψηφοφόρο 3, η ΒΝΝ κυριαρχεί της ΑΝΝ.

Άρα η λύση του προβλήµατος είναι η:(ΑΑΝ, ΑΑΒ, ΒΝΝ)

Η λύση αυτή είναι η ίδια που βρήκαµε και στη διαφάνεια 33.

•Ψηφοφόρος 1: Α>Ν>Β•Ψηφοφόρος 2: Β>Α>Ν•Ψηφοφόρος 3: Ν>Α>Β

Page 36: Game Theory

36

71

Επίπεδα ορθολογικότητας (1/3)Η µέθοδος της επαναλαµβανόµενης απαλοιφήςκυριαρχούµενων στρατηγικών βασίζεται στις εξής δύοπαραδοχές:

Κάθε παίκτης είναι λογικός και άρα δεν θα επιλέξει µιακυριαρχούµενη στρατηγική.Κάθε παίκτης γνωρίζει ότι και οι υπόλοιποι παίκτες είναι λογικοίκαι άρα δεν θα παίξουν τις δικές τους κυριαρχούµενεςστρατηγικές.Κάθε παίκτης γνωρίζει ότι οι υπόλοιποι παίκτες γνωρίζουν ότι οίδιος είναι ορθολογικός.Κάθε παίκτης γνωρίζει ότι οι υπόλοιποι παίκτες γνωρίζουν ότιαυτός γνωρίζει ότι οι υπόλοιποι παίκτες είναι ορθολογικοί.

72

Επίπεδα ορθολογικότητας (2/3)Η επαναλαµβανόµενη απαλοιφή κυριαρχούµενωνστρατηγικών γίνεται επικίνδυνη, όταν υπάρχουν πολλοί"γύροι" απαλοιφής.

Ο κίνδυνος προέρχεται από τον γεγονός ότι κάποιος παίκτηςµπορεί να µην εντοπίσει µια κυριαρχούµενη στρατηγική ή νααπαλείψει µια µη-κυριαρχούµενη στρατηγική!

Έστω το παρακάτω παιχνίδι:

7,02,02,5Bottom

5,42,53,5Middle

5,61,64,5Top

RightCenterLeftΒΑ

Page 37: Game Theory

37

73

Επίπεδα ορθολογικότητας (3/3)Μετά από επαναλαµβανόµενες απαλοιφές καταλήγουµε στηνλύση (Middle, Center).Με αυτή τη λύση ο παίκτης Β εξασφαλίζει όφελος 5, κάτιόµως που θα το εξασφάλιζε απλά επιλέγοντας την κίνησηLeft.Επιπλέον ρισκάρει να έχει όφελος µόνο 0 !

7,02,02,5Bottom

5,42,53,5Middle

5,61,64,5Top

RightCenterLeftΒΑ

74

Σειρά των απαλοιφών (1/3)Όταν η απαλοιφή γίνεται βάσει ασθενώς κυριαρχούµενωνστρατηγικών, η σειρά των απαλοιφών έχει σηµασία.Έστω το παρακάτω παιχνίδι:

Εάν απαλείψουµε ταυτόχρονα και για τους δύο παίκτες τιςκυριαρχούµενες στρατηγικές, καταλήγουµε στη λύση(Bottom, Right).

0,01,0Bottom

0,10,0Top

RightLeftΒΑ

Page 38: Game Theory

38

75

Σειρά των απαλοιφών (2/3)Εάν ωστόσο εφαρµόσουµε την απαλοιφή πρώτα για τονπαίκτη Α και µετά για τον Β, τότε:

Απαλείφουµε την Top, οπότε ο Β δεν έχει καµία κυριαρχούµενηστρατηγική πλέον!

Εάν, µάλιστα, ξεκινήσει πρώτα ο Β να κάνει απαλοιφές, τότεθα καταλήξουµε σε τρίτο αποτέλεσµα!

0,01,0Bottom

0,10,0Top

RightLeftΒΑ

76

Σειρά των απαλοιφών (3/3)Συµπεράσµατα:Η απαλοιφή ασθενώς κυριαρχούµενων στρατηγικώνµπορεί να οδηγήσει σε διαφορετικά αποτελέσµαταανάλογα µε τη σειρά µε την οποία γίνονται οι απαλοιφέςγια κάθε παίκτη.

Ως σωστή σειρά θεωρείται η ταυτόχρονη απαλοιφή γιαόλους τους παίκτες σε κάθε γύρο.

Εάν εκτελέσουµε απαλοιφή µόνο των ισχυρώςκυριαρχούµενων στρατηγικών, η σειρά της απαλοιφήςδεν παίζει ρόλο.

Page 39: Game Theory

39

77

Ύπαρξη λύσης∆εν καταλήγουµε πάντα σε µοναδική λύση µε τη µέθοδοIEDS.

Πολλά προβλήµατα δεν έχουν καθόλου κυριαρχούµενεςστρατηγικές (π.χ. η µάχη των φύλων).Άλλα προβλήµατα έχουν µερικές µόνο κυριαρχούµενεςστρατηγικές, µετά την απαλοιφή των οποίων αποµένουναρκετές άλλες στρατηγικές που δεν απαλείφονται.

78

Ισορροπία Nash

Page 40: Game Theory

40

79

Γενικά (1/2)Έστω δύο παίκτες, Α και Β.Ας υποθέσουµε ότι δεν υπάρχει καµία κυρίαρχη ούτεκυριαρχούµενη στρατηγική, για κανέναν παίκτη.Ωστόσο, ας υποθέσουµε ότι o Α "µαντεύει" ποια στρατηγικήθα επιλέξει ο αντίπαλος, έστω sΒ*.Τότε προφανώς θα επιλέξει εκείνη από τις δικές τουστρατηγικές, έστω sΑ*, η οποία είναι η καλύτερη απάντησηστην sΒ*.

80

Γενικά (2/2)Ας υποθέσουµε τώρα ότι ο Β καταλαβαίνει ποια στρατηγικήσκοπεύει να επιλέξει ο Α και δεν αλλάζει τη στρατηγική τουsΒ*.

∆ηλαδή συµβαίνει και η sΒ* να είναι για τον Β η καλύτερηαπάντηση στην sΑ*.

Το ζεύγος στρατηγικών (sΑ*, sΒ*) αποτελεί µια ισορροπίαNash.

Page 41: Game Theory

41

81

Ισορροπία NashΜια στρατηγική si* είναι η καλύτερη απάντηση (best response) σε ένα διάνυσµα στρατηγικών των άλλωνπαικτών s-i*, εάν ισχύει:

∀ si, ui(si*, s-i*)≥ui(si, s-i*)

Ένας συνδυασµός στρατηγικών s*=(s1*, s2*, ..., sN*) αποτελεί µια ισορροπία Nash, εάν:

∀ i, ∀ si, ui(si*, s-i*) ≥ ui(si, s-i*)

Με άλλα λόγια, ένα διάνυσµα στρατηγικών s* αποτελείισορροπία Nash, εάν κάθε στρατηγική si* αποτελεί τηνκαλύτερη απάντηση στο συνδυασµό στρατηγικών τωνάλλων παικτών s-i*.

82

ΠαράδειγµαΈστω το παράδειγµα της µάχης των φύλων (διαφάνεια 52).

Το παιχνίδι δεν έχει κυρίαρχες στρατηγικές.Ωστόσο έχει δύο ισορροπίες Nash:

(Γήπεδο, Γήπεδο)(Όπερα, Όπερα)

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓΑ

Page 42: Game Theory

42

83

Ύπαρξη / Μοναδικότηταισορροπιών NashΥπάρχουν παιχνίδια που έχουν περισσότερες από µιαισορροπίες Nash.Ωστόσο υπάρχουν και παιχνίδια που δεν έχουν κανένασηµείο ισορροπίας Nash.Για παράδειγµα, έστω το παιχνίδι "µονά-ζυγά":

1,00,11

0,11,00

10Β

Α

84

Παρατηρήσεις (1/2)Μπορούµε να φανταστούµε τις καταστάσεις ισορροπίας Nash ως "συνταγές" παιξίµατος.

Κάποιος δίνει στους παίκτες τη "συνταγή" πριν αυτοί παίξουνκαι κανένας παίκτης δεν "τολµά" να παίξει διαφορετικά.

Στην περίπτωση περισσοτέρων του ενός σηµείων ισορροπίαςNash, η επιλογή ενός από όλους τους παίκτες προϋποθέτεικάποιας µορφής προσυνεννόηση µεταξύ τους.

Page 43: Game Theory

43

85

Παρατηρήσεις (2/2)Εάν υποθέσουµε ένα παιχνίδι το οποίο:

Έχει περισσότερα του ενός σηµεία ισορροπίας NashΤο παιχνίδι επαναλαµβάνεται για πολλούς γύρουςΟι παίκτες δεν έχουν δυνατότητα συνεννόησης

Στον πρώτο γύρο οι παίκτες επιλέγουν τις στρατηγικές τους, οι οποίες δεν οδηγούν σε σηµείο ισορροπίας.Σε κάθε έναν από τους επόµενους γύρους κάποιοι παίκτεςαλλάζουν τις στρατηγικές τους.Υπάρχει µεγάλη πιθανότητα µετά από µερικούς γύρους οιπαίκτες να καταλήξουν σε σηµείο ισορροπίας.

Εκλογές, πελατεία καταστηµάτων κλπ.

86

Σύγκριση των διαφόρων ειδών λύσηςΕάν υπάρχει λύση κυρίαρχων στρατηγικών, τότε η λύσηαυτή:

Είναι η µοναδική λύση IEDSΕίναι το µοναδικό σηµείο ισορροπίας Nash.

Εάν ένας παίκτης έχει κυρίαρχη στρατηγική, τότε κάθε λύσηIEDS και κάθε σηµείο ισορροπίας Nash περιλαµβάνει αυτήτη στρατηγική για τον συγκεκριµένο παίκτη.Κάθε λύση IEDS είναι και σηµείο ισορροπίας Nash.Υπάρχουν σηµεία ισορροπίας Nash, τα οποία δεν είναι λύσειςIEDS.

Η µάχη των φύλων.

Page 44: Game Theory

44

87

Παράδειγµα: Το δίληµµα των φυλακισµένωνΌπως έχουµε δει, το παιχνίδι αυτό έχει µια λύση κυρίαρχωνστρατηγικών, την (Οµολογεί, Οµολογεί).Η λύση αυτή είναι και το µοναδικό σηµείο ισορροπίας Nash.

14,140,15∆Ο

15,010,10Ο

∆ΟΟKleinCalvin

88

Εφαρµογή: ∆υοπώλιο Cournot

(Antoine Augustin Cournot, 1838)

Page 45: Game Theory

45

89

Περιγραφή προβλήµατος (1/3)∆ύο εταιρείες ανταγωνίζονται στην αγορά παράγοντας τοίδιο ακριβώς προϊόν.Έστω ότι η καµπύλη ζήτησης είναι η εξής:

Q=α-βPόπου:Q: ποσότητα που πουλά η εταιρείαP: τιµή της εταιρείας ανά µονάδα προϊόντοςα, β>0 σταθερές

Εάν θέσουµε a=α/β και b=1/β, τότε η παραπάνω σχέσηγράφεται:

P=a-bQ

90

Περιγραφή προβλήµατος (2/3)

Ποσότητα (Q)

Τιµή

(P)

a/b

a

Page 46: Game Theory

46

91

Περιγραφή προβλήµατος (3/3)Ισχύει Q=Q1+Q2.Η τιµή πώλησης των προϊόντων είναι κοινή για τις δύοεταιρείες και καθορίζεται από την αγορά.Το κόστος παραγωγής ανά µονάδα προϊόντος είναι c1 και c2αντίστοιχα και ανεξάρτητο από το όγκο της παραγωγής.Το ερώτηµα που τίθεται για κάθε µια εταιρεία ξεχωριστάείναι:

Ποια είναι η ιδανική ποσότητα παραγωγής, δηλαδή αυτή πουµεγιστοποιεί το κέρδος της εταιρείας;

92

Ανάλυση του προβλήµατος (1/9)Θα εξετάσουµε το πρόβληµα από την πλευρά της εταιρείας1.Έστω ότι η εταιρεία 2 παράγει ποσότητα Q2

#.Ποια ποσότητα πρέπει να παράγει η εταιρεία 1, ώστε ναµεγιστοποιήσει το κέρδος της;Η τιµή του προϊόντος, όταν η συνολική ποσότητα είναιQ1+Q2

# είναι:P=a-b(Q1+Q2

#)

Τα έσοδα λοιπόν της εταιρείας 1 είναι:P·Q1=(a-b(Q1+Q2

#)) ·Q1

Το κόστος παραγωγής για την εταιρεία 1 είναι:c·Q1

Page 47: Game Theory

47

93

Ανάλυση του προβλήµατος (2/9)Άρα το κέρδος για την εταιρεία 1 είναι:

(a-b(Q1+Q2#)-c) ·Q1

Πρέπει λοιπόν να µεγιστοποιήσουµε την παραπάνωποσότητα.Πρόκειται για ένα πολυώνυµο δευτέρου βαθµού ως προς Q1, το οποίο µεγιστοποιείται για την τιµή:

bbQcaQ

2

#2*

1−−

=

94

Ανάλυση του προβλήµατος (3/9)Για παράδειγµα, εάν a=10, b=1, c=1 και Q2

#=5, τότεπροκύπτει ότι:

212

511102

#2*

1

=⋅

⋅−−=

−−=

bbQcaQ

Page 48: Game Theory

48

95

Ανάλυση του προβλήµατος (4/9)Προφανώς πρέπει να ισχύει Q1*>0.Ορίζουµε λοιπόν τη συνάρτηση Q1=R1(Q2), η οποία µας δίνειτην καλύτερη απάντηση (best response) της εταιρείας 1 σε κάθε πιθανή παραγωγή της εταιρείας 2, ως εξής:

⎪⎩

⎪⎨

−>

−≤

⋅⋅−−

=

bcaQbcaQ

bQbca

QR2

22

21

εάν ,0

εάν ,2)(

96

Ανάλυση του προβλήµατος (5/9)Η γραφική παράσταση της R1(Q2) φαίνεται στο παρακάτωσχήµα:

Page 49: Game Theory

49

97

Ανάλυση του προβλήµατος (6/9)Με παρόµοιο συλλογισµό προκύπτει η συνάρτησηκαλύτερης απάντησης για την εταιρεία 2:

⎪⎩

⎪⎨

−>

−≤

⋅⋅−−

=

bcaQbcaQ

bQbca

QR1

11

12

εάν ,0

εάν ,2)(

98

Ανάλυση του προβλήµατος (7/9)Παρακάτω φαίνονται οι δύο συναρτήσεις καλύτερηςαπάντησης, σχεδιασµένες στο ίδιο διάγραµµα:

Page 50: Game Theory

50

99

Ανάλυση του προβλήµατος (8/9)Το σηµείο τοµής των δύο καµπύλων αποτελεί σηµείοισορροπίας Nash!Έστω (Q1*, Q2*) οι συντεταγµένες του. Ισχύει:

Q1*=R1(Q2*)Q2*=R2(Q1*)

Το συγκεκριµένο παιχνίδι δεν έχει κανένα άλλο σηµείοισορροπίας Nash.

100

Ανάλυση του προβλήµατος (9/9)Τελικά, το σηµείο ισορροπίας Nash έχει τα παρακάτωχαρακτηριστικά:

Για a=10, b=c=1, προκύπτει Q1*=Q2*=3, P=4 καιGain1=Gain2=9.

bcaGainGain

caP

bcaQQ

⋅−

==

+=

⋅−

==

9)(

32

31

3

2

21

*2

*1

Page 51: Game Theory

51

101

Επίλυση µε IEDS (1/5)

102

Επίλυση µε IEDS (2/5)

Page 52: Game Theory

52

103

Επίλυση µε IEDS (3/5)

104

Επίλυση µε IEDS (4/5)

Page 53: Game Theory

53

105

Επίλυση µε IEDS (5/5)

106

Καρτέλ σεδυοπωλιακή αγορά

Page 54: Game Theory

54

107

Το πρόβληµαΈστω ότι οι δύο εταιρείες λειτουργούν ως καρτέλ, δηλαδήπροσπαθούν να µεγιστοποιήσουν το συνολικό κέρδος (καιόχι η κάθε µια το δικό της επιµέρους κέρδος).Πρέπει λοιπόν να βρεθεί η συνολική παραγωγή Q, για τηνοποία µεγιστοποιείται το συνολικό κέρδος.Μετά, εάν θεωρήσουµε ότι οι δύο εταιρείες είναι ισοδύναµες(π.χ. κοινό κόστος παραγωγής) θα ισχύει:Q1**=Q2**=Q/2.

108

Ανάλυση του προβλήµατος (1/2)Έστω Q η συνολική ποσότητα παραγωγής.Το συνολικό κέρδος για τις δύο εταιρείες είναι:

Gain=(a-b·Q-c) ·Q

Η παραπάνω συνάρτηση µεγιστοποιείται γιαQ**=(a-c)/(2b)

Άρα οι επιµέρους παραγωγές των δύο εταιρειών είναι:

bcaQQQ

⋅−

===42

****

2**

1

Page 55: Game Theory

55

109

Ανάλυση του προβλήµατος (2/2)Για την παραπάνω παραγωγή προκύπτουν τα εξής:

Για a=10, b=c=1, προκύπτει Q1**=Q2**=2.25, P=5.5 καιGain1=Gain2=10.125 .

Οι αντίστοιχες τιµές για το σηµείο ισορροπίας Nash ήτανQ1*=Q2*=3, P=4 και Gain1=Gain2=9.

bcaGainGain

caP

⋅−

==

+=

8)(

22

21

110

Παρατηρήσεις (1/3)Το παράδειγµα µε το καρτέλ είναι παρόµοιο µε το δίληµµατων φυλακισµένων.Εάν οι φυλακισµένοι λειτουργήσουν ως καρτέλ, θαµπορούσαν να προσυνεννοηθούν να µην οµολογήσουν καιέτσι να τους επιβληθούν µικρότερες ποινές από ότι ανοµολογήσουν και οι δύο.Ωστόσο, η λύση που µεγιστοποιεί το συνολικό όφελος δενείναι σηµείο ισορροπίας Nash.

Page 56: Game Theory

56

111

Παρατηρήσεις (2/3)Έτσι, κάθε εταιρεία (όπως και κάθε φυλακισµένος) έχει τηντάση να εξαπατήσει την άλλη, ώστε να µεγιστοποιήσει ταοφέλη της.

Εάν µια εταιρεία αθετήσει τη συµφωνία του καρτέλ και παράγειδιαφορετική (µεγαλύτερη) ποσότητα, αυξάνει τα δικά τηςκέρδη κατά ένα ποσό, αλλά µειώνει τα κέρδη της άλληςεταιρείας κατά ένα ακόµη µεγαλύτερο ποσό.

Τελικά και οι δύο εταιρείες θα λειτουργήσουν µε βάση τηµεγιστοποίηση του δικού τους "ατοµικού" κέρδους καιγρήγορα θα καταλήξουν στο σηµείο ισορροπίας Nash.Στο επόµενο διάγραµµα φαίνεται η τοποθέτηση της λύσης-καρτέλ σε σχέση µε το σηµείο ισορροπίας Nash.

112

Παρατηρήσεις (3/3)

Page 57: Game Theory

57

113

Μελέτη περίπτωσης: OPEC (1/4)Ο OPEC (Organization of Petroleum Exporting Countries) αποτελείται από τις περισσότερες πετρελαιοπαραγωγέςχώρες της Μέσης Ανατολής, της Αφρικής και της ΛατινικήςΑµερικής.

∆εν περιλαµβάνει τις ευρωπαϊκές χώρες (Μεγάλη Βρετανία, Νορβηγία, Ολλανδία), την Ρωσία και τις ΗΠΑ.

Οι χώρες αυτές αποφασίζουν από κοινού τις ποσότητες πουθα παράγουν.Αν θεωρήσουµε λοιπόν ότι έχουµε δύο οµάδες χωρών, ταµέλη και τα µη-µέλη του OPEC, ενώ η τιµή του πετρελαίουείναι περίπου κοινή, έχουµε το πρόβληµα της δυοπωλιακήςαγοράς.

114

Μελέτη περίπτωσης: OPEC (2/4)Έστω QO και QN οι ηµερήσιες παραγωγές (σε εκατοµµύριαβαρέλια) των χωρών εντός και εκτός OPEC αντίστοιχα.Έστω ότι η τιµή καθορίζεται από την παρακάτω σχέση:

Έστω ότι το κόστος παραγωγής ανά βαρέλι είναι κατά µέσοόρο 5$ για τις χώρες του OPEC και 10$ για τις χώρες εκτόςOPEC.

365 NO QQP +

−=

Page 58: Game Theory

58

115

Μελέτη περίπτωσης: OPEC (3/4)Οι συναρτήσεις καλύτερης απάντησης για τις δύο οµάδεςχωρών προκύπτουν ως εξής:

Τελικά προκύπτουν οι εξής τιµές:QO=65, QN=50, P=26.6$GainO=1.408GainN= 833

.165 εάν ,2

165)( ≤−

= OO

ON QQQR

.180 εάν ,2

180)( ≤−

= NN

NO QQQR

116

Μελέτη περίπτωσης: OPEC (4/4)Εάν ο OPEC διευρυνόταν και µε τις υπόλοιπες χώρες, θαµπορούσαν να αυξήσουν περισσότερο τα συνολικά τουςκέρδη.Το πρόβληµα που προκύπτει σε περιπτώσεις καρτέλ µεδιαφορετικό κόστος παραγωγής για τα διάφορασυµµετέχοντα µέρη είναι ότι η λύση που µεγιστοποιεί τηνσυνολική απόδοση του καρτέλ προβλέπει ότι όλη ηπαραγωγή θα παραχθεί από το µέρος εκείνο µε τοχαµηλότερο κόστος παραγωγής! (αποδείξτε το...)

Προφανώς κάτι τέτοιο δεν συµφέρει καθόλου τα µέρη µευψηλό κόστος παραγωγής.

Page 59: Game Theory

59

117

Γενίκευση σε πολλές εταιρείες (1/2)Έστω ότι έχουµε Ν ίδιες εταιρείες που κατασκευάζουν καιπωλούν το ίδιο προϊόν στην ίδια αγορά.

Q=Q1+Q2+...+QN

P=a-bQ

Η συνάρτηση καλύτερης απάντησης για την εταιρεία 1 είναιη εξής:

Το σηµείο ισορροπίας Nash είναι:

b

QbcaQQQR

N

ii

N ⋅

⋅−−=

∑=

2),...,,( 2

321

bNcaQi )1(

*

+−

=

118

Γενίκευση σε πολλές εταιρείες (2/2)Η συνολική ποσότητα είναι Ν·Q1* και τελικά η τιµή είναι:

Παρατηρούµε ότι όσο αυξάνει ο αριθµός των εταιρειών σεολιγοπωλιακές αγορές (χωρίς καρτέλ), τόσο η τιµή τείνειπρος το κόστος παραγωγής!

11 +⋅

++

=NcN

NaP

Page 60: Game Theory

60

119

Η τραγωδία των κοινώνThe commons tragedy

120

ΓενικάΗ έννοια της ισορροπίας Nash και η µελέτη ολιγοπωλιακώναγορών µπορεί να εφαρµοστεί στη µελέτη της τραγωδίας ή τουπροβλήµατος των κοινών (the commons tragedy).Ως κοινά θεωρούνται οι πόροι ή τα αγαθά τα οποία:

είναι προσβάσιµα σε όλουςη διαθεσιµότητα τους (τωρινή ή/και µελλοντική) µειώνεται µε τηχρήση.

Το πρόβληµα έγκειται στην υπερβολική χρήση τωνκοινόχρηστων πόρων:

Το όφελος από την υπερβολική χρήση κατευθύνεται σε λίγους.Το κόστος από την υπερβολική χρήση µοιράζεται σε όλους!

Page 61: Game Theory

61

121

ΠαραδείγµαταΚυνηγοί και θηράµαταΦαινόµενο του θερµοκηπίου.

Εταιρείες, έθνη κλπ δεν µειώνουν τις εκποµπές τους σεδιοξείδιο του άνθρακα.

Χρήση των modem του πανεπιστηµίου.∆ιαφηµίσεις (πινακίδες στους δρόµους, spam e-mails κλπ).

122

Ένα απλό µοντέλο (1/5)Έστω δύο παίκτες, Α και Β, και ένας κοινόχρηστος πόροςµεγέθους y>0.Σε κάθε χρονική περίοδο (π.χ. κάθε µέρα) κάθε παίκτηςµπορεί να καταναλώσει µια µη-αρνητική ποσότητα τουπόρου, cA ή cB, έτσι ώστε cA+cB≤y.Εάν η συνολική ζήτηση είναι µεγαλύτερη από τη διαθέσιµηποσότητα, αυτή µοιράζεται στους παίκτες, αλλιώς κάθεπαίκτης λαµβάνει όσο ζήτησε.Για απλοποίηση θεωρούµε ότι το παιχνίδι διαρκεί δύοχρονικές περιόδους.

Page 62: Game Theory

62

123

Ένα απλό µοντέλο (2/5)Έστω ότι το όφελος για κάθε παίκτη από την κατανάλωσηποσότητας c σε µια µέρα ισούται µε:

u(c)=log(c)

124

Ένα απλό µοντέλο (3/5)Έστω ότι την πρώτη περίοδο κάθε παίκτης κατανάλωσε cAκαι cB ποσότητες αντίστοιχα.Την δεύτερη (και τελευταία) περίοδο κάθε παίκτης θαπροσπαθήσει να καταναλώσει το µέγιστο της υπόλοιπηςποσότητας, η οποία είναι y-cA-cB.Έτσι, τη δεύτερη περίοδο κάθε παίκτης θα καταναλώσει:

Το ερώτηµα λοιπόν είναι ποιες πρέπει να είναι οι ποσότητεςcA και cB.

2BA ccy −−

Page 63: Game Theory

63

125

Ένα απλό µοντέλο (4/5)Θα υπολογίσουµε για τον παίκτη Α ποια είναι η καλύτερήτου απάντηση για µια τυχαία κατανάλωση cB του παίκτη Βστον πρώτο γύρο.Έστω λοιπόν ότι ο παίκτης Α καταναλώνει cA στον πρώτογύρο. Το αναµενόµενο συνολικό του όφελος (και για τουςδύο γύρους) είναι:

Η παραπάνω ποσότητα µεγιστοποιείται για:

2loglog BA

Accyc −−

+

2)( B

BAAcycRc −

==

126

Ένα απλό µοντέλο (5/5)Με παρόµοιο συλλογισµό βρίσκουµε ότι η καλύτερη επιλογήτου παίκτη Β στον πρώτο γύρο είναι:

Ο συνδυασµός εκείνος, cA* και cB*, που αντιστοιχεί στοσηµείο ισορροπίας Nash, καθώς και τα αντίστοιχα κέρδηείναι:

2)( A

ABBcycRc −

==

3** ycc BA ==

6log

3log** yy

B +==Α ππ

Page 64: Game Theory

64

127

Βέλτιστη λύσηΗ λύση που βρέθηκε µε βάση το σηµείο ισορροπίας Nashδεν είναι η βέλτιστη.Ας θεωρήσουµε ως βέλτιστη εκείνη τη λύση πουµεγιστοποιεί το συνολικό όφελος για το σύνολο των παικτώνκαι το σύνολο των περιόδων:

η οποία µεγιστοποιείται για:

2log2loglog# BA

BAccycc −−

⋅++=ολπ

4## ycc BA ==

4log4# y⋅=ολπ

128

Παρατηρήσεις (1/2)Στο σηµείο ισορροπίας Nash είδαµε ότι οι παίκτεςυπερκαταναλώνουν στην πρώτη περίοδο, µε αποτέλεσµα ναµην υπάρχει επαρκής ποσότητα στη δεύτερη.Κάθε παίκτης ξεχωριστά δεν διακινδυνεύει να καταναλώσειλιγότερο στον πρώτο γύρο, γιατί η ποσότητα που θαπερισσέψει θα µοιραστεί στο δεύτερο γύρο και στους δύοπαίκτες.Αντίθετα, η βέλτιστη λύση βασίζεται στη συµφωνία (τύπου"καρτέλ") όλων των εµπλεκόµενων µερών για λογικήκατανάλωση ανά περίοδο.

Page 65: Game Theory

65

129

Παρατηρήσεις (2/2)Τα αποτελέσµατα που προέκυψαν οφείλονται κατά κύριολόγο στη µορφή της συνάρτησης χρησιµότητας (utility function), η οποία ήταν κοίλη (concave).

Τα ίδια αποτελέσµατα θα προέκυπταν για οποιαδήποτε κοίλησυνάρτηση.

Εάν η συνάρτηση ήταν γραµµική, δεν θα είχε σηµασία σεποια περίοδο γίνεται η κατανάλωση.Εάν τέλος η συνάρτηση ήταν κυρτή, τότε θα ήτανπροτιµότερο όλη η κατανάλωση να γίνει σε µια περίοδο.

130

Πολλοί παίκτες (1/2)Εάν έχουµε περισσότερους παίκτες, έστω Ν, η κατάστασηχειροτερεύει:

Εάν ένας παίκτης αφήσει µια µονάδα για επόµενη περίοδο, θαµπορέσει να διεκδικήσει µόνο το 1/Ν αυτής.

Με παρόµοιο τρόπο αποδεικνύεται ότι στο σηµείο ισορροπίαςNash κάθε παίκτης καταναλώνει στην πρώτη περίοδο:

µε συνολική κατανάλωση για την πρώτη περίοδο:1

...21 +====Nyccc N

1+⋅

=NyNcολ

Page 66: Game Theory

66

131

Πολλοί παίκτες (2/2)Το συνολικό όφελος σε αυτή την περίπτωση είναι:

Αντίθετα, εάν υπολογιστούν τα ίδια µεγέθη µε στόχο τηβελτιστοποίηση της συνολικής χρησιµότητας, προκύπτει:

2

2*

)1(log

+⋅Ν=

NNy

ολπ

Nyccc N ⋅

====2

... ##2

#1

2

2#

4log

NyN⋅

⋅=ολπ

132

ΙδιωτικοποίησηΜια πιθανή λύση στο πρόβληµα των κοινών είναι αυτό τηςιδιωτικοποίησής τους.

Για παράδειγµα, στις µέρες µας οι περισσότερες εκτάσεις γηςείναι ιδιωτικές, οπότε δεν υπάρχει ανταγωνισµός για τη χρήσητους (π.χ. ως βοσκοτόπους).

Ωστόσο η ιδιωτικοποίηση ακυρώνει εντελώς την έννοια τωνκοινών πόρων, αφού αυτοί παύουν πλέον να είναι κοινοί.Επιπλέον, δεν είναι εφαρµόσιµοι σε πόρους όπως ηατµόσφαιρα κλπ.

Page 67: Game Theory

67

133

Επιβολή τελών και όριο χρηστώνΜια δεύτερη προσέγγιση είναι η επιβολή τελών χρήσηςστους κοινόχρηστους πόρους (π.χ. το νερό).

Είναι η πιο συνηθισµένη προσέγγιση αντιµετώπισης τουπροβλήµατος.

Ζητούµενο είναι να βρεθεί εκείνο το τέλος χρήσης, ούτεπολύ χαµηλό, ούτε πολύ υψηλό, το οποίο θα οδηγήσει σεκανονική χρήση του πόρου.

Ένας συνηθισµένος τρόπος χρέωσης προβλέπει µεταβολή τουτέλους χρήσης ανάλογα µε την ζήτηση (π.χ. ζήτηση νερού τοχειµώνα και το καλοκαίρι).

Εναλλακτικά µπορεί να τεθεί ένα άνω όριο στο πλήθος τωνταυτόχρονων χρηστών του πόρου.

134

Χρησιµότητα καιΑναµενόµενη χρησιµότητα

Utility and Expected Utility

Page 68: Game Theory

68

135

Σχέσεις προτίµησηςΜια σχέση προτίµησης (preference relation) είναι µιαδιµελής σχέση ≿ µεταξύ διαφόρων στρατηγικών, τέτοιαώστε:

a ≿ b ⇔ το αποτέλεσµα a είναι τουλάχιστον εξίσου καλό µε τοαποτέλεσµα b

Η σχέση πρέπει να έχει τις παρακάτω ιδιότητες:Πληρότητα (completeness): Για κάθε ζεύγος αποτελεσµάτων a και b, θα πρέπει να ισχύει είτε a ≿ b ή b ≿ a.Μεταβατικότητα (transitivity): Εάν ισχύει a ≿ b και b ≿ c, τότεπρέπει να ισχύει και a ≿ c.

Μπορούν να οριστούν οι παρακάτω σχέσεις:a ≻ b ⇔ (a ≿ b) ∧ ¬(b ≿ a)a ∼ b ⇔ (a ≿ b) ∧ (b ≿ a)

136

ΧρησιµότηταΘα θέλαµε να αντιστοιχούµε έναν αριθµό σε κάθεαποτέλεσµα και απλά να συγκρίνουµε αριθµούς.

Ο αριθµός αυτός ονοµάζεται χρησιµότητα (utility).

Για παράδειγµα, έστω πέντε αποτελέσµατα, (a,b,c,d,e), γιατα οποία ισχύει:

b ∼ d ≻ a ≻ c ≻ e

Θα µπορούσαµε να κάνουµε την αντιστοίχηση:(a,b,c,d,e) → (3,4,2,4,1)

Η παραπάνω αντιστοίχηση χρησιµοτήτων είναι συνεπής(consistent) µε τις προτιµήσεις µας.Προφανώς υπάρχουν άπειρες συνεπείς αντιστοιχήσειςχρησιµότητας.

Κάθε µονότονη συνάρτηση της παραπάνω αντιστοίχησης.

Page 69: Game Theory

69

137

Αποφάσεις υπό αβεβαιότητα (1/3)Υπάρχουν περιπτώσεις όπου το αποτέλεσµα µιαςστρατηγικής είναι αβέβαιο.

Εάν αποφασίσω να πάω κινηµατογράφο, υπάρχει πιθανότητα .7 να βρω εισιτήριο και .3 να µην βρω.Εάν παρακολουθήσω το µεταπτυχιακό Α, υπάρχει πιθανότητα .8 να βρω δουλειά και .2 να µην βρω.

Σε αυτές τις περιπτώσεις, για να αξιολογήσουµε τοαποτέλεσµα των αποφάσεών µας, πρέπει αυτές να έχουναντιστοιχηθεί σε χρησιµότητες.Μια κατανοµή πιθανοτήτων επάνω σε ένα σύνολο πιθανώναποτελεσµάτων ονοµάζεται λοταρία (lottery).

138

Αποφάσεις υπό αβεβαιότητα (2/3)Έστω δύο αποφάσεις:

Πάω κινηµατογράφο (0.7 να βρω εισιτήριο)Πάω θέατρο (0.5 να βρω εισιτήριο)

Έστω 10 η αξία που δίνω στην παρακολούθηση ενός έργουστον κινηµατογράφο, 20 η αξία που δίνω στηνπαρακολούθηση ενός θεατρικού έργου και 0 η αξία του ναµην παρακολουθήσω τίποτα.

Θεωρώ ότι δεν λαµβάνω υπόψη την τιµή του εισιτηρίου.

Πρέπει να βρω τρόπο να αντιστοιχήσω χρησιµότητες στααποτελέσµατα των δύο αποφάσεων.

Page 70: Game Theory

70

139

Αποφάσεις υπό αβεβαιότητα (3/3)Θεώρηµα αναµενόµενης χρησιµότητας (Expected Utility Theorem, von Neumann - Morgenstern):

Μια συνάρτηση χρησιµότητας πάνω σε ένα σύνολο απόλοταρίες µπορεί να γραφεί ως η αναµενόµενη χρησιµότητα τωνδιαφόρων ενδεχοµένων που συνθέτουν τη λοταρία.

Όταν αρχίζουµε και συνδυάζουµε χρησιµότητεςδιαφορετικών αποτελεσµάτων για να υπολογίσουµεχρησιµότητες σύνθετων καταστάσεων, παίζει σηµαντικόρόλο ο τρόπος µε τον οποίο έχουµε αποδώσει τιςχρησιµότητες στα επιµέρους αποτελέσµατα.

140

Το παράδοξο τηςΑγίας Πετρούπολης (1/3)

Έστω το εξής παιχνίδι:"Ρίχνουµε" ένα κέρµα πολλές φορές. Έστω k η πρώτη φοράκατά την οποία το αποτέλεσµα είναι "γράµµατα". Τότεκερδίζουµε 2k €.

Ποιο είναι το αναµενόµενο κέρδος για αυτό το παιχνίδι; Πόσα θα ήµασταν διατεθειµένοι να ρισκάρουµε για ναπαίξουµε στο παιχνίδι αυτό;Το αναµενόµενο κέρδος είναι:

Προφανώς κανείς δεν θα ρίσκαρε ένα µεγάλο ποσό για ναπαίξει σε αυτό το παιχνίδι!

∑ ∑∞

=

=

∞==⋅1 1

1221

k k

kk

Page 71: Game Theory

71

141

Το παράδοξο τηςΑγίας Πετρούπολης (2/3)

Το παράδοξο πρωτοαναφέρθηκε το 1725 στην ακαδηµία τηςΑγίας Πετρούπολης, από τον Nicollas Bernoulli.Ο πρώτος που ανέφερε µια "λύση" στο παράδοξο είναι οDaniel Bernoulli, αδελφός του Nicollas.Η κεντρική ιδέα της λύσης είναι η εξής:

Η χρησιµότητα ενός χρηµατικού ποσού (γενικότερα ενόςαγαθού) δεν είναι ανάλογη της ποσότητάς του.

Με άλλα λόγια, διπλάσιο χρηµατικό ποσό δεν µας δίνειδιπλάσια χαρά.Το πρόβληµα λοιπόν έγκειται στην αντιστοίχηση τηςποσότητας των υλικών αγαθών µε τη χρησιµότητα που αυτάέχουν για µας.

142

Αποστροφή ρίσκου (1/4)Έστω δύο λοταρίες, Α και Β, στις οποίες ρίχνουµε ένα κέρµακαι αναλόγως το αποτέλεσµα:

Λοταρία Α: Εάν έρθουν γράµµατα κερδίζουµε 1€, εάν έρθεικορώνα χάνουµε 1€.Λοταρία Β: Εάν έρθουν γράµµατα κερδίζουµε 5€, εάν έρθεικορώνα χάνουµε 5€.

Οι περισσότεροι άνθρωποι θα επέλεγαν να συµµετάσχουνστην Α αντί στην Β (ακόµη περισσότεροι επίσης θα επέλεγαννα µην "παίξουν" καθόλου!).Οι δύο λοταρίες έχουν την ίδια αναµενόµενη απόδοση, δηλαδή 0€.

Ωστόσο έχουν διαφορετικές αναµενόµενες χρησιµότητες.

Page 72: Game Theory

72

143

Αποστροφή ρίσκου (2/4)Έστω u(-5), u(-1), u(1) και u(5) οι χρησιµότητες τωνδιαφόρων αποτελεσµάτων.Το γεγονός ότι οι περισσότεροι άνθρωποι επιλέγουν την Ααπό την Β δηλώνει ότι:

½[u(1)+u(-1)]>½[u(5)+u(-5)]

ή ισοδύναµα:u(5)-u(1)<u(-1)-u(-5)

Κάτι τέτοιο µπορεί να συµβεί εάν η συνάρτηση χρησιµότηταςέχει τη µορφή που φαίνεται στην επόµενη διαφάνεια.

144

Αποστροφή ρίσκου (3/4)

Page 73: Game Theory

73

145

Αποστροφή ρίσκου (4/4)Στην προηγούµενη διαφάνεια:

Το σηµείο Ν αντιστοιχεί στην αναµενόµενη χρησιµότητα του ναµην παίξουµε καθόλου.Το σηµείο Α αντιστοιχεί στην αναµενόµενη χρησιµότητα του ναεπιλέξουµε το παιχνίδι Α.Το σηµείο Β αντιστοιχεί στην αναµενόµενη χρησιµότητα του ναεπιλέξουµε το παιχνίδι Β.

Βλέπουµε ότι µεγαλύτερη χρησιµότητα αντιστοιχεί στοσηµείο Ν, µετά στο Α και µετά στο Β.Τα παραπάνω αποτελέσµατα προέκυψαν εξαιτίας της ειδικήςµορφής της συνάρτησης χρησιµότητας, η οποία είναι κοίλη(concave).

Ισχύουν για όλες τις κοίλες συναρτήσεις.

146

Το παράδοξο τηςΑγίας Πετρούπολης (3/3)

Εάν στο παράδοξο της Αγίας Πετρούπολης ορίσουµε µιακοίλη συνάρτηση χρησιµότητας, π.χ. u(x)=log(x+c), τότεη αναµενόµενη χρησιµότητα από το παιχνίδι είναι:

Άρα ο παίκτης πρέπει να βρει ποιο είναι το µέγιστο ποσό -K που θα διακινδύνευε να χάσει, έτσι ώστε η αναµενόµενηχρησιµότητα να είναι µεγαλύτερη του µηδέν.

∑∞

=

∞<+⋅1

)2log(21

k

kk c

Page 74: Game Theory

74

147

Μη-κοίλες συναρτήσειςΣε περίπτωση που η συνάρτηση χρησιµότητας ήτανγραµµική, δηλαδή u(x)=a·x, τότε λοταρίες σαν τις Α και Βείναι ίσης προτίµησης.

Μικρά τµήµατα µιας κοίλης συνάρτησης χρησιµότητας µπορούννα θεωρηθούν γραµµικά.

Εφαρµογή σε τυχερά παιχνίδια

Σε περίπτωση που η συνάρτηση χρησιµότητας ήταν κυρτή(convex), τότε θα προτιµούσαµε το παιχνίδι Β !

148

Μικτές στρατηγικέςMixed strategies

Page 75: Game Theory

75

149

ΓενικάΈστω η µάχη των φύλων. Κάθε παίκτης έχει δύο διαθέσιµεςστρατηγικές, Γήπεδο ή Όπερα.Ωστόσο υπάρχει (τουλάχιστον) µια ακόµη στρατηγική:

"Στρίβουµε" ένα κέρµα και αν έρθει "γράµµατα" πάµε στο γήπεδο, εάν έρθει "κορώνα" πάµε στην όπερα.

Η τελευταία στρατηγική ονοµάζεται µικτή στρατηγική (mixed strategy) και µεταφράζεται σε 50% πιθανότητα να επιλέξει οπαίκτης το Γήπεδο και 50% πιθανότητα να επιλέξει την Όπερα.Υπάρχουν άπειρες µικτές στρατηγικές, ανάλογα µε τιςπιθανότητες που δίνουµε στις διάφορες επιλογές.

150

ΟρισµόςΈστω ότι ένας παίκτης έχει Μ καθαρές (pure) στρατηγικές, s1, s2, ..., sM. Μια µικτή στρατηγική για αυτόν τον παίκτηείναι µια κατανοµή πιθανότητας επί των καθαρώνστρατηγικών του:

(p1, p2, ..., pM), έτσι ώστε p1+p2+...+pM=1.

Η αξιολόγηση της αναµενόµενης χρησιµότητας µιας µικτήςστρατηγικής γίνεται αθροίζοντας τα γινόµενα των(αναµενόµενων) αποτελεσµάτων των επιµέρουςστρατηγικών επί τις αντίστοιχες πιθανότητες.

Page 76: Game Theory

76

151

ΠαράδειγµαΠαρακάτω φαίνεται το παιχνίδι της µάχης των φύλων, µε µιαεπιπλέον στρατηγική για κάθε παίκτη:

0.5, 1.5

1,3

0,0

Όπερα

0.5, 1.50,0Όπερα

1, 11.5, 0.50.5-0.5

1.5, 0.53,1Γήπεδο

0.5-0.5ΓήπεδοΓ

Α

152

Καλύτερη απάντησηµε µικτές στρατηγικές (1/2)

Έστω µια µικτή στρατηγική sm που αποτελείται από τρειςκαθαρές στρατηγικές, si1, si2 και si3, µε πιθανότητες p1, p2και p3.Έστω ότι οι αντίπαλοι εφαρµόζουν συνολικά τη στρατηγικήs-i.Τότε το όφελος για τον παίκτη i είναι:

u(sm,s-i)=p1·u(si1,s-i)+ p2·u(si2,s-i)+ p3·u(si3,s-i)

Ας υποθέσουµε ότι u(si1,s-i)>u(si2,s-i)>u(si3,s-i).Τότε θα συνέφερε τον παίκτη i να παίξει την καθαρήστρατηγική si1, αντί της µικτής στρατηγικής m !

Page 77: Game Theory

77

153

Καλύτερη απάντησηµε µικτές στρατηγικές (2/2)

Για να είναι λοιπόν µια µικτή στρατηγική m η καλύτερηαπάντηση σε έναν συνδυασµό στρατηγικών s-i τωνυπολοίπων παικτών, θα πρέπει κάθε επιµέρους καθαρήστρατηγική της µικτής στρατηγικής να είναι από µόνη τηςεπίσης η καλύτερη απάντηση.∆ηλαδή u(sm,s-i)=u(si1,s-i)=u(si2,s-i)=u(si3,s-i)Σε αυτή την περίπτωση, κάθε συνδυασµός (p1',p2',p3') τωνεπιµέρους στρατηγικών είναι καλύτερη απάντηση στοσυνδυασµό στρατηγικών s-i.

154

Μικτές στρατηγικές καιισορροπία Nash (1/5)

Έστω το παιχνίδι "µονά-ζυγά", στο οποίο δεν υπάρχει κανένασηµείο ισορροπίας Nash.Ας υποθέσουµε ότι ο παίκτης Α επιλέγει να παίζει '0' µεπιθανότητα p.Εάν ο παίκτης Β παίξει καθαρά '0', τότε το αναµενόµενοόφελός του είναι:

ΕuΒ('0')=p·0+(1-p) ·1=1-p

Παρόµοια, εάν ο παίκτης Β παίξει καθαρά '1', τοαναµενόµενο όφελός του είναι:

ΕuΒ('1')=p·1+(1-p) ·0=p

Προφανώς ισχύει:ΕuΒ('0')>ΕuΒ('1') ⇔ (1-p)>p ⇔ p< ½

1,00,11

0,11,00

10Β

Α

Page 78: Game Theory

78

155

Μικτές στρατηγικές καιισορροπία Nash (2/5)

Εάν p= ½, τότε ο παίκτης Β µπορεί να επιλέξει οποιαδήποτεστρατηγική, είτε την '0', είτε την ΄1΄, είτε ακόµηοποιαδήποτε µικτή στρατηγική από αυτές τις δύο.Άρα, µεταξύ άλλων, η µικτή στρατηγική (0.5, 0.5) για τονπαίκτη Β, είναι καλύτερη απάντηση στην µικτή στρατηγική(0.5,0.5) του παίκτη Α.Με παρόµοιο συλλογισµό µπορεί να βρεθεί ότι ισχύει και τοακριβώς αντίστροφο για τους δύο παίκτες.Στο επόµενο διάγραµµα µε q συµβολίζεται η πιθανότητα µετην οποία ο παίκτης Β επιλέγει '0'.

1,00,11

0,11,00

10Β

Α

156

Μικτές στρατηγικές καιισορροπία Nash (3/5)

Οι γραφικές παραστάσεις καλύτερης απάντησης για τους δύοπαίκτες είναι οι εξής:

1,00,11

0,11,00

10Β

Α

p

q

½

½

1

1

q=RB(p)

0

p=RA(q)

Page 79: Game Theory

79

157

Μικτές στρατηγικές καιισορροπία Nash (4/5)

Άρα το ζεύγος στρατηγικών (0.5, 0.5) – (0.5, 0.5) αποτελείσηµείο ισορροπίας Nash, διότι:Κανένας παίκτης δεν έχει λόγο να ξεφύγει από το σηµείοαυτό, γιατί δεν πρόκειται να κερδίσει άµεσα.Οποιοσδήποτε παίκτης ξεφύγει από αυτό το σηµείο δίνει τηδυνατότητα στον άλλο παίκτη να το εκµεταλλευτεί.

Για παράδειγµα, εάν στα "µονά-ζυγά" κάποιος παίκτης δείχνειγια πολλή ώρα προτίµηση σε ένα από τα δύο νούµερα, δίνει τηδυνατότητα στον άλλο παίκτη να κερδίσει µερικούς "πόντους".

1,00,11

0,11,00

10Β

Α

158

Μικτές στρατηγικές καιισορροπία Nash (5/5)

Όλα τα παιχνίδια έχουν τουλάχιστον ένα σηµείο ισορροπίαςNash στις µικτές στρατηγικές.

∆εν έχουν ωστόσο όλα τα παιχνίδια σηµείο ισορροπίας Nash στις καθαρές στρατηγικές, όπως είδαµε στο παιχνίδι "µονά-ζυγά".

Το σηµείο ισορροπίας Nash στις µικτές στρατηγικές έχειδιαφορετική ερµηνεία:

Ένας παίκτης δεν "φεύγει" από αυτό, γιατί:δεν θα κερδίσει άµεσαµπορεί να χάσει µελλοντικά

Αντίθετα, στα σηµεία καθαρής ισορροπίας, ένας παίκτης δενφεύγει γιατί θα χάσει άµεσα.

Page 80: Game Theory

80

159

Παράδειγµα:Τένις (1/5)

Έστω δύο παίκτες που παίζουν τένις, Α και Β.Κάθε φορά που είναι η σειρά του Α να χτυπήσει την µπάλα, πρέπει να επιλέξει εάν θα σηµαδέψει το εµπρός ή το πίσωµέρος του γηπέδου του Β.Αντίστοιχα, ο Β πρέπει να αποφασίσει αν θα τοποθετηθεί στοεµπρός ή στο πίσω µέρος του χώρου του.Η πιθανότητα για τον Α να έχει ένα επιτυχηµένο χτύπηµααυξάνει όταν "ξεγελάσει" τον Β.Στον πίνακα που ακολουθεί θεωρούµε ως όφελος κάθεπαίκτη την (εκατοστιαία) πιθανότητα να κερδίσει τον γύροανάλογα µε τις επιλογές και των δύο παικτών.

160

Παράδειγµα:Τένις (2/5)

Εάν ο παίκτης Α επιλέγει πάντα 'Εµπρός', τότε ο παίκτης Βµπορεί και αυτός µε τη σειρά του να επιλέγει πάντα 'Εµπρός' κερδίζοντας στο 70% των περιπτώσεων.Έστω p και q οι πιθανότητες µε τις οποίες ο Α και ο Βεπιλέγουν 'Εµπρός' αντίστοιχα.Για να µειώσει τη δυνατότητα πρόβλεψης του Β, ο Α επιλέγειτην πιθανότητα p µε τέτοιο τρόπο ώστε να είναι ισοδύναµεςγια τον Β οι δύο αποφάσεις του:

EuB(Εµπρός)=p·70+(1-p) ·30EuB(Πίσω)=p·20+(1-p) ·60EuB(Εµπρός)=EuB(Πίσω) ⇔ p=0.375

40, 6070, 30(1-p) Πίσω

80, 2030,70(p) Εµπρός

(1-q)Πίσω

(q)Εµπρός

ΒΑ

Page 81: Game Theory

81

161

Παράδειγµα:Τένις (3/5)

Παρόµοια, ο παίκτης Β επιλέγει την πιθανότητα q µε τέτοιοτρόπο ώστε να είναι ισοδύναµες για τον A οι δύο αποφάσειςτου:

EuA(Εµπρός)=q·30+(1-q) ·80EuA(Πίσω)=q·70+(1-q) ·40EuA(Εµπρός)=EuB(Πίσω) ⇔ q=0.5

Άρα το ζεύγος στρατηγικών (0.375, 0.625) για τον Α και(0.5, 0.5) για τον Β αποτελούν σηµείο ισορροπίας Nash.

40,6070,30(1-p) Πίσω

80,2030,70(p) Εµπρός

(1-q)Πίσω

(q)Εµπρός

ΒΑ

162

Παράδειγµα:Τένις (4/5)

Τα αναµενόµενα κέρδη των δύο παικτών στο σηµείο αυτό είναι:EuA=p·EuA(Εµπρός)+(1-p) ·EuA(Πίσω) = 0.375·55+0.615·55=55EuB=q·EuB(Εµπρός)+(1-q) ·EuB(Πίσω) = 0.5·45+0.5·45=45

Το ίδιο αποτέλεσµα (όσον αφορά τις τελευταίες πράξεις) προκύπτει και από τους τύπους που δίνουν είτε το EuA(Εµπρός) ή το EuA(Πίσω) για τον Α, και παρόµοια για τον Β.

Αυτό οφείλεται στο ότι στο σηµείο ισορροπίας η µικτή στρατηγικήπου ακολουθεί κάθε παίκτης έχει τα ίδια αναµενόµενα οφέλη µεκάθε επιµέρους καθαρή στρατηγική, µε την προϋπόθεση ότι οαντίπαλος δεν θα αλλάξει τη δική του µικτή στρατηγική.

40,6070,30(1-p) Πίσω

80,2030,70(p) Εµπρός

(1-q)Πίσω

(q)Εµπρός

ΒΑ

Page 82: Game Theory

82

163

Παράδειγµα:Τένις (5/5)

Ας υποθέσουµε ότι ένας παίκτης αλλάζει τη µικτήστρατηγική του, π.χ. ο Α επιλέγει p=0.5.Σε αυτή την περίπτωση ο Β µπορεί να τροποποιήσει τη δικήτου στρατηγική ώστε να µεγιστοποιήσει το δικό του όφελος.Πράγµατι, για p=0.5, ισχύει για τον Β:

EuB(Εµπρός)=0.5·70 + 0.5·30 = 50EuB(Πίσω)=0.5·20 + 0.5·60 = 40

Ο Β λοιπόν επιλέγει να παίζει συνέχεια "Εµπρός", ανεβάζοντας το αναµενόµενο όφελός του σε 50 (καιαντίστοιχα µειώνοντας το αναµενόµενο όφελος του Α).

40,6070,30(1-p) Πίσω

80,2030,70(p) Εµπρός

(1-q)Πίσω

(q)Εµπρός

ΒΑ

164

Παρατηρήσεις (1/2)Τα παραδείγµατα που προηγήθηκαν είχαν ένα κοινόχαρακτηριστικό: Αφορούσαν παιχνίδια µηδενικού (ήσταθερού) αθροίσµατος.Στα παιχνίδια αυτά όταν ο ένας παίκτης κερδίζει κάποιοποσό τότε ο άλλος χάνει το ίδιο ποσό.

Ανταγωνιστικά παιχνίδια (competitive games)

Στα σηµεία αυτά, το σηµείο µικτής ισορροπίας Nash µοιάζειαρκετά µε τα αντίστοιχα σηµεία καθαρής ισορροπίας Nash, αφού οποιοσδήποτε παίκτης ξεφύγει από αυτό κινδυνεύει ναχάσει.

Page 83: Game Theory

83

165

Παρατηρήσεις (2/2)Ωστόσο, υπάρχουν παιχνίδια µη-σταθερού αθροίσµατος, όπως η µάχη των δύο φύλων, στα οποία εάν ο ένας παίκτηςαντιληφθεί τι προτίθεται να κάνει ο άλλος, µπορεί να τοεκµεταλλευτεί για κοινό όφελος!Τέτοια παιχνίδια ονοµάζονται συνεργατικά (cooperative).

ΠΡΟΣΟΧΗ: ∆εν είναι όλα τα παιχνίδια µη-σταθερούαθροίσµατος συνεργατικά.

Στα παιχνίδια αυτά ορίζεται και πάλι η έννοια της µικτήςισορροπίας Nash, ωστόσο έχει διαφορετική ερµηνεία.

166

Παράδειγµα:Η µάχη των φύλων (1/3)

Έστω το γνωστό παράδειγµα της µάχης των φύλων, τοοποίο έχει δύο σηµεία καθαρής ισορροπίας Nash.Θα ελέγξουµε εάν υπάρχουν σηµεία µικτής ισορροπίας.Έστω ότι ο Α επιλέγει 'Γήπεδο' µε πιθανότητα p και 'Όπερα' µε πιθανότητα 1-p.Το αναµενόµενο όφελος της Γ για τις δύο καθαρέςστρατηγικές της είναι:

ΕuΓ('Γήπεδο')=p·1+(1-p) ·0 = pΕuΓ('Όπερα')=p·0+(1-p) ·3 = 3-3·p

1,3

0,0

Όπερα

0,0Όπερα

3,1Γήπεδο

ΓήπεδοΓ

Α

Page 84: Game Theory

84

167

Παράδειγµα:Η µάχη των φύλων (2/3)

Ισχύει:ΕuΓ('Γήπεδο') > ΕuΓ('Όπερα') ⇔ p > 3-3p ⇔ p > ¾ .

Άρα:αν p > ¾ συµφέρει τη γυναίκα να επιλέγει πάντα 'Γήπεδο'.αν p < ¾ συµφέρει τη γυναίκα να επιλέγει πάντα 'Όπερα'.αν p = ¾ συµφέρει τη γυναίκα εξίσου να επιλέγει είτε 'Γήπεδο΄είτε'Όπερα' είτε τέλος οποιονδήποτε συνδυασµό αυτών.

Για p= ¾ το αναµενόµενο όφελος της Γ είναι ΕuΓ=¾.

Παρόµοια για τον άντρα, εάν η γυναίκα επιλέγει 'Όπερα' µεπιθανότητα (1-q)=¾, τότε αυτός µπορεί να επιλέξειοποιαδήποτε στρατηγική (καθαρή ή µικτή) ως καλύτερηαπάντηση.

1,3

0,0

Όπερα

0,0Όπερα

3,1Γήπεδο

ΓήπεδοΓ

Α

168

Παράδειγµα:Η µάχη των φύλων (3/3)

Άρα, ο συνδυασµός µικτών στρατηγικών (¾,¼)-(¼,¾) αποτελεί σηµείο ισορροπίας Nash.Στο σηµείο αυτό το αναµενόµενο όφελος κάθε παίκτη είναι ίσοµε ΕuA=EuΓ=¾.Εάν οι παίκτες ξεφύγουν από το σηµείο ισορροπίας Nash, το πιοπιθανό είναι να αυξηθεί το αναµενόµενο όφελος και για τουςδύο!

Για παράδειγµα, για p=q=1/2 έχουµε:ΕuA= ½·½·3 + ½·½·0 + ½·½·0 + ½·½·1 = 1ΕuΓ= ½·½·1 + ½·½·0 + ½·½·0 + ½·½·3 = 1

Ωστόσο µπορεί και να µειωθεί (µηδενισθεί), εάν π.χ. επιλέξουνp=1,q=0 ή p=0,q=1.

1,3

0,0

Όπερα

0,0Όπερα

3,1Γήπεδο

ΓήπεδοΓ

Α

Page 85: Game Theory

85

169

ΠαρατηρήσειςΤο παιχνίδι της µάχης των δύο φύλων είναι συνεργατικό(και όχι ανταγωνιστικό).Σε τέτοια παιχνίδια µας ενδιαφέρει ο αντίπαλος να µάθει τηστρατηγική που πρόκειται να εφαρµόσουµε, γιατί µπορεί νατην αξιοποιήσει για κοινό όφελος. Το σηµείο µικτής ισορροπίας Nash είναι το σηµείο απόλυτηςέλλειψης πληροφόρησης για τις προθέσεις του αντιπάλου.Το σηµείο µικτής ισορροπίας Nash µας εξασφαλίζει έναελάχιστο αναµενόµενο όφελος, ανεξάρτητα από το τι θαεπιλέξει να κάνει ο αντίπαλος.

Για παράδειγµα, εάν ο άντρας επέλεγε τη στρατηγική (1/2,1/2), τότε η γυναίκα µπορούσε να επιλέξει τη στρατηγική (0,1), µεαναµενόµενο όφελος για τον άνδρα 0,5 και για τη γυναίκα 1,5.

170

Συµµετρικά παιχνίδιακαι µικτές ισορροπίες

Page 86: Game Theory

86

171

Συµµετρικά παιχνίδιαΈνα παιχνίδι µεταξύ δύο παικτών Α και Β ονοµάζεταισυµµετρικό (symmetric game) όταν:

Όλοι οι παίκτες έχουν τις ίδιες διαθέσιµες στρατηγικές.Για κάθε ζεύγος στρατηγικών s1, s2, ισχύει:

uA(s1,s2)=uB(s2,s1)(στις παρενθέσεις η πρώτη στρατηγική αναφέρεται πάντα στον Α και ηδεύτερη στον Β).

Ένα σηµείο ισορροπίας Nash ονοµάζεται συµµετρικό(symmetric equilibrium) εάν όλοι οι παίκτες έχουν επιλέξειτην ίδια στρατηγική σε αυτό.

172

Το παιχνίδι των δειλών (1/2)Έστω ότι δύο παίκτες πρέπει να αποφασίσουν εάν θαπολεµήσουν ή όχι.

Εάν πολεµήσουν (Π), οι ζηµιές είναι µεγάλες και για τους δύο.Εάν πολεµήσει µόνο ο ένας, τότε αυτός έχει µεγάλο κέρδος ενώο δεύτερος έχει ζηµιές (αλλά µικρότερες από ότι αν πολεµούσε).Εάν δεν πολεµήσει (∆Π) κανένας έχουν ισοδύναµες ακόµηµικρότερες ζηµιές.

5,50,10∆Π10,0-1, -1Π∆ΠΠ

ΒΑ

Page 87: Game Theory

87

173

Το παιχνίδι των δειλών (2/2)Το παιχνίδι έχει δύο σηµεία καθαρής ισορροπίας Nash, τα(Π,∆Π) και (∆Π,Π).Θα ελέγξουµε εάν έχει σηµείο µικτής ισορροπίας.

Έστω p και q οι πιθανότητες κάθε παίκτης να επιλέξει Π.Ο Α επιλέγει το p έτσι ώστε να ισχύει:

EuB(Π)=EuB(∆Π) ⇔ p·(-1)+(1-p)·10=p·0+(1-p)·5 ⇔ p= 5/6

Παρόµοια βρίσκουµε ότι q=5/6.

Άρα ο συνδυασµός στρατηγικών (5/6,1/6)-(5/6,1/6) είναισηµείο µικτής (συµµετρικής) ισορροπίας Nash.Στο σηµείο αυτό το αναµενόµενο όφελος κάθε παίκτη είναι5/6.

5,50,10∆Π

10,0-1, -1Π

∆ΠΠΒ

Α

174

Συµµετρικές ισορροπίεςΟι συµµετρικές ισορροπίες έχουν µια ιδιαίτερη θέση µεταξύτων διαφόρων ισορροπιών.Υπάρχει η άποψη ότι εάν όλοι οι παίκτες είναι ίδιοι, τότεγιατί να επιλέξουν διαφορετικές στρατηγικές.

Με βάση αυτό το σκεπτικό, κάθε παίκτης έχει το φόβο πως ό,τικαι αν επιλέξει ο ίδιος, το ίδιο ακριβώς θα επιλέξει και οαντίπαλος, µιας και οι δυο σκέφτονται µε τον ίδιο ακριβώςτρόπο.

Υπό αυτή την έννοια, οι συµµετρικές ισορροπίες είναι οι πιο"λογικές" ισορροπίες σε περίπτωση συµµετρικών παιχνιδιών.

Page 88: Game Theory

88

175

ΠαρατήρησηΤο παιχνίδι της µάχης των φύλων, όπως παρουσιάστηκε, δεν είναι συµµετρικό.Ωστόσο µπορεί να µετασχηµατισθεί σε συµµετρικό εάναλλάξουµε τα ονόµατα των ενεργειών σε Best και Worst, υπονοώντας την πρώτη προτίµηση για κάθε παίκτη.

Προφανώς σε αυτή την περίπτωση, το Best για τον Α είναι τοΓήπεδο και για την Γ η Όπερα.

Έτσι ο πίνακας του παιχνιδιού γίνεται:

1,3

0,0

Όπερα

0,0Όπερα

3,1Γήπεδο

ΓήπεδοΓ

Α

0,0

3,1

Worst

1,3Worst

0,0Best

BestΓ

Α

176

Μελέτη περίπτωσης:Φυσικό µονοπώλιο

Natural Monopoly

Page 89: Game Theory

89

177

ΓενικάΜια αγορά χαρακτηρίζεται ως φυσικό µονοπώλιο όταν οιεξωτερικές συνθήκες (τεχνολογικές, ζήτηση κλπ) είναιτέτοιες που δεν υπάρχει χώρος για περισσότερες από µιαεταιρείες.Φυσικά µονοπώλια µπορούν να προκύψουν όταν:

Το κόστος παραγωγής µειώνεται µε την ποσότητα.Όταν υπάρχουν ελάχιστες ποσότητες παραγωγής.Όταν η αγορά είναι µικρή.

Παραδείγµατα:MicrosoftBoeing

178

Ένα απλό µοντέλοΈστω δύο εταιρείες σε µια αγορά – φυσικό µονοπώλιο:

Κάθε χρόνο που οι δύο εταιρείες παραµένουν στην αγοράχάνουν c.Εάν µια εταιρεία αποσυρθεί, η άλλη εταιρεία κερδίζει ετησίως π(έστω π>c), ενώ αυτή που αποσύρθηκε δεν έχει κέρδη/ζηµίες.Έστω ότι κάθε εταιρεία έχει τις επιλογές να αποσυρθεί φέτος(year0), του χρόνου (year1) ή τον µεθεπόµενο χρόνο (year2).

-2c, -2cπ-c, -c2π,0year2

-c, π-c-c, -cπ,0year1

0, 2π0,π0,0year0

year2year1year0A\B

Page 90: Game Theory

90

179

Ανάλυση (1/3)Υπάρχουν δύο σηµεία καθαρής ισορροπίας Nash, τα year2-year0 και year0-year2.

Πρόκειται για µη-συµµετρικές ισορροπίες.

Θα προσπαθήσουµε να βρούµε ένα σηµείο συµµετρικήςισορροπίας (προφανώς µικτής πλέον).

Έστω pΑ, qΑ και (1-pΑ-qΑ) η πιθανότητα µε την οποία ο παίκτης Αεπιλέγει τις στρατηγικές year0, year1 και year2.Τα αναµενόµενα οφέλη για τις διάφορες στρατηγικές του παίκτη Βείναι:

EuB(year0)=pΑ·0+qΑ·0+(1-pΑ-qΑ) ·0=0EuB(year1)=pΑ·π+qΑ·(-c)+(1-pΑ-qΑ) ·(-c)=pΑ·π+(1-pΑ) ·(-c)EuB(year2)=pΑ·2π+qΑ·(π-c)+(1-pΑ-qΑ) ·(-2c)

-2c, -2cπ-c, -c2π,0year2

-c, π-c-c, -cπ,0year1

0, 2π0,π0,0year0

year2year1year0A\B

180

Ανάλυση (2/3)Τα pΑ και qΑ θα επιλεγούν από την εταιρεία Α µε τέτοιοτρόπο ώστε:

EuB(year0)=EuB(year1)=EuB(year2)

Λύνοντας το σύστηµα των εξισώσεων (2x2) προκύπτει:pΑ=c/(π+c)qΑ=01-pA-qA=π/(π+c)

Ακριβώς τα ίδια αποτελέσµατα θα προέκυπταν και για τηνεταιρεία Β.

pB=c/(π+c)qB=01-pB-qB=π/(π+c)

-2c, -2cπ-c, -c2π,0year2

-c, π-c-c, -cπ,0year1

0, 2π0,π0,0year0

year2year1year0A\B

Page 91: Game Theory

91

181

Ανάλυση (3/3)Άρα, το σηµείο µικτής (συµµετρικής) ισορροπίας Nash δενπεριλαµβάνει τη στρατηγική year1 για καµία εταιρεία!Κάθε εταιρεία λοιπόν πρέπει ανεξάρτητα να αποφασίσει ανθα εξέλθει της αγοράς εξαρχής ή µετά από 2 χρόνια.Το παράδειγµα µπορεί να γενικευθεί σε περισσότερεςχρονικές περιόδους.

Προσοχή: Το παράδειγµα υποθέτει ότι κάθε εταιρείαλαµβάνει την απόφαση της στην αρχή της περιόδου και δενµπορεί να την αλλάξει ενδιάµεσα.

-2c, -2cπ-c, -c2π,0year2

-c, π-c-c, -cπ,0year1

0, 2π0,π0,0year0

year2year1year0A\B

182

Εκτατική µορφή παιχνιδιών

Extensive form games

Page 92: Game Theory

92

183

ΓενικάΠολλά παιχνίδια περιλαµβάνουν διαδοχικές (µη-ταυτόχρονες) αποφάσεις των παικτών.Κάθε παίκτης αποφασίζει γνωρίζοντας συνήθως τιςαποφάσεις όλων των παικτών που προηγήθηκαν.

Σκάκι

Τέτοια παιχνίδια λέγονται δυναµικά (dynamic) ήακολουθιακά (sequential).Τα δυναµικά παιχνίδια συνηθίζεται να παριστάνονται στηνεκτατική µορφή αναπαράστασης (extensive form).

184

Παράδειγµα: Εισιτήρια θεάτρου (1/2)∆ύο θεατρόφιλοι, Α και Β, πρέπει να αποφασίσουν ποιο µέσοµεταφοράς θα χρησιµοποιήσουν για να πάνε στο θέατρο:

Τ(αξί)Μ(ετρό)Λ(εωφορείο)

Στο θέατρο έχει αποµείνει ακριβώς ένα εισιτήριο, το οποίοθα το πάρει ο πρώτος που θα φθάσει.Το Τ είναι γρηγορότερο από το Μ, το οποίο είναιγρηγορότερο από το Λ.Ο Α αναχωρεί πριν από τον Β.Για να προλάβει ο Β πρέπει να χρησιµοποιήσει γρηγορότεροµέσο µεταφοράς.

Page 93: Game Theory

93

185

Παράδειγµα: Εισιτήρια θεάτρου (2/2)

Παίκτης Α

Παίκτης Β

Τ

Μ

Λ

Τ

ΜΛ

Τ

ΜΛ

Τ

ΜΛ

u1(True,Τ), u2(False,Τ)

u1(True,Τ), u2(False,Μ)

u1(True,Τ), u2(False,Λ)

u1(False,Μ), u2(True,Τ)

u1(True,Μ), u2(False,Μ)

u1(True,Μ), u2(False,Λ)

u1(False,Λ), u2(True,Τ)

u1(False,Λ), u2(True,Μ)

u1(True,Λ), u2(False,Λ)

186

ΠαρατηρήσειςΤο δένδρο της προηγούµενης διαφάνειας ονοµάζεται δένδροτου παιχνιδιού (game tree)Οι εσωτερικοί κόµβοι του δένδρου ονοµάζονται κόµβοιαπόφασης (decision nodes).Τα φύλλα (τερµατικοί κόµβοι) του δένδρου αναγράφουν τοαντίστοιχο όφελος κάθε παίκτη.Ένας παίκτης µπορεί να εµφανίζεται στο δένδροπερισσότερες από µία φορές.Ένα παιχνίδι µπορεί να περιλαµβάνει περισσότερους απόδύο παίκτες.

Page 94: Game Theory

94

187

Σύνολα πληροφόρησης (1/3)Είναι δυνατόν ένας παίκτης να αποφασίζει τη στρατηγικήτου χωρίς να γνωρίζει αποφάσεις άλλων παικτών πουπροηγήθηκαν.

Για παράδειγµα, στο παιχνίδι µε τα εισιτήρια, ο παίκτης Β πουξεκινά δεύτερος από το σπίτι του, δεν γνωρίζει ποιο µέσοµεταφοράς επέλεξε ο παίκτης Α.

Σε τέτοιες περιπτώσεις, όπου δηλαδή µια απόφαση δενγίνεται γνωστή σε άλλους παίκτες, τα παιδιά τουαντίστοιχου κόµβου απόφασης εµφανίζονται ως έναςµεγάλος οβάλ κόµβος που ονοµάζεται σύνολοπληροφόρησης (information set).

188

Σύνολα πληροφόρησης (2/3)

Παίκτης Α

Τ

Μ

Λ

Τ

ΜΛ

Τ

ΜΛ

Τ

ΜΛ

Παίκτης Β

Page 95: Game Theory

95

189

Σύνολα πληροφόρησης (3/3)Παιχνίδια στα οποία δεν υπάρχουν σύνολα πληροφόρησηςονοµάζονται παιχνίδια πλήρους πληροφόρησης (perfect information games).

Στα παιχνίδια πλήρους πληροφόρησης κάθε παίκτης γνωρίζειόλες τις προηγούµενες αποφάσεις των αντιπάλων του.Τα υπόλοιπα παιχνίδια ονοµάζονται παιχνίδια µη-πλήρουςπληροφόρησης (imperfect information games).

190

ΣτρατηγικέςΜια στρατηγική είναι ένα πλήρες, υπό προϋποθέσεις πλάνοενεργειών.

Πρέπει να καλύπτει όλες τις περιπτώσεις του παιχνιδιού (πρινξεκινήσει το παιχνίδι).Πρέπει να περιλαµβάνει µια απόφαση για κάθε κόµβοαπόφασης που αφορά τον παίκτη.

Στο παιχνίδι µε τα εισιτήρια, ο παίκτης Α έχει 3 στρατηγικές.Τ, Μ, Λ

Ο παίκτης Β έχει 33=27 στρατηγικές, τρεις για κάθε µία απότις στρατηγικές του παίκτη Α.

ΤΤΤ, ΤΤΜ, ΤΤΛ, ΤΛΤ, ΤΛΜ, ΤΛΛ, ..., ΛΛΛ

Page 96: Game Theory

96

191

Εκτατική και στρατηγικήµορφή παιχνιδιών (1/2)

Έχοντας καταγράψει τις διάφορες στρατηγικές των δύοπαικτών, µπορούµε να περιγράψουµε το παιχνίδι στηνστρατηγική µορφή:

u1(True, Λ), u2(False, Λ)

...u1(False, Λ), u2(True, Μ)

u1(False, Λ), u2(True, T)

Λ

u1(True, Μ), u2(False, Λ)

...u1(False, M), u2(True, T)

u1(False, M), u2(True, T)

Μ

u1(True, T), u2(False, Λ)

...u1(True, T), u2(False, T)

u1(True, T), u2(False, T)

Τ

ΛΛΛ...ΤΤΜΤΤΤΒ

Α

192

Εκτατική και στρατηγικήµορφή παιχνιδιών (2/2)

Ισχύει και το αντίστροφο:Κάθε παιχνίδι σε στρατηγική µορφή µπορεί να γραφεί σεεκτατική, χρησιµοποιώντας σύνολα πληροφόρησης.

Calvin Klein

O

O

O∆O

∆O

∆O

Page 97: Game Theory

97

193

Μικτές στρατηγικέςΚάθε παίκτης µπορεί να έχει µικτές στρατηγικές, όπωςακριβώς και στη στρατηγική µορφή των παιχνιδιών.

Μια µικτή στρατηγική είναι µία κατανοµή πιθανοτήτων επάνωστις καθαρές στρατηγικές του παίκτη.

194

Παράδειγµα: Coke-Pepsi (1/9)Έστω ότι η Coca-Cole (Coke) πρέπει να αποφασίσει εάν θαεισέλθει ή όχι στην αγορά της πρώην Σοβιετικής Ένωσης, την οποία µέχρι τώρα ελέγχει η Pepsi.

Υπάρχουν λοιπόν δύο επιλογές για την Coke, Μ(έσα) και Ε(ξω).

Εάν η Coke αποφασίσει να εισέλθει, η Pepsi έχει δύοεπιλογές, να Α(ντιδράσει) έντονα και να Σ(υµβιβαστεί).

Coke

Pepsi

M

E

A

Σ

0, 5

-2,-1

1,2

Page 98: Game Theory

98

195

Προς τα πίσω επαγωγήΗ µέθοδος της προς τα πίσω επαγωγής (backward induction) επιχειρεί να προβλέψει τι θα επιλέξει κάθεπαίκτης σε κάθε κόµβο απόφασης.Η κεντρική ιδέα είναι ότι κάθε παίκτης επιλέγει σε κάθεκόµβο την επιλογή εκείνη που του δίνει το καλύτεροαποτέλεσµα από το σηµείο εκείνο και πέρα.Οι υπολογισµοί γίνονται ξεκινώντας από τους τελευταίουςκόµβους απόφασης και προχωρώντας προς τα πίσω µέχρι τηρίζα.

196

Παράδειγµα: Coke-Pepsi (2/9)Το δένδρο απόφασης έχει δύο κόµβους απόφασης, έναν γιατην Coke στην αρχή και έναν για την Pepsi στη συνέχεια.Έστω ότι έχει έρθει η ώρα της Pepsi να αποφασίσει.Αυτή θα επιλέξει Σ, µιας και σε αυτή την περίπτωση τοόφελος της είναι 2 (αντί για -1). Το αντίστοιχο όφελος τηςCoke θα είναι 1.

Coke

Pepsi

M

E

A

Σ

0, 5

-2,-1

1,2

Page 99: Game Theory

99

197

Παράδειγµα: Coke-Pepsi (3/9)Η Coke, εκτελώντας τους ίδιους συλλογισµούς, αντιλαµβάνεται ότι εάν επιλέξει να εισέλθει στην αγορά ηPepsi δεν θα αντιδράσει και άρα το τελικό όφελος της Coke θα είναι 1. Αντίθετα, εάν δεν εισέλθει στην αγορά, το τελικό όφελόςτης θα είναι 0.Έτσι τελικά αποφασίζει να εισέλθει στην αγορά.

Coke

Pepsi

M

E

A

Σ

0, 5

-2,-1

1,2

1,2

1,2

198

Παράδειγµα: Coke-Pepsi (4/9)Στο ίδιο αποτέλεσµα θα καταλήγαµε εάν διερευνούσαµε τηνστρατηγική µορφή του παιχνιδιού.

Ο συνδυασµός στρατηγικών (Μ,Σ) αποτελεί σηµείοισορροπίας Nash.Το ίδιο ισχύει και για το συνδυασµό στρατηγικών (Ε,Α). Ωστόσο, µε δεδοµένο ότι πρώτη αποφασίζει η Coke, έχει κάθελόγο να οδηγήσει το παιχνίδι στο σηµείο (Μ,Σ).

0,5Ε

1,2-2,-1Μ

ΣΑPepsi

Coke

Page 100: Game Theory

100

199

Παράδειγµα: Coke-Pepsi (5/9)Επεκτείνουµε το παράδειγµα ως εξής:Αφού η Coke εισέλθει στην αγορά, ανεξαρτήτως τηςεπιλογής της Pepsi, η Coke µπορεί και αυτή µε τη σειρά τηςνα ακολουθήσει µια επιθετική πολιτική, δηλαδή ναΑ(ντιδράσει), ή να ακολουθήσει µια ήρεµη πολιτική, δηλαδήνα Σ(υµβιβαστεί).

Coke

Coke

Pepsi

M

E

A

A

Σ

Σ

-2, -1

-3, 1

0, -3

1, 2

0, 5

200

Παράδειγµα: Coke-Pepsi (6/9)Το δένδρο τώρα έχει τέσσερις κόµβους απόφασης, τρεις γιατην Coke και έναν για την Pepsi.Οι κόµβοι απόφασης του τελευταίου επιπέδου αφορούν τηνCoke. Οι αποφάσεις της Coke λαµβάνονται βάσει τουοφέλους της στα διάφορα φύλλα του δένδρου:

Coke

Coke

Pepsi

M

E

A

A

Σ

Σ

-2, -1

-3, 1

0, -3

1, 2

0, 5

-2, -1

1, 2

Page 101: Game Theory

101

201

Παράδειγµα: Coke-Pepsi (7/9)Στη συνέχεια, η Pepsi αποφασίζει εάν θα αντιδράσει ή θασυµβιβαστεί βάσει της αναµενόµενης εξέλιξης του παιχνιδιούσε κάθε µια περίπτωση:

Coke

Coke

Pepsi

M

E

A

A

Σ

Σ

-2, -1

-3, 1

0, -3

1, 2

0, 5

-2, -1

1, 2

1, 2

202

Παράδειγµα: Coke-Pepsi (8/9)Τελικά, η Coke αποφασίζει στη ρίζα του δένδρου να εισέλθειστην αγορά. Η τελική κατάληξη του παιχνιδιού είναι (1,2).

Πλέον η Coke έχει το µεγαλύτερο µερίδιο στην αγορά τωνχωρών της Ανατολικής Ευρώπης.

Coke

Coke

Pepsi

M

E

A

A

Σ

Σ

-2, -1

-3, 1

0, -3

1, 2

0, 5

-2, -1

1, 2

1, 2

1, 2

Page 102: Game Theory

102

203

Παράδειγµα: Coke-Pepsi (9/9)Στον πίνακα φαίνεται η στρατηγική µορφή αναπαράστασηςτου παιχνιδιού.Τα δύο κελιά µε πορτοκαλί φόντοαποτελούν σηµείο ισορροπίαςNash.

Ουσιαστικά πρόκειται για τοίδιο σηµείο, το οποίο αποτελείκαι τη λύση που βρήκαµεµε τη µέθοδος της προς τα πίσωεπαγωγής.

Ωστόσο, η στρατηγική ΜΑΣ πλεονεκτεί έναντι της ΜΣΣ, γιατίχειρίζεται καλύτερα την περίπτωση που η Pepsi αποφασίσεινα αντιδράσει.

0,50,5Ο

1,2-3,1ΜΣΣ

0,-3-3,1ΜΣΑ

1,2-2,-1ΜΑΣ

0,-3-2,-1ΜΑΑ

ΣΑPepsi

Coke

204

Ο ρόλος της δέσµευσης (1/4)Είναι κοινή πεποίθηση ότι το να έχουµε πολλές επιλογέςείναι καλύτερο από το να έχουµε λίγες.Ωστόσο κάτι τέτοιο µπορεί να είναι επιζήµιο σε παιχνίδια µεαντιπάλους, όταν οι αντίπαλοι γνωρίζουν τις επιλογές µας.Έστω για παράδειγµα το παιχνίδι Coke-Pepsi µε 2 επιπέδων, όπου το τελικό αποτέλεσµα ήταν (1,2).

Coke

Pepsi

M

E

A

Σ

0, 5

-2,-1

1,2

1,2

1,2

Page 103: Game Theory

103

205

Ο ρόλος της δέσµευσης (2/4)Ας θεωρήσουµε ότι η Pepsi έχει µόνο µια επιλογή, νααντιδράσει εφόσον η Coke αποφασίσει να εισέλθει στηναγορά.

Γνωρίζοντάς το αυτό η Coke αποφασίζει να µην εισέλθειστην αγορά, µε αποτέλεσµα το τελικό όφελος να είναι (0,5), δηλαδή πολύ καλύτερο για την Pepsi!

Coke

Pepsi

M

E

A

0, 5

-2,-1

-2,-1

0, 5

206

Ο ρόλος της δέσµευσης (3/4)Παρόµοια, έστω το παιχνίδι τριών επιπέδων, όπου το τελικόαποτέλεσµα ήταν (1,2).Έστω τώρα ότι η Coke έχει µόνο µια επιλογή στο τελευταίοεπίπεδο, να αντιδράσει:

Coke

Coke

Pepsi

M

E

A

A

Σ

Σ

-2, -1

-3, 1

0, -3

1, 2

0, 5

Page 104: Game Theory

104

207

Ο ρόλος της δέσµευσης (4/4)Τελικά, όπως φαίνεται στο σχήµα, η Coke αποφασίζει να µηνεισέλθει στην αγορά, και το τελικό όφελος διαµορφώνεταισε (0,5), ωφελώντας την Pepsi.

Coke

Coke

Pepsi

M

E

A

A

Σ

Σ

-2, -1

-3, 1

0, -3

1, 2

0, 5

-2, -1

0, -3

-2, -1

0, 5

208

ΠαρατηρήσειςΘεώρηµα του Kuhn (και του Zermelo): Κάθε παιχνίδιπλήρους πληροφόρησης µε πεπερασµένο αριθµό κόµβωναπόφασης έχει µία λύση µε τη µέθοδο της προς τα πίσωεπαγωγής. Η λύση αυτή είναι µοναδική αν για κάθε παίκτηδεν υπάρχουν φύλλα µε το ίδιο όφελος.Η µέθοδος της προς τα πίσω επαγωγής στα παιχνίδια σεεκτατική µορφή είναι το αντίστοιχο της επαναλαµβανόµενηςαπαλοιφής κυριαρχούµενων στρατηγικών (IEDS) σταπαιχνίδια στην στρατηγική µορφή.

Page 105: Game Theory

105

209

Μελέτη περίπτωσης: Έρευνα και Ανάπτυξη

Research & Development(R&D)

210

ΓενικάΗ οικονοµική ανάπτυξη τα τελευταία 250 χρόνια βασίζεταικατά κύριο λόγο στην επιστηµονική έρευνα και ανάπτυξηνέων προϊόντων.

ΠληροφορικήΤηλεπικοινωνίεςΦαρµακευτικήΒιοτεχνολογία

Η έρευνα κατά κύριο λόγο χρηµατοδοτείται από µεγάλεςπολυεθνικές εταιρείες.Στην ιδανική περίπτωση τα αποτέλεσµα των ερευνών θαέπρεπε να ήταν κοινό αγαθό (public good).Η έρευνα κοστίζει.

Page 106: Game Theory

106

211

ΠατέντεςΟι πατέντες (patents) κατοχυρώνουν δικαιώµαταεκµετάλλευσης για τις εταιρείες που αναπτύσσουν νέαπροϊόντα. Ο πρώτος που θα αναπτύξει/κατοχυρώσει ένα προϊόν παίρνειτα πάντα!Είναι στρατηγικής σηµασίας για κάθε εταιρεία να αποφασίσει:

Πού θα κατευθύνει τους πόρους της για έρευναΜε τι ρυθµό θα χρηµατοδοτήσει την έρευναΠότε πρέπει να αποχωρήσει από την ανάπτυξη ενός νέουπροϊόντος.

212

ΜοντέλοΈστω 2 εταιρείες, Α και Β, που διαγωνίζονται για την ανάπτυξηµιας πατέντας για κάποια υπηρεσία (π.χ. τηλεόραση υψηλήςευκρίνειας).Κάνουµε τις εξής παραδοχές:

Η απόσταση από τον επιθυµητό στόχο είναι µετρήσιµη. Ορίζουµεαυθαίρετη µονάδα µέτρησης τα βήµατα (steps).Κάθε εταιρεία µπορεί να προχωρήσει 1, 2 ή 3 βήµατα σε µιαχρονική περίοδο µε αντίστοιχο κόστος 2, 7 και 15 µονάδες.

Η εµπειρία δείχνει ότι διπλάσια επένδυση σε έρευνα δεν αποφέρειδιπλάσια αποτελέσµατα...

Η εταιρεία που θα φθάσει πρώτη στον στόχο κερδίζει την πατέντα, η αξία της οποίας είναι 20 µονάδες.

Η δεύτερη εταιρεία δεν κερδίζει τίποτα.

Θεωρούµε ότι οι δύο εταιρείες λαµβάνουν αποφάσεις εναλλάξ, γνωρίζοντας πάντα τις προηγούµενες αποφάσεις τουαντιπάλου τους (παιχνίδι πλήρους πληροφόρησης).

Page 107: Game Theory

107

213

Λειτουργία καρτέλΤι θα συνέβαινε αν οι δύο εταιρείες αποφάσιζαν νασυνεννοηθούν:

Η έρευνα θα διεξαγόταν από µια µόνο εταιρεία.Η έρευνα θα διεξαγόταν µε τον πλέον αργό ρυθµό, δηλαδή έναβήµα ανά χρονική περίοδο.Η έρευνα θα διεξαγόταν από την εταιρεία που είναι πιο κοντάστον στόχο.

Γενικά, η λειτουργία καρτέλ µειώνει τις επενδύσεις σεέρευνα και ανάπτυξη, σε αντίθεση µε τον ανταγωνισµό πουτις αυξάνει κατακόρυφα.

214

Ανάλυση (1/13)Θα αναλύσουµε το πρόβληµα χρησιµοποιώντας την προς ταπίσω επαγωγή.Για την ανάλυση θα χρησιµοποιήσουµε έναν διδιάστατο χώροκαταστάσεων, του οποίου οι συντεταγµένες αντιστοιχούν στηναπόσταση (σε βήµατα) κάθε εταιρείας από την ολοκλήρωσητης έρευνας/ανάπτυξης:

Η οριζόντια γραµµή είναι η γραµµή τερµατισµού της εταιρείας Α.Η κατακόρυφη γραµµή είναι η γραµµή τερµατισµού της εταιρείαςΒ.Θα χρησιµοποιούµε τα γράµµατα a και b για να δηλώσουµε τηναπόσταση της εταιρείας Α και της εταιρείας Β αντίστοιχα από τιςσχετικές γραµµές τερµατισµού.

Page 108: Game Theory

108

215

Ανάλυση (2/13)

(3,4)

Τέλος Α

Τέλος Β

Άξονας Β

Άξονας Α

a=3

b=4

216

Ανάλυση (3/13)Ας υποθέσουµε ότι το παιχνίδι είναι στην κατάσταση (1,b) και είναι σειρά του παίκτη Α να παίξει.

Προφανώς ο παίκτης Α τελειώνει το παιχνίδι µε µία κίνηση.Ο παίκτης κερδίζει την πατέντα αξίας 20, ενώ χάνει 2 µονάδεςλόγω της κίνησης, άρα το κέρδος του είναι 18.

Παρόµοια, εάν το παιχνίδι είναι στην κατάσταση (a,1) καιείναι σειρά της εταιρείας Β να παίξει, αυτή τερµατίζει τοπαιχνίδι και κερδίζει την πατέντα.

ΠΡΟΣΟΧΗ: Στο σηµείο αυτό δεν µας ενδιαφέρει πόσα έχειξοδέψει στο παρελθόν κάθε εταιρεία. Η απόφαση πουλαµβάνεται αφορά το µέλλον, σαν να ξεκινούσε τώρα τοπαιχνίδι.

Page 109: Game Theory

109

217

Ανάλυση (4/13)Ας υποθέσουµε ότι βρισκόµαστε στην κατάσταση (2,1) ή(3,1) και είναι σειρά της εταιρείας Α να παίξει.

Η εταιρεία Α ολοκληρώνει το παιχνίδι σε µία κίνηση, κερδίζοντας αντίστοιχα 20-7=13 ή 20-15=5.Αν δεν το κάνει, στο επόµενο βήµα η εταιρεία Β θα τελειώσει τοπαιχνίδι, οπότε το κέρδος για την Α θα είναι µηδέν.

Φυσικά το ίδιο ισχύει για την εταιρεία Β, εάν το παιχνίδιείναι σε µια από τις καταστάσεις (1,2) ή (1,3) και είναι σειράτης Β να παίξει.

218

Ανάλυση (5/13)Με παρόµοιο τρόπο, εάν η τρέχουσα κατάσταση είναι η(2,2), οποιαδήποτε εταιρεία είναι σειρά της να κινηθεί θαεπιλέξει να τερµατίσει το παιχνίδι άµεσα, κερδίζοντας 20-7=13.

Πράγµατι, αν π.χ. είναι σειρά της Α και αυτή επιλέξει να κινηθείένα βήµα προς την κατάσταση (1,2) µε κόστος για την Α 2 µονάδες, τότε η Β θα τερµατίσει το παιχνίδι κερδίζοντας 13 µονάδες, όπως είδαµε!

Με παρόµοιο τρόπο βρίσκεται ότι εάν η τρέχουσα κατάστασηείναι η (3,2) και είναι σειρά της Α να κινηθεί, θα τερµατίσειτο παιχνίδι.

Παρόµοια εάν η τρέχουσα κατάσταση είναι η (2,3) και είναι ησειρά της Β.

Τέλος, εάν η τρέχουσα κατάσταση είναι η (3,3), όποιαεταιρεία κινείται πρώτη θα τερµατίσει το παιχνίδι!

Page 110: Game Theory

110

219

Ανάλυση (6/13)Από τα παραπάνω προκύπτει ότι εάν το παιχνίδι βρίσκεταιστην περιοχή a≤3 και b≤3, οποιαδήποτε εταιρεία έχει τηνπρώτη κίνηση θα τερµατίσει το παιχνίδι.

Η περιοχή αυτή ονοµάζεται πρώτη ζώνη πυροδότησης (trigger zone I).

Θα χρησιµοποιήσουµε τα συµπεράσµατα που βγάλαµε γιατην πρώτη περιοχή πυροδότησης για να δούµε τι γίνεται στιςάµεσα γειτονικές περιοχές.Η προσέγγισή µας στο πρόγραµµα είναι ουσιαστικά η προςτα πίσω επαγωγή.

220

Ανάλυση (7/13)

(3,3)

Τέλος Α

Τέλος Β

Άξονας Β

Άξονας Α

Πρώτη περιοχήπυροδότησης

Page 111: Game Theory

111

221

Ανάλυση (8/13)Τι γίνεται εάν βρισκόµαστε στην κατάσταση (4,3) και είναισειρά της εταιρείας Α να κινηθεί;

Η εταιρεία Α µπορεί να κινηθεί 1, 2 ή 3 βήµατα, µε κόστος 2, 7 και 15 αντίστοιχα.Ωστόσο, σε κάθε περίπτωση η εταιρεία Β θα κερδίσει τηνπατέντα.Άρα είναι καλύτερα για την εταιρεία Α να µην κινηθεί καθόλου, δηλαδή να εγκαταλείψει!

Το ίδιο συµπέρασµα προκύπτει εάν το παιχνίδι βρίσκεται στιςκαταστάσεις (4,2), (4,1), (5,3), (5,2) και (5,1).Εάν η εταιρεία Α εγκαταλείψει, τότε η εταιρεία Β θαπροχωρήσει µε µικρά βήµατα µέχρι τη γραµµή τερµατισµούτης.

222

Ανάλυση (9/13)Γενικά, εάν είναι a>3 και b≤3 και είναι σειρά της Α, τότεπρέπει να εγκαταλείψει. Το σύνολο των θέσεων b≤3 ονοµάζεται Πρώτη ζώνηασφαλείας για την Β (Safety Zone I for B).

Προφανώς, µιας και το παιχνίδι είναι συµµετρικό, υπάρχει ηαντίστοιχη πρώτη ζώνη ασφαλείας για την Α, η οποίαορίζεται για a≤3 και b>3.

Page 112: Game Theory

112

223

Ανάλυση (10/13)

(3,3)

Τέλος Α

Τέλος Β

Άξονας Β

Άξονας Α

Πρώτη περιοχήπυροδότησης

Πρώτηζώνη

ασφαλείαςγια την Β

Πρώτηζώνη

ασφαλείαςγια την Α

224

Ανάλυση (11/13)Ας υποθέσουµε ότι είµαστε στην κατάσταση (4,4) και είναισειρά της Α.

Η Α µπορεί µε ένα βήµα (κόστους 2) να µπει στην πρώτη ζώνηασφαλείας της.Στη συνέχεια η Β εγκαταλείπει.Τέλος η Α, µε τρία ακόµη απλά βήµατα τερµατίζει.Το όφελος της Α είναι 20-4x2=12

Εάν η Α δεν µπει στη ζώνη ασφαλείας της, τότε θα µπει η Βκαι θα πρέπει η Α να εγκαταλείψει.Παρόµοια, η Α θα επιχειρήσει να µπει στην πρώτη ζώνηασφαλείας της από την (5,4), µε αναµενόµενο κέρδος 7.Η Α δεν θα επιχειρήσει να µπει στη ζώνη ασφαλείας της απότη θέση (6,4), µιας και τότε το αναµενόµενο κέρδος της θαήταν -1.

Page 113: Game Theory

113

225

Ανάλυση (12/13)Άρα, υπάρχει µια δεύτερη ζώνη πυροδότησης (Trigger Zone II), για 3<a≤5 και 3<b≤5, από την οποία κάθε εταιρεία έχειδυνατότητα να κερδίσει.Παρόµοια, υπάρχουν δεύτερες ζώνες ασφαλείας:

Για την Α, για 3<a≤5 και b>5.Για την Β, για 3<b≤5 και a>5.

Αν συνεχίσουµε µε τον ίδιο τρόπο, καταλήγουµε στο σχήµαπου φαίνεται στο επόµενο διάγραµµα.

226

Ανάλυση (13/13)Τέλος Α

Τέλος Β

Άξονας Β

Άξονας Α

Πρώτη περιοχήπυροδότησης

Πρώτηζώνη

ασφαλείαςγια την Β

Πρώτηζώνη

ασφαλείαςγια την Α

(3,3)∆εύτερη περιοχήπυροδότησης

(5,5)

(7,7)

(8,8)

(9,9) Τρίτη περιοχήπυροδότησης

∆εύτερηζώνη

ασφαλείαςγια την Β

∆εύτερηζώνη

ασφαλείαςγια την Α

Τρίτηζώνη

ασφαλείαςγια την Α

Τρίτηζώνη

ασφαλείαςγια την Β

(10,10)

Page 114: Game Theory

114

227

Παρατηρήσεις (1/2)Στην ανάλυση που προηγήθηκε, κάθε εταιρεία σε κάθε βήµαδεν λαµβάνει υπόψη τα έξοδα που έχει κάνει µέχρι εκείνη τηστιγµή, παρά µόνο τα αναµενόµενα έσοδα/έξοδα από εκείκαι πέρα.Η ίδια ανάλυση µπορεί να γίνει και για µη-συµµετρικέςεταιρείες.

Εάν µια εταιρεία έχει µικρότερα κόστη έρευνας και ανάπτυξης, οι ζώνες της είναι πλατύτερες.Και πάλι θα δούµε ότι όσο αποµακρυνόµαστε από την αρχή τωναξόνων, τα πλάτη των ζωνών µικραίνουν.

Όσο µεγαλύτερη είναι η αξία της πατέντας, τόσοµεγαλύτερα είναι τα πλάτη των ζωνών.

228

Παρατηρήσεις (2/2)Εάν υπάρχει αβεβαιότητα για το αποτέλεσµα της έρευνας καιανάπτυξης, τότε οι εταιρείες παραµένουν στον ανταγωνισµόπερισσότερο.Εάν µια εταιρεία έχει προτίµηση για γρήγορο κέρδος, µπορείνα αποφασίσει να προχωρήσει γρηγορότερα, ακόµη και ανδεν υπάρχει ανταγωνισµός.Η εθνική πολιτική σε θέµατα επιδότησης της έρευνας παίζειπολύ σηµαντικό ρόλο, ιδιαίτερα στον ανταγωνισµό µεταξύεπιχειρήσεων από διαφορετικά κράτη / οµάδες κρατών.

Π.χ. Ευρωπαϊκά και εθνικά προγράµµατα.

Page 115: Game Theory

115

229

Τέλεια ισορροπία Nashγια υποπαίγνια

Subgame Perfect Nash Equilibrium

230

ΓενικάΗ έννοια της τέλειας ισορροπίας Nash για υποπαίγνια αφοράπαιχνίδια µη-πλήρους πληροφόρησης σε εκτατική µορφή.

Η µη-πλήρης πληροφόρηση δηλώνεται µε την ύπαρξη συνόλωνπληροφόρησης.

Coke

Coke

Pepsi

M

E

A

A

Σ

Σ

-2, -1

-3, 1

0, -3

1, 2

0, 5

Page 116: Game Theory

116

231

Κόµβοι απόφασηςΗ ύπαρξη συνόλων πληροφόρησης µειώνει το πλήθος τωνκόµβων απόφασης για τους παίκτες.Πράγµατι, στο τροποποιηµένο παιχνίδι Coke-Pepsi, η Coke έχει πλέον 2 κόµβους απόφασης, αντί των τριών που είχεστο παιχνίδι πλήρους πληροφόρησης.Άρα, κάθε στρατηγική της Coke θα πρέπει να έχει δύοσκέλη:

Εάν θα εισέλθει στην αγορά ή όχι.Σε περίπτωση που εισέλθει στην αγορά, εάν θα αντιδράσειδυναµικά ή όχι (χωρίς να γνωρίζει τι αποφάσισε να κάνει ηPepsi).

232

ΥποπαίγνιαΈνα υποπαίγνιο (subgame) είναι ένα υπο-δένδρο τουαρχικού δένδρου του παιχνιδιού, το οποίο ξεκινά µε έναναπλό κόµβο απόφασης.

Ένα υποπαίγνιο δεν µπορεί να ξεκινά από ένα σύνολοπληροφόρησης.

Το τροποποιηµένο παιχνίδι Coke-Pepsi έχει δύο υποπαίγνια:Το συνολικό παιχνίδιΤο παιχνίδι που προκύπτει µετά την απόφαση της Coke ναεισέλθει στην αγορά.

Σε ένα παιχνίδι πλήρους πληροφόρησης, κάθε κόµβοςαπόφασης είναι η ρίζα ενός υποπαίγνιου.

Page 117: Game Theory

117

233

Τέλεια ισορροπία Nash για υποπαίγνιαΈστω s µια στρατηγική για το συνολικό παιχνίδι και g έναυποδένδρο του αρχικού δένδρου του παιχνιδιού.Συµβολίζουµε µε s(g) το κοµµάτι εκείνο της στρατηγικής s πουαφορά το υποπαίγνιο g.

∆ύο στρατηγικές s1 και s2 (για δύο παίκτες Α και Β) αποτελούντέλεια ισορροπία Nash ενός παιχνιδιού σε εκτατική µορφή, εάν γιακάθε υποπαίγνιο g του αρχικού παιχνιδιού οι στρατηγικές s1(g) καιs2(g) αποτελούν επίσης τέλεια ισορροπία Nash.

Η αναζήτηση των στρατηγικών αυτών γίνεται µε τη µέθοδο τηςπρος τα πίσω επαγωγής.Ο παραπάνω ορισµός της ισορροπίας Nash αντανακλά το γεγονόςότι κάθε παίκτης σε κάθε βήµα επιλέγει την καλύτερη δυνατήκίνηση για τον εαυτό του, λαµβάνοντας υπόψη ότι το ίδιο ακριβώςθα κάνει και ο αντίπαλος.

234

Coke-Pepsi (1/3)Ξεκινούµε να υπολογίζουµε ισορροπίες Nash σε υποπαίγνια, ξεκινώντας από τα «τελευταία» χρονικά.Στο τρέχον παράδειγµα, το τελευταίο υποπαίγνιο είναι αυτόπου ξεκινά µετά την απόφαση της Coke να εισέλθει.Η ανάλυση του υποπαίγνιου θα γίνει σε στρατηγική µορφήαναπαράστασης.

Coke

Coke

Pepsi

M

E

A

A

Σ

Σ

-2, -1

-3, 1

0, -3

1, 2

0, 5

Page 118: Game Theory

118

235

Coke-Pepsi (2/3)Από τον πίνακα της στρατηγικής µορφής του υποπαίγνιουφαίνεται ότι υπάρχουν δύο σηµεία ισορροπίας Nash:

(Α,Α) µε όφελος (-2,-1)(Σ,Σ) µε όφελος (1,2)

Το (Σ,Σ) είναι καλύτερο και για τις δύο εταιρείες, οπότεαναµένεται να επιλεγεί.Άρα το αναµενόµενο αποτέλεσµα ολόκληρου του υποπαιγνίουείναι (1,2).

1,2-3,1Σ

0,-3-2,-1Α

ΣΑPepsi

Coke

Coke

Pepsi

M

E

A

A

Σ

Σ

-2, -1

-3, 1

0, -3

1, 2

0, 5

1, 2

Coke

236

Coke-Pepsi (3/3)Η Coke λοιπόν, υπολογίζοντας ότι αν επιλέξει να εισέλθειστην αγορά, το αναµενόµενο αποτέλεσµα θα είναι (1,2), επιλέγει να εισέλθει.

Coke

Pepsi

M

E

A

A

Σ

Σ

-2, -1

-3, 1

0, -3

1, 2

0, 5

1, 2

Coke

1, 2

Page 119: Game Theory

119

237

∆ίληµµα των φυλακισµένων (1/5)Θεωρούµε µια παραλλαγή του διλήµµατος τωνφυλακισµένων, όπου το παιχνίδι επαναλαµβάνεται δύοφορές.

Στο τέλος του πρώτου γύρου οι αποφάσεις που πήραν οι δύοπαίκτες (στον πρώτο γύρο) γίνονται γνωστές και στους δύο.Το συνολικό όφελος κάθε παίκτη είναι το άθροισµα από τουςδύο επιµέρους γύρους.

Το συνολικό παιχνίδι έχει πέντε υποπαίγνια:Τέσσερα που αφορούν τον δεύτερο γύρο, για τα διάφορααποτελέσµατα του πρώτου γύρου.Το συνολικό παιχνίδι.

238

∆ίληµµα των φυλακισµένων (2/5)

1, 115, 0∆Ο

0, 155, 5Ο

∆ΟΟKlein

Calvin

Ο

Ο

ΟΟ

Ο

Ο

Ο

Ο

ΟΟ

Ο

Ο

Ο

Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

10,10

5,20

20,56,65,20

0,3015,15

1,1620,515,15

30,016,16,61,1616,1

2,2

Calvin

Calvin

Klein

Klein

Ο

Page 120: Game Theory

120

239

∆ίληµµα των φυλακισµένων (3/5)Τα τέσσερα υποπαίγνια του δεύτερου γύρου έχουν όλα απόµία λύση, που αντιστοιχεί σε όλα τα παιχνίδια στοσυνδυασµό στρατηγικών (Ο,Ο):

Ο

Ο

ΟΟ

Ο

Ο

Ο

Ο

ΟΟ

Ο

Ο

Ο

Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

10,10

5,20

20,56,65,20

0,3015,15

1,1620,515,15

30,016,16,61,1616,1

2,2

Calvin

Calvin

Klein

Klein

Ο

10,10

5,20

20,5

6,6

240

∆ίληµµα των φυλακισµένων (4/5)Για τον πρώτο γύρο έχουµε πλέον να λύσουµε το παρακάτωπαιχνίδι:

Το παιχνίδι αυτό έχει µία λύση, το σηµείο ισορροπίας Nash (Ο,Ο) µε τελικό όφελος (10,10).Άρα τελικά οι στρατηγικές που επιλέγουν οι δύο παίκτεςείναι:

Calvin: OOOOOKlein: OOOOO

6,620,5∆Ο

5, 2010, 10Ο

∆ΟΟKlein

Calvin

Page 121: Game Theory

121

241

∆ίληµµα των φυλακισµένων (5/5)

Ο

Ο

ΟΟ

Ο

Ο

Ο

Ο

ΟΟ

Ο

Ο

Ο

Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

10,10

5,20

20,56,65,20

0,3015,15

1,1620,515,15

30,016,16,61,1616,1

2,2

Calvin

Calvin

Klein

Klein

Ο

10,10

5,20

20,5

6,6

10,10

242

ΠαρατήρησηΗ κεντρική ιδέα της τέλειας ισορροπίας Nash για υποπαίγνιαείναι:

«ό,τι έγινε, έγινε»

∆ηλαδή, από κάθε σηµείο του δένδρου, ανεξαρτήτως τιπροηγήθηκε, κάθε παίκτης επιλέγει την καλύτερη για αυτόεπιλογή, θεωρώντας ότι το ίδιο θα πράξουν και οι αντίπαλοι.Ωστόσο η παραπάνω αρχή είναι ιδιαίτερα αυστηρή: Εάν έναςαντίπαλος στις προηγούµενες αποφάσεις τους δεν ήτανλογικός (δεν επέλεξε δηλαδή σύµφωνα µε τα σηµείαισορροπίας Nash), τότε πώς µπορούµε να είµαστε βέβαιοι ότιθα το κάνει στις επόµενες;

Page 122: Game Theory

122

243

Επαναλαµβανόµεναπαιχνίδια

Repeated Games

244

Γενικά (1/2)Επαναλαµβανόµενα παιχνίδια: Παιχνίδια που παίζονταιαυτούσια για πολλούς γύρους.

Πεπερασµένων γύρων (Finitely repeated games)Απείρων γύρων (Infinitely repeated games)

Η συµπεριφορά των παικτών όταν ένα παιχνίδιεπαναλαµβάνεται πολλές φορές είναι εντελώς διαφορετικήαπό όταν το παιχνίδι παίζεται µόνο µια φορά.Εάν οι παίκτες πιστέψουν ότι η «καλή» συµπεριφορά τουςθα ανταµειφθεί στο µέλλον, ή ισοδύναµα ότι η «κακή»συµπεριφορά τους θα τιµωρηθεί στο µέλλον, ωθούνται ναείναι πιο «οµαδικοί» στο παιχνίδι τους.

Οι απειλές για τιµωρία και η αναµονή για ανταµοιβή πρέπει ναείναι αξιόπιστες (credible).

Η έννοια της αµοιβαιότητας (reciprocity) είναι αυτή πουδιακρίνει τα επαναλαµβανόµενα παιχνίδια.

Page 123: Game Theory

123

245

Γενικά (2/2)Κάθε επανάληψη του παιχνιδιού ονοµάζεται γύρος (stage).

Κάθε γύρος είναι συνήθως ένα παιχνίδι σε στρατηγική µορφή.

Στην αρχή του παιχνιδιού οι παίκτες έχουν τη δυνατότητανα «συζητήσουν» και να συναποφασίσουν τις στρατηγικέςτους. Μετά από κάθε γύρο οι παίκτες ενηµερώνονται για τις«κινήσεις» των αντιπάλων.

246

Παραδείγµατα:∆Φ σε 2 γύρους

Once repeated prisoners’ dilemma

Ο

Ο

ΟΟ

Ο

Ο

Ο

Ο

ΟΟ

Ο

Ο

Ο

Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

∆Ο

10,10

5,20

20,56,65,20

0,3015,15

1,1620,515,15

30,016,16,61,1616,1

2,2

Calvin

Calvin

Klein

Klein

Ο

Page 124: Game Theory

124

247

Παραδείγµατα:Τροποποιηµένο ∆ΦΈστω ότι κάθε φυλακισµένος έχει µια ακόµη επιλογή, ναοµολογήσει µερικώς (ΜΟ).

Το παιχνίδι γύρου έχει δύο σηµεία ισορροπίας Nash, το(Ο,Ο) και το (ΜΟ, ΜΟ).

Η ισορροπία στο σηµείο (ΜΟ,ΜΟ) βασίζεται στο γεγονός ότιµολονότι ένας παίκτης, π.χ. o Calvin, µπορεί να οµολογήσει καινα µετακινήσει το παιχνίδι στο σηµείο (Ο, ΜΟ) µε αποτέλεσµα(3,7), δεν θα το κάνει γιατί δεν έχει να κερδίσει κάτι.Θεωρούµε δηλαδή ότι µεταξύ ισοδύναµων επιλογών για ένανπαίκτη, αυτός θα επιλέξει εκείνη που είναι καλύτερη για τοναντίπαλο.

2, 83, 37, 3ΜΟ

8, 2

3, 7

ΜΟ

1, 115, 0∆Ο

0, 155, 5Ο

∆ΟΟKlein

Calvin

248

Παραδείγµατα:Άπειρα επαναλαµβανόµενο ∆ΦΜια τελευταία παραλλαγή του παιχνιδιού ∆Φ είναι η άπειρηεπανάληψη της απλής εκδοχής του.Σε αυτή την περίπτωση, όπως και σε όλα τα άπειραπαιχνίδια, θεωρείται ότι το όφελος για τον παίκτη i από τηνεπανάληψη j, uij, µειώνεται κατά τον παράγοντα δj, όπου0<δ<1.

Ο παράγοντας δ επιδέχεται διάφορες ερµηνείες, ανάλογα µετο παιχνίδι, όπως πιθανότητα επανάληψης του παιχνιδιού, αποπληθωρισµό µελλοντικών κερδών κλπ.

∑∞

=

=0j

ijj

i uU δ

Page 125: Game Theory

125

249

Παράδειγµα:∆ηµοπρασίες οµολόγωνΑνά τακτά χρονικά διαστήµατα µια κυβέρνηση ανακοινώνειτη δηµοπράτηση κρατικών οµολόγων.Πελάτες της κυβέρνησης είναι συνήθως οι τράπεζες.Κάθε ενδιαφερόµενο ίδρυµα υποβάλλει µια προσφοράαγοράς για συγκεκριµένη ποσότητα και τιµή.

Το παιχνίδι είναι σαφώς επαναλαµβανόµενο.Μπορεί να θεωρηθεί πεπερασµένων γύρων, υπό την έννοιαότι τα στελέχη των τραπεζών που λαµβάνουν τις αποφάσειςενδιαφέρονται για τον ισολογισµό του έτους, άρα το παιχνίδιολοκληρώνεται µε το τέλος του έτους.

250

Παράδειγµα:OPECΣτην αγορά πετρελαίου παίζεται ένα παιχνίδι µεταξύ τωνπετρελαιοπαραγωγών χωρών.Κάθε χώρα, ή οµάδα χωρών, αποφασίζει την ποσότητα πουθα παράγει (π.χ. ανά µήνα)Το παιχνίδι είναι επαναλαµβανόµενο.Θα µελετηθεί ως απείρως επαναλαµβανόµενο, υπό τηνέννοια ότι δεν υπάρχει σαφής χρονικός ορίζοντας (π.χ. ανάέτος) που να προσδιορίζει τις αποφάσεις των διαφόρωνπαικτών.

Page 126: Game Theory

126

251

ΠαρατήρησηΗ διάκριση των επαναλαµβανόµενων παιχνιδιών σεπεπερασµένων και απείρων πολλές φορές είναιυποκειµενική.Ένα παιχνίδι πεπερασµένου, αλλά αρκετά µεγάλου, αριθµούγύρων µπορεί να µελετηθεί/εξηγηθεί καλύτερα ως άπειροπαιχνίδι.Από την άλλη, αν θεωρήσουµε ότι η ζωή του καθενός είναιπεπερασµένη, θα έπρεπε όλα τα παιχνίδια να µελετούνταιως πεπερασµένα.

252

Πεπερασµέναεπαναλαµβανόµενα παιχνίδια

Finitely repeated games

Page 127: Game Theory

127

253

∆Φ σε 2 γύρουςΈστω το απλό ∆Φ µε επανάληψη σε δύο γύρους.Το συνολικό όφελος (ποινή στην προκειµένη περίπτωση) γιακάθε παίκτη είναι το άθροισµα του οφέλους σε κάθε γύρο.Στον δεύτερο γύρο, ο οποίος είναι και ο τελευταίος, κάθεπαίκτης επιλέγει την καλύτερη για αυτόν κίνηση, δηλαδή ναοµολογήσει, η οποία είναι το γνωστό σηµείο ισορροπίαςNash του παιχνιδιού.

Η απόφαση αυτή είναι ανεξάρτητη από το τι επέλεξαν οιπαίκτες στον πρώτο γύρο!

Με δεδοµένο λοιπόν ότι η απόφαση του πρώτου γύρου δενπρόκειται να επηρεάσει την απόφαση των παικτών στονδεύτερο γύρο, οι παίκτες επιλέγουν να οµολογήσουν καιστον πρώτο γύρο!

254

ΓενίκευσηΤο αποτέλεσµα για το ∆Φ σε 2 γύρους µπορεί να γενικευτείκαι για το ∆Φ σε 3 γύρους:

Η επιλογή των παικτών στους 2 τελευταίους γύρους είναι ναοµολογήσουν, ανεξάρτητα από το τι προηγήθηκε στον πρώτογύρο.Άρα στον πρώτο γύρο δεν έχουν καλύτερη επιλογή από το ναοµολογήσουν επίσης.

Το αποτέλεσµα γενικεύεται (θεωρητικά) και γιαοποιονδήποτε αριθµό επαναλήψεων.Πρόταση: Οποιοδήποτε επαναλαµβανόµενο παιχνίδι, για τοοποίο το παιχνίδι γύρου έχει ένα µόνο σηµείο ισορροπίαςNash, έχει επίσης ένα µόνο σηµείο τέλειας ισορροπίας Nash υποπαιγνίων.

Page 128: Game Theory

128

255

Στρατηγικές σταεπαναλαµβανόµενα παιχνίδιαΗ έννοια της στρατηγικής στα επαναλαµβανόµενα παιχνίδιαπρέπει να καλύπτει όλα τα πιθανά ενδεχόµενα τουπαιχνιδιού.Για παράδειγµα, στο ∆Φ σε 2 γύρους, κάθε παίκτης έχει ναπάρει µια απόφαση για τον πρώτο γύρο και 1 απόφαση στονδεύτερο γύρο για κάθε µία από τις δύο πιθανές αποφάσειςτου άλλου παίκτη στον πρώτο γύρο.Με δεδοµένο ότι ο κάθε παίκτης έχει 2 βασικές στρατηγικές(Ο και ∆Ο) για το παιχνίδι γύρου, το σύνολο τωνστρατηγικών του για το παιχνίδι των 2 γύρων είναι 23=8.

Σε παιχνίδι ∆Φ τριών γύρων, το σύνολο των στρατηγικών κάθεπαίκτη είναι 25=32.

256

Τροποποιηµένο ∆Φ (1/7)

Υπάρχει µεγάλη διαφορά µεταξύ των επαναλαµβανόµενωνπαιχνιδιών όπου το παιχνίδι γύρου έχει ένα µόνο σηµείοισορροπίας και των παιχνιδιών όπου το παιχνίδι γύρου έχειπερισσότερα σηµεία ισορροπίας.Έστω ότι το Τ∆Φ παίζεται δύο φορές:

Στην δεύτερη επανάληψη οι δύο παίκτες µπορεί να επιλέξουν(κατόπιν συνεννόησης) ένα από τα δύο σηµεία ισορροπίας.Εφόσον επιλέξουν ένα από τα δύο σηµεία, δεν έχουν λόγο να«εξαπατήσουν» ο ένας τον άλλο, γιατί δεν πρόκειται νακερδίσουν περισσότερο.

Κάθε παίκτης µπορεί να επιλέξει την απόφασή του στονδεύτερο γύρο βάσει των κινήσεων που προηγήθηκαν στονπρώτο γύρο.

2, 83, 37, 3ΜΟ

8, 2

3, 7

ΜΟ

1, 115, 0∆Ο

0, 155, 5Ο

∆ΟΟKlein

Calvin

Page 129: Game Theory

129

257

Τροποποιηµένο ∆Φ (2/7)

Έστω ότι οι δύο παίκτες συµφωνούν, πριν ξεκινήσει τοπαιχνίδι, στα εξής:

Στον πρώτο γύρο θα επιλέξουν και οι δύο ∆Ο.Στον δεύτερο γύρο, εφόσον τηρήσουν την «υπόσχεσή» τους, θαεπιλέξουν και οι δύο ΜΟ, ειδάλλως θα επιλέξουν και οι δύο Ο.

Εάν και οι δύο παίκτες τηρήσουν τη συµφωνία τους, τότε ησυνολική ποινή τους µετά την ολοκλήρωση των δύο γύρωνθα είναι 1+3=4 για τον καθένα.Εάν κάποιος παίκτης, π.χ. ο Calvin, στον πρώτο γύρο επιλέξειΟ, τότε το τελικό αποτέλεσµα για τους δύο παίκτες θα είναι:

Calvin: 0+5=5Klein: 15+5=20

Ο παραπάνω συνδυασµός στρατηγικών για τους δύο παίκτεςαποτελεί σηµείο τέλειας ισορροπίας Nash για υποπαίγνια.

2, 83, 37, 3ΜΟ

8, 2

3, 7

ΜΟ

1, 115, 0∆Ο

0, 155, 5Ο

∆ΟΟKlein

Calvin

258

Τροποποιηµένο ∆Φ (3/7)

Η στρατηγική:∆Ο στον πρώτο γύρο και ΜΟ στον δεύτερο, ή Ο εφόσον δεντηρηθεί η συµφωνία για τον πρώτο γύρο

αποτελεί σηµείο ισορροπίας µόνο όταν ισχύει:uCalvin(∆Ο,∆Ο)+uCalvin(ΜΟ,ΜΟ)<uCalvin(Ο,∆Ο)+uCalvin(Ο,Ο)uKlein(∆Ο,∆Ο)+uKlein(ΜΟ,ΜΟ)<uKlein(∆Ο,Ο)+uKlein(Ο,Ο)

∆ηλαδή, όταν κανέναν παίκτη δεν τον συµφέρει να αθετήσειµονοµερώς τη συµφωνία!Παρατηρούµε επίσης ότι µια τέλεια ισορροπία υποπαιγνίουµπορεί να περιλαµβάνει για κάποιους γύρους συνδυασµούςστρατηγικών που δεν είναι σηµεία ισορροπίας του απλούπαιχνιδιού.Ένας παίκτης λοιπόν είναι διατεθειµένος να θυσιάσειβραχυπρόθεσµα οφέλη (εξαπατώντας τον άλλο παίκτη) προκειµένου να µην χάσει τα µακροπρόθεσµα.

2, 83, 37, 3ΜΟ

8, 2

3, 7

ΜΟ

1, 115, 0∆Ο

0, 155, 5Ο

∆ΟΟKlein

Calvin

Page 130: Game Theory

130

259

Τροποποιηµένο ∆Φ (4/7)

Ο συνδυασµός στρατηγικών:Και οι δύο παίκτες επιλέγουν ∆Ο και στους δύο γύρους. Ανκάποιος παίκτης αθετήσει τη συµφωνία στον πρώτο γύρο, τότεοι δύο παίκτες επιλέγουν Ο στον δεύτερο γύρο.

δεν είναι σηµείο ισορροπίας, γιατί κάθε παίκτης µπορεί νααθετήσει τη συµφωνία στον τελευταίο γύρο, χωρίς ναζηµιωθεί.

ΠΡΟΣΟΧΗ: Το γεγονός ότι οι δύο παίκτες συνεργάζονται γιανα βρουν ένα συνδυασµό στρατηγικών, δεν σηµαίνει ότι τοπαιχνίδι είναι παιχνίδι συνεργασίας. Πράγµατι:

Κάθε παίκτης ενδιαφέρεται για το προσωπικό του κέρδος µόνο.Κάθε παίκτης δεν αθετεί τη συµφωνία (εφόσον προκύψει µιατέτοια), επειδή δεν τον συµφέρει να το κάνει µονοµερώς (και όχιεπειδή «σέβεται» το λόγο του...).

2, 83, 37, 3ΜΟ

8, 2

3, 7

ΜΟ

1, 115, 0∆Ο

0, 155, 5Ο

∆ΟΟKlein

Calvin

260

Τροποποιηµένο ∆Φ (5/7)

Υπάρχουν και άλλα σηµεία ισορροπίας για το παιχνίδι τωνδύο γύρων:

Οι δυο παίκτες επιλέγουν (Ο,Ο) και στους δύο γύρους.

Η συνολική ποινή των δύο παικτών σε αυτή την περίπτωσηείναι 5+5=10. Οποιοσδήποτε παίκτης αθετήσει τη συµφωνίαζηµιώνεται, προς όφελος του άλλου.

Γενικά ισχύει το εξής:Ένα σηµείο τέλειας ισορροπίας Nash υποπαιγνίων σταπεπερασµένα επαναλαµβανόµενα παιχνίδια είναι η επιλογή σεκάθε γύρο ενός σηµείου ισορροπίας Nash (όχι απαραίτητα πάντατου ίδιου) του παιχνιδιού γύρου.

2, 83, 37, 3ΜΟ

8, 2

3, 7

ΜΟ

1, 115, 0∆Ο

0, 155, 5Ο

∆ΟΟKlein

Calvin

Page 131: Game Theory

131

261

Τροποποιηµένο ∆Φ (6/7)

Έστω ότι το παιχνίδι επαναλαµβάνεται για Τ γύρους. Μιατέλεια ισορροπία υποπαιγνίων είναι η εξής:

Οι παίκτες επιλέγουν σε όλους τους γύρους (∆Ο, ∆Ο), εκτός απότον τελευταίο, όπου επιλέγουν (ΜΟ, ΜΟ). Εάν σε κάποιο γύρο ησυµφωνία σπάσει, τότε οι παίκτες συνεχίζουν µε (Ο,Ο) µέχριτέλους.

Η αναµενόµενη ποινή για κάθε παίκτη είναι:(Τ-1)·1+3=Τ+2

Εάν στον γύρο t<T κάποιος παίκτης, π.χ. ο Calvin, σπάσει τησυµφωνία επιλέγοντας να οµολογήσει, τότε η συνολική ποινήκαι για τους δύο παίκτες θα είναι:

Calvin: (t-1)·1+0+(T-t)·5=5·T-4·t-1=T+4·(T-t)-1 > T+2

Klein: (t-1)·1+15+(T-t)·5=5·T-4·t+14=T+4·(T-t)+14 > T+2

2, 83, 37, 3ΜΟ

8, 2

3, 7

ΜΟ

1, 115, 0∆Ο

0, 155, 5Ο

∆ΟΟKlein

Calvin

262

Τροποποιηµένο ∆Φ (7/7)

Υπάρχουν και παράξενες ισορροπίες υποπαιγνίων. Έστω ηπαρακάτω συµφωνία για παιχνίδι Τ γύρων:

Οι παίκτες συµφωνούν στον πρώτο γύρο να επιλέξουν (Ο, ∆Ο) και σε όλους τους επόµενους γύρους (ΜΟ,ΜΟ). Εάν σε κάποιογύρο η συµφωνία σπάσει, οι παίκτες συνεχίζουν µε (Ο,Ο) µέχριτέλους.

Η συνολική ποινή των δύο παικτών από την παραπάνωσυµφωνία είναι:

Calvin: 0+3·(T-1)=3·(T-1), Klein: 15+(Τ-1)·3Έστω ότι ο Klein σπάει τη συµφωνία εξαρχής, επιλέγοντας ναοµολογήσει στον πρώτο γύρο. Οι ποινές τότε γίνονται:

Calvin: Τ·5, Klein: Τ·5

Σε περίπτωση που Τ·5> 15+(Τ-1)·3 ή ισοδύναµα Τ>6, δενσυµφέρει τον Klein να σπάσει µονοµερώς τη συµφωνία.

2, 83, 37, 3ΜΟ

8, 2

3, 7

ΜΟ

1, 115, 0∆Ο

0, 155, 5Ο

∆ΟΟKlein

Calvin

Page 132: Game Theory

132

263

ΠαρατηρήσειςΠαρατηρούµε ότι ένα επαναλαµβανόµενο παιχνίδι µπορεί ναέχει πολλούς συνδυασµούς στρατηγικών που αποτελούνισορροπία για ολόκληρο το παιχνίδι.

Πολλοί µάλιστα συνδυασµοί φαίνονται παράλογοι.

Εάν υπάρχει κάποιος συνδυασµός στρατηγικών πουσυµφέρει και τους δύο παίκτες, τότε µπορούν να τονεπιλέξουν.Ειδάλλως οι παίκτες πρέπει να βρουν τρόπο νασυµφωνήσουν σε έναν συνδυασµό στρατηγικών πουενδεχοµένως να είναι περισσότερο ωφέλιµος για τον ένααπό τους δύο.

Ανάλογο είναι το παιχνίδι της µάχης των φύλων.

Στην τελική απόφαση παίζει ρόλο η ισχύς του κάθε παίκτη.

264

Μελέτη περίπτωσης:∆ηµοπρασία οµολόγων (1/8)

Έστω ότι η κεντρική τράπεζα εκδίδει κάθε φορά τον ίδιοαριθµό οµολόγων, έστω 100.Έστω ότι υπάρχουν δύο µόνο παίκτες, Α και Β.Κάθε παίκτης µπορεί να ζητήσει 50 ή 75 οµόλογα.Κάθε παίκτης µπορεί να προσφέρει µια χαµηλή (low) ή µιαυψηλή τιµή για τα οµόλογα που ζητά.Σε περίπτωση που ο ένας παίκτης προσφέρει υψηλή τιµήενώ ο άλλος χαµηλή, πρώτα ικανοποιείται πλήρως η ζήτησητου παίκτη που ζήτησε σε υψηλή τιµή.Σε περίπτωση που και οι δύο παίκτες προσφέρουν την ίδιατιµή, τα 100 οµόλογα µοιράζονται στους δύο παίκτεςανάλογα µε την ποσότητα που ζήτησε ο καθένας τους.

Για παράδειγµα, εάν ο ένας παίκτης ζήτησε 75 οµόλογα και οάλλος 50, οι δύο παίκτες θα πάρουν από 60 και 40 αντίστοιχα.

Page 133: Game Theory

133

265

Μελέτη περίπτωσης:∆ηµοπρασία οµολόγων (2/8)Θεωρούµε ότι οι παίκτες µπορούν και µεταπωλούν όλα ταοµόλογα που αγόρασαν από την κεντρική τράπεζα.Το κέρδος ανά οµόλογο εξαρτάται από την τιµή αγοράς καιείναι ulow και uhigh. Προφανώς ισχύει ulow>uhigh.Η κεντρική τράπεζα έχει δύο τρόπους να καθορίσει την τιµήπώλησης:

Μοναδική τιµή: Καθορίζεται ως κοινή τιµή πώλησης για όλουςτους παίκτες η τιµή εκείνη στην οποία καλύπτεται ακριβώς όληη ζήτηση.Πολλαπλές τιµές: Κάθε παίκτης αγοράζει στην τιµή στην οποίαέκανε προσφορά, µέχρι τον παίκτη στον οποίο εξαντλούνται ταπρος πώληση οµόλογα.

Θα προσπαθήσουµε να απαντήσουµε στο ερώτηµα: Ποιαπολιτική από τις δυο παραπάνω συµφέρει περισσότερο τηνκεντρική τράπεζα.

266

Μελέτη περίπτωσης:∆ηµοπρασία οµολόγων (3/8)

Έστω ο πίνακας µιας δηµοπρασίας µε µοναδική τιµήπώλησης:

Από τον παραπάνω πίνακα φαίνεται ότι οι πολιτικές ζήτησης50 οµολόγων κυριαρχούνται πλήρως από αυτές των 75 οµολόγων.Άρα οι εταιρείες επιλέγουν πάντα να ζητήσουν 75 οµόλογα.

50ul,50ul60ul,40ul25ul,75ul50ul,50ul75, low

40ul,60ul50ul,50ul25ul,75ul50ul,50ul50, low

75ul,25ul75ul,25ul50uh,50uh60uh,40uh75, high

50ul,50ul50ul,50ul40uh,60uh50uh,50uh50, high

75, low50, low75, high50, highΒ

Α

Page 134: Game Theory

134

267

Μελέτη περίπτωσης:∆ηµοπρασία οµολόγων (4/8)

Έστω ο πίνακας µιας δηµοπρασίας µε πολλαπλές τιµέςπώλησης:

Και σε αυτή την περίπτωση φαίνεται ότι οι πολιτικές ζήτησης50 οµολόγων κυριαρχούνται πλήρως από αυτές των 75 οµολόγων.Άρα σε όλες τις περιπτώσεις οι εταιρείες επιλέγουν ναζητήσουν 75 οµόλογα.

50ul,50ul60ul,40ul25ul,75uh50ul,50uh75, low

40ul,60ul50ul,50ul25ul,75uh50ul,50uh50, low

75uh,25ul75uh,25ul50uh,50uh60uh,40uh75, high

50uh,50ul50uh,50ul40uh,60uh50uh,50uh50, high

75, low50, low75, high50, highΒ

Α

268

Μελέτη περίπτωσης:∆ηµοπρασία οµολόγων (5/8)

Μπορούµε λοιπόν να απλοποιήσουµε τους πίνακες ως εξής:Μοναδική τιµή

Πολλαπλές τιµές

50ul,50ul25ul,75uh75, low

75uh,25ul50uh,50uh75, high

75, low75, highΒ

Α

50ul,50ul25ul,75ul75, low

75ul,25ul50uh,50uh75, high

75, low75, highΒ

Α

Page 135: Game Theory

135

269

Μελέτη περίπτωσης:∆ηµοπρασία οµολόγων (6/8)

Έστω 50uh>25ul. Τότε στην περίπτωση της µοναδικής τιµήςυπάρχει κυρίαρχη στρατηγική, η (high,high).

Στην περίπτωση πολλαπλής τιµής όµως, υπάρχει µια δεύτερηισορροπία, (low,low), εάν ισχύει 50ul>75uh.

50ul,50ul25ul,75ul75, low

75ul,25ul50uh,50uh75, high

75, low75, highΒ

Α

50ul,50ul25ul,75uh75, low

75uh,25ul50uh,50uh75, high

75, low75, highΒ

Α

100uh>50ul>75uh

270

Μελέτη περίπτωσης:∆ηµοπρασία οµολόγων (7/8)

Έστω 50uh<25ul. Τότε στην περίπτωση της µοναδικής τιµήςδεν υπάρχει σηµείο καθαρής ισορροπίας Nash. Υπάρχει όµωςσηµείο µικτής ισορροπίας Nash, όπου οι δύο παίκτεςεπιλέγουν µε πιθανότητα p=ul/(2(ul-uh)) την στρατηγική high.

Στην περίπτωση πολλαπλής τιµής όµως, υπάρχει κυρίαρχηστρατηγική:

50ul,50ul25ul,75ul75, low

75ul,25ul50uh,50uh75, high

75, low75, highΒ

Α

50ul,50ul25ul,75uh75, low

75uh,25ul50uh,50uh75, high

75, low75, highΒ

Α

Page 136: Game Theory

136

271

Μελέτη περίπτωσης:∆ηµοπρασία οµολόγων (8/8)

Σε κάθε περίπτωση λοιπόν συµφέρει την κεντρική τράπεζανα επιλέγει τη στρατηγική της µοναδικής τιµής:

Εάν ισχύει 50uh>25ul, τότε η στρατηγική µοναδικής τιµής έχεικυρίαρχη στρατηγική την (high, high), σε αντίθεση µε τηνστρατηγική πολλαπλών τιµών, η οποία, υπό προϋποθέσεις, έχειδύο σηµεία ισορροπίας Nash, µε αποτέλεσµα να δίνει τηδυνατότητα στους παίκτες να συνεννοηθούν για χαµηλή τιµή.Εάν ισχύει 50uh<25ul,τότε η στρατηγική πολλαπλών τιµών έχεικυρίαρχη στρατηγική την (low, low), ενώ η στρατηγικήµοναδικής τιµής έχει κυρίαρχη µια µικτή στρατηγική, δίνονταςέτσι κάποιες φορές υψηλή τιµή ως αποτέλεσµα.

Το «παράξενο» εκ πρώτης όψεως γεγονός έχει την εξήγησηότι η µέθοδος των πολλαπλών τιµών αποθαρρύνει γενικάτους παίκτες να προσφέρουν υψηλά ποσά.

272

Απείρωςεπαναλαµβανόµενα παιχνίδια

Infinitely repeated games

Page 137: Game Theory

137

273

Γενικά (1/2)Όταν ένα παιχνίδι επαναλαµβάνεται άπειρες φορές, δενµπορούµε να θεωρήσουµε ως συνολικό όφελος το άθροισµα γιατα επί µέρους παιχνίδια.Υπάρχουν διάφοροι τρόποι αντιµετώπισης τωναπειροαθροισµάτων, όπως:

Μέσος όροςΠροεξόφληση µελλοντικών αποδόσεων

Θα χρησιµοποιήσουµε την τελευταία µέθοδο, σύµφωνα µε τηνοποία:

Υπάρχει ένας παράγοντας προεξόφλησης (discount factor) δ<1.Η σηµερινή αξία µιας απόδοσης ut τη χρονική στιγµή t είναι δtut.Αν θεωρήσουµε σταθερή µέση απόδοση u σε κάθε χρονική στιγµή, η συνολική απόδοση του παιχνιδιού είναι:

δδδολ −

=⋅=⋅= ∑∑∞

=

= 100

uuuut

tt

t

274

Γενικά (2/2)Ο παράγοντας προεξόφλησης µπορεί να ερµηνευτεί µεπολλούς τρόπους:

Εάν το όφελος είναι χρηµατικές αποδόσεις, τότε ο παράγονταςπροεξόφλησης µπορεί να θεωρηθεί ότι είναι ίσος µε το επιτόκιοτης τράπεζας.Εάν δεν είναι γνωστό το πλήθος των επαναλήψεων τουπαιχνιδιού, ο παράγοντας προεξόφλησης είναι η πιθανότηταπου δίνουµε κάθε φορά στο να υπάρξει ακόµη µια επανάληψη.Γενικότερα ένας παίκτης προτιµά µια άµεση απόδοση έναντιµιας µελλοντικής απόδοσης.

Page 138: Game Theory

138

275

Στρατηγική ενεργοποίησης (1/5)Έστω το παιχνίδι ∆Φ (στην απλή του µορφή, µε αποδόσειςτέτοιες ώστε µεγαλύτεροι αριθµοί να είναι καλύτεροι) τοοποίο παίζεται απείρως επαναλαµβανόµενα.Έστω το παρακάτω ζεύγος στρατηγικών:

Οι παίκτες συµφωνούν να παίξουν (∆Ο, ∆Ο) για πάντα. Εάνόµως κάποιος παίκτης οµολογήσει, στο εξής και οι δύο θαεπιλέγουν Ο για πάντα.

Η παραπάνω στρατηγική (κοινή και για τους δύο παίκτες) ονοµάζεται στρατηγική ενεργοποίησης (trigger strategy).Η στρατηγική χωρίζεται σε δύο µέρη:

Στο µέρος πρώτο, όπου κανείς παίκτης δεν οµολογεί, κάθεπαίκτης ενδεχοµένως θα είχε την τάση να οµολογήσει.Στο δεύτερο µέρος, όπου και οι δύο παίκτες οµολογούν, κανείςπαίκτης δεν έχει την τάση (από µόνος του) να µην-οµολογήσει.

276

Στρατηγικήενεργοποίησης (2/5)

Έστω ότι ύστερα από t-1 γύρους, όπου οι δύο παίκτεςτήρησαν τη συµφωνία, είµαστε στην επανάληψη t.Έστω ότι ένας παίκτης, π.χ. ο Calvin, σκέφτεται ναοµολογήσει.

Το γεγονός ότι έχουν προηγηθεί t-1 γύροι δεν αλλάζει ουσιαστικάσε τίποτα τη συµπεριφορά των παικτών στον t-1 γύρο. Τοπαιχνίδι που ξεκινά στον t γύρο είναι ίδιο µε αυτό που ξεκίνησεστον πρώτο γύρο, εφόσον οι παίκτες τηρούν τη συµφωνία.

Το άµεσο όφελός του θα είναι δt·15 (αντί για δt·14 αντηρούσε τη συµφωνία).Το όφελός του από τους επόµενους γύρουςθα είναι:

14 140, 15∆Ο

15, 010, 10Ο

∆ΟΟKlein

Calvin

δδ

−⋅⋅+

11101t

Προσοχή: Μεγαλύτερεςαποδόσειςθεωρούνταικαλύτερες.

Page 139: Game Theory

139

277

Στρατηγικήενεργοποίησης (3/5)

Εάν δεν έσπαγε τη συµφωνία, τότε το όφελός του για τουςεπόµενους (άπειρους) γύρους θα ήταν:

Θα συνέφερε τον Calvin να σπάσει τη συµφωνία, εάν ίσχυε:

14 140, 15∆Ο

15, 010, 10Ο

∆ΟΟKlein

Calvin

δδ

−⋅⋅1

114t

51

111015

1114 1

<

−⋅⋅+⋅<

−⋅⋅ +

δ

δδδ

δδ

ή

ttt

278

Στρατηγικήενεργοποίησης (4/5)

Άρα, για δ>1/5 δεν συµφέρει κανέναν παίκτη να σπάσει τησυµφωνία.Σε αυτή την περίπτωση, η στρατηγική ενεργοποίησης είναισηµείο ισορροπίας, αφού κανείς παίκτης δεν τολµά να τηναλλάξει µεµονωµένα!Γενικότερα, η στρατηγική ενεργοποίησης επιβραβεύει τηνκαλή συµπεριφορά ή, ισοδύναµα, τιµωρεί την κακήσυµπεριφορά, όταν ο παράγοντας προεξόφλησης τείνει στηµονάδα, όσο δηλαδή αυξάνει η βαρύτητα του µέλλοντος.

Αντίστοιχη συµπεριφορά δεν υπάρχει στα πεπερασµένα παιχνίδια, γιατί το µέλλον είναι πεπερασµένο.

14 140, 15∆Ο

15, 010, 10Ο

∆ΟΟKlein

Calvin

Page 140: Game Theory

140

279

Στρατηγικήενεργοποίησης (5/5)

Η στρατηγική ενεργοποίησης που είδαµε δεν είναι η µοναδική. Μια παραλλαγή της θα µπορούσε να είναι η εξής:

Αρχικά οι παίκτες παίζουν εναλλάξ (Ο,∆Ο) και (∆Ο,Ο). Εάνκάποια στιγµή ένας παίκτης αθετήσει τη συµφωνία, στη συνέχειακαι οι δύο παίκτες παίζουν (Ο,Ο) για πάντα.

Η παραπάνω στρατηγική βέβαια δεν αποτελεί σηµείοισορροπίας Nash, µιας και οι παίκτες κερδίζουν κατά µέσο όρο7.5 ανά γύρο, λιγότερο από ότι κερδίζουν στο σηµείοισορροπίας Nash.

Ανάλογα µε τις επιµέρους αποδόσεις του παιχνιδιού γύρου, κάποια εκ των δύο στρατηγικών ενεργοποίησης που είδαµε(στην προκειµένη περίπτωση η πρώτη) έχει καλύτερησυνολική απόδοση.

14 140, 15∆Ο

15, 010, 10Ο

∆ΟΟKlein

Calvin

280

Επιεικής στρατηγικήΗ επιεικής στρατηγική είναι παραλλαγή της στρατηγικήςενεργοποίησης: Η «τιµωρία» λήγει µετά από κάποιον αριθµόγύρων.

Οι παίκτες συµφωνούν να παίξουν (∆Ο, ∆Ο) για πάντα. Εάν όµωςκάποιος παίκτης οµολογήσει, ο άλλος παίκτης επιλέξει Ο για τουςεπόµενους Τ γύρους.

Για να αποτελεί η παραπάνω στρατηγική σηµείο ισορροπίας, πρέπει να επιλέξουµε το Τ µε τέτοιο τρόπο ώστε κανένανπαίκτη να µην τον συµφέρει να αθετήσει τη συµφωνία.Μετά από (αρκετές...) πράξεις βρίσκεται η αναγκαία συνθήκηγια να αποτελεί η παραπάνω στρατηγική σηµείο ισορροπίας.

14 140, 15∆Ο

15, 010, 10Ο

∆ΟΟKlein

Calvin

Page 141: Game Theory

141

281

Το κοινό θεώρηµα (1/2)Το ερώτηµα που τίθεται για τα απείρως επαναλαµβανόµεναπαιχνίδια είναι το εξής:

Πόσοι (και ποιοι) είναι εκείνοι οι συνδυασµοί στρατηγικών πουοδηγούν σε ισορροπία;

Η απάντηση είναι: Πάρα πολλοί.

Θα αποδείξουµε για το ∆Φ.Ορίζουµε ως κύκλο συµπεριφοράς µια ακολουθία γύρων, όπου οι δύο παίκτες για Τ1 γύρους επιλέγουν (∆Ο, ∆Ο), στησυνέχεια για Τ2 γύρους επιλέγουν (Ο,Ο), στη συνέχεια γιαΤ3 γύρους επιλέγουν (Ο,∆Ο) και τέλος για Τ4 γύρουςεπιλέγουν (Ο,∆Ο).

Πρέπει να ισχύει T=Τ1+Τ2+Τ3+Τ4>0

282

Το κοινό θεώρηµα (2/2)Ένας κύκλος συµπεριφοράς χαρακτηρίζεται ατοµικά λογικός(individually rational) εάν το όφελος για κάθε έναν από τους δύοπαίκτες για όλο τον κύκλο είναι µεγαλύτερο ή ίσο από ό,τι ανεπέλεγαν συνέχεια (Ο,Ο).

Το κοινό θεώρηµα (folk theorem): Από κάθε ατοµικά λογικό κύκλοµπορεί να κατασκευαστεί µια τέλεια ισορροπία υποπαιγνίου, εάνσυνδυάσουµε τον κύκλο µε την στρατηγική ενεργοποίησης καιέναν συντελεστή προεξόφλησης κοντά στη µονάδα.

Φυσικά ο συντελεστής προεξόφλησης είναι µια «φυσική σταθερά» τουπροβλήµατος και δεν είναι στο χέρι µας να τον επηρεάσουµε.

Όσο πιο κοντά στη µονάδα είναι ο συντελεστής προεξόφλησης, τόσο περισσότερους συνδυασµούς στρατηγικών που να αποτελούνισορροπία µπορούµε να κατασκευάσουµε.

Αν λάβουµε υπόψη και την επιεική στρατηγική, οι συνδυασµοί µπορείνα γίνουν άπειροι.

Page 142: Game Theory

142

283

Μελέτη περίπτωσης:NASDAQ

National Association of Securities Dealers Automated Quotation

system

www.nasdaq.com

284

Γενικά (1/2)Η χρηµατιστηριακή αγορά του NASDAQ διαφέρει από άλλεςαγορές ως προς τη λειτουργία της:

Είναι ηλεκτρονική.Σε αντίθεση µε το NYSE, όπου κάθε µετοχή έχει ένανδιαπραγµατευτή (market maker, dealer), στον NASDAQ κάθεµετοχή έχει πολλούς διαπραγµατευτές (από 10 µέχρι 50, ανάλογα µε τη µετοχή).Στον NYSE οι διαπραγµατευτές απλά δέχονται εντολές αγοράςκαι πώλησης για συγκεκριµένες ποσότητες και τιµές, και απλάεκκαθαρίζουν την αγορά της µετοχής.Στον NASDAQ οι διαπραγµατευτές θέτουν οι ίδιοι τις τιµέςαγοράς και πώλησης. Οι πελάτες δεν έχουν δικαίωµακαθορισµού τιµής, παρά µόνο να αγοράσουν στην τιµή πουκαθορίζουν οι διαπραγµατευτές.

Επιτρεπτές τιµές για τους διαπραγµατευτές είναι τα πολλαπλάσιατου 1/8$.

Page 143: Game Theory

143

285

Γενικά (2/2)Προφανώς η τιµή αγοράς για τους πελάτες (ask price) είναιµεγαλύτερη από την τιµή πώλησης για τους πελάτες (bid price).

Η διαφορά των δύο τιµών ονοµάζεται άνοιγµα (spread).

Οι πελάτες αγοράζουν πάντα στην µικρότερη τιµή αγοράςκαι πωλούν πάντα στη µεγαλύτερη τιµή πώλησης. Οι διαπραγµατευτές ανταγωνίζονται µεταξύ τους, και όχι µετους πελάτες.Η κατάσταση αυτή ίσχυε µέχρι το 1996.

286

Επικρίσεις (1/4)Το 1994, οι ακαδηµαϊκοί William Christie και Paul Schultz δηµοσίευσαν την παρακάτω εργασία:

“Why do NASDAQ Market-Makers Avoid Odd-Eighth Quotes”, Journal of Finance, vol. 49, pp. 1813-1840.

Στην εργασία κατηγορούσαν τους διαπραγµατευτές ότισκοπίµως απέφευγαν να χρησιµοποιούν ως τιµέςαγοράς/πώλησης τιµές που είναι περιττά πολλαπλάσια του1/8.Η επιµονή τους να χρησιµοποιούν ως τιµές µόνο τα άρτιαπολλαπλάσια του 1/8 είχε ως αποτέλεσµα να υπάρχειάνοιγµα τουλάχιστον ¼ $ για τις µετοχές και σε πολλέςπεριπτώσεις ½ $.

Χαρακτηριστικά, βρήκαν ότι 10% των µετοχών είχε άνοιγµα1/8$, 39% είχε ¼$, 5% είχε 3/8$ και 33% είχε ½$.

Έτσι οι επενδυτές επιβαρύνονταν περισσότερο ενώ οιδιαπραγµατευτές αύξαναν τα κέρδη τους.

Page 144: Game Theory

144

287

Επικρίσεις (2/4)Οι συγκεκριµένοι ακαδηµαϊκοί κατηγόρησαν τουςδιαπραγµατευτές για συνωµοτική (collusive) τακτική.Κατηγόρησαν ακόµη το NASDAQ ότι ευνοούσε την τιµωρίαόσων διαπραγµατευτών παρέβαιναν τη συµφωνία.Φυσικά, οι συγγραφείς επεσήµαναν τον κίνδυνο τηςσταδιακής αποµάκρυνσης των επενδυτών από την αγορά, εάν διαπιστώσουν ότι υπερχρεώνονται.

Μερικούς µήνες αργότερα οι συγγραφείς (µαζί και µε τονJeffrey Harris) δηµοσίευσαν µια ακόµη εργασία µε τίτλο:

“Why Did NASDAQ Market Makers Stop Avoiding Odd-Eighth Quotes?”, Journal of Finance, vol. 49, pp. 1841-1860.

288

Επικρίσεις (3/4)Τα ποσά που προκύπτουν από την παραπάνω υπερχρέωσηµπορεί να είναι τεράστια.Στο NASDAQ διακινούνταν 650 εκατοµµύρια µετοχέςηµερησίως. Μια επιπλέον χρέωση 1/8$ είχε ως αποτέλεσµασυνολική χρέωση (και άρα κέρδη για τις εταιρείες) 80 εκατοµµύρια δολάρια.

Page 145: Game Theory

145

289

Επικρίσεις (4/4)Η αντίδραση του NASDAQ ήταν να συστήσει µιαεντυπωσιακή επιτροπή ακαδηµαϊκών η οποία κλήθηκε ναµελετήσει το φαινόµενο.Η επιτροπή κατέληξε στο ότι δεν είναι δυνατόν να προκύψεισυνωµοσία για τους ακόλουθους λόγους:

Ο αριθµός των διαπραγµατευτών είναι µεγάλος.Εάν δεν ήταν µεγάλος ο αριθµός των διαπραγµατευτών, θαµεγάλωνε µιας και νέοι διαπραγµατευτές θα εισέρχονταν στηναγορά.

Πράγµατι, για να γίνει κάποιος διαπραγµατευτής στον NASDAQ χρειάζεται κεφάλαιο 10.000$ (σε αντίθεση µε τον NYSE όπουχρειάζεται περίπου 300.000$).

290

Μοντέλο (1/3)Το παιχνίδι γύρου είναι η ταυτόχρονη αποστολή µιας τιµήςαγοράς (ask price) και µιας τιµής πώλησης (bid price) απόκάθε διαπραγµατευτή.

Η αποστολή αυτή γίνεται κάθε ώρα.

Έστω Ν οι διαπραγµατευτές για µια συγκεκριµένη µετοχήκαι ai και bi αντίστοιχα η τιµή αγοράς και πώλησης τουκαθενός.Η καλύτερη τιµή αγοράς είναι η µικρότερη:

a=miniai

Η καλύτερη τιµή πώλησης είναι η µεγαλύτερη:b=maxibi

Το άνοιγµα (spread) ισούται µε a-b.Οι τιµές a και b λέγονται επίσης και έσω τιµή αγοράς (inside ask) και έσω τιµή πώλησης (inside bid) αντίστοιχα.

Page 146: Game Theory

146

291

Μοντέλο (2/3)Έστω v η πραγµατική αξία µιας µετοχής.

∆εν µας ενδιαφέρει ο τρόπος µε τον οποίο µπορεί αυτή ναεκτιµηθεί.

Ας υποθέσουµε ότι η καµπύλη ζήτησης, για την τιµή αγοράςa είναι:

D(a)=120-40a

και η καµπύλη προσφοράς για πώληση στην τιµή b είναι:S(b)=-80+40b

Θεωρούµε ότι τα a και b είναι σε δολάρια, ενώ τα D(a), S(b) σε10.000 µετοχές.

Το συνολικό κέρδος (για όλους τους διαπραγµατευτές) σεµια χρονική περίοδο προκύπτει από τις αγοροπωλησίες σεσχέση µε την πραγµατική αξία της µετοχής και είναι:

U=(a-v)D(a)+(v-b)S(b)

292

Μοντέλο (3/3)Η πραγµατική αξία της µετοχής είναι αυτή για την οποίαεξισώνονται η προσφορά και η ζήτηση:

D(a)=S(b)⇒120-40v=-80+40v⇒200=80v⇒v=2.5$

Για την τιμή αυτή, η προσφορά και η ζήτηση γίνονται:D(a)=S(b)=20 (x10.000) μετοχές ανά ώρα.

Είναι προφανές ότι θέτοντας ai=bi=v=2.5$ έχουμε ένα σημείοισορροπίας (για κάθε γύρο ξεχωριστά αλλά και για το σύνολό τους).Στο σημείο αυτό προφανώς το κέρδος των διαπραγματευτών είναιμηδενικό, άρα έχουν κάθε λόγο να προσπαθήσουν να την αποφύγουν.Η ισορροπία αυτή μπορεί να λειτουργήσει ως απειλή τιμωρίας ώστεόλοι οι διαπραγματευτές να τηρήσουν την όποια συμφωνία κάνουν στοαπείρως επαναλαμβανόμενο παιχνίδι της διαπραγμάτευσης τηςμετοχής.

Page 147: Game Theory

147

293

Στρατηγική ενεργοποίησης (1/3)Εάν οι διαπραγµατευτές αποφασίσουν να συνεργαστούνπλήρως για να µεγιστοποιήσουν τα συνολικά τους κέρδη, τότε θα προσπαθήσουν να µεγιστοποιήσουν την παρακάτωποσότητα:

U=Maxa(120-40a)·(a-2.5)+Maxb(-80+40b)·(2.5-b)

Μετά από µερικές πράξεις βρίσκεται ότι a*=2.75$ καιb*=2.25$.Άρα το ιδανικό άνοιγµα είναι 0.5$ ή 4*1/8$.Με τις παραπάνω τιµές, στο τέλος κάθε γύρου οιδιαπραγµατευτές κερδίζουν συνολικά 50.000$.Κάθε ένας από αυτούς κερδίζει 50.000/Ν.

294

Στρατηγική ενεργοποίησης (2/3)Έστω ότι κάποιος από τους διαπραγµατευτές αθετεί τησυµφωνία και ανακοινώνει τιµές b=2.375 και a=2.625.Το συνολικό κέρδος του επόµενου γύρου θα είναι:

(120-40a)·(a-2.5)+ (-80+40b)·(2.5-b)=37.500$

Το όφελος αυτό θα το πάρει όλο ο παίκτης που αθέτησε τησυµφωνία.Στη συνέχεια όµως όλοι οι παίκτες θα οδηγηθούν στηνισορροπία Nash, µε µηδενικό κέρδος πλέον.Για να συµφέρει λοιπόν έναν παίκτη να αθετήσει τησυµφωνία θα πρέπει να ισχύει:

34)1( ισοδύναµα ή 500.37

)1(000.50

<−>−

δδ

NN

Page 148: Game Theory

148

295

Στρατηγική ενεργοποίησης (3/3)Από την αναγκαία συνθήκη για διατήρηση της συµφωνίαςΝ(1-δ)<4/3 προκύπτει ότι:

Όσο περισσότεροι είναι οι παίκτες, τόσο δυσκολότερο είναι ναδιατηρηθεί η συµφωνία.Το µέγιστο πλήθος των παικτών εξαρτάται από το δ.

Τίθεται λοιπόν το θέµα ποια είναι η τιµή του δ !Εάν το δ εκφράζει την πιθανότητα να συνεχίσει το παιχνίδι, τότε δ=1 (είναι σχεδόν απίθανο να σταµατήσει το παιχνίδι).Εάν το δ εκφράζει την τωρινή αξία εσόδων που θα έρθουνσε µια ώρα, τότε και πάλι το δ είναι σχεδόν 1.Ακόµη και για 50 διαπραγµατευτές ανά µετοχή, η συµφωνίαθα µπορούσε να διατηρηθεί εάν ίσχυε δ>0.973 (κάτι πουείναι πολύ πιθανό).Από την άλλη, για 20 παίκτες και δ=0.999 προκύπτουνετήσια έσοδα για κάθε παίκτη περίπου 2.500.000$.

296

Ηπιότερες στρατηγικές (1/2)Μια εναλλακτική, πιο ήπια στρατηγική για όλους τουςπαίκτες θα µπορούσε να είναι η εξής:

Αρχικά όλοι επιλέγουν ai=2,75 και bi=2,25. Εάν κάποιοςπαίκτης αθετήσει τη συµφωνία, τότε όλοι µεταβαίνουν στιςτιµές ai=2,625 και bi=2,375$.

Η παραπάνω στρατηγική αποτελεί σηµείο ισορροπίας.

Αν εκτελέσουµε παρόµοια ανάλυση καταλήγουµε ότι ηπαραπάνω απειλή είναι πειστική εάν ισχύει:

31

34)1(

ισοδύναµα ή)1(

500.37500.37)1(

000.50

≅−<−

−+>

δδ

δδ

δ

N

NN

Page 149: Game Theory

149

297

Ηπιότερες στρατηγικές (2/2)Όπως ήταν αναµενόµενο, τώρα είναι δυσκολότερο ναδιατηρηθεί η συµφωνία.Ωστόσο και πάλι η συµφωνία µπορεί να τηρηθεί από αρκετάπερισσότερους παίκτες.

Για παράδειγµα, για Ν=11 προκύπτει δ>0.97.Για δ=0.99, προκύπτει ότι Ν<33.

Φυσικά υπάρχουν ακόµη πιο ήπιες στρατηγικές, όπωςπεριορισµένη χρονικά τιµωρία, οι οποίες όµως τελικάµπορούν να διατηρηθούν από ακόµη λιγότερους παίκτες.

298

ΠαρατήρησηΣτην ανάλυση που προηγήθηκε, όταν ένας διαπραγµατευτήςαθετεί τη συµφωνία, υποφέρουν όλοι.

Βέβαια δεν θα µπορούσαν να κάνουν αλλιώς, γιατί τότε ο«κακός» διαπραγµατευτής θα συνέχιζε να αθετεί τη συµφωνίαπρος όφελός του.

Οι διαπραγµατευτές θα προτιµούσαν να τιµωρηθεί µόνοαυτός που αθέτησε την συµφωνία, π.χ. εξωθώντας τον σεέξοδο από την αγορά.

Μια τέτοια τακτική ισοδυναµεί µε στρατηγική ενεργοποίησης καιαπαιτεί ειδικές συνθήκες. Ωστόσο, η ανάλυση που προηγήθηκεισχύει πλήρως για όποιον σκέφτεται να αθετήσει τη συµφωνία.

Page 150: Game Theory

150

299

Προτίµηση εντολών (1/2)Οι πολίτες που επιθυµούν να αγοράσουν/πουλήσουνµετοχές δεν απευθύνονται απευθείας στουςδιαπραγµατευτές αλλά στους διαµεσολαβητές (brokers).Ένας διαµεσολαβητής δέχεται εντολές αγοράς/πώλησης απότους πελάτες του και τις προωθεί στους διαπραγµατευτές.Το NASDAQ επέτρεπε στους διαµεσολαβητές ναπροωθήσουν τις εντολές όχι µόνο στον διαπραγµατευτή πουέχει τις «καλύτερες» τιµές, αλλά σε οποιονδήποτε από τουςδιαπραγµατευτές.Για παράδειγµα, έστω ότι ο διαπραγµατευτής Α δίνει τιµήαγοράς 2,625$ και ο Β 2,75$. Ένας διαµεσολαβητής µπορείνα προωθήσει µια εντολή αγοράς στον Β και ο Β να τηνεκτελέσει προς 2,625$.Το γεγονός αυτό ονοµάζεται προτίµηση των εντολών (order preferencing).

300

Προτίµηση εντολών (2/2)Το αποτέλεσµα είναι το εξής:

Ένας διαπραγµατευτής που έχει τις καλύτερες τιµές, δεναπορροφά κατ’ ανάγκη και τον µεγαλύτερο όγκο συναλλαγών.Είναι δυνατόν µάλιστα να τιµωρηθεί µη-λαµβάνοντας καθόλουεντολές!

Ακόµη και αν δεν συνωµοτήσουν οι διαµεσολαβητές µε τουςυπόλοιπους διαπραγµατευτές, αυτό το οποίο θα συµβεί είναιτο εξής:

Ο διαπραγµατευτής που αθέτησε τη συµφωνία βελτιώνοντας τιςτιµές, στον επόµενο γύρο θα λάβει το ίδιο µερίδιο της αγοράςπου λάµβανε πριν τις βελτιώσει, µε µικρότερο όµως τώρακέρδος (λόγω µικρότερου ανοίγµατος τιµών).

Φυσικά το ίδιο θα πάθουν και οι υπόλοιποι.

Άρα δεν έχει κανέναν απολύτως λόγο να αθετήσει τησυµφωνία!

Page 151: Game Theory

151

301

Μεγάλοι και µικροίδιαπραγµατευτές (1/2)

Ας υποθέσουµε ότι στην αγορά υπάρχουν Ν µεγάλοι και Μµικροί διαπραγµατευτές και ότι, µέσω της προτίµησης τωνεντολών, οι µεγάλοι απολαµβάνουν διπλάσια εισροή απότους µικρούς.

Θεωρώντας µια στρατηγική ενεργοποίησης, για να αθετήσειένας διαπραγµατευτής τη συµφωνία πρέπει να ισχύει:

)1)(2(000.50µικρών Κέρδη

)1)(2(000.502 µεγάλων Κέρδη

δ

δ

−+⋅=

−+⋅⋅

=

MN

MN

500.37)1)(2(

000.50

ή 500.37)1)(2(

000.502

>−+⋅

>−+⋅

δ

δ

MN

MN

302

Μεγάλοι και µικροίδιαπραγµατευτές (2/2)

Οι µικροί διαπραγµατευτές είναι ο αδύναµος κρίκος τηςόποιας συµφωνίας.

Εάν τηρήσουν τη συµφωνία, κερδίζουν πολύ λιγότερα από τουςµεγάλους.Εάν σπάσουν τη συµφωνία, ελαχιστοποιούν τα µελλοντικά τουςέσοδα.

Τα πράγµατα είναι ακόµη χειρότερα εάν θεωρήσουµε ότι ολόγος απορρόφησης εντολών των µεγάλων έναντι τωνµικρών διαπραγµατευτών είναι πολύ µεγαλύτερος από 2.Αυτή είναι µια εξήγηση γιατί δεν παρατηρείται είσοδος νέωνπαικτών στην αγορά.

Η ίδια εξήγηση ισχύει και για πολλές άλλες αγορές, όχι κατ’ανάγκη χρηµατιστηριακές.

Page 152: Game Theory

152

303

ΕπίλογοςΜετά την δηµοσιότητα που πήρε το θέµα το 1994, ακολούθησε δικαστική έρευνα, η οποία αποφάνθηκε ότιόντως υπήρχε συνεννόηση µεταξύ των διαπραγµατευτών.

Το αποτέλεσµα της δικαστικής έρευνας βασίστηκε όχι στηνανάλυση που προηγήθηκε, αλλά στο γεγονός ότι υπήρχαναποδεικτικά στοιχεία (κασέτες) που να στοιχειοθετούν τηνκατηγορία.

Το αποτέλεσµα ήταν να πιεστεί το NASDAQ να λάβει µέτραώστε να κάνει δυσκολότερη την επίτευξη τέτοιωνσυµφωνιών στο µέλλον.Το ποιο σηµαντικό µέτρο που πάρθηκε (1997) τότε ήταν ότιοι εντολές που καταθέτουν οι πελάτες έχουν συγκεκριµένητιµή και ότι αυτές γίνονται δεκτές µόνο από όσουςδιαπραγµατευτές διαθέτουν τις τιµές.

304

Μελέτη περίπτωσης: OPEC

Organization of PetroleumExporting Countries

Page 153: Game Theory

153

305

Ιστορικά στοιχεία (1/3)Στο πρώτο µισό του 20ου αιώνα, οι κύριοι παραγωγοίπετρελαίου ήταν οι ΗΠΑ, η Βενεζουέλα και λίγο αργότερα ηΣοβιετική Ένωση.

Πετρέλαιο ανακαλύφθηκε στις χώρες του κόλπου µόλις στηδεκαετία του ’50.

Την ίδια περίοδο, πολλές µη-δυτικές χώρες είχαν εκχωρήσειτα δικαιώµατα εκµετάλλευσης των κοιτασµάτων τους σεδυτικές εταιρείες (Αγγλικές, Γαλλικές, Αµερικάνικες κλπ).

Anglo-Persian Oil companyArabian-American Oil Company (ARAMCO)

Οι περισσότερες από αυτές τις συµφωνίες εκχώρησηςτερµατίστηκαν στις δεκαετίες του ’40 και του ’50.

306

Ιστορικά στοιχεία (2/3)Τα σηµαντικά γεγονότα που συνέβησαν την περίοδο κατάκαι µετά τον 2ο παγκόσµιο πόλεµο ήταν τα εξής:

Ανακαλύφθηκαν µεγάλα κοιτάσµατα στη Μέση Ανατολή.Αυξήθηκε η παραγωγή του Ιράν και του Ιράκ.Η βιοµηχανική έκρηξη στις ΗΠΑ, αµέσως µετά τον πόλεµο.

Η ΗΠΑ µετατράπηκαν από καθαρά εξαγωγική χώρα σε κυρίωςεισαγωγική. Το 1970, 60% των αναγκών τους καλύπτονταν απόεισαγωγές.

Στα µέσα της δεκαετίας του ’60, η Μέση Ανατολή είχε γίνει ηκύρια περιοχή παραγωγής πετρελαίου παγκοσµίως.

Page 154: Game Theory

154

307

Ιστορικά στοιχεία (3/3)Μπορούµε να διαχωρίσουµε την ιστορία των τιµών τουπετρελαίου σε 4 φάσεις:

Φάση 1, µέχρι το 1960: Οι τιµές ήταν χαµηλές και σταθερές. Για παράδειγµα, το βαρέλι κόστιζε 1,25$ το 1950 και 1,75$ το1960.Φάση 2, 1960 µέχρι Οκτώβριο 1973: Οι τιµές ήταν χαµηλές, µεανοδικές όµως τάσεις.Έφτασαν στα µέσα του 1973 τα 5$.Φάση 3, Οκτώβριος 1973 έως 1979: Οι τιµές ήταν υψηλές καισταθερές. Μόνο τους τελευταίους µήνες του 1973 η τιµήανέβηκε στα 17$ και παρέµεινε σε αυτά τα επίπεδα µέχρι τατέλη της δεκαετίας.Φάση 4, 1980 και µετά: Οι τιµές χαµήλωσαν και ήταν ασταθείς. Για παράδειγµα, το 1982 είχαµε 30$ και στις αρχές του 1990 µόλις 10$. Στη δεκαετία του 1990 οι τιµές κυµαίνονται γύρωστα 25$ το βαρέλι.

308

Η ίδρυση του OPECΘα µελετήσουµε την ιστορία του OPEC, χρησιµοποιώντας ωςεργαλείο τα απείρως επαναλαµβανόµενα παιχνίδια.Ο OPEC ιδρύθηκε τον Σεπτέµβριο του 1960, ύστερα απόδεκαετείς διεργασίες και επίµονες πιέσεις της ΣαουδικήςΑραβίας, του Ιράν και της Βενεζουέλας.

Περιλαµβάνει 13 χώρες: Χώρες του Κόλπου, Αφρικανικέςχώρες (Λιβύη, Νιγηρία), Ασιατικές χώρες (π.χ. Ινδονησία).∆εν περιλαµβάνει δυτικές χώρες και χώρες της πρώηνΣοβιετικής Ένωσης.

Page 155: Game Theory

155

309

Μοντέλο (1/4)Η παγκόσµια αγορά πετρελαίου έχει τη µορφή µιας αγοράςCournot:

Οι παραγωγοί αποφασίζουν ανά τακτά χρονικά διαστήµατα(π.χ. κάθε µήνα) ποια ποσότητα θα παράγουν στο προσεχέςµέλλον.

Η συνολική διαθεσιµότητα πετρελαίου, σε συνδυασµό µε τηπαγκόσµια ζήτηση καθορίζουν την τιµή.Οι συναλλαγές γίνονται κυρίως µέσω των:

International Petroleum Exchange (IPE), µε έδρα το Λονδίνο(www.ipe.uk.com)New York Mercantile Exchange (NYMEX), µε έδρα τη ΝέαΥόρκη (www.nymex.com)

Ο OPEC καθορίζει αναλογίες παραγωγής για τις χώρες-µέλητου, µε στόχο να αυξήσει τα συνολικά κέρδη τους.

310

Μοντέλο (2/4)Θα θεωρήσουµε ότι ο OPEC αποτελείται από δύο µόνοχώρες, την Σαουδική Αραβία (SA) και την Βενεζουέλα (VA).

Η SA είναι µια από τις µεγαλύτερες χώρες του OPEC, ενώ η VA από τις µικρές, αναφορικά µε την παραγωγή τους.

Θεωρούµε ότι κάθε χώρα έχει δύο επίπεδα παραγωγής, τουψηλό (H) και το χαµηλό (L).

Θα συµβολίζουµε µε Q τις ποσότητες παραγωγής της SA και µεq τις αντίστοιχες ποσότητες της VA.

Έστω ότι η αντιστοιχία των επιπέδων αυτών είναι:QH=10 mbd (million barrels per day)QL=8 mbdqH=7 mbdqL=5 mbd

Οι συνδυασµοί των παραπάνω επιµέρους παραγωγώνοδηγούν σε τρεις περιπτώσεις συνολικής παραγωγής

17mbd, 15mbd και 13mbd.

Page 156: Game Theory

156

311

Μοντέλο (3/4)Όσον αφορά τη ζήτηση, έστω ότι υπάρχουν δύο επίπεδα:

Υψηλό επίπεδο ζήτησης: P=44,5 - 1,5·(Q+q)Χαµηλό επίπεδο ζήτησης: P=22,5 - 0,5·(Q+q)

Οι τιµές βαρελιού για τους τρεις συνδυασµούς συνολικήςπαραγωγής και τα 2 επίπεδα ζήτησης διαµορφώνονται ωςεξής:

14$19$13 mbd

15$22$15 mbd

16$25$17 mbd

ΧαµηλήΥψηλήΖήτηση

Συνολική παραγωγή

312

Μοντέλο (4/4)Έστω ότι το κόστος παραγωγής ενός βαρελιού είναι 5$.Προκύπτουν οι παρακάτω πίνακες παιχνιδιού γύρου, ανάλογα µε το επίπεδο ζήτησης (οι αριθµοί εκφράζουνεκατοµµύρια δολάρια ανά ηµέρα):

140, 98170, 85QH

136, 119160, 100QL

qHqL

VASA

90, 63100, 50QH

80, 7088, 55QL

qHqL

VASA

Υψηλή ζήτηση Χαµηλή ζήτηση

Page 157: Game Theory

157

313

Φάση 1Στην πρώτη φάση (περίοδος πριν το 1960)η παγκόσµια ζήτηση ήταν ακόµη µικρή.Υπάρχει κυρίαρχη στρατηγική και για τις δύο χώρες, ναπαράγουν σε µέγιστη ποσότητα, µε επιµέρους όφελος(90,63).Ο συνδυασµός (QH,qH) µεγιστοποιεί και το συνολικό κέρδοςτων δύο χωρών.

Η SA έχει τη δυνατότητα να επιτύχει όφελος ίσο µε 100, εάν ηVA επιλέξει να παράγει qL. Ωστόσο σε αυτή την περίπτωση τοκέρδος της VA µειώνεται κατά 13, λιγότερο από την αύξησητου κέρδους της SA.

Άρα κατά την Φάση 1, οι δύο χώρες, χωρίς συνεννόησηµεταξύ τους, απλά παράγουν το µέγιστο δυνατό για αυτές.

∆εν υπήρχε ανάγκη δηµιουργίας του OPEC.

90, 63100, 50QH

80, 7088, 55QL

qHqL

VASA

314

Φάση 2 (1/5)Η Φάση 2, από το 1960 µέχρι τον Οκτώβριο του 1973, χαρακτηρίζεται από συνεχόµενη αύξηση της ζήτησης, µεαρκετές όµως διακυµάνσεις.Θεωρούµε ότι σε κάθε περίοδο υπάρχει πιθανότητα p να έχουµευψηλή ζήτηση και (1-p) να έχουµε χαµηλή.Σε περίπτωση υψηλής ζήτησης έχουµε µια κατάσταση ανάλογηµε το πρόβληµα ∆Φ:

Τα συνολικά κέρδη µεγιστοποιούνται µε (QL, qL), ωστόσο υπάρχουνκυρίαρχες στρατηγικές που οδηγούν στη λύση (QH, qH).

140, 98170, 85QH

136, 119160, 100QL

qHqL

VASA

Page 158: Game Theory

158

315

Φάση 2 (2/5)Κατά την περίοδο έγιναν οι πρώτες προσπάθειες από τις χώρεςτου OPEC για επίτευξη συµφωνίας στις ποσότητες παραγωγής.Έστω ότι οι δύο χώρες συµφωνούν να παράγουν υψηλήποσότητα όταν η ζήτηση είναι χαµηλή και χαµηλή ποσότηταόταν η ζήτηση είναι υψηλή.Σε περίπτωση που µια χώρα σπάσει τη συµφωνία, στο εξής καιοι δύο θα παράγουν υψηλές ποσότητες.

Μια χώρα µπορεί να σπάσει τη συµφωνία µόνο σε περίοδο υψηλήςζήτησης, παράγοντας αντίστοιχα µεγάλη ποσότητα.

Το αναµενόµενο κέρδος για τις δύο χώρες ανά ηµέρα είναι:

90)1(160 ⋅−+⋅= ppuSA

63)1(100 ⋅−+⋅= ppuVA

316

Φάση 2 (3/5)Το µακροπρόθεσµο αναµενόµενο όφελος για κάθε χώρα είναι:

Θα εξετάσουµε την πιθανότητα µια χώρα να σπάσει τησυµφωνία σε περίοδο υψηλής ζήτησης.

δδ −⋅−+⋅

=−

=1

90)1(1601

ppuU SASA

δδ −⋅−+⋅

=−

=1

63)1(1001

ppuU VAVA

Page 159: Game Theory

159

317

Φάση 2 (4/5)Έστω η SA σε περίοδο υψηλής ζήτησης σπάει τησυµφωνία, µε άµεσο όφελος 170 (αντί για 160).Το αποτέλεσµα θα είναι ότι σε όλες τις επόµενες περιόδουςκαι οι δύο χώρες θα παράγουν υψηλά.Έτσι, το συνολικό όφελος της SA θα είναι:

Για να συµφέρει την SA να σπάσει τη συµφωνία θα πρέπεινα ισχύει:

ή τελικά:

δδ

−⋅−+⋅

⋅+=1

90)1(140170' ppUSA

δδ

δδ

−⋅−+⋅

⋅+>−

⋅−+⋅⋅+

190)1(160160

190)1(140170 pppp

p⋅+≥

211δ

318

Φάση 2 (5/5)Βλέπουµε ότι όσο µεγαλύτερο είναι το p, όσο δηλαδή πιοσίγουρο είναι ότι η αυξηµένη ζήτηση θα διατηρηθεί, τόσοπιο ανθεκτική είναι η συµφωνία.

Για p=1, προκύπτει δ>0.33, ενώ για p=0 προκύπτει δ=1.

Εάν κάνουµε την ίδια ακριβώς ανάλυση για την VA, καταλήγουµε στη σχέση:

Για p=1 προκύπτει δ>0.9, ενώ για p=0 προκύπτει δ=1.Όσο µεγαλύτερο είναι το p, τόσο ευκολότερη είναι ηδιατήρηση της συµφωνίας.Για τις µικρότερες χώρες του OPEC, η διατήρηση τηςσυµφωνίας είναι πολύ δυσκολότερη, ακόµη και σεπεριόδους υψηλής ζήτησης.

p⋅+≥

21919δ

Page 160: Game Theory

160

319

ΣυµπεράσµαταΣτη Φάση 2, η τιµή του p ήταν χαµηλή.

Αυτό εξηγεί το γεγονός ότι οι µεγάλες πετρελαιοπαραγωγέςχώρες (Σαουδική Αραβία, Ιράν) επέµεναν στην σύσταση τουOPEC, σε αντίθεση µε τις µικρές χώρες, που έφεραν τιςπερισσότερες αντιρρήσεις.

Στην Φάση 3, η τιµή του p ήταν συνεχώς κοντά στο 1. Ηφάση αυτή είναι η καλύτερη στην ιστορία λειτουργίας τουOPEC.Στη Φάση 4 εµφανίστηκε πάλι µεγάλη διακύµανση στηνζήτηση του πετρελαίου (η τιµή του p έπεσε κάτω από τηνµονάδα). Προβλήµατα εµφανίστηκαν και πάλι όπως:

Η αποχώρηση του Εκουαδόρ από τον OPEC το 1992.Οι κρυφές/γνωστές παραβάσεις των αναλογιών από τις µικρέςχώρες (π.χ. Βενεζουέλα).

320

∆υναµικά παιχνίδια:Εφαρµογή στο

πρόβληµα των κοινών

Dynamic Games

Page 161: Game Theory

161

321

ΓενικάΧαρακτηρίζουµε ως δυναµικά (dynamic games) εκείνα ταεπαναλαµβανόµενα παιχνίδια, όπου το παιχνίδι γύρουµεταβάλλεται.

Στο παράδειγµα µε τον OPEC, µελετήσαµε φάσεις όπου τοπεριβάλλον του παιχνιδιού (game environment), δηλαδή ηεξωτερική ζήτηση, δεν ήταν σταθερό.

Παρόµοια, στον NASDAQ θα µπορούσαµε να θεωρήσουµε ότι οαριθµός των διαπραγµατευτών µεταβάλλεται.Στις δηµοπρασίες οµολόγων θα µπορούσαµε να θεωρήσουµε ότι ηπροσφερόµενη από την κεντρική τράπεζα ποσότητα δεν είναι πάνταη ίδια.

Τα δυναµικά παιχνίδια είναι ο κανόνας και όχι η εξαίρεση.Θα µελετήσουµε ως δυναµικό επαναλαµβανόµενο παιχνίδιτο πρόβληµα των κοινών (the commons problem).

322

Το πρόβληµα των κοινών: Μοντέλο (1/4)

Στο πρόβληµα των κοινών το περιβάλλον του παιχνιδιού τηχρονική στιγµή t καθορίζεται από τη διαθεσιµότητα τουκοινού πόρου yt.

yt≥0

Θεωρούµε και πάλι δύο παίκτες (Ν=2). Έστω cit η κατανάλωση του παίκτη i τη χρονική στιγµή t.

Προφανώς c1t+c2t≤yt

Έστω xt=yt-(c1t+c2t) το ποσό που αποµένει µετά τηνκατανάλωση τη χρονική στιγµή t.Θα θεωρήσουµε ότι ο κοινός πόρος είναι ανανεώσιµος(renewable resource), δηλαδή ισχύει yt+1>xt.

Page 162: Game Theory

162

323

Το πρόβληµα των κοινών: Μοντέλο (2/4)Ορίζουµε ως uit=logcit τη χρησιµότητα από την κατανάλωσηποσότητας cit τη χρονική στιγµή t.

324

Το πρόβληµα των κοινών: Μοντέλο (3/4)

Ορίζουµε ως yt+1=10·sqrt(xt) τη διαθεσιµότητα του πόρου τηχρονική στιγµή t+1.

Page 163: Game Theory

163

325

Το πρόβληµα των κοινών: Μοντέλο (4/4)

Το παραπάνω µοντέλο προτάθηκε για πρώτη φορά στηνεργασία:

David Levhari and Leonard Mirman, “The Great Fish War: A Solution using Cournot-Nash Equilibrium”, Bell Journal of Economics, vol. 11, pp. 322-334, 1980.

Οι ερωτήσεις που θα προσπαθήσουµε να απαντήσουµε είναι:Πώς εξελίσσεται το yt;Υπάρχει κάποια τιµή του yt η οποία παραµένει σταθερή.Ποια είναι η κοινωνικά βέλτιστη τιµή του yt;

326

Κοινωνικά βέλτιστη λύση (1/5)Θα προσπαθήσουµε να βρούµε εκείνη την κατανάλωση γιατους δύο παίκτες που µεγιστοποιεί το συνολικό τους όφελος.Έστω ότι το παιχνίδι παίζεται για δύο µόνο γύρους.Στον δεύτερο γύρο υπάρχει διαθέσιµη ποσότητα y2.Αφού είναι ο τελευταίος γύρος, οι δύο παίκτες θακαταναλώσουν όλη τη διαθέσιµη ποσότητα:

c12+c22=y2

Πρέπει να µεγιστοποιήσουµε την ποσότητα:u12+u22=log(c12)+log(y2-c12)

Μηδενίζοντας την πρώτη παράγωγο βρίσκουµε εύκολα ότιτο µέγιστο επιτυγχάνεται για c12=c22=y2/2.Το συνολικό όφελος όταν αποµένει ένας γύρος και ητρέχουσα ποσότητα είναι y:

U1=U1(y)=log(y/2)+log(y/2)=2logy-2log2

Page 164: Game Theory

164

327

Κοινωνικά βέλτιστη λύση (2/5)Το επόµενο βήµα είναι να υπολογίσουµε την κατανάλωσηc11 και c21 κατά τον πρώτο γύρο, ώστε να µεγιστοποιηθεί τοσυνολικό όφελος (για τους δύο γύρους).Πρέπει να µεγιστοποιηθεί η ποσότητα:

u11+u21+δ(u12+u22)=log(c11)+log(c21)+δ·U1(10·(y1-c11-c21)0.5)=log(c11)+log(c21)+δ·(2log(10·(y1-c11-c21)0.5)-2log2)=log(c11)+log(c21)+δ·log(y1-c11-c21)+δ·log25

Μηδενίζοντας τις παραγώγους για c11 και c21 βρίσκουµετελικά:

c11=c21=y1/(2+δ)Παρατηρούµε ότι η παραπάνω κατανάλωση προβλέπει νααποµείνει κάτι για την επόµενη περίοδο, εφόσον δ>0.

Για δ=1 προβλέπει κατανάλωση ίση µε y1/3 ανά παίκτη.Θυµηθείτε ότι στην περίπτωση µη-ανανεώσιµου πόρου είχαµευπολογίσει ότι η κοινωνικά βέλτιστη κατανάλωση ήταν y1/4 στονπρώτο γύρο.

328

Κοινωνικά βέλτιστη λύση (3/5)

Το συνολικό µέγιστο όφελος, όταν αποµένουν 2 γύροι και ητρέχουσα ποσότητα είναι y, είναι:

U2(y)= log(y/3)+log(y/3)+δ·log(y-y/3-y/3)+δ·log25=2log(y)+δ·log(y)+δ·log25-2·log3-δ·log3

Έστω τώρα ότι το παιχνίδι έχει τρεις γύρους. Η ποσότηταπου πρέπει να µεγιστοποιηθεί είναι η:

log(c11)+log(c21)+δ·U2(10(y1-c11-c21)0.5).

Μετά από πράξεις προκύπτει ότι η βέλτιστη κατανάλωσηστην πρώτη περίοδο είναι:

c11=c21=y1/[2·(1+δ/2+δ2/4)].

Page 165: Game Theory

165

329

Κοινωνικά βέλτιστη λύση (4/5)

Παρατηρούµε τα εξής:Όταν αποµένει ένας γύρος, η βέλτιστη κατανάλωση είναι

c1=c2=y/2.Όταν αποµένουν δύο γύροι, η βέλτιστη κατανάλωση στονπρώτο από τους δύο γύρους είναι

c1=c2= y/(2+δ) = y/[2·(1+δ/2)].Όταν αποµένουν τρεις γύροι, η βέλτιστη κατανάλωση στονπρώτο από τους τρεις γύρους είναι

c1=c2= y/[2·(1+δ/2+δ2/4)].

Μπορούµε να εικάσουµε ότι όταν αποµένουν άπειροι γύροι, η κοινωνικά βέλτιστη κατανάλωση στον πρώτο από αυτούςτους γύρους (αλλά και σε κάθε γύρο!) είναι:

c1=c2= y/[2·(1+δ/2+δ2/4+δ3/8+...)] = y·(2-δ)/4.

Η ποσότητα που επενδύεται στο µέλλον είναι: xt=y·δ/2

330

Κοινωνικά βέλτιστη λύση (5/5)

Έστω xt=yt·δ/2 η ποσότητα που αποµένει τη χρονική στιγµή t.Στην επόµενη χρονική στιγµή η διαθέσιµη ποσότητα θα είναι:

yt+1=10·(xt)0.5=10·(yt·δ/2)0.5

Εάν θέσουµε yt+1=yt καταλήγουµε ότι yt=50δ.Για παράδειγµα, για δ=0.8 παίρνουµε yt=40.

Η διαθεσιµότητα αυτή του πόρου είναι διατηρήσιµη. Στοσηµείο αυτό, η ποσότητα που καταναλώνουν σε κάθε περίοδοοι δύο παίκτες είναι ακριβώς όση αναπαράγεται από µόνη της.

Page 166: Game Theory

166

331

Ισορροπία Nash (1/5)Θα εκτελέσουµε τους ίδιους υπολογισµούς για τηνπερίπτωση που οι δύο παίκτες λειτουργούν µονοµερώς.Υποθέτουµε καταρχήν ότι υπάρχουν δύο µόνο γύροι.Έστω ότι στον δεύτερο γύρο η διαθέσιµη ποσότητα είναι y2.Είναι προφανές ότι, αφού πρόκειται για τον τελευταίο γύρο, κάθε παίκτης θα επιδιώξει το µέγιστο, µε αποτέλεσµα ναµοιραστούν τη διαθέσιµη ποσότητα:

c12=c22=y2/2

Το όφελος κάθε παίκτη είναι u12=u22=log(y2/2).

332

Ισορροπία Nash (2/5)Έστω τώρα ότι είµαστε στον πρώτο από τους δύο γύρους.Για τυχαία κατανάλωση c21 του παίκτη 2, ο παίκτης 1 πρέπεινα µεγιστοποιήσει την ποσότητα:

u11+δu12=log(c11)+δ·log(10·(y1-c11-c21)0.5/2)=log(c11)+δ/2·log(y1-c11-c21)+δ/2·log5

Προκύπτει ότι η βέλτιστη κατανάλωση του παίκτη 1 στονπρώτο γύρο, ως συνάρτηση της κατανάλωσης του παίκτη 2 στον πρώτο γύρο, είναι:

c11* = b1(c21) = (y1-c21)/(1+δ/2)

Παρόµοια προκύπτει για τον παίκτη 2:c21* = b2(c11) = (y1-c11)/(1+δ/2)

Οι παραπάνω σχέσεις αποτελούν συναρτήσεις καλύτερηςαπόκρισης (best response function).

Page 167: Game Theory

167

333

Ισορροπία Nash (3/5)Το σηµείο ισορροπίας Nash είναι αυτό για το οποίο ισχύειc11*=b1(c21*) και c21*=b2(c11*) ταυτόχρονα.Βρίσκεται εύκολα ότι αυτό ισχύει για:

c11*=c21*=y1/(2+δ/2)

Γενικεύοντας:Αν σε παιχνίδι δύο γύρων µε αρχική ποσότητα y οι δύο παίκτεςαποφασίζουν µονοµερώς, στον πρώτο γύρο θα πρέπει νακαταναλώσουν ποσότητα c=y/(2+δ/2) ο καθένας.Το αναµενόµενο κέρδος για τον καθένα είναι:U2(y)=log(y/(2+δ/2)) + δ/2·log(y-c-c)+δ/2·log5=

...=(1+δ/2)·log(y) + δ/2·log(5·δ/(4+δ))-log(2+δ/2)

334

Ισορροπία Nash (4/5)Έστω ότι το παιχνίδι διαρκεί τρεις γύρους.Η αρχική ποσότητα είναι y και στον πρώτο γύρο ο παίκτης 2 καταναλώνει c12.Ο παίκτης 1 πρέπει να µεγιστοποιήσει την ποσότητα:

u11+δ·U2(y-c11-c12)=log(c11)+δ[(1+δ/2)·log(y-c11-c12)+δ/2·log(5·δ/(4+δ))-log(2+δ/2)]

Με παρόµοιους υπολογισµούς όπως και στην περίπτωση τωνδύο γύρων προκύπτει ότι το σηµείο ισορροπίας είναι για:

c11=c21=y/(2+δ/2+δ2/4)

Επαγωγικά συµπεραίνουµε ότι σε παιχνίδι άπειρων γύρων, ηκαλύτερη µονοµερής κατανάλωση στον πρώτο γύρο (αλλάκαι σε κάθε έναν από τους υπόλοιπους) είναι:

c(y)=y·(2-δ)/(4-δ)

Page 168: Game Theory

168

335

Ισορροπία Nash (5/5)Έστω ότι σε κάποιον γύρο η αρχική ποσότητα είναι yt.Η ποσότητα που θα αποµείνει µετά την κατανάλωση είναι:

xt=yt-2·c(yt)=yt-2yt(1-δ/2)/(2-δ/2)=...=yt·δ/(4-δ)

Η διαθέσιµη ποσότητα τη χρονική στιγµή t+1 θα είναι:yt+1=10xt

0.5=10·(yt·δ/(4-δ))0.5

Εάν θέσουµε yt+1=yt παίρνουµε:yt+1=yt=100·δ/(4-δ)

Για παράδειγµα, για δ=0.8 παίρνουµε yt=25.

336

ΠαρατηρήσειςΗ γενική παρατήρηση είναι ότι η µονοµερής κατανάλωσηοδηγεί σε υπερκατανάλωση:

Στην περίπτωση συνεργασίας, η κατανάλωση είναι y·(2-δ)/4.Στην µονοµερή κατανάλωση, η κατανάλωση είναι y·(2-δ)/(4-δ)Είναι προφανές ότι η δεύτερη κατανάλωση είναι µεγαλύτερη.

Παρόµοια, τα διατηρήσιµα αποθέµατα, όπου δηλαδή ηκατανάλωση θα είναι όση και η φυσική αναπαραγωγή, είναιµεγαλύτερα στην περίπτωση συνεργασίας από τηνπερίπτωση µονοµερούς κατανάλωσης:

Στην περίπτωση συνεργασίας, τα διατηρήσιµα αποθέµατα είναι50δ.Στην µονοµερή κατανάλωση, τα διατηρήσιµα αποθέµατα είναι100·δ/(4-δ).Είναι εύκολο να δειχθεί ότι 50δ>100·δ/(4-δ) για 0≤δ≤1.

Page 169: Game Theory

169

337

Ηθικός κίνδυνος καιθεωρίες κινήτρων

Moral Hazard andIncentives Theory

338

ΓενικάΟ όρος «ηθικός κίνδυνος» εµφανίστηκε στις ασφάλειες καιαφορά το γεγονός ότι ένας άνθρωπος που έχει ασφαλιστικήκάλυψη έχει µειωµένα κίνητρα για να προστατέψει τοασφαλισµένο αντικείµενο σε σχέση µε κάποιον που δεν έχειασφαλιστική κάλυψη.

Γενικά υπάρχουν συνήθειες που οι ασφαλισµένοι προτιµούν ναυιοθετούν, ενώ οι ασφαλιστικές εταιρείες θα προτιµούσαν νααποφεύγουν.

Σε κάθε περίπτωση είναι δύσκολο για την ασφαλιστικήεταιρεία να αποδείξει ότι ο πελάτης δεν πήρε όλες τιςαναγκαίες προφυλάξεις.

Page 170: Game Theory

170

339

ΠαραδείγµαταΙδιοκτήτης-∆ιευθυντής: Σε µια µεγάλη εταιρεία, η σχέσηµεταξύ του ιδιοκτήτη και του διευθυντή. Ο ιδιοκτήτης πρέπεινα δώσει κίνητρα στον διευθυντή για να εργαστεί σκληρά.Πελάτης-Παροχέας Υπηρεσίας: Η σχέση µεταξύ ενός πελάτηκαι ενός γιατρού, δικηγόρου κλπ. Ο πελάτης πρέπει ναδώσει κίνητρα στον παροχέα της υπηρεσίας, ώστε νααποδώσει το καλύτερο δυνατό.Εταιρεία-Πωλητής: Η εταιρεία πρέπει να δώσει κίνητρα στονπωλητή ώστε να φέρει περισσότερες παραγγελίες.

Σε όλες τις παραπάνω περιπτώσεις το κοινό χαρακτηριστικόείναι ότι ο εντολέας (principal) δεν µπορεί να ελέγξει τονεντολοδόχο για το αν εκτελεί σωστά τα καθήκοντά του.

340

Μοντέλο (1/3)Θα θεωρήσουµε το παράδειγµα του ιδιοκτήτη και τουδιευθυντή µιας εταιρείας.Ο ιδιοκτήτης προσφέρει στον διευθυντή ένα πακέτοαποδοχών.Στη συνέχεια ο διευθυντής αποφασίζει εάν θα καταβάλειµεγάλη ή µικρή προσπάθεια

eH και eL, για effort high και effort low αντίστοιχα.

Οι ενέργειες του διευθυντή δεν είναι παρατηρήσιµες από τονιδιοκτήτη.Υπάρχουν τρία πιθανά αποτελέσµατα, όσον αφορά τηνκερδοφορία της εταιρείας:

good (g), medium (m) και bad (b), µε g>m>b

Page 171: Game Theory

171

341

Μοντέλο (2/3)Ο καθορισµός της κερδοφορίας της εταιρείας είναιστοχαστικός και εξαρτάται από την προσπάθεια τουδιευθυντή:

Για προσπάθεια eH έχουµε: P(g)=0.6, P(m)=0.3, P(b)=0.1.Για προσπάθεια eL έχουµε: P(g)=0.1, P(m)=0.3, P(b)=0.6.

Ο ιδιοκτήτης πληρώνει τον διευθυντή ανάλογα µε τοαποτέλεσµα:

Για κέρδη g, m ή b οι αποδοχές είναι wg, wm ή wb αντίστοιχα.Προφανώς wg≥wm≥wb

Τα καθαρά κέρδη του ιδιοκτήτη σε κάθε περίπτωση είναι g-wg, m-wm και b-wb αντίστοιχα.

Ο ιδιοκτήτης ενδιαφέρεται µόνο για τα καθαρά κέρδη του.

342

Μοντέλο (3/3)Το όφελος του διευθυντή είναι συνάρτηση των οικονοµικώντου απολαβών και της προσπάθειας που κατέβαλλε.

Έστω u(wg), u(wm) και u(wb) το όφελος από τις απολαβές.Έστω dH και dL το κόστος για τα δύο επίπεδα προσπάθειας.Το συνολικό όφελος ισούται µε u(wi)-dj, i=g,m,b και j=h,l.

Θεωρούµε ότι η συνάρτηση u είναι µια αύξουσα κοίλησυνάρτηση:

Ο διευθυντής προφανώς προτιµά περισσότερα από λιγότεραχρήµατα, αλλά γενικά αποφεύγει το ρίσκο.

Σε διάφορα σηµεία παρακάτω θα χρησιµοποιήσουµε τιςπαρακάτω τιµές, για να πάρουµε συγκεκριµένααποτελέσµατα:

u(w)=2·w0.5, dH=10, dL=4, g=200, m=100, b=50.

Page 172: Game Theory

172

343

Καθαρός µισθόςΈστω ότι ο ιδιοκτήτης δίνει στον διευθυντή έναν καθαρόµισθό, ανεξάρτητα από την κερδοφορία της επιχείρησης:

w=wg=wm=wb

Το όφελος του διευθυντή για τα δύο επίπεδα προσπάθειαςείναι:

eH: u(w)-dH

eL: u(w)-dL

Με δεδοµένο ότι dh>dl, είναι προφανές ότι ο διευθυντής θακαταβάλλει λίγη προσπάθεια.

344

Ενοικίαση εταιρείαςΤο αντίθετο άκρο είναι η ενοικίαση του ονόµατος τηςεταιρείας (franchising), έναντι συγκεκριµένου τιµήµατος, ανεξαρτήτως κερδών.Έστω f το ενοίκιο. Τότε το χρηµατικό κέρδος του διευθυντή, ανάλογα µε τα κέρδη της εταιρείας, είναι:

wg=g-f, wm=m-f και wb=b-f

Ανάλογα µε την προσπάθεια που θα καταβάλλει οδιευθυντής, το αναµενόµενο όφελός του γίνεται:

eH: 0.6·u(g-f)+0.3·u(m-f)+0.1·u(b-f)-dH

eL: 0.1·u(g-f)+0.3·u(m-f)+0.6·u(b-f)-dL

∆εν είναι πλέον προφανές ποια περίπτωση συµφέρειπερισσότερο τον διευθυντή.

Page 173: Game Theory

173

345

Μισθός και µπόνουςΣτις δύο προηγούµενες περιπτώσεις, το ρίσκο επιβαρύνειπλήρως είτε τον ιδιοκτήτη, είτε τον διευθυντή.Μια ενδιάµεση κατάσταση είναι αυτή για την οποία ισχύει:

wg>wm>wb και wg-wb<g-b και wm-wb<m-b

Το αναµενόµενο όφελος του διευθυντή, ανάλογα µε τηνπροσπάθειά του, είναι:

eH: 0.6·u(wg)+0.3·u(wm)+0.1·u(wb)-dH

eL: 0.1·u(wg)+0.3·u(wm)+0.6·u(wb)-dL

Εύκολα προκύπτει ότι ο διευθυντής θα καταβάλλει µεγάληπροσπάθεια εάν:

0.5·[u(wg)-u(wb)]≥dH-dL

346

Μισθός ανάλογα µε την προσπάθειαΈστω ότι ο ιδιοκτήτης µπορεί να µετρά την προσπάθεια τουδιευθυντή, eH και eL, και να τον ανταµείβει αντίστοιχα µε wHκαι wL.Ο διευθυντής θα καταβάλλει µεγάλη προσπάθεια µόνο εάνισχύει:

u(wH)-dH≥u(wL)-dL

Προφανώς ισχύει u(wL)-dL≥0 και u(wΗ)-dΗ≥0.Από τις παραπάνω σχέσεις προκύπτει ότι οι ελάχιστεςανταµοιβές για τον διευθυντή είναι:

wL≥4wH≥25

Page 174: Game Theory

174

347

Επιλογή κινήτρων:Απουσία ηθικού κινδύνου (1/2)

Στη συνέχεια θα εξετάσουµε ποιο σχήµα κινήτρων συµφέρειτον ιδιοκτήτη.Έστω ότι ο ιδιοκτήτης µπορεί και καταγράφει τηνπροσπάθεια του διευθυντή και τον ανταµείβει βάσει τηςπροσπάθειας (wH και wL αντίστοιχα).Ανάλογα µε την προσπάθεια που θα καταβάλλει οδιευθυντής, το αναµενόµενο κέρδος για τον ιδιοκτήτη είναι:

eH: 0.6·g+0.3·m+0.1·b-wH

eL: 0.1·g+0.3·m+0.6·b-wL

Ο ιδιοκτήτης θα επέλεγε αυτό το σχήµα, ελπίζοντας ότι οδιευθυντής θα καταβάλλει µεγάλη προσπάθεια, εάν ισχύει:

0.5·(g-b)≥wH-wL

Για τις τιµές g=200, b=50, wH=25 και wL=4 η τελευταίασχέση ισχύει.

348

Επιλογή κινήτρων:Απουσία ηθικού κινδύνου (2/2)

Θέτοντας ο ιδιοκτήτης τιµή wH>25 και wL=4 επιτυγχάνει τοπαρακάτω κέρδος.

0.6·g+0.3·m+0.1·b-wH = 0.6·200+0.3·100+0.1·50-25 = 130

Page 175: Game Theory

175

349

Επιλογή κινήτρων:Ηθικός κίνδυνος (1/5)

Στην περίπτωση ύπαρξης ηθικού κινδύνου, ο ιδιοκτήτης έχεινα επιλέξει µεταξύ τριών πολιτικών:

Σταθερός µισθόςΕνοικίαση εταιρείαςΜισθός και µπόνους

Εάν ο ιδιοκτήτης επιλέξει έναν σταθερό µισθό, τότε είναισίγουρο ότι ο διευθυντής θα καταβάλλει µικρή προσπάθεια, eL.Εάν θεωρήσουµε ότι ο διευθυντής δεν έχει δυνατότητα ναβρει καλύτερη δουλειά, ωστόσο έχει τη δυνατότητα ναπαραιτηθεί από την τρέχουσα, ο ελάχιστος µισθός πουµπορεί να δεχθεί είναι τέτοιος ώστε:

u(w)-dL>0

350

Επιλογή κινήτρων:Ηθικός κίνδυνος (2/5)

Για τα νούµερα του παραδείγµατος, προκύπτει ότι:2·w0.5>4 ή w>4

Το αναµενόµενο όφελος του ιδιοκτήτη θα είναι:0.1·g+0.3·m+0.6·b-w=0.1·200+0.3·100+0.6·50-4=76

Εάν ο ιδιοκτήτης επιλέξει να ενοικιάσει την εταιρεία, τότε τοόφελός του θα είναι ένα σταθερό ενοίκιο f.Με δεδοµένη τη συνάρτηση οφέλους u(w)=2·w0.5, η οποίαδεν ορίζεται για αρνητικά w, προκύπτει ότι f≤50.

Εάν ισχύει f>50, τότε ο διευθυντής ρισκάρει να βγει χαµένοςστην περίπτωση που, ανεξαρτήτως των προσπαθειών του, ταέσοδα της εταιρείας είναι κακά (b=50).

Page 176: Game Theory

176

351

Επιλογή κινήτρων:Ηθικός κίνδυνος (3/5)

Έστω ότι ο ιδιοκτήτης επιλέγει να δώσει στον διευθυντήµισθό και µπόνους, δηλαδή:

wg>wm>wb, όµως wg-wb<g-b και wm-wb<m-b

Το αναµενόµενο κέρδος για τον ιδιοκτήτη, ανάλογα µε τηνπροσπάθεια που θα καταβάλλει ο διευθυντής, είναι:

eH: 0.6·(g-wg)+0.3·(m-wm)+0.1·(b-wb)eL: 0.1·(g-wg)+0.3·(m-wm)+0.6·(b-wb)

Ο ιδιοκτήτης θα επέλεγε ένα τέτοιο σχήµα µόνο στηνπερίπτωση που:

g-b≥wg-wb

352

Επιλογή κινήτρων:Ηθικός κίνδυνος (4/5)

Έχουµε δει ότι ο διευθυντής θα καταβάλλει µεγαλύτερηπροσπάθεια εάν ισχύει:

0.5·[u(wg)-u(wb)]≥dH-dL

Θεωρώντας ότι το ελάχιστο wb είναι ίσο µε 4 (περίπτωσηκαθαρού µισθού) προκύπτει ότι wg>=64.

Για τις παραπάνω τιµές ισχύει η σχέση:g-b≥wg-wb ή 200-50≥64-4 ή 150≥60

Άρα ο ιδιοκτήτης µπορεί να προσφέρει στον διευθυντή µισθόwg=64.

Το wm δεν εµφανίζεται πουθενά στις σχέσεις, επειδή ηπιθανότητα για µεσαία κέρδη είναι η ίδια, ανεξάρτητα τηςπροσπάθειας του διευθυντή.Άρα ο ιδιοκτήτης µπορεί να θέσει wm=wb.

Page 177: Game Theory

177

353

Επιλογή κινήτρων:Ηθικός κίνδυνος (5/5)

Έστω λοιπόν ότι ο ιδιοκτήτης επιλέγει wg=64, wm=wb=4.Ο διευθυντής θα επιλέξει να καταβάλλει µεγάληπροσπάθεια, οπότε τα αναµενόµενα κέρδη για τον ιδιοκτήτηείναι:

0.6·(g-wg)+0.3·(m-wm)+0.1·(b-wb) = 0.6·(200-64)+0.3·(100-4)+0.1·(50-4) =0.6·136+0.3·96+0.1·46 = 115

Βλέπουµε λοιπόν ότι στο συγκεκριµένο παράδειγµα, ηκαλύτερη πολιτική σε περίπτωση ύπαρξης ηθικού κινδύνου, είναι η χρήση βασικού µισθού και µπόνους.Ωστόσο, το κέρδος µεγιστοποιείται για τον ιδιοκτήτη στηνπερίπτωση έλλειψης ηθικού κινδύνου.

354

Παρατηρήσεις (1/2)Το «κλειδί» στην ανάλυση που προηγήθηκε και στααποτελέσµατα που προέκυψαν ήταν η µορφή τηςσυνάρτησης οφέλους των δύο παικτών.

Για τον διευθυντή, η συνάρτηση απόδοσης ήταν µια κοίλησυνάρτηση των αποδοχών του. Ο διευθυντής δεν έδινεδιπλάσια αξία σε διπλάσιες αποδοχές, ούτε ήταν διατεθειµένοςνα ρισκάρει για αυτές.

Μάλιστα δεν είναι διατεθειµένος να ρισκάρει ούτε το ελάχιστο τηνπερίπτωση να έχει αρνητικά έσοδα.

Για τον ιδιοκτήτη, η συνάρτηση οφέλους ταυτίζεται µε τιςαποδοχές, πρόκειται λοιπόν για γραµµική συνάρτηση. Οιδιοκτήτης δίνει διπλάσια αξία σε διπλάσια έσοδα. Επίσης είναιουδέτερος µεταξύ του να ρισκάρει ή µη τα έσοδά του (αρκείφυσικά πάντα τα αναµενόµενα έσοδα να είναι τα ίδια).

Γενικά, αυτό που πρέπει να ισχύει είναι ο ιδιοκτήτης ναφοβάται το ρίσκο λιγότερο από τον διευθυντή.

Page 178: Game Theory

178

355

Παρατηρήσεις (2/2)Το µοντέλο που παρουσιάστηκε µπορεί να επεκταθεί σεπερισσότερα από ένα επίπεδα κερδοφορίας για την εταιρεία.

Εάν έχουµε n επίπεδα κερδοφορίας, τότε χρειάζεται ναοριστούν n επίπεδα µισθών.

Μπορούµε να έχουµε περισσότερα από 2 επίπεδαπροσπάθειας για τον διευθυντή. Γενικά δεν ισχύει ότι ο ιδιοκτήτης προσπαθεί πάντα να πείσειτον διευθυντή να καταβάλλει το µέγιστο των προσπαθειώντου.Εξαρτάται από τα αναµενόµενα κέρδη και τα µπόνους πουπρέπει να πάρει ο διευθυντής για να καταβάλλει αυξηµένηπροσπάθεια.

356

Παιχνίδια µεελλιπή πληροφόρηση

Games with Incomplete Information

Page 179: Game Theory

179

357

ΓενικάΩς παιχνίδια µε ελλιπή πληροφόρηση ορίζονται αυτά σταοποία δεν είναι γνωστές σε όλους τους παίκτες όλες οιπαράµετροι του παιχνιδιού, όπως:

Ποιοι/πόσοι είναι οι άλλοι παίκτεςΠοιες είναι οι διαθέσιµες στρατηγικές στους άλλους παίκτες.Ποιες είναι οι αποδόσεις των διάφορων στρατηγικών για τουςάλλους παίκτες.κλπ

358

Παράδειγµα: ∆ιαπραγµάτευση Ι (1/2)Έστω δύο µέρη, Α και Β, τα οποία βρίσκονται σε µιακατάσταση αντιπαράθεσης.

∆ύο χώρες, εργοδότης και εργαζόµενοι, δύο οδηγοί στο δρόµο, δύο συνάδελφοι κλπ

Κάθε παίκτης µπορεί να επιλέξει είτε µια σκληρή (Σ), είτε µιαµετριοπαθή (Μ) αντιµετώπιση.Ο παίκτης Α είναι ιδιαίτερα άκαµπτος.Έστω ότι υπάρχει αβεβαιότητα για το χαρακτήρα του παίκτηΒ, εάν δηλαδή είναι άκαµπτος ή ήπιος. Έχουµε δύο πίνακες παιχνιδιού, έναν για κάθε τύπο του Β:

2,20,3Μ

3,01,1Σ

ΜΣΒ

Α

Άκαµπτος Β

2,30,2Μ

3,11,0Σ

ΜΣΒ

Α

Ήπιος Β

Page 180: Game Theory

180

359

Παράδειγµα: ∆ιαπραγµάτευση Ι (2/2)Στο παράδειγµα αυτό τα πράγµατα είναι απλά:

Ο παίκτης Α έχει κυρίαρχη στρατηγική την Σ, ανεξάρτητα από τηνστάση του παίκτη Β.Ο παίκτης Β έχει κυρίαρχη στρατηγική την Σ στον πρώτο πίνακακαι την Μ στο δεύτερο.

Οι παραπάνω στρατηγικές µπορούν να επιλεγούν από τουςπαίκτες µε βεβαιότητα και αποτελούν τη λύση τουπροβλήµατος.

2,20,3Μ

3,01,1Σ

ΜΣΒ

Α

Άκαµπτος Β

2,30,2Μ

3,11,0Σ

ΜΣΒ

Α

Ήπιος Β

360

Παράδειγµα: ∆ιαπραγµάτευση ΙΙ (1/3)Μια παραλλαγή του προηγούµενου παραδείγµατος είναι όταντο ένα µέρος θα ήθελε να προσαρµόσει τη συµπεριφορά τουβάσει της συµπεριφοράς του άλλου µέρους.Για παράδειγµα, έστω σε µια διαπραγµάτευσηεργοδότη/εργαζοµένων (Α/Β αντίστοιχα στους παρακάτωπίνακες), ο εργοδότης θα ήθελε να επιβραβεύσει µια ήπιαστάση των εργαζοµένων δίνοντας τους µια µεγαλύτερηαύξηση, όχι όµως µια άκαµπτη στάση.

2,20,3Μ

3,01,1Σ

ΜΣΒ

Α

Άκαµπτος Β

3,31,2Μ

2,10,0Σ

ΜΣΒ

Α

Ήπιος Β

Page 181: Game Theory

181

361

Παράδειγµα: ∆ιαπραγµάτευση ΙΙ (2/3)Στο παράδειγµα αυτό οι κυρίαρχες στρατηγικές για τον παίκτηΒ είναι οι ίδιες, Σ για την πρώτη περίπτωση και Μ για τηνδεύτερη.Ο παίκτης Α πλέον έχει και αυτός διαφορετικές κυρίαρχεςστρατηγικές, Σ για την πρώτη περίπτωση και Μ για τηδεύτερη.Το πρόβληµα για τον Α είναι ότι δεν γνωρίζει εξαρχής σε ποιααπό τις δύο περιπτώσεις βρισκόµαστε!

2,20,3Μ

3,01,1Σ

ΜΣΒ

Α

Άκαµπτος Β

3,31,2Μ

2,10,0Σ

ΜΣΒ

Α

Ήπιος Β

362

Παράδειγµα: ∆ιαπραγµάτευση ΙΙ (3/3)Έστω ότι ο Α θεωρεί πως κατά 90% ο Β θα είναι άκαµπτος καικατά 10% θα είναι ήπιος.Εάν επιλέξει Σ, το αναµενόµενο όφελός του είναι:

0.9·1+0.1·2=1.1

Εάν επιλέξει Μ, το αναµενόµενο όφελός του είναι:0.9·0+0.1·3=0.3

Άρα τον συµφέρει να επιλέξει Σ.Στο συγκεκριµένο παράδειγµα βρίσκουµε εύκολα ότι αν ο Β είναιάκαµπτος µε πιθανότητα µεγαλύτερη από 50%, ο Α επιλέγει Σ.

2,20,3Μ

3,01,1Σ

ΜΣΒ

Α

Άκαµπτος Β

3,31,2Μ

2,10,0Σ

ΜΣΒ

Α

Ήπιος Β

Page 182: Game Theory

182

363

Παράδειγµα: Μάχη των φύλων (1/2)

Έστω το γνωστό παιχνίδι της µάχης των φύλων, όπου οάντρας και η γυναίκα πρέπει να αποφασίσουν αν θα πάνεστην Όπερα ή στο Γήπεδο.Ο άντρας προτιµά να πάει µαζί µε τη γυναίκα του.Έστω ότι δεν είναι γνωστό στον άντρα εάν η γυναίκα τουπροτιµά να πάει µαζί µε τον άντρα της κάπου ή χώρια.

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά µαζί

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

364

Παράδειγµα: Μάχη των φύλων (2/2)

Ο πληροφορηµένος παίκτης (η γυναίκα) δεν έχει κάποιακυρίαρχη στρατηγική σε καµία από τις δύο περιπτώσεις.

Άρα, µολονότι γνωρίζει ποιος είναι ο σωστός πίνακας παιχνιδιού, δεν της είναι ξεκάθαρο τι να επιλέξει.

Τα πράγµατα είναι ακόµη χειρότερα για τον άνδρα, ο οποίος, εκτός από το ότι δεν έχει καµία κυρίαρχη στρατηγική σεκανένα παιχνίδι, δεν γνωρίζει καν ποιος είναι ο σωστόςπίνακας παιχνιδιού!Θα αναλύσουµε το παιχνίδι στις επόµενες διαφάνειες.

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά µαζί

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

Page 183: Game Theory

183

365

ΠαρατήρησηΣτα παραδείγµατα που προηγήθηκαν θεωρήσαµεαβεβαιότητα για τον ένα από τους δύο παίκτες.Στην πραγµατικότητα µπορεί να υπάρχει αβεβαιότητα και γιατους δύο.Σε αυτή την περίπτωση µπορεί να έχουµε τόσους πίνακεςπαιχνιδιού, όσοι είναι οι δυνατοί συνδυασµοί ενδεχόµενωνκαταστάσεων των δύο παικτών.

ΠΡΟΣΟΧΗ: Θεωρούµε ότι το πλήθος των δυνατώνδιαφορετικών καταστάσεων κάθε παίκτη είναι πεπερασµένο.

366

Ισορροπία Bayes-Nash (1/4)Για το παιχνίδι της µάχης των φύλων µε ελλιπήπληροφόρηση κάνουµε τις εξής παραδοχές:

Η γυναίκα γνωρίζει ποιος είναι ο σωστός πίνακας τουπαιχνιδιού.Ο άνδρας δεν γνωρίζει τον τύπο της γυναίκας του, ωστόσογνωρίζει την πιθανότητα ρ ο πίνακας του παιχνιδιού να είναι οπρώτος (η γυναίκα του τον αγαπά).

Άρα η πιθανότητα ο σωστός πίνακας του παιχνιδιού να είναι οδεύτερος είναι 1-ρ.

Και η γυναίκα γνωρίζει την τιµή του ρ.

Page 184: Game Theory

184

367

Ισορροπία Bayes-Nash (2/4)Μετατρέπουµε το παιχνίδι σε εκτατική µορφή, θεωρώνταςότι ένας τρίτος παίκτης, η φύση, επιλέγει στην αρχή τοντύπο της γυναίκας.

Φύση

Γυναίκα

Τύπος 1

Τύπος 2

Άνδρας

Γ

Ο

Γ

Ο

Γ

Γ

Γ

Γ

Ο

Ο

Ο

Ο

3,1

0,0

0,0

1,3

3,0

0,1

0,3

1,0

ΠΡΟΣΟΧΗ:Τα πρώτανούµερα

αντιστοιχούνστον άνδρα

368

Ισορροπία Bayes-Nash (3/4)Στο συγκεκριµένο παιχνίδι ο άνδρας έχει έναν κόµβοαπόφασης, άρα πρέπει να λάβει µία απόφαση:

Οι καθαρές στρατηγικές του άνδρα είναι οι Γ και Ο.Μια µικτή στρατηγική του άνδρα µπορεί να παρασταθεί µε τηνπιθανότητα λ να επιλέξει Γ (άρα η πιθανότητα να επιλέξει Οείναι 1-λ).

Η γυναίκα έχει δύο κόµβους απόφασης, άρα έχει να λάβειδύο αποφάσεις:

Οι καθαρές στρατηγικές της γυναίκας είναι οι (Γ,Γ), (Γ,Ο), (Ο,Γ) και (Ο,Ο).Μια µικτή στρατηγική για τη γυναίκα αποτελείται από έναζεύγος πιθανοτήτων (µ1, µ2), όπου µi είναι η πιθανότητα ηγυναίκα να επιλέξει Γ όταν ο τύπος της είναι i, i=1,2.

Οι καθαρές στρατηγικές της γυναίκας αντιστοιχούν στις µικτέςστρατηγικές (1,1), (1,0), (0,1) και (0,0).

Page 185: Game Theory

185

369

Ισορροπία Bayes-Nash (4/4)Μια ισορροπία Bayes-Nash για το συγκεκριµένο παιχνίδιείναι ένας συνδυασµός πιθανοτήτων (λ, µ1, µ2), τέτοιοςώστε κάθε παίκτης (και κάθε τύπος παίκτη) επιλέγει τηνκαλύτερη απάντηση στην επιλογή του άλλου παίκτη:

Η πιθανότητα µ1 µεγιστοποιεί το αναµενόµενο όφελος τηςγυναίκας τύπου 1, όταν ο άνδρας επιλέγει Γ µε πιθανότητα λ.Η πιθανότητα µ2 µεγιστοποιεί το αναµενόµενο όφελος τηςγυναίκας τύπου 2, όταν ο άνδρας επιλέγει Γ µε πιθανότητα λ.Η πιθανότητα λ µεγιστοποιεί το αναµενόµενο όφελος τουάνδρα, ο οποίος πιστεύει ότι η γυναίκα είναι τύπου 1 µεπιθανότητα ρ και επιλέγει Γ µε πιθανότητα µ1, ενώ είναι τύπου2 µε πιθανότητα 1-ρ και επιλέγει Γ µε πιθανότητα µ2.

Στις επόµενες διαφάνειες θα βρούµε κάποια σηµείαισορροπίας Bayes-Nash µε καθαρές και µε µικτέςστρατηγικές.

370

Ισορροπίες καθαρών στρατηγικών (1/3)Έστω ότι ο άνδρας αποφασίζει Γ (δηλαδή λ=1).Η καλύτερη απάντηση της γυναίκας τύπου 1 είναι επίσης Γ(µ1=1) και της γυναίκας τύπου 2 είναι Ο (µ2=0).Θα ελέγξουµε πότε η επιλογή Γ του άνδρα είναι η καλύτερηαπάντηση στις επιλογές (Γ,Ο) ή ισοδύναµα (1,0), τηςγυναίκας.Επιλέγοντας Γ ο άνδρας έχει αναµενόµενο όφελος:

3·ρ+0·(1-ρ)=3ρ

Αν επέλεγε Ο, θα είχε αναµενόµενο όφελος:0·ρ+1·(1-ρ)=1-ρ

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά µαζί

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

Page 186: Game Theory

186

371

Ισορροπίες καθαρών στρατηγικών (2/3)Η επιλογή Γ για τον άνδρα είναι λοιπόν καλύτερη απάντησηστην επιλογή (Γ,Ο) της γυναίκας, όταν 3·ρ≥1-ρ ήισοδύναµα ρ≥0.25.Άρα, για ρ≥0.25, ο συνδυασµός (Γ,(Γ,Ο)), ή µε πιθανότητες(λ=1, µ1=1, µ2=0) είναι σηµείο ισορροπίας κατά Bayes-Nash, µε καθαρές στρατηγικές.Παρόµοια µπορούµε να βρούµε ότι για ρ≥0.75 υπάρχει τοσηµείο ισορροπίας (Ο, (Ο,Γ)) ή (λ=0, µ1=0, µ2=1).∆εν υπάρχει κανένα άλλο σηµείο ισορροπίας µε καθαρέςστρατηγικές!

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά µαζί

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

372

Ισορροπίες καθαρών στρατηγικών (3/3)Συνοψίζοντας:

Για ρ>0.75 υπάρχουν δύο σηµεία ισορροπίας µε καθαρέςστρατηγικές, τα (Γ, (Γ,Ο)) και (Ο, (Ο,Γ)).Για 0.25<ρ<0.75 υπάρχει µόνο ένα σηµείο ισορροπίας µεκαθαρές στρατηγικές, το (Γ, (Γ,Ο)).Για ρ<0.25 δεν υπάρχει κανένα σηµείο ισορροπίας µε καθαρέςστρατηγικές.

Page 187: Game Theory

187

373

Ισορροπίες µικτών στρατηγικών (1/7)Είναι προφανές ότι υπάρχουν και ισορροπίες µικτώνστρατηγικών, ακόµη και για ρ<0.25.Για παράδειγµα, έστω ρ=0. Τότε είναι σίγουρο ότι η γυναίκαείναι τύπου 2, οπότε ισχύει µόνο ο δεύτερος πίνακας τουπαιχνιδιού.

Το παιχνίδι τώρα µοιάζει µε το «µονά-ζυγά», το οποίο έχειισορροπία Nash µε µικτές στρατηγικές.Πράγµατι, για λ=0.25 και µ2=0.25, οι δύο παίκτες είναιαδιάφοροι για την επιλογή του αντιπάλου.

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

374

Ισορροπίες µικτών στρατηγικών (2/7)Έστω ότι ρ>0.Ας υποθέσουµε ότι ο άνδρας επιλέγει Γ µε πιθανότητα λ.

Εάν η γυναίκα τύπου 1 επιλέξει Γ, τότε το αναµενόµενο όφελόςτης είναι:

λ·1+(1-λ)·0=λ

Εάν η γυναίκα τύπου 1 επιλέξει Ο, το αναµενόµενο όφελός τηςείναι:

λ·0+(1-λ)·3=(1-λ)·3

Προφανώς η γυναίκα θα επιλέξει αυτό που τη συµφέρειπερισσότερο, εκτός εάν λ=3·(1-λ) ή λ=0.75, οπότε µπορεί ναεπιλέξει οποιαδήποτε µικτή στρατηγική.

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά µαζί

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

Page 188: Game Theory

188

375

Ισορροπίες µικτών στρατηγικών (3/7)Παρόµοια:

Εάν η γυναίκα τύπου 2 επιλέξει Γ, τότε το αναµενόµενο όφελόςτης είναι:

λ·0+(1-λ)·1=1-λ

Εάν η γυναίκα τύπου 2 επιλέξει Ο, το αναµενόµενο όφελός τηςείναι:

λ·3+(1-λ)·0=3λ

Προφανώς η γυναίκα θα επιλέξει αυτό που τη συµφέρειπερισσότερο, εκτός εάν 1-λ=3λ ή λ=0.25, οπότε µπορεί ναεπιλέξει οποιαδήποτε µικτή στρατηγική.

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά µαζί

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

376

Ισορροπίες µικτών στρατηγικών (4/7)Ας δούµε τώρα το πρόβληµα από την πλευρά του άνδρα.Έστω ότι η γυναίκα επιλέγει τη µικτή στρατηγική (µ1,µ2).

Εάν ο άνδρας επιλέξει Γ, το αναµενόµενο όφελός του είναι:ρ·µ1·3+(1-ρ)·µ2·3

Εάν ο άνδρας επιλέξει Ο, το αναµενόµενο όφελός του είναι:ρ·(1-µ1)·1+(1-ρ)·(1-µ2)·1

Ο άνδρας θα επιλέξει Γ ή Ο, ανάλογα µε το ποια από τιςπαραπάνω δύο εκφράσεις δίνει µεγαλύτερο όφελος.Στην ειδική περίπτωση που οι δύο παρακάνω εκφράσεις είναιίσες, ο άνδρας µπορεί να επιλέξει µικτές στρατηγικές.

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά µαζί

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

Page 189: Game Theory

189

377

Ισορροπίες µικτών στρατηγικών (5/7)Ας προσπαθήσουµε να βρούµε µια µικτή ισορροπία:

Έστω ότι ο άνδρας επιλέγει λ=0.75.Τότε η γυναίκα τύπου 1 µπορεί να επιλέξει οποιαδήποτε µικτήστρατηγική, δηλαδή οποιοδήποτε µ1.Ωστόσο η γυναίκα τύπου 2 θα επιλέξει υποχρεωτικά Ο (µ2=0).Ο άντρας µπορεί να επιλέξει µικτή στρατηγική µόνο όταν:

ρ·µ1·3+(1-ρ)·µ2·3=ρ·(1-µ1)·1+(1-ρ)·(1-µ2)·1

ή ισοδύναµα (αφού µ2=0)µ1=1/(4ρ) για ρ≥0.25

Για παράδειγµα, για ρ=0.5 έχουµε την µικτή ισορροπία:(λ=0.75, µ1=0.5, µ2=0)

378

Ισορροπίες µικτών στρατηγικών (6/7)Παρόµοια:

Έστω ότι ο άνδρας επιλέγει λ=0.25.Τότε η γυναίκα τύπου 1 θα επιλέξει υποχρεωτικά Ο, δηλαδήµ1=0.Από την άλλη, η γυναίκα τύπου 2 µπορεί να επιλέξειοποιαδήποτε στρατηγική.Ο άντρας µπορεί να επιλέξει µικτή στρατηγική µόνο όταν:

ρ·µ1·3+(1-ρ)·µ2·3=ρ·(1-µ1)·1+(1-ρ)·(1-µ2)·1

ή ισοδύναµα (αφού µ1=0)µ2=1/(4-4ρ) για ρ≤0.75

Για παράδειγµα, για ρ=0.2 έχουµε την µικτή ισορροπία:(λ=0.25, µ1=0, µ2=0.3125)

Page 190: Game Theory

190

379

Ισορροπίες µικτών στρατηγικών (7/7)Τα αποτελέσµατα που βρήκαµε δεν είναι γενικά, αλλάαφορούν µόνο το συγκεκριµένο παράδειγµα.Η γενικότερη προσέγγιση που ακολουθήθηκε µπορεί ωστόσονα εφαρµοστεί σε οποιοδήποτε ανάλογο παράδειγµα.

Συµπερασµατικά:Οι πληροφορηµένοι παίκτες (η γυναίκα στο συγκεκριµένοπαράδειγµα) επιλέγουν τη στρατηγική τους όπως στα παιχνίδιαπλήρους πληροφόρησης.

Πρέπει να επιλέξουν µια στρατηγική για κάθε τύπο παιχνιδιού.

Οι µη πληροφορηµένοι παίκτες ουσιαστικά καλούνται νααντιµετωπίσουν µικτές στρατηγικές, όπου οι πιθανότητεςκαθορίζονται από τη συχνότητα εµφάνισης των διαφόρωντύπων παίκτη.

380

Παράδειγµα: Μάχη των φύλων ΙΙ (1/4)

Στο παράδειγµα που είδαµε είχαµε ελλιπή πληροφόρησηµόνο όσον αφορά τον τύπο της γυναίκας.Θα δείξουµε πώς η προσέγγιση γενικεύεται όταν υπάρχειελλιπή πληροφόρηση και για τον τύπο του άνδρα.Έστω ότι υπάρχουν δύο τύποι άνδρα:

ο αισιόδοξος (τύπος 1), που θεωρεί ότι η πιθανότητα η γυναίκανα επιθυµεί κοινή έξοδο είναι ρ1.ο απαισιόδοξος (τύπος 2), που θεωρεί ότι η πιθανότητα ηγυναίκα να επιθυµεί κοινή έξοδο είναι ρ2, όπου 0<ρ2<ρ1<1.

ΠΡΟΣΟΧΗ: Οι δύο διαφορετικοί τύποι άνδρα δεν έχουν να κάνουνµε τη συνάρτηση οφέλους (όπως συµβαίνει µε τη γυναίκα).

Τέλος η γυναίκα γνωρίζει ότι η πιθανότητα ο άντρας της ναείναι αισιόδοξος είναι q.

Και ο άντρας γνωρίζει αυτή τη γνώση της γυναίκας.

Page 191: Game Theory

191

381

Παράδειγµα: Μάχη των φύλων ΙΙ (2/4)

Μια στρατηγική της γυναίκας αποτελείται, όπως και πριν, από δύο επιλογές, για τους δύο τύπους της γυναίκας.

Οι καθαρές στρατηγικές της γυναίκας είναι οι (Γ,Γ), (Γ,Ο), (Ο,Γ) και (Ο,Ο).Οι µικτές στρατηγικές της γυναίκας είναι όλα τα ζεύγη (µ1,µ2), όπου µi η πιθανότητα µε την οποία η γυναίκα τύπου i επιλέγειΓ.

Τώρα όµως και µια στρατηγική του άντρα αποτελείται απόδύο µέρη, ένα για κάθε τύπο του άντρα.

Οι καθαρές στρατηγικές του άντρα είναι οι (Γ,Γ), (Γ,Ο), (Ο,Γ) και (Ο,Ο).Οι µικτές στρατηγικές του άντρα είναι όλα τα ζεύγη (λ1,λ2), όπου λi η πιθανότητα µε την οποία ο άντρας τύπου i επιλέγει Γ.

382

Παράδειγµα: Μάχη των φύλων ΙΙ (3/4)

Μια ισορροπίας Bayes-Nash είναι µια τετράδα (λ1,λ2,µ1,µ2) τέτοια ώστε κάθε τύπος παίκτη να έχει επιλέξει µια βέλτιστηαναµενόµενη απάντηση στις επιλογές όλων των διαφόρωντύπων του αντιπάλου.Για παράδειγµα:

η πιθανότητα µ1 µεγιστοποιεί το αναµενόµενο όφελος τηςγυναίκας τύπου 1, όταν ο άνδρας τύπου j επιλέγει Γ µεπιθανότητα λj και η πιθανότητα ο άνδρας να είναι τύπου 1 είναιq.η πιθανότητα λ1 µεγιστοποιεί το αναµενόµενο όφελος τουάνδρα τύπου 1, όταν η γυναίκα τύπου i επιλέγει Γ µεπιθανότητα µi και η πιθανότητα η γυναίκα να είναι τύπου 1 είναι ρ1.

Page 192: Game Theory

192

383

Παράδειγµα: Μάχη των φύλων ΙΙ (4/4)

Παρακάτω φαίνεται η εκτατική µορφή του παιχνιδιού, µεπρώτο παίκτη τη φύση να αποφασίζει για τους τύπους τωνδύο παικτών.

Φύση

ΓυναίκαΆντρας

Τύπος 2

Τύπος 2

Τύπος 1

Τύπος 1

Γ

Γ

Γ

Γ

Ο

Ο

Ο

Ο

Γ

Γ

Γ

Γ

Γ

Γ

Γ

Γ

Ο

Ο

Ο

Ο

Ο

Ο

Ο

Ο

3,00,1

0,31,0

3,10,0

0,01,3

3,00,1

0,31,0

3,10,0

0,01,3

ΠΡΟΣΟΧΗ:Τα πρώτανούµερα

αντιστοιχούνστον άνδρα

384

Γενίκευση (1/2)Το γενικότερο πλαίσιο που πρότεινε ο Harsanyi (1967, 1968) για τη µελέτη των παιχνιδιών ελλιπούςπληροφόρησης έχει ως εξής:

Έστω ότι έχουµε δύο παίκτες.Έστω ότι υπάρχουν Μ διαφορετικοί τύποι για τον παίκτη 1, οιψ1, ψ2, ... , ψΜ.Έστω ότι υπάρχουν L διαφορετικοί τύποι για τον παίκτη 2, οιθ1, θ2, ..., θL.Θεωρούµε ότι στην αρχή κανένας παίκτης δεν γνωρίζει τουςτύπους των παικτών (ούτε του εαυτού του δηλαδή).Στην αρχή του παιχνιδιού η «φύση» αποφασίζει για τον τύποκάθε παίκτη, έστω (ψj, θi). Κάθε παίκτης µαθαίνει το δικό τουτύπο, όχι όµως του αντιπάλου.

Page 193: Game Theory

193

385

Γενίκευση (2/2)Ο παίκτης 1, αφού «πληροφορηθεί» τον τύπο του ψj, επιλέγειµια στρατηγική που µεγιστοποιεί το αναµενόµενο όφελός του, βάσει της εκτίµησής του για τις πιθανότητες εµφάνισης τωνδιαφόρων τύπων του παίκτη 2.Παρόµοια, ο παίκτης 2, αφού «πληροφορηθεί» τον τύπο του θi, επιλέγει µια στρατηγική που µεγιστοποιεί το αναµενόµενοόφελός του, βάσει της εκτίµησής του για τις πιθανότητεςεµφάνισης των διαφόρων τύπων του παίκτη 1.

ΠΡΟΣΟΧΗ: ∆ιαφορετικοί τύποι του ίδιου παίκτη µπορεί να έχουνδιαφορετικές εκτιµήσεις για τη συχνότητα εµφάνισης των διαφόρωντύπων του άλλου παίκτη, όπως είδαµε στη µάχη των φύλων ΙΙ.Ωστόσο, όλες οι εκτιµήσεις είναι γνωστές και στους δύο παίκτες!

Εάν µπορέσουµε να βρούµε ένα σύνολο στρατηγικών, µία γιακάθε τύπο παίκτη, που να είναι καλύτερες απαντήσεις στιςεπιλογές των αντιπάλων, τότε έχουµε βρει ένα σηµείοισορροπίας Bayes-Nash

386

Εξαρτηµένες πιθανότητες (1/2)Προσοχή χρειάζεται όταν οι διάφορες κατανοµές πιθανοτήτωνείναι εξαρτηµένες µεταξύ τους.Για παράδειγµα, στη µάχη των δύο φύλων ΙΙ, η πιθανότηταεµφάνισης του ενός τύπου συζύγου εξαρτάται από τον τύποτου άλλου συζύγου.

Για παράδειγµα, η πιθανότητα εµφάνισης µιας γυναίκας πουεπιθυµεί κοινή έξοδο εξαρτάται από τον τύπο του άντρα(αισιόδοξος ή απαισιόδοξος).Με δεδοµένο όµως ότι οι δύο παίκτες έχουν κοινή γνώση για τιςπιθανότητες, η ανεξάρτητη πιθανότητα εµφάνισης ενόςαισιόδοξου άντρα, q, τροποποιείται όταν γνωρίζουµε τι τύποςγυναίκας εµφανίστηκε.

Page 194: Game Theory

194

387

Εξαρτηµένες πιθανότητες (2/2)Οι εκ των προτέρων ανεξάρτητες πιθανότητες εµφάνισης τωνδιαφόρων συνδυασµών τύπων παικτών είναι οι παρακάτω:

Μια γυναίκα τύπου 1 λοιπόν (θ1) θεωρεί ότι η εξαρτηµένηπιθανότητα ο άντρας της να είναι αισιόδοξος είναι:

Παρόµοια, ένας αισιόδοξος άντρας θεωρεί ότι η πιθανότητα ηγυναίκα του να επιθυµεί κοινή έξοδο είναι:

(1-q)·(1-ρ2)(1-q)·ρ2ψ2, απαισιόδοξος

q·(1-ρ1)q·ρ1ψ1, αισιόδοξος

θ2

Χώριαθ1

ΜαζίΓυναίκα

Άνδρας

21

1

)1( ρρρ

⋅−+⋅⋅qq

q

111

1

)1(ρ

ρρρ

=−⋅+⋅

⋅qqq

388

Ισορροπίες καθαρών στρατηγικών (1/6)Θα ελέγξουµε τώρα αν και πότε το σηµείο (Γ,Ο,Γ,Ο), ή µεπιθανότητες το σηµείο (λ1=1, λ2=0, µ1=1, µ2=0), αποτελείσηµείο ισορροπίας Bayes-Nash.Εάν ο άνδρας τύπου 1 (αισιόδοξος) επιλέξει Γ, το αναµενόµενοόφελός του είναι:

ρ1·3+(1-ρ1)·0=3·ρ1

Εάν ο άνδρας τύπου 1 επιλέξει Ο, το αναµενόµενο όφελός τουείναι:

ρ1·0+(1-ρ1)·1=1-ρ1

Ο άντρας τύπου 1 επιλέγει λοιπόν Γ ως καλύτερη απάντηση στιςεπιλογές (Γ,Ο) της γυναίκας, όταν 3ρ1≥1-ρ1 ή ρ1≥0.25.

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά µαζί

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

Page 195: Game Theory

195

389

Ισορροπίες καθαρών στρατηγικών (2/6)Εάν ο άνδρας τύπου 2 (απαισιόδοξος) επιλέξει Γ, τοαναµενόµενο όφελός του είναι:

ρ2·3+(1-ρ2)·0=3·ρ2

Εάν ο άνδρας τύπου 2 επιλέξει Ο, το αναµενόµενο όφελός τουείναι:

ρ2·0+(1-ρ2)·1=1-ρ2

Ο άντρας τύπου 2 επιλέγει λοιπόν Ο ως καλύτερη απάντησηστις επιλογές (Γ,Ο) της γυναίκας, όταν 3ρ2≤1-ρ2 ή ρ2≤0.25.

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά µαζί

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

390

Ισορροπίες καθαρών στρατηγικών (3/6)

Για τη γυναίκα τύπου 1, οι πιθανότητες να έχει έναναισιόδοξο και έναν απαισιόδοξο άντρα αντίστοιχα είναι:

Για τη γυναίκα τύπου 2, οι πιθανότητες να έχει έναναισιόδοξο και έναν απαισιόδοξο άντρα αντίστοιχα είναι:

21

111 )1( ρρ

ρ⋅−+⋅

⋅=

qqqq

21

221 )1(

)1(ρρ

ρ⋅−+⋅

⋅−=

qqqq

)1()1()1()1(

21

112 ρρ

ρ−⋅−+−⋅

−⋅=

qqqq

)1()1()1()1()1(

21

222 ρρ

ρ−⋅−+⋅−

−⋅−=

qqqq

Page 196: Game Theory

196

391

Ισορροπίες καθαρών στρατηγικών (4/6)

Εάν η γυναίκα τύπου 1 επιλέξει Γ, το αναµενόµενο όφελόςτης είναι:

q11·1+q21·0=q11

Εάν η γυναίκα τύπου 1 επιλέξει O, το αναµενόµενο όφελόςτης είναι:

q11·0+q21·3=3·q21

Η γυναίκα τύπου 1 επιλέγει λοιπόν Γ ως καλύτερη απάντησηστις επιλογές (Γ,Ο) του άνδρα, όταν q11≥3·q21 ή τελικάq·ρ1≥3·ρ2(1-q).

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά µαζί

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

392

Ισορροπίες καθαρών στρατηγικών (5/6)Τέλος εάν η γυναίκα τύπου 2 επιλέξει Γ, το αναµενόµενοόφελός της είναι:

q12·0+q22·1=q22

Εάν η γυναίκα τύπου 2 επιλέξει O, το αναµενόµενο όφελόςτης είναι:

q12·3+q22·0=3·q12

Η γυναίκα τύπου 2 επιλέγει λοιπόν Ο ως καλύτερηαπάντηση στις επιλογές (Γ,Ο) του άνδρα, όταν q22≤3·q12 ήτελικά 3·q·(1-ρ1)>=(1-q)·(1-ρ2).

1,30,0Όπερα

0,03,1Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά µαζί

1,00,1Όπερα

0,33,0Γήπεδο

ΌπεραΓήπεδοΓ

Α

Γυναίκα προτιµά χώρια

Page 197: Game Theory

197

393

Ισορροπίες καθαρών στρατηγικών (6/6)

Βρήκαµε τελικά ότι για να είναι σηµείο ισορροπίας Bayes-Nash το (Γ,Ο,Γ,Ο) πρέπει να ισχύουν οι ανισότητες:

ρ1≥0.25ρ2≤0.25q·ρ1≥3·ρ2(1-q)3·q·(1-ρ1)>=(1-q)·(1-ρ2)

Για παράδειγµα, για ρ1=0.8, ρ2=0.2, οι δύο τελευταίεςανισότητες γίνονται:

q≥0.43q≥0.58

Άρα, για ρ1=0.8, ρ2=0.2 και q=0.7 το σηµείο (Γ,Ο,Γ,Ο) είναισηµείο ισορροπίας Bayes-Nash.

Για να βρούµε το σύνολο των τιµών (q,ρ1,ρ2) για τις οποίες τοπαραπάνω σηµείο είναι σηµείο ισορροπίας, θα έπρεπε νακάνουµε ένα διάγραµµα στο χώρο.

394

Κυριαρχία στρατηγικών (1/5)Στα παιχνίδια πλήρους πληροφόρησης είδαµε την έννοια τηςκυριαρχίας στρατηγικών. Ειδικότερα:

Εάν υπάρχει κυρίαρχη στρατηγική, ένας παίκτης παίζει πάντααυτή.Εάν υπάρχουν κυριαρχούµενες στρατηγικές, αυτές δενεπιλέγονται πότε από τους παίκτες.

Η έννοια της κυριαρχίας ορίζεται και για τα παιχνίδιαελλιπούς πληροφόρησης.Σε παιχνίδι µε δύο παίκτες, µια στρατηγική s1 κυριαρχείέναντι µιας στρατηγικής s2 ενός παίκτη, εάν για κάθεσυνδυασµό στρατηγικών όλων των τύπων του αντιπάλουτου η s1 δίνει µεγαλύτερο αναµενόµενο όφελος από την s2.

Ανάλογα για παιχνίδια µε περισσότερους από δύο παίκτες.

Page 198: Game Theory

198

395

Κυριαρχία στρατηγικών (2/5)Έστω το παιχνίδι της ∆ιαπραγµάτευσης Ι (ο παίκτης Α είναιπάντα άκαµπτος).

Στο παιχνίδι αυτό ο παίκτης Α δεν γνωρίζει τον τύπο του Β.

Οι στρατηγικές του Α είναι δύο, οι Σ και Μ.Οι στρατηγικές του Β είναι τέσσερις, οι (Σ,Σ), (Σ,Μ), (Μ,Σ) και (Μ,Μ).Η στρατηγική Σ του Α κυριαρχεί έναντι της Μ πάντα. Παρόµοια, η στρατηγική (Σ,Μ) του Β κυριαρχεί έναντι τωνυπολοίπων πάντα.

2,20,3Μ

3,01,1Σ

ΜΣΒ

Α

Άκαµπτος Β

2,30,2Μ

3,11,0Σ

ΜΣΒ

Α

Ήπιος Β

396

Κυριαρχία στρατηγικών (3/5)Στο παιχνίδι της διαπραγµάτευσης ΙΙ, ο παίκτης Α θα ήθελενα ακολουθήσει παρόµοια τακτική µε τον Β (σκληρή ήµετριοπαθή) .

Ο παίκτης Α πρέπει να αποφασίσει ωστόσο τι τακτική θαακολουθήσει πριν βεβαιωθεί για την τακτική του Β.Οι στρατηγικές του Α είναι οι Σ και Μ.Οι στρατηγικές του Β είναι οι (Σ,Σ), (Σ,Μ), (Μ,Σ), (Μ,Μ).

2,20,3Μ

3,01,1Σ

ΜΣΒ

Α

Άκαµπτος Β

3,31,2Μ

2,10,0Σ

ΜΣΒ

Α

Ήπιος Β

Page 199: Game Theory

199

397

Κυριαρχία στρατηγικών (4/5)Θα ελέγξουµε αν και πότε η στρατηγική Σ του Α κυριαρχεί της Μ. Θαπρέπει για κάθε στρατηγική του Β να έχει µεγαλύτερο αναµενόµενοόφελος.

Απέναντι στην (Σ,Σ) του Β, οι στρατηγικές Σ και Μ του Α έχουναναµενόµενο όφελος:

Σ: ρ*1+(1-ρ)*0=ρΜ: ρ*0+(1-ρ)*1=1-ρ

Θα πρέπει ρ≥1-ρ ή ρ≥0.5

Το ίδιο αποτέλεσµα προκύπτει και για τις υπόλοιπες τρεις στρατηγικέςτου Β.Άρα για ρ≥0.5, η Σ κυριαρχεί επί της Μ για τον Α (και αντίστροφα γιαρ<0.5).

Προφανώς κυρίαρχη στρατηγική του Β είναι η (Σ,Μ).

2,20,3Μ

3,01,1Σ

ΜΣΒ

Α

Άκαµπτος Β

3,31,2Μ

2,10,0Σ

ΜΣΒ

Α

Ήπιος Β

398

Κυριαρχία στρατηγικών (5/5)Τέλος, στα παιχνίδια µε ελλιπή πληροφόρηση µπορεί ναεφαρµοστεί και η επαναλαµβανόµενη απαλοιφήκυριαρχούµενων στρατηγικών (Iterated Elimination of Dominated Strategy, IEDS).

Ο παίκτης Α µπορεί να µην έχει αρχικά καµία κυριαρχούµενηστρατηγική, ύστερα όµως από την απαλοιφή κυριαρχούµενωνστρατηγικών του Β µπορεί να αποκτήσει και ο Α.Η διαδικασία αυτή µπορεί να επαναληφθεί για πολλούςκύκλους!

Page 200: Game Theory

200

399

Μελέτη περίπτωσης:∆υοπώλιο Cournot

µε ελλιπή πληροφόρηση

400

Σύνοψη (1/3)Έχουµε δει την περίπτωση του δυοπωλίου Cournot, όπου δυοεταιρείες, 1 και 2, παράγουν ισοδύναµα προϊόντα.

Οι ποσότητες παραγωγής των δύο εταιρειών είναι Q1 και Q2.Η τιµή πώλησης του προϊόντος είναι: P=a-b(Q1+Q2), a>0, b>0.Το κόστος παραγωγής ανά µονάδα προϊόντος είναι κοινό για τιςδύο εταιρείες και ίσο µε c.

Έχουµε δει ότι η συνάρτηση καλύτερης απάντησης τηςεταιρείας i σε παραγωγή Qj της εταιρείας j, όπου i≠j, είναι:

⎪⎪⎩

⎪⎪⎨

−>

−≤

−−

=

bcaQbcaQ

bbQca

QRj

jj

ji

εάν ,0

εάν ,2)(

Page 201: Game Theory

201

401

Σύνοψη (2/3)Το σηµείο ισορροπίας Nash είναι ένα σηµείο (Q1*, Q2*), γιατο οποίο ισχύει:

Q1*=R1(Q2*)Q2*=R2(Q1*)

Έχουµε δείξει ότι στο σηµείο αυτό ισχύουν:

bca

caP

bcaQQ

9)(

32

31

3

2

21

*2

*1

−==

+=

−==

ππ

402

Σύνοψη (3/3)Στο διάγραµµα φαίνονται οι συναρτήσεις καλύτερηςαπάντησης στο ίδιο διάγραµµα. Η τοµή τους είναι το σηµείοισορροπίας.

Page 202: Game Theory

202

403

∆υοπώλιο µε ελλιπή πληροφόρησηΈστω τώρα ότι υπάρχει αβεβαιότητα στην εταιρεία 1 σχετικάµε το κόστος παραγωγής της εταιρείας 2.

Το κόστος παραγωγής της εταιρείας 1 είναι c.Το κόστος παραγωγής της εταιρείας 2 είναι c+ε.

Την ακριβή τιµή του ε τη γνωρίζει µόνο η εταιρεία 2.

Θεωρούµε ότι η απόκλιση ε έχει γνωστή κατανοµή µε µέση τιµήόµως 0: Ε(ε)=0

Θέλουµε να δούµε πώς µεταβάλλονται οι παραγωγές τωνδύο εταιρειών και τα κέρδη τους, ανάλογα µε την τιµή τουε.Επίσης θέλουµε να δούµε αν και πότε συµφέρει την εταιρεία2 να φανερώσει το κόστος παραγωγής της.

404

Ανάλυση (1/3)Για την εταιρεία 2 (µε γνωστό κόστος παραγωγής c+ε) ησυνάρτηση καλύτερης απάντησης βρίσκεται ότι είναι:

Μπορούµε µάλιστα να παρατηρήσουµε ότι ισχύει:

Επίσης παρατηρούµε ότι ΕQ2(ε)=Q2(0), δηλαδή ηαναµενόµενη παραγωγή της εταιρείας 2 ως καλύτερηαπάντηση στην παραγωγή της εταιρείας 1 είναι αυτή που θαήταν αν ε=0.

⎪⎩

⎪⎨

+−>

+−≤

−+−

==

bcaQbcaQ

bbQca

QRQ )( εάν ,0

)( εάν ,2

)(

)()(1

11

122 ε

εε

ε ε

bQRQR

2)()( 1

0212

εε −=

Page 203: Game Theory

203

405

Ανάλυση (2/3)Η εταιρεία 1 δεν γνωρίζει ποια είναι η παραγωγή της εταιρείας2.Εάν η παραγωγή της εταιρείας 2 είναι Q2(ε), τότε το κέρδοςτης εταιρείας 1 για παραγωγή Q1 είναι:

π1(Q1,ε)=[a-b·(Q1+Q2(ε))-c]·Q1

Λόγω της αβεβαιότητας, η εταιρεία 1 επιθυµεί ναµεγιστοποιήσει το αναµενόµενο κέρδος της, το οποίο είναι:

Επ1(Q1,ε)=[a-b·(Q1+ΕQ2(ε))-c]·Q1

Όµως ΕQ2(ε) =Q2(0), άρα το αναµενόµενο κέρδος της 1 είναιαυτό που θα είχε αν το κόστος της 2 ήταν c.Τελικά η καλύτερη απάντηση της 1 είναι:

⎪⎩

⎪⎨

−>

−≤

−−

==

bcaQbcaQ

bbQca

QRQ)0( εάν ,0

)0( εάν ,2

)0(

))((2

22

211 ε

406

Ανάλυση (3/3)Ένα σηµείο ισορροπίας Bayes-Nash, Q1*, Q2*(ε), θα πρέπεινα έχει τις ιδιότητες:

Q1*=R1(Q2*(ε))Q2*(ε)=R2

ε(Q1*)

Μετά από λίγες πράξεις προκύπτει το αποτέλεσµα:

Η τιµή που θα διαµορφωθεί στην αγορά είναι:

Τα κέρδη των δύο εταιρειών είναι:

bbcaQ

bcaQ

23)( ,

3 2*1

εε −−

=−

=

22))0(())(()( **

2*1

*2

*1

* εεεε +=++−=+−= PQQbaQQbaP

)2

)0()(2

()( ,)2

()( *2

**2

*1

**1 b

QcPQcP εεεπεεπ −−−=−+=

Η τιµή για ε=0

Page 204: Game Theory

204

407

ΣυµπεράσµαταΗ παραγωγή της 1 δεν αλλάζει.Για θετικό ε:

Η παραγωγή της 2 µειώνεται.Η τιµή πώλησης αυξάνεται.Τα κέρδη της 1 αυξάνονται.Τα κέρδη της 2 µειώνονται.

Το ακριβώς αντίθετα συµπεράσµατα προκύπτουν γιααρνητικό ε.

408

Λύση µε πλήρη πληροφόρηση (1/2)Τι θα γινόταν εάν η εταιρεία 1 γνώριζε την τιµή του ε;Οι συναρτήσεις καλύτερης απάντησης είναι οι:

Η µόνη διαφορά στις παραπάνω συναρτήσεις (σε σχέση µε τηνπερίπτωση ελλιπούς πληροφόρησης της εταιρείας 1) είναι ότι ηκαλύτερη απάντηση της 1 υπολογίζεται βάσει της πραγµατικήςπαραγωγής Q2(ε) της εταιρείας 2 (και όχι της αναµενόµενης Q2(0).

⎪⎩

⎪⎨

+−>

+−≤

−+−

==

bcaQbcaQ

bbQca

QRQ )( εάν ,0

)( εάν ,2

)(

)()(1

11

122 ε

εε

ε ε

⎪⎩

⎪⎨

−>

−≤

−−

==

bcaQbcaQ

bbQca

QRQ)( εάν ,0

)( εάν ,2

)(

))((2

22

211

ε

εε

ε

Page 205: Game Theory

205

409

Λύση µε πλήρη πληροφόρηση (2/2)Το σηµείο ισορροπίας Nash είναι πλέον το Q1

#(ε), Q2#(ε):

Η τιµή και τα κέρδη των εταιρειών διαµορφώνονται ως:bb

caQbb

caQ32

3)( ,

33)( #

2#

1εεεε −

−=+

−=

)32)(

32()(

)3

)(3

()(

3*

*2

*#2

*1

*#1

bQcP

bQcP

PP

εεεπ

εεεπ

ε

−−−=

+−+=

+=

410

ΣυµπεράσµαταΕάν η εταιρεία 1 γνωρίζει την τιµή του ε, τότε για ε>0:

Η εταιρεία 1 αυξάνει την παραγωγή της.Η εταιρεία 2 µειώνει την παραγωγή της, και µάλισταπερισσότερο από όσο θα την µείωνε αν η 1 δεν γνώριζε τηντιµή του ε.Η τιµή είναι και πάλι αυξηµένη σε σχέση µε την τιµή για ε=0, αλλά λιγότερο από όταν η 1 δεν γνώριζε την τιµή του ε.Τα κέρδη της εταιρείας 1 είναι ελαφρώς αυξηµένα.Τα κέρδη της εταιρείας 2 είναι σαφώς χαµηλότερα.

Άρα, εάν ε>0, δεν συµφέρει στην εταιρεία 2 να φανερώσειτο κόστος παραγωγής της.Ανάλογα (αλλά αντίθετα) συµπεράσµατα προκύπτουν ότανε<0. Μάλιστα, εάν ε<0, συµφέρει την εταιρεία 2 ναφανερώσει το κόστος παραγωγής της στους αντιπάλους.

Συµπέρασµα: Εάν µια εταιρεία δεν φανερώνει το κόστοςπαραγωγής της, µάλλον αυτό είναι µεγάλο!

Page 206: Game Theory

206

411

Σχεδίαση µηχανισµώνMechanism design

412

ΕισαγωγήΗ σχεδίαση µηχανισµών αφορά τη δηµιουργία παιχνιδιώνγια να παίξουν κάποιοι παίκτες µε τέτοιο τρόπο, ώστε ναµεγιστοποιηθεί το όφελος αυτού που σχεδιάζει/διοργανώνειτο παιχνίδι.Οι παίκτες και οι προτιµήσεις τους είναι δεδοµένες.Ο σχεδιαστής καθορίζει τις διαθέσιµες ενέργειες στουςπαίκτες και το αποτέλεσµα τους για κάθε έναν από αυτούς.

ΠΡΟΣΟΧΗ: Οι παίκτες δεν είναι υποχρεωµένοι να παίξουν!

Στο παιχνίδι οι παίκτες θα επιλέξουν ένα σηµείο ισορροπίας.

Page 207: Game Theory

207

413

Παράδειγµα: Το πρόβληµα των κοινώνΗ κυβέρνηση θα µπορούσε να θέσει τους κανόνες χρήσηςτων κοινών πόρων ως εξής:

Εκδοχή 1: Στην αρχή κάθε χρόνου η κυβέρνηση εκχωρεί τοαποκλειστικό δικαίωµα χρήσης του πόρου για έναν χρόνο, στονενδιαφερόµενο που θα κάνει την καλύτερη προσφορά.Εκδοχή 2: Η κυβέρνηση, κατόπιν πλειοδοτικού διαγωνισµού, εκχωρεί το δικαίωµα χρήσης του κοινόχρηστου πόρου γιαπάντα στον ενδιαφερόµενο που θα πλειοδοτήσει.

Ιδιωτικοποίηση

Εκδοχή 3: Η κυβέρνηση επιτρέπει σε κάθε ενδιαφερόµενο ναχρησιµοποιεί τον πόρο, θέτει όµως ένα τέλος χρήσης ανάλογοµε τον βαθµό χρήσης.

Κάθε µία από τις παραπάνω εκδοχές θα έχει ένα διαφορετικόόφελος για την κυβέρνηση, και άρα πρέπει να βρει αυτή πουτην συµφέρει περισσότερο.

414

Παράδειγµα: ∆ηµοπρασία µε έναν παίκτη (1/2)

Έστω ότι ένας οίκος ενδιαφέρεται να πουλήσει έναπανάκριβο έργο τέχνης και υπάρχει µόνο ένας που θαµπορούσε να το αγοράσει.Το πρόβληµα είναι ότι ο οίκος δεν γνωρίζει πόσα χρήµαταθα ήταν διατεθειµένος ο αγοραστής να πληρώσει.Έστω ότι υπάρχουν δύο ενδεχόµενα:

Ο αγοραστής να είναι φανατικός λάτρης της τέχνης και άραείναι διατεθειµένος να πληρώσει ένα µεγάλο ποσό.Ο αγοραστής είναι απλός θαυµαστής και άρα είναιδιατεθειµένος να πληρώσει ένα σηµαντικά µικρότερο ποσό.

Page 208: Game Theory

208

415

Παράδειγµα: ∆ηµοπρασία µε έναν παίκτη (2/2)

Μερικές εκδοχές για το πώς θα µπορούσε να διοργανωθεί ηδηµοπρασία είναι οι εξής:

Εκδοχή 1: Ο οίκος θέτει µια µεγάλη τιµή, που µόνο έναςφανατικός λάτρης θα ήταν διατεθειµένος να τη δεχτεί.Εκδοχή 2: Ο οίκος θέτει µια µικρότερη τιµή, που θα µπορούσενα τη δεχτεί και ένας απλός θαυµαστής.

Όχι όµως και ένας κοινός άνθρωπος...

Εκδοχή 3: Ο οίκος θέτει δύο τιµές, µια µεγάλη και µια µικρή. Ηµεγάλη τιµή εγγυάται ότι ο ενδιαφερόµενος θα πάρει το έργοσίγουρα, ενώ η µικρή επιτρέπει στον οίκο, µε κάποια γνωστήπιθανότητα, να αποσύρει το έργο από τη δηµοπρασία.

416

Παράδειγµα: ∆ηµοπρασία µε πολλούς παίκτεςΈστω ότι ο οίκος θέτει το έργο σε ανοικτή δηµοπρασία.Προφανώς ο οίκος θέλει να πουλήσει το έργο στονενδιαφερόµενο που είναι διατεθειµένος να δώσει το µεγαλύτεροποσό και για όλο το ποσό αυτό.Από την άλλη όµως, κανείς υποψήφιος αγοραστής δεν θέλει νααποκαλύψει το ποσό που είναι διατεθειµένος να πληρώσει, ελπίζοντας να αγοράσει το έργο σε χαµηλότερη τιµή.Μερικές από τις δυνατές εκδοχές είναι οι εξής:

Εκδοχή 1: Οι ενδιαφερόµενοι κάνουν τις προσφορές τους και τοέργο κατοχυρώνεται σε αυτόν που θα υποβάλλει την µεγαλύτερηπροσφορά και για την τιµή αυτή (first-price auction).Εκδοχή 2: Οι ενδιαφερόµενοι κάνουν τις προσφορές τους και τοέργο κατοχυρώνεται σε αυτόν που θα κάνει την µεγαλύτερηπροσφορά, για την τιµή όµως της αµέσως επόµενης προσφοράς(second-price auction).

Page 209: Game Theory

209

417

∆ηµοπρασία µεέναν αγοραστή

418

ΠεριγραφήΘα εξετάσουµε αναλυτικά το παράδειγµα της δηµοπρασίαςµε έναν παίκτη, για τον οποίο δεν είναι γνωστή η αξία πουδίνει στο έργο.Έστω θ η αξία για έναν φανατικό λάτρη και µ η αξία γιαέναν απλό θαυµαστή.

θ>µ>0ΠΡΟΣΟΧΗ: Για απλοποίηση εκφράζουµε την ωφέλεια κάθε παίκτησε χρηµατικά ποσά.

Έστω ρ η πιθανότητα ο αγοραστής να είναι φανατικόςλάτρης.

Θα εξετάσουµε πώς θα έπρεπε ο οίκος να πουλήσει το έργοστον υποψήφιο αγοραστή.

Page 210: Game Theory

210

419

Περίπτωση γνωστού αγοραστήΕάν ο οίκος γνώριζε ότι ο αγοραστής είναι φανατικόςλάτρης, θα έθετε την τιµή πώλησης σε θ.Παρόµοια, εάν ο οίκος γνώριζε ότι ο αγοραστής είναι απλόςθαυµαστής, θα έθετε την τιµή πώλησης σε µ.

Για να είναι σίγουρος ότι ο αγοραστής θα δεχθεί την προσφορά, κανονικά θα έπρεπε να θέσει την τιµή πώλησης ελαφρώς κάτωαπό τις τιµές θ και µ.

Εάν λοιπόν ο οίκος έχει τρόπο να «µαντέψει» τον τύπο τουαγοραστή, το αναµενόµενο κέρδος του (πριν µαντέψει...) είναι:

πmax=ρ·θ+(1-ρ)·µ

Το παραπάνω αναµενόµενο κέρδος είναι το µέγιστο πουµπορεί να πετύχει ο οίκος.

420

Ερώτηση στον αγοραστήΜια «θεωρητική» εκδοχή θα ήταν να ρωτηθεί ο αγοραστήςεάν είναι φανατικός λάτρης ή απλός θαυµαστής.

Ανάλογα µε την απάντησή του η τιµή πώλησης θα τεθεί σε θ ήµ αντίστοιχα.

Ο αγοραστής γνωρίζοντας αυτή τη συνέπεια δεν έχεικανέναν λόγο να οµολογήσει ότι είναι φανατικός λάτρης(εάν είναι), ώστε σε κάθε περίπτωση να πληρώσει µόνο µ.

µ<πmax

Page 211: Game Theory

211

421

Μία τιµήΜια άλλη εκδοχή θα ήταν να τεθεί µία µόνο τιµή.Η µόνη «λογική» τιµή που θα µπορούσε να ελκύσει και τουςδύο παίκτες είναι η µ.

Σε αυτή την περίπτωση, τα έσοδα του οίκου είναι µ, ενώ τοκέρδος του αγοραστή είναι θ-µ ή 0, ανάλογα µε τον τύπο του.

Εάν ο οίκος θέσει σταθερή τιµή µεγαλύτερη από µ, τότεαυτή θα πρέπει να είναι θ.

Σε αυτή την περίπτωση, µόνο ο φανατικός λάτρης θα αγοράσειτο έργο, µε αναµενόµενα έσοδα για τον οίκο ρ·θ ( <πmax).

422

Συνδυασµός τιµών (1/2)Ο οίκος µπορεί να προτείνει δύο τιµές, µια υψηλή p (p≤θ) στην οποία η συναλλαγή είναι εξασφαλισµένη, και µιαχαµηλή q (q<p, q≤µ), στην οποία η πιθανότητα ναπραγµατοποιηθεί η συναλλαγή είναι Q.Ένας φανατικός λάτρης θα επιλέξει τη βέβαιη επιλογή, εάνισχύει:

(θ-p)≥Q(θ-q) ή ισοδύναµα:

Παρόµοια, ένας απλός θαυµαστής θα επέλεγε την αβέβαιηπερίπτωση εάν:

Q(µ-q)≥µ-p ή ισοδύναµα:

Τελικά, για να επιλέγει ένας φανατικός λάτρης την βέβαιηπερίπτωση και ένας απλός θαυµαστής την αβέβαιη, πρέπει:

QQqp

−−

≥1

θ

QQqp

−−

≤1

µ

µθ ≥−−

≥QQqp

1

Page 212: Game Theory

212

423

Συνδυασµός τιµών (2/2)Η τελευταία ανισότητα ονοµάζεται περιορισµόςσυµβατότητας κινήτρων (incentive-compatibility constraint).

Κάθε παίκτης επιλέγει την επιλογή που «σχεδιάστηκε» γιααυτόν.

Φυσικά πρέπει να ισχύουν και οι ανισότητες:θ≥p, µ≥qΟι παραπάνω ανισότητες ονοµάζονται περιορισµοί ατοµικήςορθολογικότητας (individual-rationality constraint).

Εάν ισχύουν όλοι οι παραπάνω περιορισµοί, τότε τααναµενόµενα έσοδα του οίκου είναι:

Επ=ρ·p+(1-ρ)·Q·q

Το πρόβληµα σχεδίασης µηχανισµού αναδιατυπώνεται πλέονως εξής:

Βρείτε τα p, q και Q τα οποία πληρούν τους παραπάνωπεριορισµούς και µεγιστοποιούν τα αναµενόµενα έσοδα τουοίκου.

424

Ανάλυση (1/3)Από τον περιορισµό και µετά από λίγες πράξειςπροκύπτει ότι θ>p.

Πράγµατι:

οπότε µε δεδοµένο ότι θ>q, άρα –θQ<-qQ προκύπτει ότι θ>p.

Άρα ο περιορισµός αυτός αρκεί για να ικανοποιήσουµε καιτον περιορισµό της ατοµικής ορθολογικότητας για τηνπερίπτωση του φανατικού λάτρη.Με δεδοµένο ότι όσο αυξάνει το p αυξάνει και η ποσότηταµπορούµε να αυξήσουµε το p έως ότου συµβεί:

Έτσι µεγιστοποιούµε τα κέρδη, χωρίς να διακινδυνεύουµε νααποσυρθεί ο φανατικός λάτρης της τέχνης!

QQqp

−−

≥1

θ

qQpQQQqp

⋅−≥⋅−⇒−−

≥ θθθ1

QQqp

−−

1

QQqp

−−

=1

θ

Page 213: Game Theory

213

425

Ανάλυση (2/3)Από την άλλη, είναι εύκολο να δούµε ότι η χαµηλή τιµή q µπορεί να αυξηθεί µέχρι την τιµή µ, χωρίς να παραβιάζεικανέναν περιορισµό.

Πράγµατι, αν µ=q τότε ο περιορισµός

εκφυλίζεται στον p>µ που προφανώς ισχύει.

Τέλος από τις σχέσεις q=µ και προκύπτει:

µ≥−−QQqp

1

QQqp

−−

=1

θ

θµ )1( QQp −+=

426

Ανάλυση (3/3)Αντικαθιστώντας στην σχέση που µας δίνει το αναµενόµενοκέρδος του οίκου:

Επ=ρ·p+(1-ρ)·Q·q

βρίσκουµε:Επ=Qµ+(1-Q)ρθ

Στην παραπάνω σχέση η µόνη παράµετρος είναι η Q, ενώόλοι οι περιορισµοί ικανοποιούνται.Η παραπάνω σχέση είναι γραµµική, άρα δεν έχει ακρότατο!Ωστόσο, µε δεδοµένο ότι 0≤Q≤1, µπορούµε να βρούµεακρότατα για Q=0 και για Q=1 :

Εάν µ<ρθ, τότε το µέγιστο είναι για Q=0. Σε αυτή τηνπερίπτωση ουσιαστικά ο οίκος αρνείται να πουλήσει στον απλόθαυµαστή (και άρα p=θ).Εάν µ>ρθ, τότε το µέγιστο είναι για Q=1. Σε αυτή τηνπερίπτωση ο οίκος πουλά και στους δύο, στην τιµή p=q=µ.

Page 214: Game Theory

214

427

ΣυµπεράσµαταΕίδαµε τελικά ότι τα κέρδη του οίκου µεγιστοποιούνται ότανδεν υπάρχει αβεβαιότητα (Q=0 ή Q=1).Άρα ο µηχανισµός που σχεδιάσαµε αποδείχθηκε ισοδύναµοςενός µηχανισµού µε σταθερή τιµή, είτε θ ή µ, ανάλογα µε τησχέση των ποσοτήτων µ και ρθ.

Ο µηχανισµός συνδυασµού δύο τιµών, εφόσον αυτέςπληρούν τους δύο περιορισµούς, έχει και µια ακόµηιδιότητα:

Οι παίκτες δεν έχουν πλέον λόγο να κρύβουν τον τύπο τους.Μπορούν να τον ανακοινώσουν στον οίκο και βάσει του τύπουτους να επιλέξουν µια από τις δύο επιλογές.

Ένας τέτοιες µηχανισµός, που έχει ξεχωριστές επιλογέςειδικά σχεδιασµένες για διαφορετικούς τύπους παικτών, ονοµάζεται µηχανισµός άµεσης αποκάλυψης.

direct revelation mechanism

428

Αρχή της αποκάλυψηςRevelation principle

Page 215: Game Theory

215

429

Παιχνίδια ενός παίκτη (1/3)Έστω ότι έχουµε έναν µόνο παίκτη µε δύο τύπους, θ και µ.

Έστω ρ η πιθανότητα να είναι τύπου θ.Ένας µηχανισµός είναι ένα σύνολο κανόνων (το παιχνίδι) που καθορίζει ποιες ενέργειες µπορεί να εκτελέσει οπαίκτης.Αυτό το οποίο είναι δεδοµένο εξαρχής είναι η συνάρτησηαπολαβής του παίκτη, η οποία καθορίζει το όφελός τουανάλογα µε τον τύπο του και τη στρατηγική που επιλέγει.

Για παράδειγµα, µε π(s,θ) συµβολίζουµε το όφελος του παίκτηεάν ο τύπος του είναι θ και επιλέξει τη στρατηγική s.

Έστω ότι για ένα συγκεκριµένο µηχανισµό υπάρχουν µιαστρατηγική sθ για τον τύπο θ του παίκτη και µια στρατηγικήsµ για τον τύπο µ του παίκτη, έτσι ώστε:

π(sθ,θ) ≥ π(s,θ) για κάθε sπ(sµ,µ) ≥ π(s,µ) για κάθε s

Το σύνολο στρατηγικών sθ, sµ ονοµάζεται συµβατό µε τακίνητρα (incentive compatible).

430

Παιχνίδια ενός παίκτη (2/3)Με άλλα λόγια, οι στρατηγικές sθ και sµ είναι κυρίαρχες γιατους αντίστοιχους τύπους παίκτη.Επειδή ωστόσο κανείς παίκτης δεν µπορεί να εξαναγκαστείνα παίξει ένα παιχνίδι, για τις στρατηγικές αυτές θα πρέπειεπίσης να ισχύει:

π(sθ,θ) ≥ π0

π(sµ,µ) ≥ π0όπου π0 το όφελος από το να µην συµµετάσχει καθόλου οπαίκτης στο παιχνίδι.

Οι τελευταίες ανισότητες ονοµάζονται περιορισµοί ατοµικήςορθολογικότητας (individual-rationality constraints).Ο σχεδιαστής µηχανισµών λοιπόν πρέπει να βρει ένανµηχανισµό που να διαθέτει συµβατό µε τα κίνητρα σύνολοστρατηγικών και να πληρεί τους περιορισµούς ατοµικήςορθολογικότητας, τέτοιο ώστε να µεγιστοποιείται τοαναµενόµενο όφελος του σχεδιαστή.

Page 216: Game Theory

216

431

Παιχνίδια ενός παίκτη (3/3)Στη σχεδίαση µηχανισµών για παιχνίδια ενός παίκτηαποδεικνύεται το εξής:

Για οποιοδήποτε µηχανισµό και µια ανάθεση στρατηγικών γιατους διάφορους τύπους του παίκτη η οποία είναι συµβατή µε τακίνητρα και ατοµικά ορθολογική, µπορεί να κατασκευαστεί έναςµηχανισµός που βασίζεται απλά στην αποκάλυψη εκ µέρους τουπαίκτη του τύπου του και ο οποίος παράγει την ίδια ακριβώςαντιστοίχηση όταν οι παίκτες λένε την αλήθεια. Έτσι ο σχεδιαστής µηχανισµών µπορεί να ασχοληθεί µόνο µεµηχανισµούς άµεσης αποκάλυψης.

Η παραπάνω αρχή ονοµάζεται αρχή της αποκάλυψης γιαπαιχνίδια ενός παίκτη (revelation principle Ι).

432

Παιχνίδια µε πολλούς παίκτες (1/2)Έστω ότι έχουµε δύο παίκτες, κάθε ένας από τους οποίουςµπορεί να είναι τύπου θ ή τύπου µ.

Έστω ρ η πιθανότητα για κάθε παίκτη να είναι τύπου θ.

Έστω ένα σύνολο στρατηγικών (s1θ,s1µ,s2θ,s2µ) το οποίοαποτελεί σηµείο ισορροπίας Bayes-Nash, δηλαδή:

Η στρατηγική s1θ µεγιστοποιεί το αναµενόµενο όφελος τουπαίκτη 1 τύπου θ, εάν ο αντίπαλος επιλέγει, ανάλογα µε τοντύπο του, s2θ και s2µ αντίστοιχα. Παρόµοια ισχύουν για τις s1µ, s2θ και s2µ.

Έστω λοιπόν ο παρακάτω µηχανισµός άµεσης αποκάλυψης:Κάθε παίκτης φανερώνει τον τύπο του (πριν µάθει τον τύπο τουαντιπάλου) και το παιχνίδι οδηγείται στην αντίστοιχη ισορροπία.Είναι φανερό ότι στον παραπάνω µηχανισµό άµεσηςαποκάλυψης, κανείς παίκτης δεν έχει λόγο να πει ψέµατα!

Page 217: Game Theory

217

433

Παιχνίδια µε πολλούς παίκτες (2/2)Ισχύει λοιπόν το εξής:

Για οποιοδήποτε µηχανισµό και για οποιοδήποτε σηµείοισορροπίας Bayes-Nash αυτού του µηχανισµού, µπορεί νακατασκευαστεί ένας µηχανισµός άµεσης αποκάλυψης ο οποίοςπαράγει την βέλτιστη αντιστοίχηση ενεργειών για τους παίκτεςόταν αυτοί λένε την αλήθεια. Έτσι ο σχεδιαστής µηχανισµών µπορεί να ασχοληθεί µόνο µεµηχανισµούς άµεσης αποκάλυψης.

Η παραπάνω αρχή ονοµάζεται αρχή της αποκάλυψης γιαπαιχνίδια πολλών παικτών (revelation principle ΙΙ).

434

Παράδειγµα:Πώληση µεταβλητής ποσότητας (1/8)

Έστω ότι µια εταιρεία µπορεί να πουλά µεταβλητέςποσότητες ενός προϊόντος σε υποψήφιους αγοραστές.

Για παράδειγµα, δηµοπρασίες οµολόγων

Έστω ότι υπάρχουν δύο τύποι αγοραστών, A και B.Μια ποσότητα Q έχει αξία για τον τύπο A ίση µε 2·(10·Q-Q2).Η ίδια ποσότητα έχει αξία για τον τύπο B ίση µε (10·Q-Q2).

Το κόστος παραγωγής ανά µονάδα για την εταιρεία είναι 2.Έστω ρ η πιθανότητα ένας αγοραστής να είναι τύπου A.

Άρα η πιθανότητα να είναι τύπου B είναι 1-ρ.

Η εταιρεία πρέπει να βρει ποια ποσότητα θα πουλήσει σεκάθε αγοραστή και σε ποια τιµή.

Page 218: Game Theory

218

435

Παράδειγµα:Πώληση µεταβλητής ποσότητας (2/8)

Έστω ότι η εταιρεία γνωρίζει τον τύπο του αγοραστή.Εάν αυτός είναι A, τότε η εταιρεία θα πουλήσει το προϊόνστην µέγιστη δυνατή τιµή, η οποία είναι 2·(10·Q-Q2)Το κέρδος της εταιρείας σε αυτή την περίπτωση είναι:

2·(10·Q-Q2)-2Q

Το κέρδος µεγιστοποιείται για Q=4.5. Για την ποσότητα αυτήη τιµή πώλησης (για το σύνολο της ποσότητας) είναιPA=49.5 και το κέρδος 40.5.

Εκτελώντας παρόµοιους υπολογισµούς για την περίπτωσηενός γνωστού παίκτη τύπου Β βρίσκουµε ότι:

Η εταιρεία θα πουλήσει ποσότητα q=4 στην τιµή PB=24 µεκέρδος για την εταιρεία 16.

436

Παράδειγµα:Πώληση µεταβλητής ποσότητας (3/8)

Η εταιρεία θα µπορούσε να αντιµετωπίσει όλους τουςαγοραστές σαν να ήταν τύπου Β, θέτοντας Q=q=4 καιP=PB=24.

Το κέρδος της εταιρείας ανά αγοραστή θα είναι 16.

Μια άλλη επιλογή είναι η εταιρεία να αγνοήσει τουςαγοραστές τύπου Β και να θεωρήσει ότι όλοι οι αγοραστέςείναι τύπου Α, θέτοντας ως µόνη επιλογή την Q=4.5 καιP=PA=49.5.

Το αναµενόµενο κέρδος της εταιρείας σε αυτή την περίπτωσηείναι ρ·40.5.

Θα προσπαθήσουµε να βρούµε µια ενδιάµεση κατάσταση, όπου η εταιρεία να πουλά και στους δύο τύπους αγοραστών.

Page 219: Game Theory

219

437

Παράδειγµα:Πώληση µεταβλητής ποσότητας (4/8)

Με βάση την αρχή της αποκάλυψης, γνωρίζουµε ότιµπορούµε να αναζητήσουµε µόνο µηχανισµούς άµεσηςαποκάλυψης όπου:

Ο παίκτης θα δηλώνει τον τύπο του.Εάν ο τύπος του είναι Α, θα παίρνει ποσότητα Q στην τιµή Μ.Εάν ο τύπος του είναι Β, θα παίρνει ποσότητα q στην τιµή m.Προφανώς Q>q και M>m.

Οι περιορισµοί συµβατότητας κινήτρων µας λένε ότι:2·(10·Q-Q2)-M≥2·(10·q-q2)-m(10·q-q2)-m≥(10·Q-Q2)-M

Οι περιορισµοί ατοµικής ορθολογικότητας µας λένε ότι:2·(10·Q-Q2)-M≥0(10·q-q2)-m≥0

438

Παράδειγµα:Πώληση µεταβλητής ποσότητας (5/8)

Το αναµενόµενο κέρδος της εταιρείας είναι:ρ·(Μ-2·Q)+(1-ρ)·(m-2·q)

Από τους δύο περιορισµούς ατοµικής ορθολογικότητας:2·(10·Q-Q2)-M≥0(10·q-q2)-m≥0

τουλάχιστον σε έναν πρέπει να ισχύει η ισότητα. Πράγµατι, αν και για τους δύο ισχύει το >0, τότε µπορούµενα αυξήσουµε λίγο το m και λίγο το Μ, προσέχοντας να µηνπαραβιάσουµε τους περιορισµούς συµβατότητας κινήτρων, αυξάνοντας έτσι τα αναµενόµενα κέρδη της εταιρείας.Με δεδοµένο ότι:

2·(10·Q-Q2)-M ≥ 2·(10·q-q2)-m ≥ (10·q-q2)-m

είναι φανερό ότι τελικά πρέπει να ισχύει:(10·q-q2)-m=0

Page 220: Game Theory

220

439

Παράδειγµα:Πώληση µεταβλητής ποσότητας (6/8)

Επίσης, µπορούµε να δούµε ότι ο πρώτος περιορισµόςσυµβατότητας κινήτρων:

2·(10·Q-Q2)-M≥2·(10·q-q2)-m

πρέπει να ισχύει µε ισότητα.Αν δεν ισχύει η ισότητα, τότε η εταιρεία µπορεί να αυξήσειτο Μ, αυξάνοντας τα κέρδη της, χωρίς να κινδυνεύει νααλλάξει ο παίκτης τύπου Α την επιλογή του. Άρα:

2·(10·Q-Q2)-M=2·(10·q-q2)-m

Αντικαθιστώντας, βάσει των δύο εξισώσεων που βρήκαµε, τα Μ και m στο αναµενόµενο κέρδος της εταιρείας, αυτόγίνεται:

ρ·(18·Q-2·Q2)+(1-2·ρ)·(10·q-q2)-(1-ρ)·2·q

440

Παράδειγµα:Πώληση µεταβλητής ποσότητας (7/8)

Από τη µορφή που έχει η σχέση για το αναµενόµενο κέρδος, παρατηρούµε ότι αυτό µπορεί να µεγιστοποιηθεί ξεχωριστάγια Q και ξεχωριστά για q.Βρίσκουµε λοιπόν ότι αυτό µεγιστοποιείται για:

Q=4.5q=(4-9ρ)/(1-2ρ)Προφανώς, επειδή πρέπει να ισχύει q≥0, για τιµές του ρ>4/9 θεωρούµε ότι q=0.

Page 221: Game Theory

221

441

Παράδειγµα:Πώληση µεταβλητής ποσότητας (8/8)

Από τις εξισώσεις που βρήκαµε νωρίτερα προκύπτουν και οιτιµές πώλησης του προϊόντος. Ειδικότερα:Για ρ<=4/9, η εταιρεία πουλά και στους δύο τύπους πελάτη.

Στους πελάτες τύπου Β πουλά ποσότητα q=(4-9ρ)/(1-2ρ) στηντιµή m=10q-q2 (ακριβώς όσο είναι η αξία αυτής ποσότητας γιατους πελάτες τύπου Β)Στους πελάτες τύπου Α πουλά ποσότητα Q=4.5 σε τιµή όµωςµικρότερη από την αξία αυτής της ποσότητας για τους πελάτεςτύπου Α.

Για ρ>4/9 η εταιρεία πουλά µόνο στους πελάτες τύπου Αποσότητα Q=4.5. Μάλιστα σε αυτή την περίπτωση η τιµήπώλησης είναι ίση µε την αξία της ποσότητας για τουςπελάτες τύπου Α.

442

ΠαρατηρήσειςΤα αποτελέσµατα είναι λογικά. Πράγµατι:

Όταν υπάρχει η επιλογή Β, ο πελάτης τύπου Α δεν έχει λόγο ναπληρώσει για ποσότητα Q τη µέγιστη τιµή, µιας και σε αυτή τηνπερίπτωση το αναµενόµενο όφελός του είναι µηδέν, ενώ ανεπιλέξει την µικρότερη ποσότητα µε το µικρότερο όµως κόστοςθα έχει κάποιο αναµενόµενο θετικό όφελος.Όταν δεν υπάρχει η επιλογή Β, ο πελάτης Α το µόνο πουµπορεί να κάνει είναι να αγοράσει στη µέγιστη για αυτόν τιµή.

Γενικά, όσο µικρότερη είναι η ποσότητα q, τόσο η τιµή για τονΑ πλησιάζει στη µέγιστη για αυτόν.

Πραγµατικό παράδειγµα: Οι τιµές των επιχειρήσεων σεκανονική περίοδο και σε περίοδο εκπτώσεων. Ένας παίκτηςτύπου Β πρέπει να περιµένει µέχρι τις εκπτώσεις, µε κίνδυνοµάλιστα να µην βρει το προϊόν που θέλει.

Page 222: Game Theory

222

443

∆ηµοπρασίεςAuctions

444

Γενικά (1/2)Υπάρχουν δηµοπρασίες για σχεδόν κάθε είδος αγαθού πουµπορεί να πουληθεί.

Έργα τέχνης (Sotheby’s, Christie’s) ∆ηµοπρασίες κατασχεµένων αυτοκινήτων, σπιτιών κ.λ.π.∆ηµοπρασίες για δηµόσια έργα∆ηµοπρασίες για εισιτήρια σε αγώνες, παραστάσεις, αεροπορικάεισιτήρια κλπ∆ηµοπρασίες οµολόγων

Μια τυπική δηµοπρασία χαρακτηρίζεται από έναν πωλητή καιπολλούς υποψήφιους αγοραστές.

Ο αγοραστής δεν γνωρίζει πόσα είναι διατεθειµένος ναπληρώσει κάθε αγοραστής.

Page 223: Game Theory

223

445

Γενικά (2/2)Ο πωλητής µπορεί να πουλά µόνο µια µονάδα (π.χ. ένανπίνακα ζωγραφικής) ή πολλές µονάδες, όπως π.χ. ένασύνολο αεροπορικών εισιτηρίων ή τα δωµάτια ενόςξενοδοχείου.

Υπάρχουν περιπτώσεις δηµοπρασιών όπου ο πωλητής πουλάπολλά διαφορετικά είδη. Η κατάσταση περιπλέκεται περισσότερο εάν οι παίκτες µπορούννα ζητήσουν συνδυασµούς των προϊόντων. Η κατάσταση περιπλέκεται ακόµη περισσότερο εάν οιδηµοπρασίες έχουν διαφορετικό χρονικό ορίζοντα λήξης.

Υπάρχουν πολλά είδη δηµοπρασιών: Τις περισσότερες φορέςαυτός που προσφέρει το µεγαλύτερο ποσό κερδίζει τηδηµοπρασία.Οι διάφορες δηµοπρασίες διαφέρουν κυρίως σε δύοπράγµατα:

Πώς καθορίζεται η καλύτερη προσφορά.Πόσο πρέπει να πληρώσει αυτός που κερδίζει την δηµοπρασία.

446

∆ηµοπρασίες ανερχόµενων προσφορώνΗ πιο κοινή δηµοπρασία είναι η δηµοπρασία ανερχόµενωνπροσφορών (ascending-bid auction).Αυτή ξεκινά από µια χαµηλή τιµή και κάθε παίκτης µπορεί νααυξήσει την τιµή.

Συνήθως υπάρχει ελάχιστο/συγκεκριµένο ποσό/ποσοστόαύξησης.

Η δηµοπρασία τερµατίζει όταν δεν υπάρχει κανείς παίκτηςδιατεθειµένος να αυξήσει την τιµή.Ο παίκτης που έκανε την τελευταία αύξηση κερδίζει τηνδηµοπρασία και πληρώνει το τελικό ποσό.

Sotheby’s, δηµοπρασίες ακινήτων, Travel.com κλπ

Οι δηµοπρασίες αυτές λέγονται και Αγγλικές δηµοπρασίες(English auctions).

Page 224: Game Theory

224

447

∆ηµοπρασίες κατερχόµενων προσφορώνΣτις δηµοπρασίες αυτές ξεκινάµε από µια πολύ υψηλή τιµήκαι προοδευτικά αυτή ελαττώνεται από τον διοργανωτή τηςδηµοπρασίας.Ο πρώτος παίκτης που θα δεχθεί µια τιµή κερδίζει τηδηµοπρασία στην τιµή αυτή.Η δηµοπρασία αυτή ονοµάζεται Ολλανδική δηµοπρασία(Dutch auction).

Ο µηχανισµός αυτός χρησιµοποιείται στη µεγαλύτερηπαγκοσµίως αγορά χονδρικής πώλησης λουλουδιών στοΆµστερνταµ.

448

∆ηµοπρασίες σφραγισµένων προσφορώνΣτις δηµοπρασίες σφραγισµένων προσφορών (sealed auctions) οι συµµετέχοντες αποστέλλουν έναν φάκελο µετην προσφορά τους στον διοργανωτή.Ο παίκτης µε τη µεγαλύτερη προσφορά κερδίζει τηνδηµοπρασία.Υπάρχουν δύο παραλλαγές αυτών των δηµοπρασιών:

Στις δηµοπρασίες πρώτης τιµής (first-price auction) ο παίκτηςπου κέρδισε πληρώνει το ποσό της δικής του προσφοράς.Στις δηµοπρασίες δεύτερης τιµής (second-price auction) οπαίκτης που κέρδισε τη δηµοπρασία αλλά πληρώνει το ποσό τηςδεύτερης µεγαλύτερης προσφοράς.

Υπάρχει µεγάλη οµοιότητα µεταξύ της δηµοπρασίαςανερχόµενης τιµής και της δηµοπρασίας σφραγισµένωνπροσφορών δεύτερης τιµής.Παρόµοια µεταξύ της δηµοπρασίας κατερχόµενης τιµής καιτης δηµοπρασίας σφραγισµένων προσφορών πρώτης τιµής.

Page 225: Game Theory

225

449

ΠαραδοχέςΣτα επόµενα θα θεωρήσουµε την εξής απλή κατάστασηδηµοπρασίας:

Υπάρχει µία µονάδα ενός προϊόντος για πώληση.Υπάρχουν δύο υποψήφιοι αγοραστές, οι Α και Β. Κάθε ένας έχει δύο δυνατούς διαφορετικούς τύπους, τον τύπο1 και τον τύπο 2, µε ίση πιθανότητα εµφάνισης (ρ=½). Το ανώτερο ποσό που είναι διατεθειµένος να δώσει έναςαγοραστής τύπου 1 είναι θ ενώ για έναν αγοραστή τύπου 2 είναι µ, όπου θ>µ.

Εάν το προϊόν πουληθεί στην τιµή p, το όφελος κάθε τύπου παίκτηθα είναι θ-p και µ-p αντίστοιχα.

Ο πωλητής ενδιαφέρεται να µεγιστοποιήσει τα κέρδη του.

450

∆ηµοπρασία δεύτερης τιµής (1/2)Το βασικό χαρακτηριστικό της δηµοπρασίας δεύτερης τιµήςείναι ότι έχει κυρίαρχη στρατηγική:

Κάθε παίκτης προσφέρει το µέγιστο που είναι διατεθειµένος ναπληρώσει.

Κανείς παίκτης δεν έχει λόγο να προσφέρει είτε λίγο λιγότερα, είτελίγο περισσότερα.

Το παραπάνω αποτέλεσµα είναι γενικό, δεν εξαρτάται από τοπλήθος των παικτών, από τους δυνατούς τύπους κάθε παίκτηούτε από τις πιθανότητες εµφάνισής τους.

Page 226: Game Theory

226

451

∆ηµοπρασία δεύτερης τιµής (2/2)Θα εξετάσουµε την πιθανότητα ένας παίκτης να κερδίσει τηδηµοπρασία και το αναµενόµενο ποσό που θα πληρώσει.Έστω ένας παίκτης τύπου 1. Αυτός κερδίζει τη δηµοπρασίασίγουρα αν ο δεύτερος παίκτης είναι τύπου 2, και µε πιθανότητα50% εάν ο δεύτερος παίκτης είναι και αυτός τύπου 1. Άρα ένας παίκτης τύπου 1 κερδίζει τη δηµοπρασία µε πιθανότητα:

½·1 + ½·½=0.75

Το αναµενόµενο ποσό που θα πληρώσει είναι:½·µ + ½·½·θ= ½(µ+θ/2)

Το αναµενόµενο κέρδος είναι:0.75·θ-½(µ+θ/2)=(θ-µ)/2

Παρόµοια, για έναν παίκτη τύπου 2 βρίσκουµε ότι τοαναµενόµενο ποσό που θα πληρώσει είναι µ/4 και τοαναµενόµενο κέρδος του είναι 0.

452

∆ηµοπρασία πρώτης τιµής (1/10)Στις δηµοπρασίες αυτές δεν υπάρχει κυρίαρχη στρατηγική.

Η καλύτερη απάντηση ενός παίκτη εξαρτάται πάντα από τηνεπιλογή του αντιπάλου.

Άρα πρέπει να βρούµε σηµεία ισορροπίας Bayes-Nash.Μιας και πρόκειται για συµµετρικό παιχνίδι, θα ψάξουµεµόνο για συµµετρικά σηµεία ισορροπίας.Έστω p µια στρατηγική για έναν παίκτη τύπου 1 και q µιαστρατηγική για παίκτη τύπου 2.Θα ψάξουµε λοιπόν για ισορροπίες της µορφής (p,q,p,q), όπου:

p είναι η καλύτερη απάντηση του παίκτη Α τύπου 1, εάν οι δύοτύποι του παίκτη Β επιλέξουν αντίστοιχα (p,q). Παρόµοια για τις άλλες τρεις στρατηγικές του παραπάνωσυνδυασµού στρατηγικών.

Page 227: Game Theory

227

453

∆ηµοπρασία πρώτης τιµής (2/10)Είναι φανερό ότι σε µια ισορροπία (p,q,p,q) πρέπει να ισχύειq=µ για τους παίκτες τύπου 2.Εάν ένας παίκτης τύπου 2 προσφέρει τιµή q<µ, θα βγειχαµένος εφόσον ο αντίπαλος προσφέρει τιµή q’ τέτοιαώστε q<q’<µ.

Άρα η ισορροπία θα πρέπει να είναι της µορφής (p,µ,p,µ).

Από την άλλη πλευρά, µπορούµε εύκολα να δούµε για τουςπαίκτες τύπου 1 ότι πρέπει να ισχύει p<θ.

Αν ένας παίκτης τύπου 1 προσφέρει p=θ, το καθαρό όφελόςτου είναι 0. Αντίθετα αν προσφέρει κάτι λιγότερο από θ, κάθεφορά που ο αντίπαλος είναι τύπου 2, ο παίκτης τύπου 1 θα έχεικάποιο θετικό όφελος.

454

∆ηµοπρασία πρώτης τιµής (3/10)Προχωρώντας το συλλογισµό µπορούµε να βρούµε ότι έναςπαίκτης τύπου 1 πρέπει να επιλέξει µια µικτή στρατηγική, και µάλιστα συνεχούς µορφής (κατανοµή πιθανότητας γιαόλες τις τιµές του p εντός κάποιου διαστήµατος).

Αν ένας παίκτης, π.χ. ο Α, επιλέξει συγκεκριµένη τιµή για το p, π.χ. pΑ=p, τότε ο παίκτης Β θα επιλέξει pΒ=p+1, κερδίζονταςπερισσότερα.Τότε όµως ο παίκτης A έχει καλύτερη στρατηγική pΑ’=p+2, κοκ.

Page 228: Game Theory

228

455

∆ηµοπρασία πρώτης τιµής (4/10)Έστω ότι η κοινή για τους παίκτες στρατηγική p είναι ηεξής:

Κάθε παίκτης τύπου 1 επιλέγει µια προσφορά b από έναδιάστηµα [b1,b2].Συµβολίζουµε µε P(bid≤b) τη σωρευτική πιθανότητα ηπροσφορά ενός παίκτη να βρίσκεται στο διάστηµα [b1, b]

Σε τέτοιες κατανοµές πιθανότητας, η πιθανότητα η προσφορά ναπάρει µια συγκεκριµένη τιµή, P(bid=b), µε δεδοµένο ότι το σύνολοτων τιµών είναι άπειρο, είναι πάντα 0.

Το διάστηµα [b1,b2] και τη συνάρτηση P(bid≤b) αποµένει νατα προσδιορίσουµε.

456

∆ηµοπρασία πρώτης τιµής (5/10)Μπορούµε εύκολα να βρούµε ότι το αριστερό άκρο τουδιαστήµατος είναι b1=µ.

Πράγµατι, όταν ένας παίκτης τύπου 1 επιλέξει b=b1, είναισίγουρο ότι η µόνη περίπτωση να κερδίσει τη δηµοπρασία είναιόταν ο αντίπαλός είναι τύπου 2 (µιας και η πιθανότητα οαντίπαλος να είναι τύπου 1 και να επιλέξει και αυτός b=b1 είναιµηδέν).

Μάλιστα, για να µην µοιραστεί τα κέρδη, σε αυτή τηνπερίπτωση το b µπορεί να θεωρηθεί οριακά λίγο πάνω από τοµ, έτσι ώστε ένας παίκτης τύπου 1 που επιλέγει b=b1 νακερδίζει πάντα έναν αντίπαλο παίκτη τύπου 2.Τα αναµενόµενα κέρδη του παίκτη τύπου 1 στην περίπτωσηb=b1=µ είναι λοιπόν:

)(21)1τύπος,( µθµπ −===b

Page 229: Game Theory

229

457

∆ηµοπρασία πρώτης τιµής (6/10)Γνωρίζουµε όµως ότι για να επιλέξει ένας παίκτης τύπου 1 µικτήστρατηγική, θα πρέπει το αναµενόµενο κέρδος του να είναι τοίδιο για οποιαδήποτε καθαρή στρατηγική και αν επέλεγε.Έστω λοιπόν ότι ο παίκτης Α τύπου 1 επιλέγει καθαρήστρατηγική b∈[b1,b2].

Ο παίκτης Β επιλέγει τη µικτή στρατηγική που περιγράψαµε για τοντύπο 1 και q=µ για τον τύπο 2.

Ο Α κερδίζει τη δηµοπρασία όταν:ο Β είναι τύπου 2, µε πιθανότητα ½.ο Β είναι τύπου 1 και η προσφορά που επέλεξε είναι bB<b.

Η πιθανότητα να συµβεί αυτό είναι ½·P(bΒ≤b)

Άρα το αναµενόµενο όφελος του Α σε αυτή την περίπτωσηείναι:

))((21)(

21)1τύπος,( bbbidPbb −≤+−== θθπ

458

∆ηµοπρασία πρώτης τιµής (7/10)Θα πρέπει λοιπόν να ισχύει:

Λύνοντας την τελευταία σχέση ως προς P(bid≤b) βρίσκουµε:

Η µέγιστη τιµή του b, δηλαδή η τιµή b2, θα είναι αυτή για τηνοποία ισχύει P(bid≤b2)=1. Λύνοντας ως προς b2 βρίσκουµε:

)(21))((

21)(

21 µθθθ −=−≤+− bbbidPb

bbbbidP−−

=≤θ

µ)(

22µθ +

=b

Page 230: Game Theory

230

459

∆ηµοπρασία πρώτης τιµής (8/10)Το συµπέρασµα στο οποίο καταλήξαµε είναι το εξής:

Σε δηµοπρασία πρώτης τιµής µε ισοπίθανους παίκτες, υπάρχεισηµείο ισορροπίας Bayes-Nash, όπου ο παίκτης τύπου 2 επιλέγει καθαρή στρατηγική ίση µε µ, ενώ ο παίκτης τύπου 1 επιλέγει συνεχή µικτή στρατηγική στο διάστηµα µεταξύ µ και(θ+µ)/2 µε σωρευτική πιθανότητα P(bid<b)=(b-µ)/(θ-b).

Το παραπάνω σηµείο ισορροπίας Bayes-Nash είναι και τοµοναδικό.

Στις δύο επόµενες διαφάνειες φαίνονται οι γραφικέςπαραστάσεις των συναρτήσεων P(bid<b) και p(bid=b) γιατυπικές τιµές µ=10 και θ=20.

460

∆ηµοπρασία πρώτης τιµής (9/10)Σωρευτική πιθανότητα η προσφορά να είναι µικρότερη απόµια τιµή b.

Page 231: Game Theory

231

461

∆ηµοπρασία πρώτης τιµής (10/10)Κατανοµή πιθανότητας p(bid=b).

462

ΠαρατηρήσειςΠαρατηρούµε ότι το αναµενόµενο όφελος για τους δύοτύπους παικτών:

Για τον παίκτη τύπου 1 είναι (θ-µ)/2Για τον παίκτη τύπου 2 είναι 0.

είναι το ίδιο και για τις δύο δηµοπρασίες (πρώτης καιδεύτερης τιµής).Το ίδιο συµβαίνει και µε τις πιθανότητες νίκης.Άρα και τα αναµενόµενα έσοδα του διοργανωτή τηςδηµοπρασίας είναι τα ίδια και στους δύο τύπουςδηµοπρασίας.Για το λόγο αυτό, οι δηµοπρασίες πρώτης και δεύτερης τιµήςχαρακτηρίζονται ως ισοδύναµες ως προς τα έσοδα (revenue equivalent).

Page 232: Game Theory

232

463

Βέλτιστες δηµοπρασίεςOptimal Auctions

464

ΠαραδοχέςΘα προσπαθήσουµε να απαντήσουµε στο ερώτηµα: Ποιαείναι η βέλτιστη απόδοση που µπορεί να πετύχει οδιοργανωτής µιας δηµοπρασίας;

Θα θεωρήσουµε τα ίδια χαρακτηριστικά των 2 παικτών πουείδαµε στις προηγούµενες διαφάνειες.

Θα περιορίσουµε την αναζήτησή µας µόνο σε µηχανισµούςάµεσης αποκάλυψης.Ανάλογα µε τους τύπους των δύο παικτών, ο διοργανωτήςαποφασίζει αν και σε ποιον θα δώσει το αντικείµενο και σεποια τιµή, έτσι ώστε να µεγιστοποιήσει τα αναµενόµεναέσοδά του.

Page 233: Game Theory

233

465

Πιθανότητες (1/2)Συµβολίζουµε µε P(θ,µ) την πιθανότητα να κερδίσει τηδηµοπρασία ο παίκτης Α, όταν αυτός δηλώσει τύπο θ ενώ οπαίκτης Β δηλώσει τύπο µ.

Άρα, σε αυτή την περίπτωση η πιθανότητα να κερδίσει ο παίκτης Βείναι 1-P(θ,µ).

Λόγω συµµετρίας, η ίδια είναι η πιθανότητα να κερδίσει οπαίκτης Α, όταν αυτός δηλώσει µ και ο Β δηλώσει θ:

P(µ,θ)=1-P(θ,µ)

Εάν και οι δύο παίκτες δηλώσουν θ, τότε η πιθανότητα είναι ίδιακαι για τους δύο παίκτες και ίση µε:

P(θ,θ)= ½

Τέλος, εάν και οι δύο παίκτες δηλώσουν µ, η πιθανότητα είναιίδια και για τους δύο παίκτες, αλλά:

P(µ,µ) ≤ ½

466

Πιθανότητες (2/2)Εάν ο παίκτης Α δηλώσει τύπου θ, τότε η πιθανότητα νακερδίσει τη δηµοπρασία είναι:

P(θ) = ½·½ + ½·P(θ,µ) = ½ · ( ½+P(θ,µ) )

Εάν ο παίκτης Α δηλώσει τύπου µ, τότε η πιθανότητα νακερδίσει τη δηµοπρασία είναι:

P(µ) = ½·P(µ,θ) + ½·P(µ,µ) = ½ · ( P(µ,θ) + P(µ,µ) )

Έστω Μ(θ) η αναµενόµενη πληρωµή για έναν παίκτη τύπουθ και Μ(µ) η αναµενόµενη πληρωµή για έναν παίκτη τύπουµ.

ΠΡΟΣΟΧΗ: Οι παραπάνω «πληρωµές» είναι ο σταθµισµένοςµέσος όρος του ποσού που πληρώνει ένας παίκτης στουςτέσσερις συνδυασµούς παικτών που µπορεί να εµφανιστούν.

Άρα το αναµενόµενο κέρδος του οίκου ανά παίκτη είναι:

2)()( µθ MM +

Page 234: Game Theory

234

467

ΠεριορισµοίΓια έναν µηχανισµό άµεσης αποκάλυψης πρέπει να ισχύουνοι εξής περιορισµοί:

Περιορισµοί συµβατότητας κινήτρων:

Περιορισµοί ατοµικής ορθολογικότητας:

)()()()()()()()(θθµµµµµµθθθθ

MPMPMPMP−⋅≥−⋅−⋅≥−⋅

0)()(0)()(≥−⋅≥−⋅

µµµθθθ

MPMP

468

Αναµενόµενο όφελος πωλητήΜε συλλογισµούς όµοιους µε αυτούς που εφαρµόσαµε στοπαράδειγµα πώλησης µεταβλητής ποσότητας (διαφάνειες 79-86) συµπεραίνουµε ότι:

Αντικαθιστώντας στο αναµενόµενο όφελος του πωλητή αυτόγίνεται:

το οποίο, αντικαθιστώντας τα P(θ) και P(µ), γίνεται:

0)()( =−⋅ µµµ MP)()()()( µµθθθθ MPMP −⋅=−⋅

)()]()([2

µµθθθ PPP ⋅+−⋅

82),(

42),(

2θµµµθµµθµθ

−+−

+− PP

Page 235: Game Theory

235

469

Μεγιστοποίηση οφέλουςΗ µεγιστοποίηση της παράστασης:

εξαρτάται από τα P(θ,µ) και P(µ,µ).

Προφανώς, σε κάθε περίπτωση πρέπει να ισχύει P(θ,µ)=1.Επιπλέον, αν 2µ-θ>0 ή ισοδύναµα µ>θ/2, µεγιστοποιείταιγια P(µ,µ)= ½.Αντίθετα, αν 2µ-θ<0 ή ισοδύναµα µ<θ/2, µεγιστοποιείταιγια P(µ,µ)= 0.

82),(

42),(

2θµµµθµµθµθ

−+−

+− PP

470

ΣυµπεράσµαταΕάν λοιπόν µ>θ/2, τότε:

P(θ)=3/4 P(µ)=1/4

Η αναµενόµενη τιµή πώλησης για τους δύο τύπους παίκτη είναι:

Το αναµενόµενο κέρδος του πωλητή ανά παίκτη τελικά γίνεται:

Εάν µ<θ/2, τότε P(µ,µ)=0 και άρα P(µ)=0, άρα Μ(µ)=0. Η αναµενόµενη τιµή πώλησης γίνεται Μ(θ)=3θ/4.Το αναµενόµενο κέρδος του πωλητή ανά παίκτη γίνεται:

4)( µµ =M

42)( µθθ +

=M

4µθ +

83θ

Page 236: Game Theory

236

471

Σύγκριση (1/3)Θα συγκρίνουµε τις δηµοπρασίες πρώτης και δεύτερης τιµής(οι οποίες αποδείχθηκαν ισοδύναµες) µε την βέλτιστηδηµοπρασία.Στις δηµοπρασίες αυτές, το αναµενόµενο ποσό που πληρώνειένας παίκτης τύπου 1 είναι (2µ+θ)/4, ενώ για έναν παίκτητύπου 2 είναι µ/4.Άρα το αναµενόµενο ποσό που πληρώνει γενικά ένας παίκτης, και άρα τα αναµενόµενα έσοδα του πωλητή ανά παίκτη, σεόλες τις περιπτώσεις, είναι:

83 θµ +

472

Σύγκριση (2/3)Στη βέλτιστη δηµοπρασία και ειδικά στην περίπτωση πουµ>θ/2, οι πιθανότητες για τους δύο παίκτες να κερδίσουνείναι:

P(θ)=3/4, P(µ)=1/4

Ακριβώς δηλαδή όπως και στις δηµοπρασίες πρώτης καιδεύτερης τιµής.Το αναµενόµενο όφελος του πωλητή είναι (θ+µ)/4, το οποίοείναι µεγαλύτερο από το (3µ+θ)/8 των µη-βέλτιστωνδηµοπρασιών.

Ειδικότερα, µπορούµε να δούµε ότι και στις τρεις περιπτώσεις τοΜ(µ) ίδιο και ίσο µε µ/4.Η βέλτιστη δηµοπρασία διαφέρει στο ότι χρεώνει περισσότερο τονπαίκτη θ:

Στη βέλτιστη ο παίκτης θ χρεώνεται κατά µέσο όρο (2θ+µ)/4, ενώστις µη βέλτιστες χρεώνεται (θ+2µ)/4.

Page 237: Game Theory

237

473

Σύγκριση (3/3)Θα µπορούσε κανείς να τροποποιήσει τους κανόνες των µη-βέλτιστων δηµοπρασιών προς όφελος του πωλητή.

Για παράδειγµα, στη δηµοπρασία δεύτερης τιµής, θα µπορούσεο κανόνας να είναι ότι σε περίπτωση δύο παικτών τύπου 1 και 2 αντίστοιχα, ο παίκτης τύπου 1 κερδίζει τη δηµοπρασία αλλάπληρώνει (θ+µ)/2 αντί για µ.Με αυτή την τροποποίηση ο παίκτης τύπου 1 εξακολουθεί ναέχει λόγο (αν και οριακό) να συµµετάσχει στην δηµοπρασία καινα πει την αλήθεια!

Στην περίπτωση µ<θ/2, η βέλτιστη δηµοπρασία δεν πουλάποτέ στον παίκτη τύπου 2.

Σε αντίθεση µε τις δηµοπρασίες πρώτης και δεύτερης τιµής.

Το συµπέρασµα είναι ότι οι δηµοπρασίες πρώτης καιδεύτερης τιµής είναι αρκετά δηµοκρατικές!

474

ΠαρατηρήσειςΗ βασική υπόθεση που κάναµε στις προηγούµενεςδιαφάνειες ήταν ότι πωλείται ένα προϊόν.Τα πράγµατα περιπλέκονται όταν πωλούνται πολλές µονάδεςενός προϊόντος ή, ακόµη χειρότερα, διαφορετικώνπροϊόντων.Σε αυτές τις περιπτώσεις οι προσφορές είναι συνδυασµοίπροϊόντων µε αντίστοιχες τιµές.Σε αυτές τις δηµοπρασίες έχει πρόβληµα ακόµη και οπωλητής να αποφασίσει πού τον συµφέρει να πουλήσει ταπροϊόντα του!