ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o...

1

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412)

ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΜΕ ΠΛΗΡΗ ΠΛΗΡΟΦΟΡΗΣΗ

ΜΕΡΟΣ Α

2

o Η πιο απλή αλλά και ταυτόχρονα πιο θεμελιώδης κατηγορία παιγνίων είναι αυτή των

στατικών παιγνίων με πλήρη πληροφόρηση (ΣΠ).

Στατικά: οι παίκτες επιλέγουν ενέργειες μια φορά και ταυτόχρονα.

Πλήρη πληροφόρηση: όλοι οι παίκτες γνωρίζουν όλα τα στοιχεία του παιγνίου και η

πληροφόρηση αυτή είναι κοινή γνώση.

Περιγραφή

• Στρατηγική μορφή παιγνίων

Επίλυση

• Διαδοχική απαλοιφή αυστηρώς κυριαρχούμενων στρατηγικών

• Ισορροπία Nash

Ioannis

Highlight

Ioannis

Highlight

3

o Δυο βασικές σημειώσεις πριν ξεκινήσουμε:

1) Για τα στατικά παίγνια, οι έννοιες ενέργεια και στρατηγική είναι ταυτόσημες,

ενέργεια ≡ στρατηγική

Από εδώ και στο εξής, στην ανάλυση των στατικών παιγνίων θα αναφερόμαστε

αποκλειστικά σε στρατηγική/ες.

(θα επανέλθουμε σε αυτό το θέμα στην ενότητα 6)

2) Σχετικά με τα αποτελέσματα ενός στατικού παιγνίου,

αποτέλεσμα ≡ συνδυασμός στρατηγικών ≡ προφίλ στρατηγικών

Θα χρησιμοποιούμε και τους τρεις παραπάνω όρους.

Ioannis

Highlight

Ioannis

Highlight

4

ΣΤΡΑΤΗΓΙΚΗ ΜΟΡΦΗ ΠΑΙΓΝΙΩΝ

o Η στρατηγική μορφή ενός παιγνίου προσδιορίζει:

- το σύνολο των παικτών, 𝑁 = {1, 2, … , 𝑛}

- τις διαθέσιμες στρατηγικές του κάθε παίκτη, {𝑆1, … , 𝑆𝑛}

- τις αποδόσεις του κάθε παίκτη για κάθε πιθανό αποτέλεσμα, {𝑢1, … , 𝑢𝑛}

o Παράδειγμα

Έστω το σύνολο παικτών, 𝑁 = 1, 2, δηλαδή έχουμε δυο (2) παίκτες, τον παίκτη 1 και

τον παίκτη 2.

To σύνολο των στρατηγικών του παίκτη 1 είναι: 𝑆1 = {𝛢, 𝛣}

To σύνολο των στρατηγικών του παίκτη 2 είναι: 𝑆2 = {𝛤, 𝛥}

Ioannis

Highlight

5

Για να περιγράψουμε τις αποδόσεις των παικτών θα χρησιμοποιήσουμε τον πίνακα

αποδόσεων.

1/2 Γ Δ

Α 2, 0 0, 1

Β 1, 3 1, 1

Παίγνιο 2.1

Γραμμές του πίνακα: στρατηγικές του παίκτη 1

Στήλες του πίνακα: στρατηγικές του παίκτη 2

Κελιά του πίνακα: αποτελέσματα του παιγνίου – κάθε παίκτης έχει από 2 στρατηγικές

άρα έχουμε 4 πιθανά αποτελέσματα (η 4 πιθανούς συνδυασμούς στρατηγικών)

{𝛢, 𝛤}, {𝛢, 𝛥}, {𝛣, 𝛤}, {𝛣, 𝛥}

Ioannis

Highlight

6

Οι αποδόσεις των παικτών για κάθε αποτέλεσμα αναγράφονται στο αντίστοιχο κελί,

όπου σε κάθε κελί ο πρώτος αριθμός (πριν το κόμμα) δείχνει την απόδοση του παίκτη

1 και ο δεύτερος αριθμός (μετά το κόμμα) την απόδοση του παίκτη 2, δηλαδή

• ο παίκτης 1 επιλέγει Α και ο παίκτης 2 επιλέγει Γ, το αποτέλεσμα είναι {𝛢, 𝛤}

και οι αποδόσεις του κάθε παίκτη είναι

𝑢1(𝛢, 𝛤) = 2, 𝑢2(𝛢, 𝛤) = 0

• ο παίκτης 1 επιλέγει Α και ο παίκτης 2 επιλέγει Δ, το αποτέλεσμα είναι {𝛢, 𝛥}

𝑢1(𝛢, 𝛥) = 0, 𝑢2(𝛢, 𝛥) = 1

• ο παίκτης 1 επιλέγει Β και ο παίκτης 2 επιλέγει Γ, το αποτέλεσμα είναι {𝛣, 𝛤}

𝑢1(𝛣, 𝛤) = 1, 𝑢2(𝛣, 𝛤) = 3

• ο παίκτης 1 επιλέγει Β και ο παίκτης 2 επιλέγει Δ, το αποτέλεσμα είναι {𝛣, 𝛥}

𝑢1(𝛣, 𝛥) = 1, 𝑢2(𝛣, 𝛥) = 1

7

ΔΙΑΔΟΧΙΚΗ ΕΞΑΛΕΙΨΗ ΑΥΣΤΗΡΩΣ ΚΥΡΙΑΡΧΟΥΜΕΝΩΝ ΣΤΡΑΤΗΓΙΚΩΝ

o Η πρώτη μέθοδος επίλυσης είναι η διαδοχική εξάλειψη αυστηρώς κυριαρχούμενων

στρατηγικών. Αυτή η μέθοδος βασίζεται στην αρχή:

«οι ορθολογικοί παίκτες δεν παίζουν αυστηρώς κυριαρχούμενες στρατηγικές»

o Αυστηρώς κυριαρχούμενη στρατηγική: μεταξύ δυο στρατηγικών 𝑠1 και 𝑠2 ενός παίκτη,

η 𝑠1 είναι αυστηρά κυριαρχούμενη από την 𝑠2 όταν η απόδοση του παίκτη όταν παίζει

𝑠1 είναι πάντα μικρότερη από την απόδοση όταν παίζει 𝑠2 ανεξάρτητα του τι παίζουν

οι άλλοι παίκτες.

o Ασθενώς κυριαρχούμενη στρατηγική: μεταξύ δυο στρατηγικών 𝑠1 και 𝑠2 ενός παίκτη,

η 𝑠1 είναι ασθενώς κυριαρχούμενη από την 𝑠2 όταν η απόδοση του παίκτη όταν παίζει

𝑠1 είναι μικρότερη ή ίση από την απόδοση όταν παίζει 𝑠2 ανεξάρτητα του τι παίζουν

οι άλλοι παίκτες.

Ioannis

Highlight

8

1/2 Γ Δ

Α 2, − 1, −

Β 1, − 2, −

o Στον αριστερό πίνακα: Για τον παίκτη 1 η στρατηγική Β είναι αυστηρά κυριαρχούμενη

από την στρατηγική Α διότι

- Αν ο 2 παίξει Γ, τότε ο 1 προτιμάει την Α από την Β, (𝟐 > 𝟏)

- Αν ο 2 παίξει Δ, τότε ο 1 πάλι προτιμάει την Α από την Β (𝟏 > 𝟎)

o Στον κεντρικό πίνακα: Για τον παίκτη 1 η στρατηγική Β είναι ασθενώς κυριαρχούμενη

από την στρατηγική Α διότι

- Αν ο 2 παίξει Γ, τότε ο 1 προτιμάει την Α από την Β, (𝟐 > 𝟏)

- Αν ο 2 παίξει Δ, τότε ο 1 είναι αδιάφορος μεταξύ Α και Β, (𝟏 = 𝟏)

o Στον δεξιό πίνακα: Υπάρχει αυστηρώς ή ασθενώς κυριαρχούμενη στρατηγική?

1/2 Γ Δ

Α 2, − 1, −

Β 1, − 0, −

1/2 Γ Δ

Α 2, − 1, −

Β 1, − 1, −

9

1/2 Δ Ε

Α 2, − 3, −

Β 1, − 1, −

Γ 1, − 1, −

o Στον αριστερό πίνακα: και η στρατηγική Β αλλά και η στρατηγική Γ είναι αυστηρώς

κυριαρχούμενες από την στρατηγική Α. Με άλλα λόγια, η στρατηγική Α κυριαρχεί

αυστηρώς και επί της Β και επί της Γ, οπότε σε αυτή την περίπτωση, μπορούμε να

πούμε ότι η στρατηγική Α είναι αυστηρά κυρίαρχη στρατηγική.

o Στον δεξιό πίνακα: η στρατηγική Γ είναι αυστηρώς κυριαρχούμενη τόσο από την Α

όσο και από την Β. Η στρατηγική Α κυριαρχεί αυστηρώς επί της Γ, αλλά δεν είναι

κυρίαρχη στρατηγική γιατί δεν κυριαρχεί επί της Β. Επίσης, η στρατηγική Β κυριαρχεί

αυστηρώς επί της Γ, αλλά δεν είναι κυρίαρχη στρατηγική γιατί δεν κυριαρχεί επί της

Α.

1/2 Δ Ε

Α 2, − 1, −

Β 1, − 2, −

Γ 0, − 0, −

10

o Πως λειτουργεί η διαδικασία της διαδοχικής εξάλειψης αυστηρώς κυριαρχούμενων

στρατηγικών? Όπως ήδη έχει αναφερθεί, η μέθοδος αυτή βασίζεται στην αρχή ότι οι

ορθολογικοί παίκτες δεν παίζουν αυστηρώς κυριαρχούμενες στρατηγικές.

o Βασική υπόθεση: υπάρχει κοινή γνώση ορθολογικότητας – όλοι οι παίκτες γνωρίζουν

ότι όλοι οι παίκτες γνωρίζουν ότι είναι ορθολογικοί, επιπλέον όλοι γνωρίζουν ότι όλοι

γνωρίζουν ότι όλοι γνωρίζουν, κ.ο.κ. στο άπειρο…

o Θεωρούμε το παρακάτω παίγνιο.

1/2 Α Μ Δ

Π 1, 0 1, 2 0, 1 Κ 0, 3 0, 1 2, 0

Παίγνιο 2.2

Ioannis

Highlight

11

o 1ο βήμα: Παρατηρούμε ότι η στρατηγική Δ του παίκτη 2 είναι αυστηρά κυριαρχούμενη

από την στρατηγική Μ.

1/2 Α Μ Δ

Π 1, 0 1, 2 0, 1 Κ 0, 3 0, 1 2, 0

Αυτό συμβαίνει διότι

𝑢2(𝛱, 𝛭) = 𝟐 > 𝟏 = 𝑢2(𝛱, 𝛥)

𝑢2(𝛫, 𝛭) = 𝟏 > 𝟎 = 𝑢2(𝛫, 𝛥)

Ο παίκτης 2 είναι ορθολογικός (δεν παίζει αυστηρώς κυριαρχούμενες στρατηγικές).

Επιπλέον, ο παίκτης 1 γνωρίζει ότι ο παίκτης 2 είναι ορθολογικός άρα μπορούμε να

διαγράψουμε την στρατηγική Δ, και το παίγνιο μειώνεται στο:

12

1/2 Α Μ

Π 1, 0 1, 2

Κ 0, 3 0, 1

Παίγνιο 2.2(α)

o 2ο βήμα: Παρατηρούμε ότι η στρατηγική Κ του παίκτη 1 είναι αυστηρά κυριαρχούμενη

από την στρατηγική Π.

1/2 Α Μ

Π 1, 0 1, 2

Κ 0, 3 0, 1


𝑢1(𝛱, 𝛢) = 𝟏 > 𝟎 = 𝑢1(𝛫, 𝛢)

𝑢1(𝛱, 𝛭) = 𝟏 > 𝟎 = 𝑢1(𝛫, 𝛭)

13

Ο παίκτης 2 είναι ορθολογικός. Επιπλέον, ο παίκτης 1 γνωρίζει ότι ο παίκτης 2 είναι

ορθολογικός. Ο παίκτης 1 είναι ορθολογικός. Επιπλέον, ο παίκτης 2 γνωρίζει ότι ο

παίκτης 1 είναι ορθολογικός. Επιπλέον, ο παίκτης 2 γνωρίζει ότι ο παίκτης 1 γνωρίζει

ότι ο παίκτης 2 είναι ορθολογικός, άρα μπορούμε να διαγράψουμε την στρατηγική Κ,

και το παίγνιο μειώνεται στο:

1/2 Α Μ

Π 1, 0 1, 2

Παίγνιο 2.2(β)

o 3ο βήμα: Παρατηρούμε ότι η στρατηγική Α του παίκτη 2 είναι αυστηρά κυριαρχούμενη

από την στρατηγική Μ.

14

1/2 Α Μ

Π 1, 0 1, 2


𝑢2(𝛱, 𝛢) = 𝟎 < 𝟐 = 𝑢2(𝛱, 𝛭)

Άρα οι μοναδικές στρατηγικές οι οποίες επιβιώνουν από την ΔΕΑΚΣ είναι οι Π και Μ

Το τελικό αποτέλεσμα του παιγνίου θα είναι το {𝜫, 𝜧}

15

Δυο βασικές παρατηρήσεις

1. Η υπόθεση της κοινής γνώσης της ορθολογικότητας είναι πολύ σημαντική αλλά και

ομολογουμένως πολύ «απαιτητική».

Θεωρούμε το παρακάτω παίγνιο.

1/2 Α Δ

Π 8, 10 −100, 9

Κ 7, 6 6, 5

Παίγνιο 2.3

Τι προβλέπει η διαδικασία της ΔΕΑΚΣ ως τελικό αποτέλεσμα?

Ioannis

Highlight

Ioannis

Highlight

16

1ο βήμα: Παρατηρούμε ότι η στρατηγική Δ του παίκτη 2 είναι αυστηρά κυριαρχούμενη

από την στρατηγική Α.

1/2 Α Δ

Π 8, 10 −100, 9

Κ 7, 6 6, 5


𝑢2(𝛱, 𝛢) = 𝟏𝟎 > 𝟗 = 𝑢2(𝛱, 𝛥)

𝑢2(𝛫, 𝛢) = 𝟔 > 𝟓 = 𝑢2(𝛫, 𝛥)

Ο παίκτης 2 είναι ορθολογικός (δεν παίζει αυστηρώς κυριαρχούμενες στρατηγικές).

Επιπλέον, ο παίκτης 1 γνωρίζει ότι ο παίκτης 2 είναι ορθολογικός άρα μπορούμε να

διαγράψουμε την στρατηγική Δ, και το παίγνιο μειώνεται στο:

17

1/2 Α

Π 8, 10

Κ 7, 6

Παίγνιο 2.3(α)

2ο βήμα: Παρατηρούμε ότι η στρατηγική Κ του παίκτη 1 είναι αυστηρά κυριαρχούμενη

από την στρατηγική Π.

1/2 Α

Π 8, 10

Κ 7, 6


𝑢1(𝛱, 𝛢) = 𝟖 > 𝟕 = 𝑢1(𝛫, 𝛢)

18

Ο παίκτης 2 είναι ορθολογικός. Επιπλέον, ο παίκτης 1 γνωρίζει ότι ο παίκτης 2 είναι

ορθολογικός. Ο παίκτης 1 είναι ορθολογικός. Επιπλέον, ο παίκτης 2 γνωρίζει ότι ο

παίκτης 1 είναι ορθολογικός. Επιπλέον, ο παίκτης 2 γνωρίζει ότι ο παίκτης 1 γνωρίζει

ότι ο παίκτης 2 είναι ορθολογικός, άρα μπορούμε να διαγράψουμε την στρατηγική Κ.

Άρα οι μοναδικές στρατηγικές οι οποίες επιβιώνουν από την ΔΕΑΚΣ είναι οι Π και Α

Το τελικό αποτέλεσμα του παιγνίου θα είναι το {𝜫, 𝜜}

Οι καθηγητές D. Fudenberg και J. Tirole, ζητήσανε από μια ομάδα φοιτητών τους να

παίξουν το παίγνιο 2.3.

- To 100% των φοιτητών στην θέση του παίκτη 2 επέλεξαν την στρατηγική Α

- Μόνο το (περίπου) 50% των φοιτητών στην θέση του παίκτη 1 επέλεξαν την

στρατηγική Π!

Τι πήγε «στραβά» στην προκειμένη περίπτωση? Ήταν το 50% των φοιτητών στην

θέση του παίκτη 1 που επέλεξαν την στρατηγική Κ ανορθολογικοί?

19

2. Πολλές φορές, η διαδικασία της ΔΕΑΚΣ δίνει ανακριβείς προβλέψεις για το ποιο θα

είναι το τελικό αποτέλεσμα του παιγνίου. Υπάρχουν δε περιπτώσεις στις οποίες η

ΔΕΑΚΣ δεν μας λέει τίποτα – όλα μπορούν να συμβούν!

Θεωρούμε το παρακάτω παίγνιο

1/2 Α Κ Δ

Π 0, 4 4, 0 5, 3 Μ 4, 0 0, 4 5, 3 Κ 3, 5 3, 5 6, 6

Παίγνιο 2.4

Ποιες στρατηγικές επιβιώνουν από την διαδικασία ΔΕΑΚΣ? → ΟΛΕΣ!

Τι μας λέει η ΔΕΑΚΣ για το τελικό αποτέλεσμα του παιγνίου? → ΤΙΠΟΤΑ!

Ioannis

Highlight

Ioannis

Highlight

20

ΙΣΟΡΡΟΠΙΑ NASH

o Ορισμοί:

Α. Ένας συνδυασμός στρατηγικών αποτελεί ισορροπία Nash όταν για κάθε παίκτη,

η στρατηγική που επέλεξε είναι η καλύτερη απάντηση (best response) σε κάθε μια

στρατηγική που επέλεξε ο κάθε ένας από τους υπόλοιπους παίκτες.

Β. Ένας συνδυασμός στρατηγικών αποτελεί ισορροπία Nash όταν κανένας παίκτης

δεν έχει κίνητρο να αποκλίνει μονομερώς από την στρατηγική του.

Οι δυο παραπάνω ορισμοί είναι ταυτόσημοι.

o Πως βρίσκουμε πρακτικά την ισορροπία Nash σε ένα παίγνιο?

Θα εφαρμόσουμε δυο τρόπους, ο κάθε ένας βασιζόμενος στους δυο παραπάνω

ορισμούς.

Ioannis

Highlight

21

ΤΡΟΠΟΣ Α

o Θεωρούμε το παίγνιο 2.4 παραπάνω

o Βρίσκουμε πρώτα την καλύτερη απάντηση του 1 για κάθε μια από τις στρατηγικές

του 2, δηλ.,

ο 2 παίζει Α → η καλύτερη απάντηση του 1 είναι η Μ

𝑢1(𝛭, 𝛢) = 𝟒 > 𝑢1(𝛫, 𝛢) = 𝟑 > 𝑢1(𝛱, 𝛢) = 𝟎

ο 2 παίζει Κ → η καλύτερη απάντηση του 1 είναι η Π

𝑢1(𝛱, 𝛫) = 𝟒 > 𝑢1(𝛫, 𝛫) = 𝟑 > 𝑢1(𝛭, 𝛫) = 𝟎

ο 2 παίζει Δ → η καλύτερη απάντηση του 1 είναι η Κ

𝑢1(𝛫, 𝛥) = 𝟔 > 𝑢1(𝛱, 𝛥) = 𝑢1(𝛭, 𝛥) = 𝟓

Ioannis

Highlight

22

1/2 Α Κ Δ

Π 0, 4 4, 0 5, 3

Μ 4, 0 0, 4 5, 3

Κ 3, 5 3, 5 6, 6

o Βρίσκουμε μετά την καλύτερη απάντηση του 2 για κάθε μια από τις στρατηγικές του

1, δηλ.,

o ο 1 παίζει Π → η καλύτερη απάντηση του 2 είναι η Α

o 𝑢2(𝛱, 𝛢) = 𝟒 > 𝑢2(𝛱, 𝛥) = 𝟑 > 𝑢2(𝛱, 𝛫) = 𝟎

o ο 1 παίζει Μ → η καλύτερη απάντηση του 2 είναι η Κ

o 𝑢2(𝛭, 𝛫) = 𝟒 > 𝑢2(𝛭, 𝛥) = 𝟑 > 𝑢2(𝛭, 𝛢) = 𝟎

o ο 1 παίζει Κ → η καλύτερη απάντηση του 2 είναι η Δ

𝑢2(𝛫, 𝛥) = 𝟔 > 𝑢2(𝛫, 𝛢) = 𝑢2(𝛫, 𝛫) = 𝟓

23

1/2 Α Κ Δ

Π 0, 4 4, 0 5, 3

Μ 4, 0 0, 4 5, 3

Κ 3, 5 3, 5 6, 6

o Η μοναδική ισορροπία Nash είναι ο συνδυασμός στρατηγικών {𝜥, 𝜟} διότι

Η Κ είναι η καλύτερη απάντηση του 1 όταν ο 2 επιλέγει Δ, και ταυτόχρονα

η Δ είναι η καλύτερη απάντηση του 2 όταν ο 1 επιλέγει Κ.

1/2 Α Κ Δ

Π 0, 4 4, 0 5, 3

Μ 4, 0 0, 4 5, 3

Κ 3, 5 3, 5 6, 6

24

ΤΡΟΠΟΣ Β

o Θεωρούμε το παρακάτω παίγνιο

1/2 Γ Δ

Α −1, 1 1, 2

Β 0, 0 0, 1

Παίγνιο 2.5

o Θα εξετάσουμε κάθε ένα από τα τέσσερα πιθανά αποτελέσματα για να δούμε εάν

ένας τουλάχιστον παίκτης έχει κίνητρο να αποκλίνει μονομερώς, δηλ., αν μετάνιωσε

για την επιλογή του. Αν κανένας από τους 2 παίκτες δεν έχει κίνητρο να αποκλίνει

μονομερώς, τότε το αποτέλεσμα αυτό είναι ισορροπία Nash.

Ioannis

Highlight

Ioannis

Highlight

25

- Αποτέλεσμα {𝜜, 𝜞}: ΔΕΝ είναι ισορροπία Nash.

Δεδομένου ότι ο 2 παίζει Γ, ο 1 μετανιώνει για την επιλογή του διότι προτιμάει την

Β από την Α (𝟎 > −𝟏). Δεδομένου ότι ο 1 παίζει Α, ο 2 μετανιώνει για την επιλογή

του διότι προτιμάει την Δ από την Γ (𝟐 > 𝟏).

- Αποτέλεσμα {𝜝, 𝜞}: ΔΕΝ είναι ισορροπία Nash.

Δεδομένου ότι ο 2 παίζει Γ, ο 1 δεν μετανιώνει για την επιλογή του διότι προτιμάει

την Β από την Α (𝟎 > −𝟏). Δεδομένου ότι ο 1 παίζει Β, ο 2 μετανιώνει για την

επιλογή του διότι προτιμάει την Δ από την Γ (𝟏 > 𝟎).

- Αποτέλεσμα {𝜜, 𝜟}: ΕΙΝΑΙ ισορροπία Nash. Δεδομένου ότι ο 2 παίζει Δ, ο 1 δεν

μετανιώνει για την επιλογή – προτιμάει την Α από την Β (𝟏 > 𝟎). Δεδομένου ότι ο

1 παίζει Α, ο 2 δεν μετανιώνει για την επιλογή του διότι προτιμάει την Δ από την

Γ (𝟐 > 𝟏).

26

- Αποτέλεσμα {𝜝, 𝜟}: ΔΕΝ είναι ισορροπία Nash.

Δεδομένου ότι ο 2 παίζει Δ, ο 1 μετανιώνει για την επιλογή του διότι προτιμάει την

Α από Β (𝟏 > 𝟎). Δεδομένου ότι ο 1 παίζει Β, ο 2 δεν μετανιώνει για την επιλογή

του διότι προτιμάει την Δ από την Γ (𝟏 > 𝟎).

o Η μοναδική ισορροπία Nash είναι ο συνδυασμός στρατηγικών {𝜜, 𝜟} διότι μόνο σε

αυτό το αποτέλεσμα κανένας από τους δυο παίκτες δεν μετανιώνει για την επιλογή

του, δηλ., δεν έχει κίνητρο να αποκλίνει μονομερώς.

1/2 Γ Δ

Α −1, 1 𝟏, 𝟐

Β 0, 0 0, 1

o Και σε αυτό το παράδειγμα, όπως και στο προηγούμενο, η ισορροπία Nash μας δίνει

ένα τελικό αποτέλεσμα το οποίο είναι το καλύτερο και για τους δυο παίκτες. Αυτό δεν

συμβαίνει πάντα (όπως θα δούμε στην συνέχεια)!

Ioannis

Highlight

27

Μια πολύ βασική παρατήρηση

o Θυμηθείτε τον πρώτο ορισμό της ισορροπίας Nash:

Α. Ένας συνδυασμός στρατηγικών αποτελεί ισορροπία Nash όταν για κάθε παίκτη,

η στρατηγική που επέλεξε είναι η καλύτερη απάντηση (best response) σε κάθε μια

στρατηγική που επέλεξε ο κάθε ένας από τους υπόλοιπους παίκτες.

o O ορισμός αυτός έχει ουσιαστικά δυο μέρη:

1) κάθε παίκτης επιλέγει την στρατηγική του με τον βέλτιστο τρόπο δεδομένων των

πεποιθήσεων/προσδοκιών για τις επιλογές των άλλων παικτών.

2) Οι πεποιθήσεις αυτές είναι σωστές, υπό την έννοια ότι είναι λογικά συνεπείς με τις

πραγματικές επιλογές των άλλων παικτών.

28

o Η υπόθεση της κοινής γνώσης της ορθολογικότητας δεν αρκεί για την δικαιολογήση

της χρήση ισορροπίας Nash για να κάνουμε προβλέψεις σχετικά με το αποτέλεσμα

ενός παιχνιδιού!

o Αυτή η υπόθεση επιτρέπει μόνο να περιορίσουμε την προσοχή μας στο σύνολο των

ορθολογιστικών στρατηγικών, δηλαδή αρκεί μόνο για το πρώτο μέρος του ορισμού

αλλά όχι για το δεύτερο!

Η ορθολογική σκέψη και μόνο δεν μας επιτρέπει να συμπεράνουμε ότι οι

πεποιθήσεις πρέπει να είναι σωστές!

o Θα επανέλθουμε σε αυτό το θέμα στην ενότητα 5.

29

ΟΡΟΛΟΓΙΑ

στρατηγική

strategy

στρατηγική μορφή

strategic form

αυστηρώς κυριαρχούμενη στρατηγική

strictly dominated strategy

ασθενώς κυριαρχούμενη στρατηγική

weakly dominated strategy

αυστηρά κυρίαρχη στρατηγική

strictly dominant strategy

διαδοχική εξάλειψη αυστηρώς

κυριαρχούμενων στρατηγικών

iterated elimination of strictly dominated

strategies

ισορροπία Nash

Nash equilibrium

καλύτερη απάντηση

best response

προσδοκίες

expectations

πεποιθήσεις

beliefs

30

ΒΙΒΛΙΟΓΡΑΦΙΑ

• Βαρουφάκης Γιάνης. Θεωρία Παιγνίων.

Κεφάλαιο 2, υποενότητα 2.3 (2.2.3)

ενότητα 3 (2.3)

υποενότητα 4.1 (2.4.1)

υποενότητα 5.1 (2.5.1)

• Σταματόπουλος Γεώργιος. Θεωρία Παιγνίων.

Κεφάλαιο 2, ενότητες 2 και 3 (2.2 – 2.3)

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o...

Documents

Transcript of ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o...