ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o...

30
1 ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412) ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΜΕ ΠΛΗΡΗ ΠΛΗΡΟΦΟΡΗΣΗ ΜΕΡΟΣ Α

Transcript of ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o...

Page 1: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

1

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412)

ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΜΕ ΠΛΗΡΗ ΠΛΗΡΟΦΟΡΗΣΗ

ΜΕΡΟΣ Α

Page 2: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

2

o Η πιο απλή αλλά και ταυτόχρονα πιο θεμελιώδης κατηγορία παιγνίων είναι αυτή των

στατικών παιγνίων με πλήρη πληροφόρηση (ΣΠ).

Στατικά: οι παίκτες επιλέγουν ενέργειες μια φορά και ταυτόχρονα.

Πλήρη πληροφόρηση: όλοι οι παίκτες γνωρίζουν όλα τα στοιχεία του παιγνίου και η

πληροφόρηση αυτή είναι κοινή γνώση.

Περιγραφή

• Στρατηγική μορφή παιγνίων

Επίλυση

• Διαδοχική απαλοιφή αυστηρώς κυριαρχούμενων στρατηγικών

• Ισορροπία Nash

Ioannis
Highlight
Ioannis
Highlight
Page 3: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

3

o Δυο βασικές σημειώσεις πριν ξεκινήσουμε:

1) Για τα στατικά παίγνια, οι έννοιες ενέργεια και στρατηγική είναι ταυτόσημες,

ενέργεια ≡ στρατηγική

Από εδώ και στο εξής, στην ανάλυση των στατικών παιγνίων θα αναφερόμαστε

αποκλειστικά σε στρατηγική/ες.

(θα επανέλθουμε σε αυτό το θέμα στην ενότητα 6)

2) Σχετικά με τα αποτελέσματα ενός στατικού παιγνίου,

αποτέλεσμα ≡ συνδυασμός στρατηγικών ≡ προφίλ στρατηγικών

Θα χρησιμοποιούμε και τους τρεις παραπάνω όρους.

Ioannis
Highlight
Ioannis
Highlight
Page 4: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

4

ΣΤΡΑΤΗΓΙΚΗ ΜΟΡΦΗ ΠΑΙΓΝΙΩΝ

o Η στρατηγική μορφή ενός παιγνίου προσδιορίζει:

- το σύνολο των παικτών, 𝑁 = {1, 2, … , 𝑛}

- τις διαθέσιμες στρατηγικές του κάθε παίκτη, {𝑆1, … , 𝑆𝑛}

- τις αποδόσεις του κάθε παίκτη για κάθε πιθανό αποτέλεσμα, {𝑢1, … , 𝑢𝑛}

o Παράδειγμα

Έστω το σύνολο παικτών, 𝑁 = 1, 2, δηλαδή έχουμε δυο (2) παίκτες, τον παίκτη 1 και

τον παίκτη 2.

To σύνολο των στρατηγικών του παίκτη 1 είναι: 𝑆1 = {𝛢, 𝛣}

To σύνολο των στρατηγικών του παίκτη 2 είναι: 𝑆2 = {𝛤, 𝛥}

Ioannis
Highlight
Page 5: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

5

Για να περιγράψουμε τις αποδόσεις των παικτών θα χρησιμοποιήσουμε τον πίνακα

αποδόσεων.

1/2 Γ Δ

Α 2, 0 0, 1

Β 1, 3 1, 1

Παίγνιο 2.1

Γραμμές του πίνακα: στρατηγικές του παίκτη 1

Στήλες του πίνακα: στρατηγικές του παίκτη 2

Κελιά του πίνακα: αποτελέσματα του παιγνίου – κάθε παίκτης έχει από 2 στρατηγικές

άρα έχουμε 4 πιθανά αποτελέσματα (η 4 πιθανούς συνδυασμούς στρατηγικών)

{𝛢, 𝛤}, {𝛢, 𝛥}, {𝛣, 𝛤}, {𝛣, 𝛥}

Ioannis
Highlight
Page 6: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

6

Οι αποδόσεις των παικτών για κάθε αποτέλεσμα αναγράφονται στο αντίστοιχο κελί,

όπου σε κάθε κελί ο πρώτος αριθμός (πριν το κόμμα) δείχνει την απόδοση του παίκτη

1 και ο δεύτερος αριθμός (μετά το κόμμα) την απόδοση του παίκτη 2, δηλαδή

• ο παίκτης 1 επιλέγει Α και ο παίκτης 2 επιλέγει Γ, το αποτέλεσμα είναι {𝛢, 𝛤}

και οι αποδόσεις του κάθε παίκτη είναι

𝑢1(𝛢, 𝛤) = 2, 𝑢2(𝛢, 𝛤) = 0

• ο παίκτης 1 επιλέγει Α και ο παίκτης 2 επιλέγει Δ, το αποτέλεσμα είναι {𝛢, 𝛥}

𝑢1(𝛢, 𝛥) = 0, 𝑢2(𝛢, 𝛥) = 1

• ο παίκτης 1 επιλέγει Β και ο παίκτης 2 επιλέγει Γ, το αποτέλεσμα είναι {𝛣, 𝛤}

𝑢1(𝛣, 𝛤) = 1, 𝑢2(𝛣, 𝛤) = 3

• ο παίκτης 1 επιλέγει Β και ο παίκτης 2 επιλέγει Δ, το αποτέλεσμα είναι {𝛣, 𝛥}

𝑢1(𝛣, 𝛥) = 1, 𝑢2(𝛣, 𝛥) = 1

Page 7: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

7

ΔΙΑΔΟΧΙΚΗ ΕΞΑΛΕΙΨΗ ΑΥΣΤΗΡΩΣ ΚΥΡΙΑΡΧΟΥΜΕΝΩΝ ΣΤΡΑΤΗΓΙΚΩΝ

o Η πρώτη μέθοδος επίλυσης είναι η διαδοχική εξάλειψη αυστηρώς κυριαρχούμενων

στρατηγικών. Αυτή η μέθοδος βασίζεται στην αρχή:

«οι ορθολογικοί παίκτες δεν παίζουν αυστηρώς κυριαρχούμενες στρατηγικές»

o Αυστηρώς κυριαρχούμενη στρατηγική: μεταξύ δυο στρατηγικών 𝑠1 και 𝑠2 ενός παίκτη,

η 𝑠1 είναι αυστηρά κυριαρχούμενη από την 𝑠2 όταν η απόδοση του παίκτη όταν παίζει

𝑠1 είναι πάντα μικρότερη από την απόδοση όταν παίζει 𝑠2 ανεξάρτητα του τι παίζουν

οι άλλοι παίκτες.

o Ασθενώς κυριαρχούμενη στρατηγική: μεταξύ δυο στρατηγικών 𝑠1 και 𝑠2 ενός παίκτη,

η 𝑠1 είναι ασθενώς κυριαρχούμενη από την 𝑠2 όταν η απόδοση του παίκτη όταν παίζει

𝑠1 είναι μικρότερη ή ίση από την απόδοση όταν παίζει 𝑠2 ανεξάρτητα του τι παίζουν

οι άλλοι παίκτες.

Ioannis
Highlight
Page 8: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

8

1/2 Γ Δ

Α 2, − 1, −

Β 1, − 2, −

o Στον αριστερό πίνακα: Για τον παίκτη 1 η στρατηγική Β είναι αυστηρά κυριαρχούμενη

από την στρατηγική Α διότι

- Αν ο 2 παίξει Γ, τότε ο 1 προτιμάει την Α από την Β, (𝟐 > 𝟏)

- Αν ο 2 παίξει Δ, τότε ο 1 πάλι προτιμάει την Α από την Β (𝟏 > 𝟎)

o Στον κεντρικό πίνακα: Για τον παίκτη 1 η στρατηγική Β είναι ασθενώς κυριαρχούμενη

από την στρατηγική Α διότι

- Αν ο 2 παίξει Γ, τότε ο 1 προτιμάει την Α από την Β, (𝟐 > 𝟏)

- Αν ο 2 παίξει Δ, τότε ο 1 είναι αδιάφορος μεταξύ Α και Β, (𝟏 = 𝟏)

o Στον δεξιό πίνακα: Υπάρχει αυστηρώς ή ασθενώς κυριαρχούμενη στρατηγική?

1/2 Γ Δ

Α 2, − 1, −

Β 1, − 0, −

1/2 Γ Δ

Α 2, − 1, −

Β 1, − 1, −

Page 9: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

9

1/2 Δ Ε

Α 2, − 3, −

Β 1, − 1, −

Γ 1, − 1, −

o Στον αριστερό πίνακα: και η στρατηγική Β αλλά και η στρατηγική Γ είναι αυστηρώς

κυριαρχούμενες από την στρατηγική Α. Με άλλα λόγια, η στρατηγική Α κυριαρχεί

αυστηρώς και επί της Β και επί της Γ, οπότε σε αυτή την περίπτωση, μπορούμε να

πούμε ότι η στρατηγική Α είναι αυστηρά κυρίαρχη στρατηγική.

o Στον δεξιό πίνακα: η στρατηγική Γ είναι αυστηρώς κυριαρχούμενη τόσο από την Α

όσο και από την Β. Η στρατηγική Α κυριαρχεί αυστηρώς επί της Γ, αλλά δεν είναι

κυρίαρχη στρατηγική γιατί δεν κυριαρχεί επί της Β. Επίσης, η στρατηγική Β κυριαρχεί

αυστηρώς επί της Γ, αλλά δεν είναι κυρίαρχη στρατηγική γιατί δεν κυριαρχεί επί της

Α.

1/2 Δ Ε

Α 2, − 1, −

Β 1, − 2, −

Γ 0, − 0, −

Page 10: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

10

o Πως λειτουργεί η διαδικασία της διαδοχικής εξάλειψης αυστηρώς κυριαρχούμενων

στρατηγικών? Όπως ήδη έχει αναφερθεί, η μέθοδος αυτή βασίζεται στην αρχή ότι οι

ορθολογικοί παίκτες δεν παίζουν αυστηρώς κυριαρχούμενες στρατηγικές.

o Βασική υπόθεση: υπάρχει κοινή γνώση ορθολογικότητας – όλοι οι παίκτες γνωρίζουν

ότι όλοι οι παίκτες γνωρίζουν ότι είναι ορθολογικοί, επιπλέον όλοι γνωρίζουν ότι όλοι

γνωρίζουν ότι όλοι γνωρίζουν, κ.ο.κ. στο άπειρο…

o Θεωρούμε το παρακάτω παίγνιο.

1/2 Α Μ Δ

Π 1, 0 1, 2 0, 1 Κ 0, 3 0, 1 2, 0

Παίγνιο 2.2

Ioannis
Highlight
Page 11: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

11

o 1ο βήμα: Παρατηρούμε ότι η στρατηγική Δ του παίκτη 2 είναι αυστηρά κυριαρχούμενη

από την στρατηγική Μ.

1/2 Α Μ Δ

Π 1, 0 1, 2 0, 1 Κ 0, 3 0, 1 2, 0

Αυτό συμβαίνει διότι

𝑢2(𝛱, 𝛭) = 𝟐 > 𝟏 = 𝑢2(𝛱, 𝛥)

𝑢2(𝛫, 𝛭) = 𝟏 > 𝟎 = 𝑢2(𝛫, 𝛥)

Ο παίκτης 2 είναι ορθολογικός (δεν παίζει αυστηρώς κυριαρχούμενες στρατηγικές).

Επιπλέον, ο παίκτης 1 γνωρίζει ότι ο παίκτης 2 είναι ορθολογικός άρα μπορούμε να

διαγράψουμε την στρατηγική Δ, και το παίγνιο μειώνεται στο:

Page 12: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

12

1/2 Α Μ

Π 1, 0 1, 2

Κ 0, 3 0, 1

Παίγνιο 2.2(α)

o 2ο βήμα: Παρατηρούμε ότι η στρατηγική Κ του παίκτη 1 είναι αυστηρά κυριαρχούμενη

από την στρατηγική Π.

1/2 Α Μ

Π 1, 0 1, 2

Κ 0, 3 0, 1

Αυτό συμβαίνει διότι

𝑢1(𝛱, 𝛢) = 𝟏 > 𝟎 = 𝑢1(𝛫, 𝛢)

𝑢1(𝛱, 𝛭) = 𝟏 > 𝟎 = 𝑢1(𝛫, 𝛭)

Page 13: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

13

Ο παίκτης 2 είναι ορθολογικός. Επιπλέον, ο παίκτης 1 γνωρίζει ότι ο παίκτης 2 είναι

ορθολογικός. Ο παίκτης 1 είναι ορθολογικός. Επιπλέον, ο παίκτης 2 γνωρίζει ότι ο

παίκτης 1 είναι ορθολογικός. Επιπλέον, ο παίκτης 2 γνωρίζει ότι ο παίκτης 1 γνωρίζει

ότι ο παίκτης 2 είναι ορθολογικός, άρα μπορούμε να διαγράψουμε την στρατηγική Κ,

και το παίγνιο μειώνεται στο:

1/2 Α Μ

Π 1, 0 1, 2

Παίγνιο 2.2(β)

o 3ο βήμα: Παρατηρούμε ότι η στρατηγική Α του παίκτη 2 είναι αυστηρά κυριαρχούμενη

από την στρατηγική Μ.

Page 14: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

14

1/2 Α Μ

Π 1, 0 1, 2

Αυτό συμβαίνει διότι

𝑢2(𝛱, 𝛢) = 𝟎 < 𝟐 = 𝑢2(𝛱, 𝛭)

Άρα οι μοναδικές στρατηγικές οι οποίες επιβιώνουν από την ΔΕΑΚΣ είναι οι Π και Μ

Το τελικό αποτέλεσμα του παιγνίου θα είναι το {𝜫, 𝜧}

Page 15: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

15

Δυο βασικές παρατηρήσεις

1. Η υπόθεση της κοινής γνώσης της ορθολογικότητας είναι πολύ σημαντική αλλά και

ομολογουμένως πολύ «απαιτητική».

Θεωρούμε το παρακάτω παίγνιο.

1/2 Α Δ

Π 8, 10 −100, 9

Κ 7, 6 6, 5

Παίγνιο 2.3

Τι προβλέπει η διαδικασία της ΔΕΑΚΣ ως τελικό αποτέλεσμα?

Ioannis
Highlight
Ioannis
Highlight
Page 16: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

16

1ο βήμα: Παρατηρούμε ότι η στρατηγική Δ του παίκτη 2 είναι αυστηρά κυριαρχούμενη

από την στρατηγική Α.

1/2 Α Δ

Π 8, 10 −100, 9

Κ 7, 6 6, 5

Αυτό συμβαίνει διότι

𝑢2(𝛱, 𝛢) = 𝟏𝟎 > 𝟗 = 𝑢2(𝛱, 𝛥)

𝑢2(𝛫, 𝛢) = 𝟔 > 𝟓 = 𝑢2(𝛫, 𝛥)

Ο παίκτης 2 είναι ορθολογικός (δεν παίζει αυστηρώς κυριαρχούμενες στρατηγικές).

Επιπλέον, ο παίκτης 1 γνωρίζει ότι ο παίκτης 2 είναι ορθολογικός άρα μπορούμε να

διαγράψουμε την στρατηγική Δ, και το παίγνιο μειώνεται στο:

Page 17: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

17

1/2 Α

Π 8, 10

Κ 7, 6

Παίγνιο 2.3(α)

2ο βήμα: Παρατηρούμε ότι η στρατηγική Κ του παίκτη 1 είναι αυστηρά κυριαρχούμενη

από την στρατηγική Π.

1/2 Α

Π 8, 10

Κ 7, 6

Αυτό συμβαίνει διότι

𝑢1(𝛱, 𝛢) = 𝟖 > 𝟕 = 𝑢1(𝛫, 𝛢)

Page 18: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

18

Ο παίκτης 2 είναι ορθολογικός. Επιπλέον, ο παίκτης 1 γνωρίζει ότι ο παίκτης 2 είναι

ορθολογικός. Ο παίκτης 1 είναι ορθολογικός. Επιπλέον, ο παίκτης 2 γνωρίζει ότι ο

παίκτης 1 είναι ορθολογικός. Επιπλέον, ο παίκτης 2 γνωρίζει ότι ο παίκτης 1 γνωρίζει

ότι ο παίκτης 2 είναι ορθολογικός, άρα μπορούμε να διαγράψουμε την στρατηγική Κ.

Άρα οι μοναδικές στρατηγικές οι οποίες επιβιώνουν από την ΔΕΑΚΣ είναι οι Π και Α

Το τελικό αποτέλεσμα του παιγνίου θα είναι το {𝜫, 𝜜}

Οι καθηγητές D. Fudenberg και J. Tirole, ζητήσανε από μια ομάδα φοιτητών τους να

παίξουν το παίγνιο 2.3.

- To 100% των φοιτητών στην θέση του παίκτη 2 επέλεξαν την στρατηγική Α

- Μόνο το (περίπου) 50% των φοιτητών στην θέση του παίκτη 1 επέλεξαν την

στρατηγική Π!

Τι πήγε «στραβά» στην προκειμένη περίπτωση? Ήταν το 50% των φοιτητών στην

θέση του παίκτη 1 που επέλεξαν την στρατηγική Κ ανορθολογικοί?

Page 19: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

19

2. Πολλές φορές, η διαδικασία της ΔΕΑΚΣ δίνει ανακριβείς προβλέψεις για το ποιο θα

είναι το τελικό αποτέλεσμα του παιγνίου. Υπάρχουν δε περιπτώσεις στις οποίες η

ΔΕΑΚΣ δεν μας λέει τίποτα – όλα μπορούν να συμβούν!

Θεωρούμε το παρακάτω παίγνιο

1/2 Α Κ Δ

Π 0, 4 4, 0 5, 3 Μ 4, 0 0, 4 5, 3 Κ 3, 5 3, 5 6, 6

Παίγνιο 2.4

Ποιες στρατηγικές επιβιώνουν από την διαδικασία ΔΕΑΚΣ? → ΟΛΕΣ!

Τι μας λέει η ΔΕΑΚΣ για το τελικό αποτέλεσμα του παιγνίου? → ΤΙΠΟΤΑ!

Ioannis
Highlight
Ioannis
Highlight
Page 20: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

20

ΙΣΟΡΡΟΠΙΑ NASH

o Ορισμοί:

Α. Ένας συνδυασμός στρατηγικών αποτελεί ισορροπία Nash όταν για κάθε παίκτη,

η στρατηγική που επέλεξε είναι η καλύτερη απάντηση (best response) σε κάθε μια

στρατηγική που επέλεξε ο κάθε ένας από τους υπόλοιπους παίκτες.

Β. Ένας συνδυασμός στρατηγικών αποτελεί ισορροπία Nash όταν κανένας παίκτης

δεν έχει κίνητρο να αποκλίνει μονομερώς από την στρατηγική του.

Οι δυο παραπάνω ορισμοί είναι ταυτόσημοι.

o Πως βρίσκουμε πρακτικά την ισορροπία Nash σε ένα παίγνιο?

Θα εφαρμόσουμε δυο τρόπους, ο κάθε ένας βασιζόμενος στους δυο παραπάνω

ορισμούς.

Ioannis
Highlight
Page 21: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

21

ΤΡΟΠΟΣ Α

o Θεωρούμε το παίγνιο 2.4 παραπάνω

o Βρίσκουμε πρώτα την καλύτερη απάντηση του 1 για κάθε μια από τις στρατηγικές

του 2, δηλ.,

ο 2 παίζει Α → η καλύτερη απάντηση του 1 είναι η Μ

𝑢1(𝛭, 𝛢) = 𝟒 > 𝑢1(𝛫, 𝛢) = 𝟑 > 𝑢1(𝛱, 𝛢) = 𝟎

ο 2 παίζει Κ → η καλύτερη απάντηση του 1 είναι η Π

𝑢1(𝛱, 𝛫) = 𝟒 > 𝑢1(𝛫, 𝛫) = 𝟑 > 𝑢1(𝛭, 𝛫) = 𝟎

ο 2 παίζει Δ → η καλύτερη απάντηση του 1 είναι η Κ

𝑢1(𝛫, 𝛥) = 𝟔 > 𝑢1(𝛱, 𝛥) = 𝑢1(𝛭, 𝛥) = 𝟓

Ioannis
Highlight
Page 22: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

22

1/2 Α Κ Δ

Π 0, 4 4, 0 5, 3

Μ 4, 0 0, 4 5, 3

Κ 3, 5 3, 5 6, 6

o Βρίσκουμε μετά την καλύτερη απάντηση του 2 για κάθε μια από τις στρατηγικές του

1, δηλ.,

o ο 1 παίζει Π → η καλύτερη απάντηση του 2 είναι η Α

o 𝑢2(𝛱, 𝛢) = 𝟒 > 𝑢2(𝛱, 𝛥) = 𝟑 > 𝑢2(𝛱, 𝛫) = 𝟎

o ο 1 παίζει Μ → η καλύτερη απάντηση του 2 είναι η Κ

o 𝑢2(𝛭, 𝛫) = 𝟒 > 𝑢2(𝛭, 𝛥) = 𝟑 > 𝑢2(𝛭, 𝛢) = 𝟎

o ο 1 παίζει Κ → η καλύτερη απάντηση του 2 είναι η Δ

𝑢2(𝛫, 𝛥) = 𝟔 > 𝑢2(𝛫, 𝛢) = 𝑢2(𝛫, 𝛫) = 𝟓

Page 23: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

23

1/2 Α Κ Δ

Π 0, 4 4, 0 5, 3

Μ 4, 0 0, 4 5, 3

Κ 3, 5 3, 5 6, 6

o Η μοναδική ισορροπία Nash είναι ο συνδυασμός στρατηγικών {𝜥, 𝜟} διότι

Η Κ είναι η καλύτερη απάντηση του 1 όταν ο 2 επιλέγει Δ, και ταυτόχρονα

η Δ είναι η καλύτερη απάντηση του 2 όταν ο 1 επιλέγει Κ.

1/2 Α Κ Δ

Π 0, 4 4, 0 5, 3

Μ 4, 0 0, 4 5, 3

Κ 3, 5 3, 5 6, 6

Page 24: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

24

ΤΡΟΠΟΣ Β

o Θεωρούμε το παρακάτω παίγνιο

1/2 Γ Δ

Α −1, 1 1, 2

Β 0, 0 0, 1

Παίγνιο 2.5

o Θα εξετάσουμε κάθε ένα από τα τέσσερα πιθανά αποτελέσματα για να δούμε εάν

ένας τουλάχιστον παίκτης έχει κίνητρο να αποκλίνει μονομερώς, δηλ., αν μετάνιωσε

για την επιλογή του. Αν κανένας από τους 2 παίκτες δεν έχει κίνητρο να αποκλίνει

μονομερώς, τότε το αποτέλεσμα αυτό είναι ισορροπία Nash.

Ioannis
Highlight
Ioannis
Highlight
Page 25: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

25

- Αποτέλεσμα {𝜜, 𝜞}: ΔΕΝ είναι ισορροπία Nash.

Δεδομένου ότι ο 2 παίζει Γ, ο 1 μετανιώνει για την επιλογή του διότι προτιμάει την

Β από την Α (𝟎 > −𝟏). Δεδομένου ότι ο 1 παίζει Α, ο 2 μετανιώνει για την επιλογή

του διότι προτιμάει την Δ από την Γ (𝟐 > 𝟏).

- Αποτέλεσμα {𝜝, 𝜞}: ΔΕΝ είναι ισορροπία Nash.

Δεδομένου ότι ο 2 παίζει Γ, ο 1 δεν μετανιώνει για την επιλογή του διότι προτιμάει

την Β από την Α (𝟎 > −𝟏). Δεδομένου ότι ο 1 παίζει Β, ο 2 μετανιώνει για την

επιλογή του διότι προτιμάει την Δ από την Γ (𝟏 > 𝟎).

- Αποτέλεσμα {𝜜, 𝜟}: ΕΙΝΑΙ ισορροπία Nash. Δεδομένου ότι ο 2 παίζει Δ, ο 1 δεν

μετανιώνει για την επιλογή – προτιμάει την Α από την Β (𝟏 > 𝟎). Δεδομένου ότι ο

1 παίζει Α, ο 2 δεν μετανιώνει για την επιλογή του διότι προτιμάει την Δ από την

Γ (𝟐 > 𝟏).

Page 26: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

26

- Αποτέλεσμα {𝜝, 𝜟}: ΔΕΝ είναι ισορροπία Nash.

Δεδομένου ότι ο 2 παίζει Δ, ο 1 μετανιώνει για την επιλογή του διότι προτιμάει την

Α από Β (𝟏 > 𝟎). Δεδομένου ότι ο 1 παίζει Β, ο 2 δεν μετανιώνει για την επιλογή

του διότι προτιμάει την Δ από την Γ (𝟏 > 𝟎).

o Η μοναδική ισορροπία Nash είναι ο συνδυασμός στρατηγικών {𝜜, 𝜟} διότι μόνο σε

αυτό το αποτέλεσμα κανένας από τους δυο παίκτες δεν μετανιώνει για την επιλογή

του, δηλ., δεν έχει κίνητρο να αποκλίνει μονομερώς.

1/2 Γ Δ

Α −1, 1 𝟏, 𝟐

Β 0, 0 0, 1

o Και σε αυτό το παράδειγμα, όπως και στο προηγούμενο, η ισορροπία Nash μας δίνει

ένα τελικό αποτέλεσμα το οποίο είναι το καλύτερο και για τους δυο παίκτες. Αυτό δεν

συμβαίνει πάντα (όπως θα δούμε στην συνέχεια)!

Ioannis
Highlight
Page 27: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

27

Μια πολύ βασική παρατήρηση

o Θυμηθείτε τον πρώτο ορισμό της ισορροπίας Nash:

Α. Ένας συνδυασμός στρατηγικών αποτελεί ισορροπία Nash όταν για κάθε παίκτη,

η στρατηγική που επέλεξε είναι η καλύτερη απάντηση (best response) σε κάθε μια

στρατηγική που επέλεξε ο κάθε ένας από τους υπόλοιπους παίκτες.

o O ορισμός αυτός έχει ουσιαστικά δυο μέρη:

1) κάθε παίκτης επιλέγει την στρατηγική του με τον βέλτιστο τρόπο δεδομένων των

πεποιθήσεων/προσδοκιών για τις επιλογές των άλλων παικτών.

2) Οι πεποιθήσεις αυτές είναι σωστές, υπό την έννοια ότι είναι λογικά συνεπείς με τις

πραγματικές επιλογές των άλλων παικτών.

Page 28: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

28

o Η υπόθεση της κοινής γνώσης της ορθολογικότητας δεν αρκεί για την δικαιολογήση

της χρήση ισορροπίας Nash για να κάνουμε προβλέψεις σχετικά με το αποτέλεσμα

ενός παιχνιδιού!

o Αυτή η υπόθεση επιτρέπει μόνο να περιορίσουμε την προσοχή μας στο σύνολο των

ορθολογιστικών στρατηγικών, δηλαδή αρκεί μόνο για το πρώτο μέρος του ορισμού

αλλά όχι για το δεύτερο!

Η ορθολογική σκέψη και μόνο δεν μας επιτρέπει να συμπεράνουμε ότι οι

πεποιθήσεις πρέπει να είναι σωστές!

o Θα επανέλθουμε σε αυτό το θέμα στην ενότητα 5.

Page 29: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

29

ΟΡΟΛΟΓΙΑ

στρατηγική

strategy

στρατηγική μορφή

strategic form

αυστηρώς κυριαρχούμενη στρατηγική

strictly dominated strategy

ασθενώς κυριαρχούμενη στρατηγική

weakly dominated strategy

αυστηρά κυρίαρχη στρατηγική

strictly dominant strategy

διαδοχική εξάλειψη αυστηρώς

κυριαρχούμενων στρατηγικών

iterated elimination of strictly dominated

strategies

ισορροπία Nash

Nash equilibrium

καλύτερη απάντηση

best response

προσδοκίες

expectations

πεποιθήσεις

beliefs

Page 30: ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412 · → ΤΙΠΟΤΑ! 20 ΙΣΟΡΡΟΠΙΑ NASH o Οριμοί: Α. Ένας υνυαμός ραηγικών απολί ιορροπία Nash

30

ΒΙΒΛΙΟΓΡΑΦΙΑ

• Βαρουφάκης Γιάνης. Θεωρία Παιγνίων.

Κεφάλαιο 2, υποενότητα 2.3 (2.2.3)

ενότητα 3 (2.3)

υποενότητα 4.1 (2.4.1)

υποενότητα 5.1 (2.5.1)

• Σταματόπουλος Γεώργιος. Θεωρία Παιγνίων.

Κεφάλαιο 2, ενότητες 2 και 3 (2.2 – 2.3)