OR_GameTheoryExercises.pdf

1

ΑΣΚΗΣΗ 1

Δύο επιχειρήσεις Α και Β, μοιράζονται το μεγαλύτερο μερίδιο της αγοράς για ένα συγκεκριμένο προϊόν.

Καθεμία σχεδιάζει τη νέα της στρατηγική για τον επόμενο χρόνο, προκειμένου να αποσπάσει πωλήσεις από την

άλλη. Οι συνολικές πωλήσεις του προϊόντος είναι σχετικά σταθερές. Για κάθε επιχείρηση υπάρχουν τέσσερις

δυνατότητες: 1) Βελτίωση προϊόντος, 2) Καλύτερη συσκευασία, 3) Αυξημένη διαφημιστική δαπάνη, 4) Μείωση

τιμής. Το κόστος των τεσσάρων εναλλακτικών στρατηγικών είναι περίπου ίδιο. Η αύξηση του ποσοστού των

πωλήσεων για την επιχείρηση Α σε βάρος της Β, για κάθε συνδυασμό στρατηγικών, δίνεται στον παρακάτω

πίνακα:

Επιχείρηση B

Επιχείρηση Α

Β1 Β2 Β3 Β4

Α1 2 3 4 5

Α2 1 1 -1 -2

Α3 4 1 3 3

Α4 -3 1 0 1

Προσδιορίστε την άριστη στρατηγική για κάθε πλευρά και την τιμή του παιγνίου.

ΑΣΚΗΣΗ 2

Μία Επιτροπή εργαζομένων (παίκτης Α) βρίσκεται σε διαπραγματεύσεις με τη Διοίκηση της εργοδότριας

εταιρείας (παίκτης Β) για την κατάρτιση της νέας σύμβασης εργασίας. Κάθε ένας από τους δύο παίκτες, δύναται

να ακολουθήσει μία, από τέσσερις διαθέσιμες στρατηγικές, ώστε να αποσπάσει μεγαλύτερο όφελος. Στην

προκειμένη περίπτωση, η Επιτροπή προσπαθεί να εξασφαλίσει μεγαλύτερο ποσοστό αύξησης του βασικού

μισθού, ενώ η Διοίκηση προσπαθεί, από τη δική της πλευρά, να παραχωρήσει μικρότερο ποσοστό. Στον πίνακα

πληρωμών που ακολουθεί, βλέπετε για όλους τους πιθανούς συνδυασμούς στρατηγικών των δύο παικτών, το

όφελος για την Επιτροπή ως ποσοστιαία αύξηση του βασικού μισθού.

Διοίκηση (Β)

Επιτροπή (Α)

Β1 Β2 Β3 Β4

Α1 3 1 2 1

Α2 -1 2 -1 -2

Α3 5 3 1 2

Α4 -3 1 1 0

1. Χωρίς να διαγράψετε τις υποδεέστερες στρατηγικές, εφαρμόστε το κριτήριο minimax στον πίνακα

πληρωμών, για να διαπιστώσετε την ύπαρξη ή όχι σημείου ισορροπίας.

2. Διαγράψτε όλες τις υποδεέστερες στρατηγικές, ώστε να μειώσετε όσο περισσότερο μπορείτε τις διαστάσεις

του πίνακα πληρωμών.

3. Συνεχίζοντας από το προηγούμενο ερώτημα, προσδιορίστε την άριστη στρατηγική για κάθε παίκτη και την

τιμή του παιγνιδιού.

ΑΣΚΗΣΗ 3

Δύο εταιρείες πληροφορικής, έστω Α και Β, ανταγωνίζονται στον τομέα της μηχανοργάνωσης μεγάλων έργων

και ειδικότερα στον τομέα της υγείας. Καθεμία έχει καταθέσει τις προτάσεις της σχετικά με την υλοποίηση ενός

πληροφοριακού συστήματος ενός μεγάλου ιδιωτικού νοσοκομείου και το συνολικό κόστος που προτείνουν είναι

περίπου το ίδιο. Η κατακύρωση του έργου από την πλευρά του πελάτη μπορεί να γίνει τμηματικά και στις δύο

εταιρείες. Κάθε εταιρεία, στην προσπάθειά της να αποσπάσει μεγαλύτερο τμήμα του έργου, μέχρι την ανακοίνωση

της τελικής απόφασης εφαρμόζει κάποια στρατηγική δίνοντας επιπλέον παροχές προς τον πελάτη, π.χ. δωρεάν

2

ετήσια εκπαίδευση, συμβόλαια συντήρησης χαμηλότερου κόστους, νέες εκδόσεις σε ανταγωνιστικές τιμές,

προσωπικό υποστήριξης με δικά τους έξοδα κλπ. Η εταιρεία Α μπορεί να εφαρμόσει τρεις στρατηγικές ενώ η Β

τέσσερις. Αν θεωρήσουμε όλο το έργο ως 100%, τότε το ποσοστό του έργου που κατακυρώνεται στην επιχείρηση

Α για κάθε συνδυασμό στρατηγικών, δίνεται στον παρακάτω πίνακα:

Επιχείρηση Β

Επιχείρηση

Α

Β1 Β2 Β3 Β4

Α1 50 30 40 15

Α2 40 50 60 20

Α3 20 60 50 40

1. Εφαρμόστε το κριτήριο minimax στον πίνακα πληρωμών, χωρίς να διαγράψετε καμία υποδεέστερη στρατηγική,

για να ελέγξετε αν υπάρχει σημείο ισορροπίας.

2. Διαγράψτε τις υποδεέστερες στρατηγικές και εφαρμόστε την κατάλληλη μεθοδολογία ώστε να προσδιορίσετε

την άριστη στρατηγική για κάθε επιχείρηση και το ποσοστό του έργου που θα αναλάβει κάθε εταιρεία.

ΑΣΚΗΣΗ 4

Σε ένα παίγνιο μηδενικού αθροίσματος συμμετέχουν δύο παίκτες, έστω Α, Β. Ο κάθε παίκτης έχει στη διάθεση

του 2 ευρώ και από αυτά μπορεί να ποντάρει 0, 1 ή και τα 2 ευρώ. Το κέρδος του κάθε παίκτη προκύπτει από το

αποτέλεσμα της ρίψης ενός νομίσματος και από το ποσό που πόνταρε αυτός καθώς και ο αντίπαλος του.

Συγκεκριμένα, αν το αποτέλεσμα της ρίψης του νομίσματος είναι «ΚΕΦΑΛΗ» τότε τα κέρδη/ζημιές του παίκτη

Α προσδιορίζονται από τον Πίνακα 1, ενώ αν είναι «ΓΡΑΜΜΑΤΑ» από τον Πίνακα 2. Και στους δύο πίνακες

οι στρατηγικές των παικτών Α και Β, όταν ποντάρουν 0, 1, 2 ευρώ συμβολίζονται με Α0, Α1, Α2, και Β0, Β1,

Β2 αντίστοιχα.

Πίνακας 1:Κέρδος/ζημία του Α για «ΚΕΦΑΛΗ» (σε ευρώ)

Β0 Β1 Β2

Α0 0 -1 2

Α1 1 0 -1

Α2 1 1 2

Πίνακας 2: Κέρδος/ζημία του Α για «ΓΡΑΜΜΑΤΑ» (σε ευρώ)

Β0 Β1 Β2

Α0 2 -1 0

Α1 -1 1 -1

Α2 1 -1 -1

1. Να κατασκευάσετε τον πίνακα πληρωμών (αποτελεσμάτων) για τον παίκτη Α, θεωρώντας ότι τα

αποτελέσματα της ρίψης του νομίσματος είναι ισοπίθανα.

2. Με βάση τον πίνακα πληρωμών (αποτελεσμάτων) για τον παίκτη Α που κατασκευάσατε στο ερώτημα 1, να

εφαρμόσετε αρχικά το κριτήριο minimax (χωρίς διαγραφή υποδεέστερων στρατηγικών) για να ελέγξετε αν

υπάρχει ισορροπία. Στη συνέχεια, εφαρμόζοντας την κατάλληλη μεθοδολογία να προσδιορίσετε την άριστη

στρατηγική κάθε παίκτη, καθώς και την τιμή του παιγνίου.

3. Ο παίκτης Α «νοθεύει» το παίγνιο αλλάζοντας το νόμισμα με ένα κάλπικο που έχει «ΚΕΦΑΛΗ» και στις

δύο όψεις. Ευνοεί το νοθευμένο παίγνιο τον παίκτη Α;

ΑΣΚΗΣΗ 5

Η κεντρική ταχυδρομική υπηρεσία συνεργάζεται με δύο εταιρείες ταχυμεταφορών για τις ειδικές μεταφορές

μεταξύ των κυριοτέρων πόλεων της χώρας. Ας ονομάσουμε τις δύο αυτές εταιρείες Α και Β. Επί του παρόντος,

3

η εταιρεία Α κατέχει ένα μερίδιο 30% στη συνεργασία αυτή και η Β το υπόλοιπο 70%. Η ταχυδρομική υπηρεσία

έχει προκηρύξει διαγωνισμό, από τα αποτελέσματα του οποίου θα προκύψει η συνεργασία για το επόμενο έτος.

Οι εταιρεία Α θα κάνει μία προσφορά εκ τριών που συζητιούνται στο διοικητικό της συμβούλιο, ας τις

ονομάσουμε τις προσφορές αυτές Α1, Α2 και Α3. Αντίστοιχα η εταιρεία Β έχει τρεις άλλες στρατηγικές στη

διάθεσή της, τις Β1, Β2 και Β3. Ανάλογα με την προσφορά που θα κάνουν οι δύο εταιρείες (πράγμα το οποίο

γίνεται ταυτόχρονα με την κατάθεση κλειστών φακέλων χωρίς να γνωρίζουν οι αντίπαλοι την προσφορά που

τελικά επέλεξε ο αντίπαλός τους πριν να ανοιχτούν οι φάκελοι) υπάρχουν τέσσερα πιθανά ενδεχόμενα: (α) Η

εταιρεία Α κερδίζει το διαγωνισμό και την αποκλειστικότητα, οπότε ανεβάζει το ποσοστό της από 30% που

κατέχει τώρα στο 100%. Το ποσοστό της εταιρείας Β εκμηδενίζεται. (β) Η εταιρεία Β κερδίζει το διαγωνισμό

και ανεβάζει αυτή το ποσοστό της από 70% που έχει τώρα στο αποκλειστικό 100%. Το ποσοστό της εταιρείας Α

εκμηδενίζεται. (γ) Ο διαγωνισμός κατακυρώνεται και στις δύο κατά το ήμισυ (ισοπαλία) οπότε ουσιαστικά η Α

ανεβάζει το ποσοστό της στο 50% (από το 30% που είχε μέχρι τώρα) και η Β χάνει ένα τμήμα της αγοράς αφού

πέφτει στο 50% (από το 70% που κατείχε. μέχρι τώρα). (δ) Τα ποσοστά για την επόμενη χρονιά αντιστρέφονται

(δηλαδή η Α θα αναλαμβάνει το 70% των εργασιών και η Β το 30%). Στον επόμενο πίνακα βλέπετε το πιθανό

αποτέλεσμα του διαγωνισμού ανάλογα με το συνδυασμό στρατηγικών που εφαρμόζει κάθε εταιρεία.

Εταιρεία Β

Εταιρεία Α

Προσφορά Β1 Προσφορά Β2 Προσφορά Β3

Προσφορά Α1 ισοπαλία κερδίζει η Β κερδίζει η Α

Προσφορά Α2 αντιστροφή ποσοστών κερδίζει η Α κερδίζει η Β

Προσφορά Α3 ισοπαλία κερδίζει η Β κερδίζει η Β

1. Διαμορφώστε το παραπάνω πρόβλημα ως παίγνιο δύο παικτών, θεωρώντας κάθε μία εταιρεία ως παίκτη

(εταιρεία Α = παίκτης Α και εταιρεία Β = παίκτης Β), κατασκευάζοντας τον πίνακα πληρωμών για τον

παίκτη Α.

2. Προσδιορίστε την άριστη στρατηγική για κάθε πλευρά και την τιμή του παιγνιδιού. Ποιο είναι το φυσικό

νόημα της άριστης στρατηγικής για κάθε παίκτη και της τιμής του παιγνίου;

4

ΑΣΚΗΣΗ 1

Η εφαρμογή του κριτηρίου minimax απευθείας στον πίνακα δεν μπορεί να δώσει αμιγείς στρατηγικές και

υποδεικνύει την μη ύπαρξη ισορροπίας. Πράγματι, το maximin σημείο των σειρών του παραπάνω πίνακα είναι η

τιμή 2 στην τομή των στρατηγικών Α1 και Β1, ενώ το minimax σημείο των στηλών είναι η τιμή 3 στην τομή

των στρατηγικών Α1 και Β2. Επομένως δεν υπάρχει ισορροπία (δεν υπάρχουν αμιγείς στρατηγικές που θα

μπορούσαν να ισορροπήσουν οι δύο παίκτες) οπότε θα καταφύγουμε στον εντοπισμό μεικτών στρατηγικών.

Έτσι, συνεχίζουμε την επίλυση με διαγραφή κατ’ αρχήν όσων περισσοτέρων υποδεέστερων στρατηγικών. Οι

στρατηγικές Α2 και Α4 διαγράφονται επειδή είναι υποδεέστερες της Α1 (στην προκειμένη περίπτωση είναι

υποδεέστερες και της Α3) και δεν εφαρμόζονται ποτέ από έναν ορθολογιστή παίκτη Α (δηλαδή έχουν μηδενική

πιθανότητα εφαρμογής). Στη συνέχεια, μπορούν να διαγραφούν και οι στρατηγικές Β3 και Β4 διότι είναι τώρα

υποδεέστερες της Β2 (αφού τα εναπομένοντα στοιχεία των στηλών τους είναι όλα μεγαλύτερα από τα

αντίστοιχα της Β2) και ο ορθολογιστής παίκτης Β δεν θα τις εφάρμοζε. Τελικά, ο πίνακας πληρωμών μειώνεται

στον ακόλουθο πίνακα διάστασης 22 και δεν υπάρχουν άλλες υποδεέστερες στρατηγικές.

Β1

y

Β2

1-y

Α1 x 2 3

Α3 1-x 4 1

Αν τώρα, ονομάσουμε x την πιθανότητα ο παίκτης Α να ακολουθήσει τη στρατηγική του Α1, τότε (1-x) είναι

η πιθανότητα να ακολουθήσει την Α3. Ομοίως, έστω y η πιθανότητα ο Β να ακολουθήσει τη στρατηγική του

Β1, οπότε (1-y) είναι η πιθανότητα να ακολουθήσει τη στρατηγική του Β2.

Έτσι, για τον παίκτη Α έχουμε ότι V(A, B1) = 2x + 4(1-x) = -2x + 4 και V(A, B2) = 3x + 1(1-x) = 2x + 1.

Θέτοντας V(A, B1) = V(A, B2) έχουμε ότι: -2x + 4 = 2x + 1 δηλαδή 4x = 3 που δίνει x=0.75 άρα 1-x = 0.25. Η

τιμή του παιγνίου βρίσκεται με αντικατάσταση των πιθανοτήτων σε οποιοδήποτε από τα V(A, B1) ή V(A, B2)

δηλαδή είναι V = 20.75 + 1 = 2.5.

Για τον παίκτη B, με όμοιο τρόπο, έχουμε ότι V(B, A1) = V(B, A3) απ’ όπου προκύπτει μετά τις πράξεις ότι

–y + 3 = 3y + 1 που δίνει y = 0.5 οπότε 1-y = 0.5.

Ανακεφαλαιώνοντας, το αποτέλεσμα είναι το εξής:

Μεικτή στρατηγική για τον παίκτη Α: (0.75, 0, 0.25, 0)

Μεικτή στρατηγική για τον παίκτη Β: (0.5, 0.5, 0, 0

Τιμή του παιγνίου V = 2.5 (αναμενόμενο κέρδος στον παίκτη Α, ζημιά του παίκτη Β)

5

ΑΣΚΗΣΗ 2

Έχουμε ένα παίγνιο δύο παικτών μηδενικού αθροίσματος. Η εφαρμογή του κριτηρίου minimax απευθείας στον

πίνακα πληρωμών του παίκτη Α χωρίς διαγραφή των υποδεέστερων στρατηγικών, όπως βλέπουμε στον πίνακα

παρακάτω, δεν μπορεί να δώσει αμιγείς στρατηγικές και υποδεικνύει την ανυπαρξία σημείου ισορροπίας.

Πράγματι, το maximin σημείο του παίκτη Α των σειρών (της Επιτροπής) του παραπάνω πίνακα, είναι η τιμή 1

στην τομή των στρατηγικών Α1 - Β2 και Α1 - Β4 αλλά και στην τομή των στρατηγικών Α3 - Β3. Από την άλλη

πλευρά, το minimax σημείο του παίκτη Β των στηλών (της Διοίκησης) είναι η τιμή 2 στην τομή δύο ζευγών,

δηλαδή των στρατηγικών Α1 - Β3 και των στρατηγικών Α3 - Β4. Επομένως, αφού δεν υπάρχει κοινό σημείο

ισορροπίας (δηλαδή δεν υπάρχουν αντίστοιχες αμιγείς στρατηγικές που θα μπορούσαν να ισορροπήσουν οι δύο

παίκτες) θα προχωρήσουμε στον εντοπισμό μεικτών στρατηγικών.

Β1 Β2 Β3 Β4 row min

Α1 3 1 2 1 1

Α2 -1 2 -1 -2 -2

Α3 5 3 1 2 1

Α4 -3 1 1 0 -3

column max 5 3 2 2 1 ≠ 2

Συνεχίζουμε με τη διαγραφή των υποδεέστερων στρατηγικών. Η στρατηγική Α2 διαγράφεται ως υποδεέστερη

της Α3. Η στρατηγική Α4 διαγράφεται επειδή είναι υποδεέστερη και της Α1 και της Α3. Στη συνέχεια, μπορεί

να διαγραφεί η στρατηγική Β1 επειδή είναι υποδεέστερη όλων των υπολοίπων στρατηγικών του παίκτη Β.

Τέλος, διαγράφεται η Β2 επειδή είναι υποδεέστερη της Β4. Τελικά, ο πίνακας πληρωμών μειώνεται στον

ακόλουθο πίνακα διάστασης 22, όπου δεν υπάρχουν άλλες υποδεέστερες στρατηγικές.

Β3

y

Β4

1-y

Α1 x 2 1

Α3 1-x 1 2

Ας ονομάσουμε x την πιθανότητα ο παίκτης Α να ακολουθήσει τη στρατηγική του Α1, τότε (1-x) είναι η

πιθανότητα να ακολουθήσει την Α3. Ομοίως, έστω y η πιθανότητα ο Β να ακολουθήσει τη στρατηγική του Β3,

οπότε (1-y) είναι η πιθανότητα να ακολουθήσει τη στρατηγική Β4. Έτσι, για τον παίκτη Α έχουμε ότι η

προσδοκώμενη τιμή, όταν ο Β εφαρμόζει την Β3, είναι V(A, B3) = 2x +1(1-x) = x + 1 και όταν ο Β εφαρμόζει

τη Β4 είναι V(A, B4) = 1x + 2(1-x) = -x + 2. Επειδή πρέπει να ισχύει V(A, B3) = V(A, B4) είναι: x + 1 = -x + 2,

δηλαδή 2x = 1 που δίνει x = 0,5 άρα 1-x = 0,5. Η τιμή του παιγνίου (το κέρδος του Α) βρίσκεται με αντικατάσταση

των πιθανοτήτων x και 1-x σε οποιοδήποτε από τα V(A, B3) ή V(A, B4) δηλαδή V = 0.5 + 1 = -0.5 + 2 = 1.5

είναι το προσδοκώμενο κέρδος του παίκτη Α.

Για τον παίκτη B, με όμοιο τρόπο, έχουμε ότι V(B, A1) = V(B, A3), απ’ όπου προκύπτει μετά τις πράξεις ότι

y + 1 = -y + 2, που δίνει y = 0.5 οπότε 1-y = 0.5. Άλλωστε, παρατηρήστε ότι ο παραπάνω πίνακας είναι

συμμετρικός και όπως ήταν αναμενόμενο οι τιμές των πιθανοτήτων y και 1-y θα ήταν αντίστοιχες με αυτές των

τιμών x και 1-x. Με αντικατάσταση των τιμών των πιθανοτήτων y και 1-y σε οποιαδήποτε από τις σχέσεις V(B,

A1) ή V(B, A3), επαληθεύουμε ότι πράγματι η τιμή του παιγνίου (η ζημιά του Β) είναι V = 1.5, όσο δηλαδή το

κέρδος του Α, κάτι που πρέπει να συμβαίνει αφού έχουμε παίγνιο δύο παικτών μηδενικού αθροίσματος.

Ανακεφαλαιώνοντας, το τελικό αποτέλεσμα είναι το εξής:

Μεικτή στρατηγική για τον παίκτη Α: (0.5, 0, 0.5, 0)

Μεικτή στρατηγική για τον παίκτη Β: (0, 0, 0.5, 0.5)

Τιμή του παιγνίου V = 1.5 (αναμενόμενο κέρδος για τον παίκτη Α, ζημιά του παίκτη Β)

6

ΑΣΚΗΣΗ 3

Έχουμε ένα παίγνιο δύο παικτών σταθερού αθροίσματος όπου το άθροισμα είναι το ποσοστό 100% το οποίο οι

παίκτες μοιράζονται. Η εφαρμογή του κριτηρίου minimax απευθείας στον πίνακα χωρίς διαγραφή υποδεέστερων

στρατηγικών δίνει τα ακόλουθα αποτελέσματα:

Β1 Β2 Β3 Β4 row min

Α1 50 30 40 15 15

Α2 40 50 60 20 20

Α3 20 60 50 40 20

column max 50 60 60 40 20 ≠ 40

Συνεπώς το maximin σημείο των σειρών του παραπάνω πίνακα (το 20) είναι διαφορετικό από το minimax

σημείο των στηλών (το 40) και δεν υπάρχει ισορροπία με αμιγείς στρατηγικές. Άρα θα πρέπει να προχωρήσουμε

στον εντοπισμό των μεικτών στρατηγικών.

Οι στρατηγικές Β2 και Β3 είναι υποδεέστερες της Β4 και διαγράφονται. Τελικά, ο πίνακας πληρωμών μειώνεται

στον ακόλουθο πίνακα διάστασης 32 και δεν υπάρχουν άλλες υποδεέστερες στρατηγικές.



Α

Β1

y

Β4

1-y

Α1 50 15

Α2 40 20

Α3 20 40

Στη συνέχεια εφαρμόζουμε τη γραφική επίλυση ονομάζοντας y την πιθανότητα ο παίκτης Β να ακολουθήσει τη

στρατηγική Β1 οπότε (1-y) είναι η πιθανότητα να εφαρμόσει τη στρατηγική Β4. Για τον παίκτη Β με τις δύο

στρατηγικές έχουμε ότι:

V(B, A1) = 50y + 15(1-y) = 35y + 15

V(B, A2) = 40y + 20(1-y) = 20y +20

V(B, A3) = 20y + 40(1-y) = -20y + 40

Σύρουμε δύο παράλληλους κάθετους άξονες με ίδια κλίμακα μέτρησης που απέχουν μεταξύ τους μία μονάδα

και οι οποίοι αντιπροσωπεύουν τις δύο στρατηγικές του παίκτη B. Ο οριζόντιος άξονας παριστάνει τις τιμές της

πιθανότητας y. Μετά φέρουμε τα ευθύγραμμα τμήματα που παριστάνουν τις πληρωμές στον παίκτη Α (δηλαδή

τα V(B, Ai), i=1,2,3)) ανάλογα με τη στρατηγική που εφαρμόζει ο A και την πιθανότητα εφαρμογής από τον

παίκτη B είτε της B1 είτε της B4.

7

Επειδή ο παίκτης Β επιλέγει minimax στρατηγική, αυτό σημαίνει ότι επιλέγει το ελάχιστο από τα μέγιστα. Άρα

θα ακολουθήσει την τεθλασμένη γραμμή που βρίσκεται στην ανώτερη περιοχή του σχήματος και η οποία

παρουσιάζεται με πιο έντονες κόκκινες γραμμές. Επάνω σ’ αυτήν, θα επιλέξει το χαμηλότερο (minimax) σημείο

δηλαδή το σημείο Κ, όπως σημειώνεται. Ως εκ τούτου, η στρατηγική A2 από την πλευρά του παίκτη A

απορρίπτεται αφού δεν συμμετέχει στον καθορισμό του minimax σημείου Κ και η διάσταση του προβλήματος

γίνεται 2x2 με τον ακόλουθο πίνακα πληρωμών:



Α

Β1

y

Β4

1-y

Α1 x 50 15

Α3 1-x 20 40

Ας ονομάσουμε x την πιθανότητα ο παίκτης Α να ακολουθήσει τη στρατηγική Α1, οπότε (1-x) είναι η

πιθανότητα να ακολουθήσει την Α3. Έτσι, για τον παίκτη Α έχουμε ότι

V(A, B1) = 50x + 20(1-x) = 30x + 20 και

V(A, B4) = 15x + 40(1-x) = -25x + 40.

Θέτοντας V(A, B1) = V(A, B4) έχουμε ότι: 30x + 20 = -25x + 40 που δίνει 55x = 20 δηλαδή x=4/11 άρα 1-x =

7/11. Η τιμή του παιγνίου βρίσκεται με αντικατάσταση των πιθανοτήτων αυτών σε οποιοδήποτε από τα V(A,

B1) ή V(A, B4) δηλαδή είναι V = 304/11+ 20 = 340/11 ( 30.9091)

Για τον παίκτη B έχουμε ότι V(B, A1)=V(B, A3) απ’ όπου προκύπτει ότι 35y + 15 = -20y + 40 που μετά τις

πράξεις δίνει y = 5/11 οπότε 1-y = 6/11.

Ανακεφαλαιώνοντας, το αποτέλεσμα είναι το ακόλουθο:

Μεικτή στρατηγική για τον παίκτη Α: (4/11, 0, 7/11, 0)

Μεικτή στρατηγική για τον παίκτη Β: (5/11, 0, 0, 6/11)

Τιμή του παιγνίου V = 340/11, δηλαδή περίπου 30.91 που παριστάνει το αναμενόμενο ποσοστό του έργου

που θα αναλάβει η εταιρεία Α ενώ η εταιρεία Β θα αναλάβει ποσοστό περίπου 69.09% του έργου. Όλα αυτά

εφόσον οι δύο εταιρείες εφαρμόζουν τις μεικτές στρατηγικές που βρέθηκαν.

8

ΑΣΚΗΣΗ 4

Επειδή τα αποτελέσματα της ρίψης του νομίσματος είναι ισοπίθανα και δεδομένου ότι δεν υπάρχει κάποιο τρίτο

ενδεχόμενο, η πιθανότητα εμφάνισης του κάθε ενός ισούται με p = 0.5. Συνεπώς το αναμενόμενο κέρδος/ζημία

του παίκτη Α για ένα συνδυασμό στρατηγικών (Α, Β) δίνεται από το σταθμισμένο μέσο των τιμών των κελιών

των Πινάκων 1 και 2 που αντιστοιχούν στο συνδυασμό (Α, Β). Η στάθμιση γίνεται με την πιθανότητα p = 0.5.

Παράδειγμα, το αναμενόμενο κέρδος/ζημία του παίκτη Α για το συνδυασμό (Α1, Β0) είναι ίσο με 0.5(1) +

0.5(-1) = 0, όπου 1 είναι η τιμή του κελιού (Α1, Β0) στον Πίνακα 1 και -1 η τιμή του κελιού (Α1, Β0) στον

Πίνακα 2 αντίστοιχα. Άρα ο πίνακας πληρωμών (αποτελεσμάτων) για τον παίκτη Α είναι:

Αναμενόμενο κέρδος/ζημία για τον παίκτη Α

Β0 Β1 Β2

Α0 1 -1 1

Α1 0 0,5 -1

Α2 1 0 0,5

Πρόκειται για ένα παίγνιο δύο παικτών μηδενικού αθροίσματος. Η εφαρμογή του κριτηρίου minimax απευθείας

στον πίνακα πληρωμών του παίκτη Α χωρίς διαγραφή των υποδεέστερων στρατηγικών, όπως βλέπουμε στoν

παρακάτω πίνακα, δεν μπορεί να δώσει αμιγείς στρατηγικές και υποδεικνύει την ανυπαρξία σημείου ισορροπίας.

Πράγματι, η maximin τιμή του παίκτη Α είναι ίση με 0 (τομή των στρατηγικών Α2 – Β1) και η minimax τιμή

του παίκτη Β είναι ίση με 0.5 (τομή των στρατηγικών Α1 – Β1).

Β0 Β1 Β2 Ελάχιστο Γραμμής

Α0 1 -1 1 -1

Α1 0 0.5 -1 -1

Α2 1 0 0,5 0

Μέγιστο Στήλης 1 0.5 1 0.5 ≠ 0

Επομένως, αφού δεν υπάρχει κοινό σημείο ισορροπίας (δηλαδή δεν υπάρχουν αντίστοιχες αμιγείς στρατηγικές

που θα μπορούσαν να ισορροπήσουν οι δύο παίκτες) θα προχωρήσουμε στον εντοπισμό μεικτών στρατηγικών.

Συνεχίζουμε με τη διαγραφή των υποδεέστερων στρατηγικών. H στρατηγική Β0 είναι υποδεέστερη της Β2 και

συνεπώς διαγράφεται. Τελικά, ο πίνακας πληρωμών μειώνεται στον ακόλουθο πίνακα διάστασης 32, όπου δεν

υπάρχουν άλλες υποδεέστερες στρατηγικές.

Β1 Β2

Α0 -1 1

Α1 0,5 -1

Α2 0 0,5

Στη συνέχεια εφαρμόζουμε τη γραφική μέθοδο επίλυσης. Για τον προσδιορισμό των άριστων μεικτών στρατηγικών

θεωρούμε ότι ο παίκτης Β εφαρμόζει την στρατηγική Β1 με πιθανότητα y, οπότε 1-y είναι η πιθανότητα να

εφαρμόσει τη στρατηγική Β2. Η γραφική επίλυση του παιγνίου ακολουθεί.

9

Επειδή ο παίκτης Β επιλέγει minimax στρατηγική, αυτό σημαίνει ότι επιλέγει το ελάχιστο από τα μέγιστα. Άρα

θα ακολουθήσει την τεθλασμένη γραμμή που βρίσκεται στην ανώτερη περιοχή του σχήματος και η οποία

παρουσιάζεται με έντονες γραμμές. Επάνω σ’ αυτήν, θα επιλέξει το χαμηλότερο (minimax) σημείο δηλαδή το

σημείο Κ, όπως σημειώνεται. Ως εκ τούτου, η στρατηγική A0 από την πλευρά του παίκτη A απορρίπτεται αφού

δεν συμμετέχει στον καθορισμό του minimax σημείου Κ και η διάσταση του προβλήματος γίνεται 2x2 με τον

ακόλουθο πίνακα πληρωμών:

Β1

y Β2

1 - y

x Α1 0,5 -1

1 - x Α2 0 0,5

Από αυτό το σημείο και μετά επιλύουμε το παίγνιο ως πρόβλημα διάστασης 22 κάτι που ως γνωστό γίνεται ως

εξής: ονομάζουμε x την πιθανότητα ο παίκτης Α να ακολουθήσει τη στρατηγική Α1, οπότε (1-x) είναι η

πιθανότητα να ακολουθήσει την Α2. Έτσι, για τον παίκτη Β έχουμε ότι

V(B, A1) = 0.5y - 1(1 – y)

V(B, A1) = 0y + 0.5(1 – y)

Θέτοντας V(B, A1)= V(B, A1) και αντικαθιστώντας έχουμε y = 0.75, οπότε 1- y = 0.25

Η τιμή του παιγνίου για τον παίκτη Β προκύπτει με αντικατάσταση του y στην V(B,A 1) ή στην V(B, A2) και

είναι ίση με 0.125 ευρώ.

Για τον παίκτη Α ισχύει: V(Α, Β1)= 0.5x + 0(1 – x) και V(Α, Β2) = -x + 0.5(1 – x)

Θέτοντας V(Α, Β1)= V(Α, Β2) και αντικαθιστώντας βρίσκουμε x = 0.25 και 1 – x = 0.75

Η τιμή του παιγνίου για τον παίκτη Α προκύπτει από την αντικατάσταση του x είτε στην V(Α, Β1) ή στην V(Α,

Β2) και είναι ίση με 0.125 ευρώ.

Συνοψίζοντας, το αποτέλεσμα είναι το εξής :

Μεικτή στρατηγική για τον παίκτη Α: (0, 0.25, 0.75)

Μεικτή στρατηγική για τον παίκτη Β: (0, 0.75, 0.25)

Τιμή του παιγνίου V = 0.125 ευρώ

Για το ερώτημα 3, Πρέπει να λυθεί το παίγνιο με πίνακα κέρδους/ζημίας του παίκτη Α τον Πίνακα 1. Εύκολα

βλέπουμε ότι η στρατηγική Β0 είναι υποδεέστερη της Β1 οπότε απορρίπτεται, και ο Πίνακας 1 γίνεται:

K

10

Β1 Β2

Α0 -1 2

Α1 0 -1

Α2 1 2

Στον παραπάνω πίνακα φαίνεται ότι η στρατηγική Α2 κυριαρχεί τόσο επί της στρατηγικής Α0 όσο και επί της

Α1. Άρα οι δύο αυτές στρατηγικές απορρίπτονται και ο πίνακας γίνεται:

Β1 Β2

Α2 1 2

Τώρα μπορούμε να απαλείψουμε τη στρατηγική Β2 αφού είναι υποδεέστερη της Β1 και επομένως προκύπτει το

σημείο ισορροπίας (Α2, Β1) στο οποίο το κέρδος για τον παίκτη Α είναι 1 ευρώ. Άρα το νοθευμένο παίγνιο

ευνοεί τον παίκτη Α.

11

ΑΣΚΗΣΗ 5

Ο πίνακας πληρωμών προκύπτει ως εξής: Όταν το αποτέλεσμα του διαγωνισμού είναι ισοπαλία τότε οι δύο

εταιρείες παίρνουν ποσοστό από 50% της αγοράς. Αυτό σημαίνει ότι η Α κερδίζει 20 ποσοστιαίες μονάδες (από

το 30% πάει στο 50%) και η Β χάνει 20 μονάδες (από το 70% πάει στο 50%), Όταν κερδίζει το διαγωνισμό η

εταιρεία Α τότε ανεβάζει το ποσοστό της στο 100% επομένως κερδίζει 70 ποσοστιαίες μονάδες τις οποίες χάνει

η Β της οποίας το ποσοστό εκμηδενίζεται. Όταν κερδίζει το διαγωνισμό η Β τότε ανεβάζει αυτή το ποσοστό της

στο 100% δηλαδή κερδίζει 30 ποσοστιαίες μονάδες τις οποίες χάνει η Α της οποίας το ποσοστό εκμηδενίζεται.

Τέλος, όταν αντιστρέφονται τα ποσοστά η Α κερδίζει 40 ποσοστιαίες μονάδες ανεβάζοντας το ποσοστό της στο

70%, μονάδες τις οποίες χάνει η Β η οποία πέφτει στο 30%. Έτσι ο πίνακας πληρωμών για τον παίκτη Α

διαμορφώνεται ως εξής:

Εταιρεία Β

Εταιρεία Α

Προσφορά

Β1

Προσφορά

Β2

Προσφορά

Β3

Προσφορά

Α1 20 -30 70

Προσφορά

Α2 40 70 -30

Προσφορά

Α3 20 -30 -30

Αν εφαρμόσουμε το κριτήριο minimax στον πίνακα πληρωμών τότε έχουμε τα ακόλουθα αποτελέσματα.

Προσφορά Β1 Προσφορά Β2 Προσφορά Β3 row min

Προσφορά Α1 20 -30 70 -30

Προσφορά Α2 40 70 -30 -30

Προσφορά Α3 20 -30 -30 -30

column max 40 70 70 -30 ≠ 40

Παρατηρούμε ότι η maximin τιμή είναι ίση με –30 (μάλιστα από τρία διαφορετικά στοιχεία του πίνακα) και η

minimax είναι ίση με 40 (οπότε -30 40) συνεπώς δεν υπάρχουν αμιγείς στρατηγικές και δεν υπάρχει σημείο

ισορροπίας. Επομένως θα πρέπει να εντοπιστούν μεικτές στρατηγικές. Πρώτα ελέγχουμε αν μπορούν να

διαγραφούν υποδεέστερες στρατηγικές. Πράγματι η στρατηγική Α3 είναι υποδεέστερη της Α1 (και της Α2) και

διαγράφεται. Ο πίνακας πληρωμών μειώνεται στον ακόλουθο πίνακα διάστασης 23 και δεν υπάρχουν άλλες

υποδεέστερες στρατηγικές.

Β1

y1 Β2

y2 Β3

y3

Α1 x 20 -30 70

Α2 1-x 40 70 -30

Στη συνέχεια, εφαρμόζουμε τη γραφική μέθοδο επίλυσης. Ονομάζουμε x την πιθανότητα ο παίκτης Α να

ακολουθήσει τη στρατηγική του Α1, οπότε (1-x) είναι η πιθανότητα να ακολουθήσει την Α2. Για τον παίκτη Β

ονομάζουμε y1 την πιθανότητα να ακολουθήσει τη στρατηγική του Β1, y2 να εφαρμόσει την Β2 και y3 να

εφαρμόσει την Β3. Προφανώς y1+y2+y3 =1. Για τον παίκτη με δύο στρατηγικές (δηλαδή τον Α) έχουμε τις

ακόλουθες σχέσεις:

V(A, B1) = 20x +40(1-x) = -20x + 40,

V(A, B2) = -30x+70(1-x) = -100x + 70 και

V(A, B3) = 70x - 30(1-x) = 100x - 30.

12

Σύρουμε δύο παράλληλους κάθετους άξονες με ίδια κλίμακα μέτρησης που απέχουν μεταξύ τους μία μονάδα

και οι οποίοι αντιπροσωπεύουν τις στρατηγικές του παίκτη Α. Ο οριζόντιος άξονας παριστάνει τις τιμές της

πιθανότητας x. Μετά φέρουμε τα ευθύγραμμα τμήματα που παριστάνουν τις πληρωμές στον παίκτη Α (δηλαδή

τα V(A, Bi), i=1, 2, 3) ανάλογα με τη στρατηγική που εφαρμόζει ο Β και την πιθανότητα εφαρμογής από τον

παίκτη Α είτε της Α1 είτε της Α2. Για να χαράξουμε τα τρία αυτά ευθύγραμμα τμήματα αρκεί να συνδέσουμε

τις αντίστοιχες τιμές των δύο αξόνων από τον πίνακα πληρωμών δηλαδή για να χαράξουμε την ευθεία που

αντιστοιχεί στο V(A, B1) συνδέουμε το 20 με το 40, για το V(A, B2) συνδέουμε το -30 με το 70 και για την

ευθεία V(A, B3) συνδέουμε το 70 με το -30.

Επειδή ο παίκτης Α επιλέγει maximin στρατηγική, αυτό συνεπάγεται ότι επιλέγει το μέγιστο από τα ελάχιστα.

Δηλαδή θα ακολουθήσει την τεθλασμένη γραμμή που βρίσκεται στην κατώτερη περιοχή του σχήματος και η

οποία παρουσιάζεται με πιο έντονες γραμμές και επάνω σε αυτήν θα επιλέξει το υψηλότερο σημείο δηλαδή το

σημείο Κ. Ως εκ τούτου, η στρατηγική Β1 από την πλευρά του παίκτη Β απορρίπτεται αφού δεν συμμετέχει

στον καθορισμό του maximin σημείου Κ και πρακτικά το πρόβλημα γίνεται πρόβλημα διάστασης 22 με πίνακα

πληρωμών τον ακόλουθο:

Β2

y2

Β3

y3

Α1 x -30 70

Α2 1-x 70 -30

Από αυτό το σημείο και μετά επιλύουμε το παίγνιο ως πρόβλημα διάστασης 22. Για να βρούμε αλγεβρικά

τις τιμές των μεικτών στρατηγικών και την τιμή του παιγνίου εξισώνουμε τις V(A, B2) και V(A, B3) και έχουμε

-100x + 70 = 100x - 30 που δίνει 200x = 100 άρα x = 1/2 και 1 - x = 1/2 (στο σχήμα πράγματι φαίνεται ότι η

τιμή της πιθανότητας x είναι στο 1/2). Η τιμή του παιγνίου βρίσκεται με αντικατάσταση των πιθανοτήτων σε

οποιοδήποτε από τα V(A, B2) ή V(A, B3) δηλαδή είναι V = 1001/2 - 30 = 20 (πράγματι στο σχήμα

καταδεικνύεται η τιμή του παιγνίου η οποία είναι στο 20).

Για τον παίκτη B έχουμε ότι V(B, A1) = V(B, A2) δηλαδή -30y2 +70y3 = 70y2 - 30y3 που δίνει y2 = y3.

Επίσης, y2 + y3 = 1 οπότε προφανώς y2 = y3 = 1/2. Αν αντικαταστήσουμε τις πιθανότητες αυτές είτε στο V(B,

A1) είτε στο V(B, A2) θα πρέπει να πάρουμε τιμή του παιγνίου ίση με V = 20 που βρήκαμε πριν και πράγματι

έτσι είναι. Συνοψίζοντας το αποτέλεσμα είναι το εξής :

Μεικτή στρατηγική για τον παίκτη Α: (1/2, 1/2, 0)

Μεικτή στρατηγική για τον παίκτη Β: (0, 1/2, 1/2)

Τιμή του παιγνίου V = 20

13

Το φυσικό νόημα της τιμής του παιγνίου είναι ότι, εφόσον επαναληφθεί πολλές φορές το παιγνίδι με τους ίδιους

όρους (δηλαδή σε πολλές επαναλήψεις του διαγωνισμού), το μέσο (αναμενόμενο) κέρδος του Α σε βάρος του Β

ως προς το μερίδιο αγοράς είναι 20 ποσοστιαίες μονάδες που πρακτικά σημαίνει ότι μακροπρόθεσμα η εταιρεία

Α κερδίζει κατά μέσο όρο 20 μονάδες και η εταιρεία Β τις χάνει. Σε κάθε επανάληψη του διαγωνισμού φυσικά

πότε κερδίζει ποσοστά η Α, πότε κερδίζει ποσοστά η Β σύμφωνα με τον πίνακα πληρωμών. Το αποτέλεσμα που

δίνει η τιμή του παιγνίου είναι η μέση τιμή.

OR_GameTheoryExercises.pdf

Documents

Transcript of OR_GameTheoryExercises.pdf