Ε.Ν.Αντωνίου - Μαθηματικά ΙΙΙ
-
Upload
lieut-zwijedt -
Category
Documents
-
view
199 -
download
3
description
Transcript of Ε.Ν.Αντωνίου - Μαθηματικά ΙΙΙ
Περιεχόµενα
1 Πιθανότητες - Εισαγωγικές Έννοιες 1
Εισαγωγή 1
∆ειγµατοχώρος - Γεγονότα 2
Πράξεις µε γεγονότα 3
Σχετική Συχνότητα και Πιθανότητα 4
2 Αρχές Συνδυαστικής 9
Εισαγωγή 9
Κανόνας Γινοµένου - Αθροίσµατος 9
Ανεξάρτητα ενδεχόµενα 9
Αµοιβαία Αποκλειόµενα ενδεχόµενα 10
Μεταθέσεις - ∆ιατάξεις 11
Μεταθέσεις n διακεκριµένων αντικειµένων, χωρίς επαναλήψεις 11
∆ιατάξεις k διακεκριµένων αντικειµένων από n, χωρίς επαναλήψεις 12
∆ιατάξεις k αντικειµένων από n, µε επαναλήψεις 13
Μεταθέσεις n αντικειµένων, χωρισµένων σε p οµάδες όµοιων αντικειµένων 14
Γενικά Παραδείγµατα στις Μεταθέσεις - ∆ιατάξεις 15
Συνδυασµοί 17
Συνδυασµοί k αντικειµένων από n, χωρίς επαναλήψεις 17
Συνδυασµοί k αντικειµένων από n, µε επαναλήψεις 18
Τοποθέτηση Σφαιριδίων σε κουτιά 19
Γενικά παραδείγµατα στη συνδυαστική - διακριτή πιθανότητα 21
3 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία 25
ii
∆εσµευµένη Πιθανότητα 25
Ανεξάρτητα γεγονότα 31
Γενικά παραδείγµατα στη δεσµευµένη πιθανότητα - ανεξαρτησία 32
4 Τυχαίες Μεταβλητές - Κατανοµές 37
Μονοδιάστατες τυχαίες µεταβλητές 37
Συνάρτηση πιθανότητας διακριτής τυχαίας µεταβλητής 38
Συνάρτηση κατανοµής διακριτής τυχαίας µεταβλητής 40
Μέση τιµή, διασπορά διακριτής τυχαίας µεταβλητής 41
Σηµαντικές διακριτές κατανοµές 43
Οµοιόµορφη κατανοµή 43
Κατανοµή Bernoulli 44
∆ιωνυµική κατανοµή 44
Κατανοµή Poisson 45
Γενικά Παραδείγµατα 46
Συνάρτηση κατανοµής και πυκνότητας πιθανότητας συνεχούς τ.µ. 52
Μέση τιµή, διασπορά συνεχούς τυχαίας µεταβλητής 55
Σηµαντικές συνεχείς κατανοµές 56
Οµοιόµορφη κατανοµή 57
Κανονική Κατανοµή 58
5 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες 63
Εισαγωγή 63
Αριθµητικά σφάλµατα 64
Ευαισθησία και Κατάσταση 67
Προς τα Πίσω Ανάλυση Σφαλµάτων 69
Αριθµητική κινητής υποδιαστολής 70
iii
Πράξεις µε αριθµούς κινητής υποδιαστολής 74
6 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων 79
Εισαγωγή 79
Άµεσες Μέθοδοι 80
Μέθοδος απαλοιφής του Gauss και προς τα πίσω αντικατάσταση 80
Επαναληπτικές Μέθοδοι 84
Μέθοδος Jacobi 85
Μέθοδος Gauss - Seidel 88
7 Αριθµητικές µέθοδοι επίλυσης µη γραµµικών εξισώσεων 91
Μέθοδος του Newton 91
Μέθοδος της τέµνουσας 94
Μέθοδος της διχοτόµησης 97
8 Παρεµβολή 101
Εισαγωγή 101
Πολυωνυµική παρεµβολή 101
Μέθοδος του Lagrange 103
Μέθοδος του Newton 106
9 Αριθµητική Ολοκλήρωση Συναρτήσεων 109
Εισαγωγή 109
Κανόνας του ορθογωνίου 111
Κανόνας του τραπεζίου 113
Κανόνας του Simpson 115
iv
10 Αριθµητική επίλυση διαφορικών εξισώσεων 117
Εισαγωγή 117
Μέθοδος του Taylor 118
Μέθοδος του Euler 120
Μέθοδος Runge - Kutta 122
Μέθοδος Runge - Kutta 2ης τάξης 122
Μέθοδος Runge - Kutta 4ης τάξης 123
1 Πιθανότητες - Εισαγωγικές
Έννοιες
Εισαγωγή
Η θεωρία πιθανοτήτων είναι ο κλάδος των µαθηµατικών που ασχολείται µε
την ανάλυση τυχαίων φαινοµένων. Τα κεντρικά αντικείµενα της θεωρίας πιθα-
νοτήτων είναι οι τυχαίες µεταβλητές και οι στοχαστικές διαδικασίες, οι οποίες
είναι µαθηµατικά µοντέλα µη αιτιοκρατικών γεγονότων ή µετρήσιµων µεγε-
θών, τα οποία εµφανίζονται είτε µια µόνο φορά είτε εξελίσσονται στο χρόνο
κατά τυχαίο τρόπο. Παρόλο που το αποτέλεσµα της ρίψης ενός νοµίσµατος
είναι ένα καθαρά τυχαίο γεγονός, η επανάληψη του πειράµατος πολλές φορές
εµφανίζει στατιστικές ιδιότητες που µπορούν να µελετηθούν και να προβλε-
φθούν. ∆ύο χαρακτηριστικά παραδείγµατα τέτοιων αποτελεσµάτων της θεω-
ρίας πιθανοτήτων είναι οι νόµοι των µεγάλων αριθµών και το κεντρικό οριακό
θεώρηµα.
Η θεωρία πιθανοτήτων παρέχει το θεωρητικό υπόβαθρο για τη στατιστική ε-
πιστήµη, ένα κλάδο που ασχολείται µε την ποσοτική και ποιοτική ανάλυση
µεγάλων ποσοτήτων δεδοµένων που µπορεί να προέρχονται από όλους τους
τοµείς της ανθρώπινης δραστηριότητας. Πιθανοκρατικές µέθοδοι εφαρµόζο-
νται στην περιγραφή πολύπλοκων συστηµάτων, των οποίων η κατάσταση µας
είναι µόνο κατά ένα µέρος γνωστή (π.χ. στατιστική µηχανική). Μια µεγά-
λη ανακάλυψη της φυσικής του εικοστού αιώνα ήταν επίσης η πιθανοκρατική
φύση των φυσικών φαινοµένων στην ατοµική κλίµακα, η οποία µελετάται και
περιγράφεται από την κβαντοµηχανική.
Η µαθηµατική θεωρία των πιθανοτήτων έχει της ρίζες της σε προσπάθειες να
αναλυθούν τυχερά παίγνια από τον Gerolamo Cardano τον δέκατο έκτο αιώνα
2 Πιθανότητες - Εισαγωγικές Έννοιες
και τον Blaise Pascal κατά τον δέκατο έβδοµο αιώνα. Αρχικά η θεωρία πι-
θανοτήτων ασχολήθηκε κυρίως µε διακριτά γεγονότα και οι µέθοδοι της ήταν
κυρίως βασισµένοι στη συνδυαστική. Σταδιακά, η αναλυτική σκέψη οδήγη-
σε στην ενσωµάτωση συνεχών µεταβλητών στη θεωρία πιθανοτήτων, που είχε
σαν αποτέλεσµα την θεµελίωση της µοντέρνας θεωρίας πιθανοτήτων από τον
Andrey Nikolaevich Kolmogorov. Το 1933 ο Kolmogorov συνδυάζοντας την
έννοια του δειγµατοχώρου, που επινοήθηκε από τον Richard von Mises, µε
τη θεωρία µέτρου, παρουσίασε την αξιωµατική θεµελίωση της θεωρίας πιθα-
νοτήτων, η οποία πολύ σύντοµα αποτέλεσε την αδιαµφισβήτητη αξιωµατική
βάση της µοντέρνας θεωρίας πιθανοτήτων.
∆ειγµατοχώρος - Γεγονότα
Βασική έννοια της θεωρίας πιθανοτήτων είναι το πείραµα και η µελέτη των
αποτελεσµάτων του.
Παράδειγµα 1.1 Μερικά παραδείγµατα πειραµάτων θα µπορούσαν να είναι
τα παρακάτω :
• Η ρίψη ενός νοµίσµατος
• Το πλήθος των παιδιών σε µια οικογένεια
• Η θερµοκρασία σε µια συγκεκριµένη περιοχή της Ελλάδας, κάποια συγκεκρι-
µένη χρονική στιγµή
• Το βάρος ενός παιδιού της 6ης δηµοτικού
Τα αναµενόµενα αποτελέσµατα των παραπάνω πειραµάτων θα µπρορούσαν να
είναι αντίστοιχα :
• Κορώνα ή Γράµµατα
• Ένας (φυσικός) αριθµός (π.χ. 0,1,2,3... κλπ)
• Ένας πραγµατικός αριθµός στην κλίµακα -10...50
• Ένας πραγµατικός αριθµός στην κλίµακα 15...35
Με βάση τα παραπάνω οδηγούµαστε στον ακόλουθο ορισµό :
Ορισµός 1.2 Το σύνολο των δυνατών αποτελεσµάτων ενός πειράµατος ονο-
µάζεται δειγµατικός χώρος ή δειγµατοχώρος και συµβολίζεται συνήθως µε το
Πράξεις µε γεγονότα 3
γράµµα Ω. Κάθε στοιχείο ω ∈ Ω του δειγµατοχώρου ονοµάζεται απλό γεγο-
νός ή απλό ενδεχόµενο του πειράµατος. Επιπλέον, µια οποιαδήποτε συλλογή
απλών γεγονότων, δηλαδή ένα υποσύνολο A ⊆ Ω, αποτελεί (σύνθετο) γεγονόςή ενδεχόµενο.
Μια σηµαντική διάκριση που προκύπτει άµεσα για τους δειγµατοχώρους του
παραδείγµατος 1.1, είναι ότι στα δύο πρώτα πειράµατα (ρίψη νοµίσµατος,
αριθµός παιδιών στην οικογένεια) οι δειγµατοχώροι είναι απαριθµήσιµοι ή
διακριτοί. Επιπλέον, ο δειγµατοχώρος του πρώτου πειράµατος περιέχει µόνο
2 ενδεχόµενα (Κ ή Γ) και λέγεται πεπερασµένος. Αντίθετα, οι δειγµατοχώ-
ροι των δύο επόµενων πειραµάτων (θερµοκρασία, βάρος) αποτελούνται από
(συνεχή) διαστήµατα του συνόλου των πραγµατικών αριθµών και δεν είναι
προφανώς ούτε διακριτοί, ούτε πεπερασµένοι.
Παράδειγµα 1.3 Ρίχνουµε ένα ζάρι. Ο δειγµατοχώρος του πειράµατος είναι
Ω = 1, 2, 3, 4, 5, 6Προφανώς ο Ω είναι διακριτός και πεπερασµένος δειγµατοχώρος, αφού τα απλά
γεγονότα του πειράµατος της ρίψης του ενός ζαριού είναι συνολικά 6. Ενδεικτι-
κά, θα µπορούσαµε επίσης να ορίσουµε σύνθετα γεγονότα ως εξής :
• Ζυγό (άρτιο) αποτέλεσµα, το οποίο αντιστοιχεί στο A = 2, 4, 6 ⊆ Ω
• Αποτέλεσµα µεγαλύτερο του 3, το οποίο αντιστοιχεί στο B = 4, 5, 6 ⊆ Ω
Πράξεις µε γεγονότα
Έστω Ω ο δειγµατοχώρος ενός πειράµατος και A,B,Γ, ... γεγονότα. Μπορού-
µε να ορίσουµε τις παρακάτω πράξεις γεγονότων :
1. Ένωση δύο γεγονότων A,B ονοµάζεται το γεγονός που συµβαίνει, όταν
συµβαίνει τουλάχιστον ένα από τα A,B και συµβολίζεται µε A∪B. Στο πα-
ράδειγµα 1.3, θα µπορούσαµε να ορίσουµε την ένωση A∪B = 2, 4, 5, 6,που εκφράζει το γεγονός “αποτέλεσµα άρτιο ή µεγαλύτερο του 3”.
2. Τοµή δύο γεγονότων A,B ονοµάζεται το γεγονός που συµβαίνει, όταν
συµβαίνουν ταυτόχρονα και το A και το B και συµβολίζεται µε A ∩ B.Στο παράδειγµα 1.3, θα µπορούσαµε να ορίσουµε την τοµή A∩B = 4, 6,που εκφράζει το γεγονός “αποτέλεσµα άρτιο και µεγαλύτερο του 3”.
3. Συµπλήρωµα του γεγονότος A, ονοµάζεται το γεγονός που συµβαίνει ό-
ταν δεν συµβαίνει το A και συµβολίζεται µε A. Στο παράδειγµα 1.3, θα
4 Πιθανότητες - Εισαγωγικές Έννοιες
µπορούσαµε να ορίσουµε το συµπλήρωµα A = 1, 3, 5, που εκφράζει το
γεγονός “αποτέλεσµα όχι άρτιο (δηλ. περιττό)”.
Παρατηρήστε ότι οι ο πράξεις γεγονότων όπως αυτές ορίστηκαν παραπάνω
ανάγονται ουσιαστικά στις αντίστοιχες πράξεις συνόλων. Εύκολα µπορούµε
να διαπιστώσουµε ότι ισχύουν οι ακόλουθες ιδιότητες :
A ∪A = A A ∩A = AA ∪Ω = Ω A ∩Ω = AA ∪∅ = A A ∩∅ = ∅
A ∪A = Ω A ∩A = ∅
A ∪B = B ∪A A ∩B = B ∩AA ∪ (B ∪ Γ) = (A ∪B) ∪ Γ A ∩ (B ∩ Γ) = (A ∩B) ∩ Γ
A ∩ (B ∪ Γ) = (A ∩B) ∪ (A ∩ Γ) A ∪ (B ∩ Γ) = (A ∪B) ∩ (A ∪ Γ)A ∪B = A ∩B A ∩B = A ∪B
Σχετική Συχνότητα και Πιθανότητα
Έστω ότι εκτελούµε το πείραµα ρίψης ενός ζαριού N = 60 φορές και παίρ-
νουµε τις παρακάτω παρατηρήσεις :
Ενδεχόµενο (ωi) 1 2 3 4 5 6
Συχνότητα εµφανίσης (Ni) 12 10 9 9 11 9
Παρατηρούµε ότι το πλήθος των εµφανίσεων το κάθε αποτελέσµατος είναι
λίγο µικρότερο ή λίγο µεγαλύτερο του 10. Κάτι τέτοιο είναι αναµενόµενο
αφού όλες οι πλευρές του ζαριού είναι ίδιες, άρα περιµένουµε στις 60 ρίψεις
να έχουµε κατά προσέγγιση 606 = 10 εµφανίσεις του κάθε ενδεχοµένου. Ο
λόγος
fi =Ni
Nονοµάζεται σχετική συχνότητα του ενδεχοµένου ωi, στο συγκεκριµένο πεί-
ραµα. Οι σχετικές συχνότητες για το πείραµα µας είναι :
Ενδεχόµενο (ωi) 1 2 3 4 5 6
Σχετική Συχνότητα (fi) 0.200 0.167 0.150 0.150 0.183 0.150
∆ιαισθητικά αντιλαµβανόµαστε ότι αν εκτελούσαµε το πείραµα της ρίψης του
ζαριού περισσότερες φορές, για παράδειγµα 600 φορές, θα έπρεπε να περι-
µένουµε σχετικές συχνότητες που συγκλίνουν όλο και περισσότερο στην τιµή16 ≃ 0.167. Με βάση αυτό το σκεπτικό ο von Mises πρότεινε η πιθανότητα
Σχετική Συχνότητα και Πιθανότητα 5
P (A) που αντιστοιχεί σε ένα ενδεχόµενο A, να οριστεί ως το όριο της σχετικής
συχνότητας εµφάνισης του ενδεχοµένου αυτού όταν το πείραµα επαναληφθεί
πάρα πολλές φορές. ∆ηλαδή, χρησιµοποιώντας µαθηµατική ορολογία
P (A) = limN→∞
Ni
N
Ο εµπειρικός αυτός ορισµός παρουσιάζει σηµαντικές µαθηµατικές δυσκολίες
(π.χ. δεν µπορούµε να εγγυηθούµε την ύπαρξη ορίου σε οποιοδήποτε πείρα-
µα) γι’ αυτό το λόγο σήµερα έχει σχεδόν εγκαταλειφθεί, δίνοντας τη θέση
του στην αξιωµατική θεµελίωση της µαθηµατικής πιθανότητας που προτάθη-
κε από τον Kolmogorov το 1933. Σύµφωνα µε αυτή την προσέγγιση, σε κάθε
ενδεχόµενο αντιστοιχεί ένας πραγµατικός αριθµός που ονοµάζεται πιθανότη-
τα του ενδεχοµένου, ο οποίος απλά πληροί κάποιες προϋποθέσεις χωρίς να
γίνεται αναφορά σε σχετική συχνότητα ή άλλα εµπειρικά αποτελέσµατα.
Έστω ο δειγµατοχώρος Ω ενός πειράµατος. Σε κάθε ενδεχόµενο A του πειρά-
µατος αυτού αντιστοιχεί ένας πραγµατικός αριθµός P (A), που επαληθεύει τα
παρακάτω αξιώµατα :
• P (Ω) = 1
• P (A) ≥ 0 για κάθε γεγονός A
• Για οποιαδήποτε ακολουθία γεγονότων A1, A2, . . . , An που είναι αν δύο
ξένα µεταξύ τους, δηλ. Ai∩Aj = ∅ για i = j, ισχύει P (A1∪A2∪...∪An) =P (A1) + P (A2) + . . . + P (An)
Παρατηρήστε ότι στα παραπάνω αξιώµατα δεν γίνεται καµιά αναφορά στον
τρόπο ορισµού της πιθανότητας των ενδεχοµένων του δειγµατοχώρου. Παρόλα
αυτά είναι προφανές ότι τα αξιώµατα των πιθανοτήτων, αφενός δεν έρχονται
σε αντίθεση µε την έννοια της σχετικής συχνότητας, αφετέρου επιτρέπουν
διαφορετικές προσεγγίσεις όπως στο παρακάτω παράδειγµα :
Παράδειγµα 1.4 Επανερχόµαστε στο πείραµα της ρίψης ενός ζαριού. Ο δειγ-
µατοχώρος του πειράµατος είναι :
Ω = 1, 2, 3, 4, 5, 6θεωρούµε τα έξι απλά ενδεχόµενα του πειράµατος A1 = 1, A2 = 2, A3 =3, A4 = 4, A5 = 5, A6 = 6, τα οποία είναι προφανώς ανά δύο ξένα
µεταξύ τους (δηλ. Ai ∩ Aj = ∅ για i = j). Λαµβάνοντας υπόψη το τρίτο
αξίωµα, θα πρέπει να ισχύει
P (A1 ∪A2 ∪ ... ∪A6) = P (A1) + P (A2) + . . . + P (A6)
6 Πιθανότητες - Εισαγωγικές Έννοιες
Επειδή όµως A1 ∪A2 ∪ ... ∪A6 = Ω, η παραπάνω σχέση γράφεται
P (Ω) = P (A1) + P (A2) + . . . + P (A6)
όµως από το πρώτο αξίωµα έχουµε P (Ω) = 1, άρα
P (A1) + P (A2) + . . . + P (A6) = 1
Αν τώρα δεχθούµε ότι το ζάρι είναι “τίµιο”, δεν υπάρχει κανένας λόγος να
θεωρούµε ότι η πιθανότητες εµφάνισης των 6 απλών ενδεχοµένων είναι δια-
φορετικές µεταξύ τους, άρα υποθέτουµε ότι P (A1) = P (A2) = . . . = P (A6).Χρησιµοποιώντας την προηγούµενη σχέση, εύκολα προκύπτει :
P (A1) = P (A2) = . . . = P (A6) =1
6
Γενικεύοντας τη λογική του παραπάνω παραδείγµατος µπορούµε να πούµε ότι
σε ένα πεπερασµένο δειγµατοχώρο Ω, που αποτελείται από N απλά ενδεχόµε-
να ωi τα όποια είναι ισοπίθανα, η πιθανότητα του καθενός από τα απλά αυτά
ενδεχόµενα είναι :
P (ωi) =1
NΕπίσης, εύκολα προκύπτει πως σε µια τέτοια περίπτωση, η πιθανότητα ενός
σύνθετου ενδεχοµένου A που αποτελείται από nA απλά ενδεχόµενα, είναι
P (A) =NA
N
Μερικές επιπλέον συνέπειες του αξιωµατικού τρόπου θεµελίωσης της έννοιας
της πιθανότητας συνοψίζονται στο παρακάτω θεώρηµα :
Θεώρηµα 1 Έστω ο δειγµατοχώρος Ω ενός πειράµατος και A,B γεγονότα
του. Τότε :
1. P (A) + P (A) = 1
2. 0 ≤ P (A) ≤ 1
3. P (∅) = 0
4. P (A ∪B) = P (A) + P (B)− P (A ∩B)
5. Αν A ⊆ B τότε P (A) ≤ P (B)
Παράδειγµα 1.5 Από µια τράπουλα 52 φύλλων τραβάµε τυχαία ένα φύλλο.
Ζητείται η πιθανότητα του ενδεχοµένου το φύλλο να είναι φιγούρα ή κούπα. Για
να απαντήσουµε στο ζητούµενο πρέπει αρχικά να διακρίνουµε ότι το ζητούµενο
ενδεχόµενο είναι ουσιαστικά ένωση δύο απλούστερων ενδεχοµένων. Τα δύο
Σχετική Συχνότητα και Πιθανότητα 7
αυτά ενδεχόµενα είναι
A = το φύλλο είναι φιγούραB = το φύλλο είναι κούπα
Άρα το ζητούµενο είναι ο υπολογισµός του P (A ∪B).
Θα υπολογίσουµε αρχικά την πιθανότητα του ενδεχοµένου A. Το πλήθος των
φιγούρων στην τράπουλα είναι συνολικά 12, άρα εφόσον όλα τα φύλλα είναι
εξίσου πιθανό να τραβηχτούν, έχουµε
P (A) =12
52
Σκεπτόµενοι αντίστοιχα το πλήθος των φύλλων κούπα είναι 13, άρα
P (B) =13
52Για να υπολογίσουµε την P (A ∪ B) θα εκµεταλλευτούµε τον τύπο 4 του θεω-
ρήµατος , οπότε θα πρέπει επιπλέον να υπολογίσουµε την P (A ∩B), δηλ. την
πιθανότητα εµφάνισης φύλλου που είναι ταυτόχρονα κούπα και φιγούρα. Τα
φύλλα που είναι ταυτόχρονα κούπα και φιγούρα είναι συνολικά 3, άρα
P (A ∩B) =3
52Τελικά, εφαρµόζοντας τον τύπο 4 του θεωρήµατος , έχουµε
P (A ∪B) = P (A) + P (B)− P (A ∩B) =
=12
52+
13
52− 3
52=
22
52≃ 0.423
2 Αρχές Συνδυαστικής
Εισαγωγή
Σε ένα πεπερασµένο δειγµατοχώρο Ω, που αποτελείται από N απλά ενδεχόµε-
να ωi τα όποια είναι ισοπίθανα, η πιθανότητα του καθενός από τα απλά αυτά
ενδεχόµενα είναι :
P (ωi) =1
NΕπίσης, εύκολα προκύπτει πως σε µια τέτοια περίπτωση, η πιθανότητα ενός
σύνθετου ενδεχοµένου A που αποτελείται από nA απλά ενδεχόµενα, είναι
P (A) =NA
NΠαρόλο που ο παραπάνω τύπος είναι πολύ απλός στον υπολογισµό του, εί-
ναι συχνά αρκετά δύσκολο τόσο να υπολογίσουµε τον συνολικό αριθµό απλών
ενδεχοµένων του Ω, όσο και του πλήθους των απλών ενδεχοµένων που αποτε-
λούν το σύνθετο ενδεχόµενο A. Με τέτοιου είδους προβλήµατα απαρίθµησης
ασχολείται ο κλάδος τον µαθηµατικών που λέγεται συνδυαστική.
Παρακάτω παρουσιάζουµε µερικές περιπτώσεις που αφορούν τα σηµαντικότε-
ρα συνδυαστικά προβλήµατα.
Κανόνας Γινοµένου - Αθροίσµατος
Ανεξάρτητα ενδεχόµενα
Συχνά είναι ζητούµενο να απαριθµήσουµε το πλήθος απλών ενδεχοµένων, τα
οποία προέρχονται από δύο ή περισσότερες “πηγές”, οι οποίες είναι ανεξάρ-
τητες µεταξύ τους. ∆ηλαδή, το πλήθος των επιλογών από την µια “πηγή”
10 Αρχές Συνδυαστικής
ενδεχοµένων, δεν επηρεάζεται από το πλήθος της άλλης. Τέτοιου είδους εν-
δεχόµενα ονοµάζονται ανεξάρτητα.
Παράδειγµα 2.1 Εξετάζουµε το πείραµα ρίψης δύο διαφορετικών σε χρώµα
ζαριών (π.χ. ένα κόκκινο και ένα µπλε).
Προφανώς υπάρχουν 6 απλά ενδεχόµενα για κάθε ζάρι, τα οποία είναι ανεξάρ-
τητα, αφού το ένα ζάρι δεν επηρεάζει το άλλο. Είναι εύκολο να αντιληφθούµε
ότι τα απλά ενδεχόµενα του δειγµατοχώρου είναι ζευγάρια τιµών (µια τιµή για
κάθε ζάρι) και προφανώς το πλήθος των ζευγαριών αυτών είναι 6× 6 = 36.
Ο παραπάνω απλός συλλογισµός γενικεύεται εύκολα στον παρακάτω κανόνα
που είναι γνωστός ως κανόνας του γινοµένου.
Ορισµός 2.2 Εάν ένα ενδεχόµενο µπορεί να πραγµατοποιηθεί µε m διαφο-
ρετικούς τρόπους ενώ ένα άλλο, ανεξάρτητο, ενδεχόµενο µπορεί να πραγµα-
τοποιηθεί µε n τρόπους, τότε ο συνδυασµός των δύο ενδεχοµένων µπορεί να
πραγµατοποιηθεί µε m×n διαφορετικούς τρόπους. Ο ίδιος κανόνας ισχύει και
για περισσότερα από δύο ανεξάρτητα ενδεχόµενα.
Αµοιβαία Αποκλειόµενα ενδεχόµενα
Μια άλλη κατηγορία προβληµάτων αφορά την απαρίθµηση ενδεχοµένων, τα
οποία προέρχονται και πάλι από δύο ή περισσότερες “πηγές”, όµως αυτή τη
φορά η επιλογή ενδεχοµένων µπορεί να γίνει από µια µόνο “πηγή”, αποκλεί-
οντας την ή τις υπόλοιπες. Τέτοιου είδους ενδεχόµενα ονοµάζονται αµοιβαία
αποκλειόµενα.
Παράδειγµα 2.3 Πρόκειται να αγοράσουµε ένα αυτοκίνητο και πρέπει να επι-
λέξουµε χρώµα. Το αυτοκίνητο που µας ενδιαφέρει διατίθεται σε δύο “εκδοχές”
την Sport και την Classic, όµως η εκδοχή Sport διατίθεται σε κόκκινο ή µαύ-
ρο, ενώ η εκδοχή Classic σε ασηµί, µπλε ή λευκό. Πόσες δυνατότητες επιλογής
χρώµατος έχουµε;
Προφανώς, συνολικά υπάρχουν 5 διαφορετικά χρώµατα (απλά ενδεχόµενα) στη
διάθεσή µας, τα οποία προκύπτουν αν προσθέσουµε των αριθµό των χρωµάτων
της Sport εκδοχής (2), µε τον αριθµό χρωµάτων της Classic (3). Αν επιλέξουµε
την εκδοχή Sport, τότε αποκλείουµε την εκδοχή Classic, αλλά και αντίστροφα.
Τέτοιου είδους ενδεχόµενα ονοµάζονται αµοιβαία αποκλειόµενα.
Μεταθέσεις - ∆ιατάξεις 11
Ο παραπάνω συλλογισµός της άθροισης του πλήθους αµοιβαία αποκλειόµενων
ενδεχοµένων γενικεύεται στον κανόνα που είναι γνωστός ως κανόνας του
αθροίσµατος.
Ορισµός 2.4 Εάν ένα ενδεχόµενο µπορεί να πραγµατοποιηθεί µε m διαφο-
ρετικούς τρόπους ενώ ένα άλλο ενδεχόµενο µπορεί να πραγµατοποιηθεί µε nτρόπους, και τα δύο ενδεχόµενα δεν µπορεί να πραγµατοποιηθούν ταυτόχρονα,
δηλαδή είναι αµοιβαία αποκλειόµενα, τότε η πραγµατοποίηση κάποιου από τα
δύο αυτά ενδεχόµενα µπορεί να γίνει µε m + n διαφορετικούς τρόπους. Ο ί-
διος κανόνας γενικεύεται και για περισσότερα από δύο αµοιβαία αποκλειόµενα
ενδεχόµενα.
Μεταθέσεις - ∆ιατάξεις
Οι έννοιες των µεταθέσεων και των διατάξεων είναι συγγενικές. Όταν µιλάµε
για µεταθέσεις n διακεκριµένων αντικειµένων αναφερόµαστε στους πιθανούς
τρόπους τοποθέτησης των n αυτών αντικειµένων σε µια συγκεκριµένη σειρά.
Όταν γενικότερα έχουµε να τοποθετήσουµε ένα υποσύνολο των n αντικείµε-
νων, που περιέχει k αντικείµενα, σε µια συγκεκριµένη σειρά, αναφερόµαστε
σε διατάξεις k αντικειµένων από n.
Η έννοια των διακεκριµένων αντικειµένων που αναφέρθηκε παραπάνω, έχει
να κάνει µε το γεγονός ότι τα αντικείµενα του προβλήµατος µας µπορούν να
διακριθούν µε κάποιο τρόπο. Για παράδειγµα µπορεί να είναι σφαιρίδια που
έχουν διαφορετικά χρώµατα, καθίσµατα µε αρίθµηση, άνθρωποι που έχουν
ονόµατα κ.λ.π. Παρακάτω παρουσιάζουµε τις σηµαντικότερες περιπτώσεις
µεταθέσεων - διατάξεων.
Μεταθέσεις n διακεκριµένων αντικειµένων, χωρίςεπαναλήψεις
Ένα χαρακτηριστικό παράδειγµα µεταθέσεων n διακεκριµένων αντικειµένων,
χωρίς επαναλήψεις είναι το παρακάτω :
Παράδειγµα 2.5 ∆ιαθέτουµε τα γράµµατα Α, ∆, Κ, Μ πόσες διαφορετικές
λέξεις (χωρίς οι λέξεις αυτές να έχουν κατ’ ανάγκη νόηµα) µπορούµε να κατα-
σκευάσουµε µε τα γράµµατα αυτά, χρησιµοποιώντας καθένα τους ακριβώς µια
φορά;
12 Αρχές Συνδυαστικής
Σε ένα τέτοιο πρόβληµα το ζητούµενο είναι να µετρήσουµε τον αριθµό των
µεταθέσεων τεσσάρων διακεκριµένων αντικειµένων (Α, ∆, Κ, Μ), χωρίς επανά-
ληψη. Το ζητούµενο της µη επανάληψης αφορά την απαίτηση το κάθε γράµµα
να χρησιµοποιηθεί ακριβώς µια φορά. Το σκεπτικό της απαρίθµησης είναι το
εξής :
• Για την 1η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα, άρα υπάρχουν
4 ενδεχόµενα
• Για την 2η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα από τα 3 που
απέµειναν, άρα υπάρχουν 3 ενδεχόµενα
• Για την 3η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα από τα 2 που
απέµειναν, άρα υπάρχουν 2 ενδεχόµενα
• Για την 4η θέση πρέπει να επιλέξουµε το 1 γράµµα που απέµεινε, άρα υπάρχει
1 ενδεχόµενο
Οι τέσσερις παραπάνω επιλογές είναι ανεξάρτητες µεταξύ τους, άρα εφαρµόζο-
ντας τον κανόνα του γινοµένου έχουµε :
4× 3× 2× 1 = 24 ενδεχόµενα
Γενικότερα,
Ορισµός 2.6 Μια τοποθέτηση n διακεκριµένων αντικειµένων σε µια σειρά
ονοµάζεται µετάθεση των αντικειµένων αυτών, και ο αριθµός των δυνατών
µεταθέσεών τους είναι ίσος µε n× (n−1)× . . .×1.Ο αριθµός των µεταθέσεων
n διαφορετικών αντικειµένων γράφεται, πιο σύντοµα, ως n! και διαβάζεται “nπαραγοντικό”. Όταν n = 0, τότε ορίζεται 0! = 1.
∆ιατάξεις k διακεκριµένων αντικειµένων από n, χωρίςεπαναλήψεις
Γενικότερα µπορεί να τεθεί σαν ζητούµενο να διατάξουµε µόνο ένα υποσύνολο
από τα αντικείµενα που µας δίνονται. Σε µια τέτοια περίπτωση µιλάµε για
διατάξεις k διακεκριµένων αντικειµένων από n, χωρίς επαναλήψεις.
Παράδειγµα 2.7 ∆ιαθέτουµε τα γράµµατα Α, ∆, Κ, Μ, Ε, Ζ, Π πόσες διαφο-
ρετικές λέξεις (χωρίς οι λέξεις αυτές να έχουν κατ’ ανάγκη νόηµα) µήκους 4,
µπορούµε να κατασκευάσουµε µε τα γράµµατα αυτά, χρησιµοποιώντας καθένα
τους ακριβώς µια φορά;
Μεταθέσεις - ∆ιατάξεις 13
Η διαφορά σε σχέση µε το προηγούµενο παράδειγµα είναι ότι αυτή φορά δεν
θα εξαντλήσουµε το σύνολο 7 γραµµάτων, αφού χρειαζόµαστε µόνο 4 από αυτά.
Το σκεπτικό της απαρίθµησης είναι αντίστοιχο :
• Για την 1η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα, άρα υπάρχουν
7 ενδεχόµενα
• Για την 2η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα από τα 6 που
απέµειναν, άρα υπάρχουν 6 ενδεχόµενα
• Για την 3η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα από τα 5 που
απέµειναν, άρα υπάρχουν 5 ενδεχόµενα
• Για την 4η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα από τα 4 που
απέµειναν, άρα υπάρχουν 4 ενδεχόµενα
Οι τέσσερις παραπάνω επιλογές είναι ανεξάρτητες µεταξύ τους, άρα εφαρµόζο-
ντας τον κανόνα του γινοµένου έχουµε :
7× 6× 5× 4 = 840 ενδεχόµενα
Γενικότερα,
Ορισµός 2.8 Μια τοποθέτηση k αντικειµένων από n διακεκριµένα αντικείµενα
σε µια σειρά ονοµάζεται διάταξη k αντικειµένων από n, και ο αριθµός των
δυνατών τέτοιων διατάξεων είναι ίσος µε n× (n− 1)× . . .× (n− k + 1). Ο
αριθµός των διατάξεων k αντικειµένων (k ≤ n) από n συµβολίζεται µε P (n, k)και εύκολα µπορεί να διαπιστωθεί ότι
P (n, k) =n!
(n− k)!
∆ιατάξεις k αντικειµένων από n, µε επαναλήψεις
Σε αυτή την κατηγορία προβληµάτων µας ενδιαφέρουν διατάξεις k αντικει-
µένων από n, όµως αυτή τη φορά επιτρέπουµε σε οποιοδήποτε από τα n
αντικείµενα µας να συµµετέχουν στη διάταξη όσες φορές θέλουµε.
Παράδειγµα 2.9 Πόσοι διαφορετικοί τετραψήφιοι δυαδικοί αριθµοί υπάρχουν;
Το πρόβληµα έχει αρκετές οµοιότητες, αλλά και αρκετές διαφορές µε αυτό του
παραδείγµατος 2.7. Στο δυαδικό σύστηµα έχουµε στη διάθεση µας n = 2 αντι-
κείµενα (0 ή 1). Αντίστοιχα στο παράδειγµα 2.7 είχαµε n = 7 γράµµατα. Το
ζητούµενο είναι (όπως και στο παράδειγµα 2.7 να σχηµατίσουµε διατάξεις µή-
κους k = 4. Η βασική διαφορά όµως σε σχέση µε το παράδειγµα 2.7, είναι ότι
14 Αρχές Συνδυαστικής
η χρησιµοποίηση οποιουδήποτε από τα δύο διαθέσιµα σύµβολα (0 ή 1), δεν το
καθιστά πλέον µη διαθέσιµο, αφού επιτρέπονται απεριόριστες επαναλήψεις. Το
σκεπτικό της απαρίθµησης είναι το εξής :
• Για την 1η θέση µπορούµε να επιλέξουµε οποιοδήποτε από τα 0 ή 1, άρα
υπάρχουν 2 ενδεχόµενα
• Για την 2η θέση µπορούµε να επιλέξουµε οποιοδήποτε από τα 0 ή 1, άρα
υπάρχουν 2 ενδεχόµενα
• Για την 3η θέση µπορούµε να επιλέξουµε οποιοδήποτε από τα 0 ή 1, άρα
υπάρχουν 2 ενδεχόµενα
• Για την 4η θέση µπορούµε να επιλέξουµε οποιοδήποτε από τα 0 ή 1, άρα
υπάρχουν 2 ενδεχόµενα
Οι τέσσερις παραπάνω επιλογές είναι ανεξάρτητες µεταξύ τους, άρα εφαρµόζο-
ντας τον κανόνα του γινοµένου έχουµε :
2× 2× 2× 2 = 24 = 16 ενδεχόµενα
Άρα,
Ορισµός 2.10 Μια τοποθέτηση k αντικειµένων από n αντικείµενα, όπου επι-
τρέπεται η επανάληψη σε µια σειρά ονοµάζεται διάταξη k αντικειµένων απόn µε επαναλήψεις και ο αριθµός των δυνατών διατάξεων είναι ίσος µε nk.
Μεταθέσεις n αντικειµένων, χωρισµένων σε p οµάδεςόµοιων αντικειµένων
Μια άλλη γνωστή παραλλαγή του προβλήµατος των µεταθέσεων n αντικει-
µένων, αφορά περιπτώσεις όπου τα n αντικείµενα δεν είναι όλα διαφορετικά
µεταξύ τους αλλά υπάρχουν p οµάδες οµοίων αντικειµένων. Παρακολουθείστε
το παρακάτω παράδειγµα :
Παράδειγµα 2.11 Πόσες λέξεις µπορούν να κατασκευαστούν µε τα γράµµατα
της λέξης ΚΑΚΑΟ;
Παρατηρήστε ότι έχουµε στη διάθεση µας n = 5 γράµµατα, τα οποία όµως
είναι χωρισµένα σε p = 3 οµάδες. Συγκεκριµένα έχουµε 2Κ, 2Α και 1Ο. Το
ζητούµενο είναι πόσες µεταθέσεις µπορούµε να κατασκευάσουµε µε τα γράµµατα
αυτά.
Μεταθέσεις - ∆ιατάξεις 15
Αν τα γράµµατα ήταν όλα διαφορετικά µεταξύ τους θα είχαµε προφανώς 5!λέξεις. Ας υποθέσουµε ότι κάτι τέτοιο συµβαίνει και για να το πετύχουµε, µετο-
νοµάζουµε τα γράµµατα µας σε Κ1, Κ2, Α1, Α2, Ο, ώστε να διακρίνονται µεταξύ
τους. Ανάµεσα σε αυτές τις 5! λέξεις θα υπάρχουν ζεύγη όπως το παρακάτω :
Κ1Α1Κ2Α2Ο και Κ1Α2Κ2Α1Ο
οι δύο λέξεις διαφέρουν µεταξύ τους µόνο στο ότι τα δύο “Α”, είναι τοπο-
θετηµένα αντίστροφα. Αν αφαιρέσουµε τους δείκτες από τα Α, οι δύο λέξεις
ταυτίζονται.
Αν λάβουµε υπόψη µας ότι ανάµεσα σε όλες τις 5! υπάρχουν πάντα ζεύγη που
απλά διαφέρουν στην αντιµετάθεση των δύο Α, θα πρέπει συνολικά αν δεν δια-
κρίνουµε τα δύο Α να κρατήσουµε µόνο τις µισές, δηλ. 5!2 . Όµως µια αντίστοιχη
λογική µπορεί να εφαρµοστεί και για τις δύο εµφανίσεις του Κ, οπότε και πάλι
πρέπει να κρατήσουµε µόνο
5!
2× 2=
1× 2× 3× 4× 5
2× 2= 30 ενδεχόµενα
Γενικότερα,
Θεώρηµα 2 Ο αριθµός µεταθέσεων n αντικειµένων, χωρισµένων σε p ο-µάδες όµοιων αντικειµένων που η κάθε µια τους περιέχει ni αντικείµενα, έτσι
ώστε n1 + n2 + ... + np = n, είναιn!
n1!n2!...np!
Γενικά Παραδείγµατα στις Μεταθέσεις - ∆ιατάξεις
Παράδειγµα 2.12 Έχοντας στην διάθεσή µας τα ψηφία 0 έως και 9 πόσους
αριθµούς µήκους1 k µπορούµε να σχηµατίσουµε (µε απεριόριστη επανάληψη
των ψηφίων) οι οποίοι περιέχουν µία τουλάχιστον φορά το 0 (σε οποιαδήποτε
θέση);
Για να µετρήσουµε το ζητούµενο πλήθος θα µπορούσαµε να αναλύσουµε το
πρόβληµα σε ένα µεγάλο αριθµό αµοιβαία αποκλειόµενων περιπτώσεων, που
αφορούν το πλήθος των εµφανίσεων του 0 (προσέξτε ότι η εκφώνηση απαιτεί
τουλάχιστον µια εµφάνιση του 0 και όχι ακριβώς µία). Αυτό σηµαίνει ότι θα
έπρεπε να καταµετρήσουµε το πλήθος των k-ψήφιων αριθµών µε 1 µηδενικό, στη
συνέχεια µε 2 µηδενικά, 3 µηδενικά κλπ. Κάτι τέτοιο είναι αρκετά δύσκολο (όχι
όµως αδύνατο !) γι’ αυτό προτιµούµε να εφαρµόσουµε το παρακάτω τέχνασµα :
1 Σε αυτό το παράδειγµα, για λόγους απλότητας θεωρούµε ότι οι αριθµοί µήκους k που
ξεκινούν µε 0, είναι k-ψήφιοι (π.χ. θεωρούµε το 01234 είναι πενταψήφιο και όχι τετραψήφιο)
16 Αρχές Συνδυαστικής
Το πλήθος των αριθµών µήκους k που µπορούν να σχηµατιστούν χωρίς τον
περιορισµό σχετικά µε την εµφάνιση του 0 είναι 10k (αριθµός διατάξεων kστοιχείων από 10 διακεκριµένα στοιχεία µε επανάληψη). Στη συνέχεια υπολογί-
ζουµε το πλήθος των αριθµών που ικανοποιούν τη “συµπληρωµατική” συνθήκη
σχετικά µε το πλήθος των εµφανίσεων του 0. Η συµπληρωµατική της συνθήκης
“. . . τουλάχιστον µια φορά το 0”, είναι προφανώς “. . . καµιά φορά το 0”.
Οι αριθµοί µήκους k που δεν περιέχουν καµία φορά το 0 είναι αντίστοιχα 9k
(αριθµός διατάξεων k στοιχείων από 9 διακεκριµένα στοιχεία µε επανάληψη).
Εφόσον οι συµπληρωµατικές συνθήκες είναι αµοιβαία αποκλειόµενες, εφαρµό-
ζουµε τον κανόνα του αθροίσµατος. (δηλαδή, αν A είναι το ζητούµενο πλήθος
αριθµών µε τουλάχιστον ένα µηδενικό, πρέπει να ισχύει
A+ 9k = 10k
άρα
A = 10k − 9k
Παράδειγµα 2.13 α) Με πόσους τρόπους µπορούν 5 άνθρωποι (ο Γιάννης, ο
Πέτρος, η Μαρία, ο Άρης και η ∆ήµητρα) να δειπνήσουν σε ένα κυκλικό τραπέζι
5 (διακεκριµένων) θέσεων έτσι ώστε ο Γιάννης και η Μαρία να µην είναι ποτέ
σε διπλανές θέσεις;
β) Ποια η διαφορά αν το τραπέζι δεν ήταν κυκλικό;
γ) Με πόσους τρόπους µπορούν να καθίσουν τα 5 παραπάνω άτοµα σε ένα µη
κυκλικό τραπέζι 10 θέσεων, αν πρέπει αναγκαστικά ανάµεσα στο Γιάννη και στη
Μαρία να µεσολαβούν ακριβώς δύο κενές θέσεις;
α) Αν δεν υπήρχε ο περιορισµός που περιγράφεται στην εκφώνηση θα είχαµε
ένα απλό πρόβληµα µεταθέσεων 5 µη διακεκριµένων αντικειµένων, αφού κάθε
συνδαιτυµόνας θα µπορούσε να καθίσει σε οποιαδήποτε θέση µε λύση
5! = 120
Από αυτές θα πρέπει να εξαιρέσουµε τις περιπτώσεις όπου ο Γιάννης και η Μα-
ρία κάθονται σε διπλανές θέσεις. Αν ονοµάσουµε τις διακεκριµένες θέσεις του
κυκλικού τραπεζιού Α, Β, Γ, ∆, Ε τότε υπάρχουν 5 επιλογές διπλανών θέσεων :
A-B, Β-Γ, Γ-∆, ∆-Ε, Ε-Α. Οι δυνατές όµως τοποθετήσεις της Μαρίας δίπλα
στο Γιάννη είναι 10 αφού για κάθε µια από τις προηγούµενες επιλογές µπο-
ρεί να κάθεται πρώτα ο Γιάννης και µετά η Μαρία και αντιστρόφως. Για κάθε
τοποθέτηση του Γιάννη και της Μαρίας µένουν 3 διακεκριµένες θέσεις για να
καθίσουν οι υπόλοιποι συνδαιτυµόνες. Αυτό είναι ένα πρόβληµα µεταθέσεων 3
αντικειµένων και έχει λύση
3! = 6Σύµφωνα µε τον κανόνα του γινοµένου οι τρόποι µε τους οποίους µπορούν να
τοποθετηθούν οι συνδαιτυµόνες ώστε ο Γιάννης να καθίσει δίπλα στη Μαρία
Συνδυασµοί 17
είναι
10× 6 = 60Εποµένως, οι τρόποι µε τους οποίους µπορούν να τοποθετηθούν οι συνδαιτυ-
µόνες ώστε ο Γιάννης να µην καθίσει δίπλα στη Μαρία είναι
120− 60 = 60
β) Αν το τραπέζι δεν είναι κυκλικό τότε οι θέσεις Ε-Α δεν είναι γειτονικές, άρα
έχουµε 2× 4 = 8 “απαγορευµένες” τοποθετήσεις για τον Γιάννη και τη Μαρία.
Σκεπτόµενοι αντίστοιχα µε την περίπτωση α), θα έχουµε
5!− 8× 3! = 120− 48 = 72 τοποθετήσεις
γ) Θα θεωρήσουµε την ακολουθία “Γ - - Μ” σαν ένα νέο άτοµο, οπότε το
πρόβληµα µας θα ήταν ισοδύναµο µε το να τοποθετήσουµε 4 άτοµα σε 7 θέσεις,
άρα
P (7, 4) = 840 τοποθετήσεις
Αντίστοιχα θεωρώντας την ακολουθία “Μ - - Γ” σαν ένα νέο άτοµο έχουµε
επίσης 840 τοποθετήσεις. Άρα συνολικά
840 + 840 = 1680 τοποθετήσεις
Συνδυασµοί
Μια άλλη σηµαντική κατηγορία συνδυαστικών προβληµάτων αφορά τη δη-
µιουργία συνδυασµών. Η βασική διαφορά της έννοιας των συνδυασµών σε
σχέση µε αυτή των διατάξεων, είναι ότι αντίθετα µε τις δεύτερες στους συν-
δυασµούς δεν ενδιαφερόµαστε για τη συγκεκριµένη σειρά εµφάνισης των α-
ντικειµένων που επιλέγουµε από το σύνολο των αντικειµένων.
Συνδυασµοί k αντικειµένων από n, χωρίς επαναλήψεις
Το τυπικό παράδειγµα δηµιουργίας συνδυασµών χωρίς επανάληψη είναι η κλή-
ρωση του ΛΟΤΤΟ, που εµφανίζεται στο παρακάτω παράδειγµα :
Παράδειγµα 2.14 Στην κλήρωση του ΛΟΤΤΟ στην κληρωτίδα υπάρχουν n =49 διακεκριµένα σφαιρίδια (αριθµηµένα από 1 έως 49) από τα οποία επιλέγουµε
k = 6. Η τυχερή ακολουθία αποτελείται από 6 νούµερα, διαφορετικά µεταξύ
τους (δηλ. χωρίς επαναλήψεις), αλλά το σηµαντικό είναι ότι πλέον δεν µας
ενδιαφέρει η σειρά εµφάνισης τους. Για παράδειγµα, δεν µας ενδιαφέρει αν
οι τυχεροί αριθµοί ήταν 5,23,7,40,17,11 και εµφανίστηκαν µε τη συγκεκριµένη
σειρά ή µε οποιαδήποτε άλλη σειρά (π.χ. 17,5,23,11,40,17).
18 Αρχές Συνδυαστικής
Ορισµός 2.15 ∆οθέντος ενός συνόλου n διαφορετικών αντικειµένων, η επι-
λογή k αντικειµένων από αυτά χωρίς επαναλήψεις ονοµάζεται συνδυασµός kαντικειµένων από n. Αποδεικνύεται ότι το πλήθος των συνδυασµών k από n,δίνεται από τον τύπο
C(n, k) =n!
k!(n− k)!οι αριθµοί C(n, k) ονοµάζονται διωνυµικοί συντελεστές.
Στο παράδειγµα της κλήρωσης του ΛΟΤΤΟ ο συνολικός αριθµός συνδυασµών
είναι
C(49, 6) =49!
6!(49− 6)!=
49!
6!43!= 13.983.816
Συνδυασµοί k αντικειµένων από n, µε επαναλήψεις
Όπως είδαµε παραπάνω το πλήθος των συνδυασµών k αντικειµένων από n,
χωρίς επαναλήψεις, είναι C(n, k). Πως θα µπορούσαµε να παράγουµε ένα α-
ντίστοιχο αποτέλεσµα για την περίπτωση που το ζητούµενο είναι συνδυασµοί
k αντικειµένων από n, επιτρέποντας αυτή τη φορά επαναλήψεις; Παρακολου-
θείστε το παρακάτω παράδειγµα
Παράδειγµα 2.16 Υποθέτουµε ότι έχουµε ένα σύνολο από n = 4 διακεκριµένα
αντικείµενα. Έστω ότι αυτό το σύνολο είναι το A = 1, 2, 3, 4. Το πλήθος των
συνδυασµών k = 3 αριθµών από τα 4, όταν δεν επιτρέπουµε επαναλήψεις είναι
C(4, 3) = 4, οι οποίοι είναι οι παρακάτω :
1, 2, 3, 1, 2, 4, 1, 3, 4, 2, 3, 4
Αν επιτρέψουµε τις επαναλήψεις πρέπει να λάβουµε υπόψη ότι υπάρχουν κάποιοι
επιπλέον συνδυασµοί. Τέτοιοι συνδυασµοί θα µπορούσαν να είναι, για παρά-
δειγµα, οι 1, 1, 3, 2, 2, 2.Ένας τρόπος υπολογισµού του συνολικού πλήθους
των συνδυασµών µε επανάληψη είναι ο ακόλουθος :
Επεκτείνουµε το σύνολο A έτσι ώστε να περιέχει k − 1 = 3− 1 = 2 επιπλέον
στοιχεία. Έστω ότι το νέο σύνολο στοιχείων είναι το A′ = 1, 2, 3, 4, 5, 6 και
από το νέο αυτό σύνολο επιλέγουµε συνδυασµούς 3 αριθµών χωρίς επανάληψη.
Κάθε τέτοια επιλογή συνδυασµού από το A′, χωρίς επαναλήψεις µπορεί να αντι-
στοιχιστεί µοναδικά σε κάποιο συνδυασµό 3 αριθµών από το A µε επανάληψη,
χρησιµοποιώντας της εξής λογική :
• H εµφάνιση του 5 αντιπροσωπεύει επανάληψη του πρώτου αριθµού στο συν-
δυασµό µε επαναλήψεις (δηλ. ο αριθµός στη θέση 5− 4 = 1)
Τοποθέτηση Σφαιριδίων σε κουτιά 19
• H εµφάνιση του 6 αντιπροσωπεύει επανάληψη του δεύτερου αριθµού στο
συνδυασµό µε επαναλήψεις (δηλ. ο αριθµός στη θέση 6− 4 = 2)
Για παράδειγµα ο συνδυασµός 1, 1, 3 από το A, µπορεί να αντιστοιχιστεί στο
συνδυασµό 1, 3, 5 από το A′, ή αντίστοιχα ο συνδυασµός 2, 2, 2 από το A,µπορεί να αντιστοιχιστεί στο συνδυασµό 2, 5, 6 από το A′.
Άρα ο αριθµός των συνδυασµών 3 αντικειµένων από 4, µε επαναλήψεις, είναι
ίσος µε τον αριθµό των συνδυασµών 3 αντικειµένων από 6, χωρίς επαναλήψεις.
∆ηλαδή στην περίπτωση µας C(6, 3) = 6!(6−3)!3! = 20
Η παραπάνω λογική γενικεύεται και δίνει το παρακάτω θεώρηµα :
Θεώρηµα 3 Ο αριθµός συνδυασµών k στοιχείων από n, µε επαναλήψεις είναι
C(n + k − 1, k)
Τοποθέτηση Σφαιριδίων σε κουτιά
Μια πολύ σηµαντική κατηγορία συνδυαστικών µοντέλων που χρησιµοποιεί-
ται πολύ συχνά για την επίλυση συνδυαστικών προβληµάτων είναι γνωστή
ως “τοποθέτηση σφαιριδίων σε κουτιά”. Τα βασικά συστατικά στοιχεία των
µοντέλων “σφαιρίδια σε κουτιά” είναι δύο οµάδες από αντικείµενα : η µία ο-
µάδα περιέχει n σφαιρίδια και η άλλη περιέχει m κουτιά. Ο αρχικός µας (και
βασικός) στόχος είναι να µετρήσουµε µε πόσους τρόπους είναι δυνατόν να το-
ποθετηθούν τα σφαιρίδια αυτά στα κουτιά όταν επιτρέπουµε στα κουτιά να
περιέχουν οσαδήποτε σφαιρίδια, χωρίς περιορισµούς. Τα σφαιρίδια µπορεί α-
νάλογα µε το µοντέλο να θεωρηθεί ότι είναι διακεκριµένα ή όχι, ενώ αντίθετα
τα κουτιά είναι σε όλα τα µοντέλα που εξετάζουµε διακεκριµένα. Επιπλέον,
σε κάποια από τα µοντέλα (όπου τα σφαιρίδια είναι διακεκριµένα) µπορεί να
µας ενδιαφέρει η σειρά εµφάνισης των σφαιριδίων στα κουτιά ή όχι.
Τα µοντέλα αυτά συνοψίζονται στον παρακάτω πίνακα, όπου σε όλες τις πε-
ριπτώσεις θεωρούµε ότι τοποθέτηση των n σφαιριδίων γίνεται σε m διακε-
κριµένα κουτιά :
20 Αρχές Συνδυαστικής
Σφαιρίδια Περιορισµός Πλήθος
∆ιακεκριµένα ∆εν έχει σηµασία η σειρά των σφαιριδίων mn
∆ιακεκριµένα Έχει σηµασία η σειρά των σφαιριδίων(m+n−1)!(m−1)!
Όµοια ∆εν έχει σηµασία η σειρά των σφαιριδίων(m+n−1)!(m−1)!n!
Όµοια Το πολύ ένα σφαιρίδιο σε κάθε κουτί (m ≥ n) m!n!(m−n)!
Για να γίνουν ξεκάθαρες οι οµοιότητες και οι διαφορές των µοντέλων του
πίνακα, παρακολουθείστε τα παρακάτω παραδείγµατα :
Παράδειγµα 2.17 Σε ένα λεωφορείο ταξιδεύουν 20 επιβάτες, οι οποίοι πρό-
κειται να αποβιβαστούν στις επόµενες 5 στάσεις. Με πόσους διαφορετικούς
τρόπους µπορεί να γίνει η αποβίβαση αν δεν µας ενδιαφέρει η σειρά αποβίβα-
σης των επιβατών σε κάθε στάση;
Το δεδοµένο πρόβληµα µπορεί να θεωρηθεί σαν πρόβληµα τοποθέτησης σφαι-
ριδίων σε κουτιά. Το ισοδύναµο µοντέλο είναι να έχουµε n = 20 διακεκριµένα
σφαιρίδια (τα 20 άτοµα που είναι άνθρωποι άρα διακεκριµένα πρόσωπα), που
θέλουµε να τα τοποθετήσουµε σε m = 5 διακεκριµένα κουτιά (στις 5 διαφορε-
τικές στάσεις). Άρα σύµφωνα µε το πρώτο µοντέλο του πίνακα, αυτό µπορεί να
γίνει µε
mn = 520 τρόπους
Παράδειγµα 2.18 Σε µια τράπεζα υπάρχουν 20 πελάτες που περιµένουν να
εξυπηρετηθούν από 5 διαφορετικά ταµεία. Με πόσους διαφορετικούς τρόπους
µπορούν οι 20 πελάτες δηµιουργήσουν ουρές σε κάθε ένα από τα 5 ταµεία
(υποθέτουµε ότι όλοι οι πελάτες είναι ήδη στην τράπεζα);
Αντίστοιχα µε το προηγούµενο παράδειγµα έχουµε να τοποθετήσουµε n = 20διακεκριµένα σφαιρίδια (τα 20 άτοµα που είναι άνθρωποι άρα διακεκριµένα
πρόσωπα), σε m = 5 διακεκριµένα κουτιά (στις 5 διαφορετικές ουρές), όµως
αυτή τη φορά µας ενδιαφέρει η σειρά των σφαιριδίων (πελατών) σε κάθε κουτί
(ουρά). Σύµφωνα µε το δεύτερο µοντέλο του πίνακα, αυτό µπορεί να γίνει µε
(m + n− 1)!
(m− 1)!=
(5 + 20− 1)!
(5− 1)!=
24!
4!τρόπους
Παράδειγµα 2.19 Έχουµε να µοιράσουµε 20 νοµίσµατα του 1 ευρώ, σε 5
παιδιά. Με πόσους τρόπους µπορεί να γίνει η κατανοµή των νοµισµάτων;
Σε αυτή την περίπτωση έχουµε να τοποθετήσουµε n = 20 όµοια σφαιρίδια (τα
20 νοµίσµατα που είναι ίδια), σε m = 5 διακεκριµένα κουτιά (στα 5 διαφορετικά
παιδιά). Άρα χρησιµοποιώντας το τρίτο µοντέλο του πίνακα, η κατανοµή µπορεί
Γενικά παραδείγµατα στη συνδυαστική - διακριτή πιθανότητα 21
να γίνει µε
(m + n− 1)!
(m− 1)!n!=
(5 + 20− 1)!
(5− 1)!20!=
24!
4!20!τρόπους
Παράδειγµα 2.20 Πόσοι είναι οι 8-ψήφιοι δυαδικοί αριθµούς που περιέχουν
ακριβώς 5 µονάδες (και φυσικά 3 µηδενικά);
Σε αυτή την περίπτωση µπορούµε να αντιστοιχήσουµε τις 8 θέσεις του δυαδικού
αριθµού µε m = 8 διακεκριµένα κουτιά και να θεωρήσουµε έχουµε n = 5όµοια σφαιρίδια (τις µονάδες), που πρέπει να κατανεµηθούν στα κουτιά υπό
τον περιορισµό ότι σε κάθε κουτί θα µπει το πολύ ένα σφαιρίδιο (εννοείται ότι
στα 3 κουτιά που θα µείνουν άδεια αντιστοιχούν τα 3 µηδενικά του αριθµού).
Χρησιµοποιώντας το τέταρτο µοντέλο του πίνακα έχουµε
m!
n!(m− n)!=
8!
5!(8− 5)!=
8!
5!3!τρόπους
Παρατηρείστε ότι θα µπορούσαµε να εφαρµόσουµε το ίδιο µοντέλο, βλέποντας το
πρόβληµα σαν τοποθέτηση n = 3 σφαιριδίων, στα οποία τώρα αντιστοιχίζουµε
τα 3 µηδενικά, στα m = 8 κουτιά. Η απάντηση σε αυτή την περίπτωση είναι η
ίδια µε παραπάνω, αφού θα είχαµε 8!3!(8−3)! =
8!3!5! τρόπους.
Γενικά παραδείγµατα στη συνδυαστική - διακριτή πιθανότητα
Παράδειγµα 2.21 Θεωρούµε τη ρίψη δύο τίµιων ζαριών.
α) Ποια είναι η πιθανότητα και τα δύο ζάρια να εµφανίσουν τον ίδιο αριθµό;
β) Ποια είναι η πιθανότητα να εµφανιστεί τουλάχιστον ένα “εξάρι”;
Αρχικά καθορίζουµε το πλήθος των δυνατών αποτελεσµάτων που µπορεί να
φέρουν τα δύο ζάρια. Ο δειγµατοχώρος Ω, αποτελείται από ζεύγη αριθµών από
το 1 ως το 6, άρα σύµφωνα µε τον κανόνα του γινοµένου το πλήθος των απλών
ενδεχοµένων του Ω, είναι n = 6× 6 = 36.
α) Εξετάζουµε τώρα το πλήθος των ευνοϊκών ενδεχοµένων, δηλαδή µε πόσους
τρόπους τα δύο ζάρια έχουν ίδιο αποτέλεσµα. Προφανώς, τα πιθανά ζευγάρια
είναι (1, 1), (2, 2), . . . , (6, 6). Άρα το πλήθος των ευνοϊκών ενδεχοµένων είναι
nA = 6. Αφού όλα τα (απλά) ενδεχόµενα του πειράµατος µας είναι ισοπίθανα
η ζητούµενη πιθανότητα είναι
P =6
36=
1
6
β) Αντίστοιχα, θα µετρήσουµε το πλήθος των περιπτώσεων που εµφανίζεται
σε τουλάχιστον ένα από τα έξι ζάρια. Ένα πρώτο ευνοϊκό ενδεχόµενο είναι
το ζεύγος (6, 6). Επιπλέον, υπάρχουν 5 ευνοϊκά ενδεχόµενα της µορφής (6, X),
22 Αρχές Συνδυαστικής
όπου X = 1, 2, 3, 4, 5 αντίστοιχα άλλα 5 ευνοϊκά ενδεχόµενα της µορφής (X, 6),όπου επίσης όπου X = 1, 2, 3, 4, 5. Άρα συνολικά τα ευνοϊκά ενδεχόµενα είναι
nA = 1 + 5 + 5 = 11, συνεπώς η ζητούµενη πιθανότητα είναι
P =11
36
Παράδειγµα 2.22 α) Από τα 52 χαρτιά που υπάρχουν σε µια τράπουλα επιλέ-
γουµε τυχαία τέσσερα από αυτά. Ποια είναι η πιθανότητα να έχουµε τραβήξει
τέσσερις άσους (µια τράπουλα περιέχει µόνο τέσσερις άσους);
β) Επιλέγουµε πέντε φύλλα στην τύχη. Ποια είναι η πιθανότητα ανάµεσα στα
πέντε αυτά φύλλα να περιέχονται τέσσερις άσοι;
α) Ο δειγµατοχώρος Ω του πειράµατος µας, αποτελείται από διατεταγµένες τε-
τράδες χαρτιών. ∆ηλαδή ουσιαστικά κάθε απλό ενδεχόµενο είναι ένας διάταξη
k = 4 χαρτιών από n = 52, χωρίς επανάληψη αφού τα φύλλα που τραβάµε
δεν υπάρχει περίπτωση να ξαναεµφανιστούν. Το πλήθος των διατάξεων αυτών
είναι :
P (52, 4) =52!
48!= 6497400
Το ζητούµενο ευνοϊκό ενδεχόµενο είναι να τραβήξουµε 4 άσσους. Από τη στιγµή
που η τράπουλα περιέχει ακριβώς 4 άσσους, υπάρχουν 4! πιθανές διατάξεις τους.Άρα η ζητούµενη πιθανότητα είναι
P =4!
6497400≃ 3.6938× 10−6
β) Αντίστοιχα µε το υποερώτηµα α) ο δειγµατοχώρος µας αποτελείται P (52, 5)διατεταγµένες πεντάδες φύλλων. Οι ευνοϊκές πεντάδες θα περιέχουν τους 4
άσσους και ένα πέµπτο φύλλο το οποίο µπορεί να είναι οποιοδήποτε από τα υ-
πόλοιπα 48 (52 φύλλα µείον τους 4 άσσους), το οποίο στη διατεταγµένη πεντάδα
µπορεί να τοποθετηθεί σε 5 διαφορετικές θέσεις, ενώ επιπλέον πρέπει να λά-
βουµε υπόψη τις 4! πιθανές διατάξεις των 4 άσσων. Άρα οι ευνοϊκές πεντάδες
θα είναι συνολικά 48× 5× 4!. Συνεπώς η ζητούµενη πιθανότητα είναι
P =48× 5× 4!
P (52, 5)=
48× 5× 4!52!47!
≃ 1. 846 9× 10−5
Παράδειγµα 2.23 Ποια είναι η πιθανότητα ανάµεσα σε 23 διακεκριµένα άτο-
µα, να υπάρχουν τουλάχιστον δύο που έχουν γενέθλια την ίδια ηµέρα. (Θεωρού-
µε ότι όλες οι ηµέρες του έτους είναι ισοπίθανες για τη γέννηση των ανθρώπων)
Ο δειγµατοχώρος Ω του πειράµατος µας αποτελείται από διατεταγµένες 23-άδες
αριθµών, οι οποίοι µπορούν να πάρουν τιµές από 1 έως 365, όσες δηλαδή οι
ηµέρες ενός έτους. Το πλήθος των 23-άδων αυτών µπορεί εύκολα να υπολογιστεί
αν σκεφτούµε ότι ουσιαστικά πρόκειται για διατάξεις k = 23 αριθµών από
n = 365, όπου επιτρέπονται επαναλήψεις. ∆ηλαδή, συνολικά ο δειγµατοχώρος
Γενικά παραδείγµατα στη συνδυαστική - διακριτή πιθανότητα 23
µας αποτελείται από
N = nk = 36523
απλά ενδεχόµενα.
Επειδή είναι δύσκολο να µετρήσουµε πόσα είναι τα ευνοϊκά απλά ενδεχόµενα για
το ζητούµενο να υπάρχουν τουλάχιστον δύο άτοµα που έχουν γενέθλια την ίδια
ηµέρα, θα υπολογίσουµε το πλήθος των απλών ενδεχοµένων στο συµπληρωµατι-
κό σύνθετο ενδεχόµενο. ∆ηλαδή, θα υπολογίσουµε πόσες περιπτώσεις υπάρχουν
ώστε τα 23 άτοµα να έχουν γενέθλια σε διαφορετική ηµέρα το καθένα.
Προφανώς σε αυτή την περίπτωση έχουµε να απαριθµήσουµε το πλήθος των
διατάξεων k′ = 23 αριθµών από n = 365, όπου δεν επιτρέπονται επαναλήψεις,των οποίων το πλήθος είναι
NA = P (n, k′) =n!
(n′ − k′)!=
365!
342!
Άρα η πιθανότητα όλα τα άτοµα να έχουν γενέθλια σε διαφορετικές ηµέρες είναι
P ′ =NA
N=
365!342!
36523≃ 0.492 7
Αν τώρα επιστρέψουµε στο αρχικό ζητούµενο, δηλαδή την πιθανότητα δύο του-
λάχιστον άτοµα να έχουν γενέθλια την ίδια ηµέρα, έχουµε
P = 1− P ′ ≃ 1− 0.4921 ≃ 0.508
Το παραπάνω γεγονός είναι γνωστό στη βιβλιογραφία ως “παράδοξο των γενε-
θλίων”. Ο χαρακτηρισµός παράδοξο δικαιολογείται από το γεγονός ότι αρκούν
µόλις 23 άτοµα για να έχουµε πιθανότητα οριακά µεγαλύτερη από 50%, ώστε
ανάµεσα τους τουλάχιστον δύο άτοµα να έχουν γενέθλια την ίδια ηµέρα.
Παράδειγµα 2.24 Σε ένα λεωφορείο ταξιδεύουν 20 επιβάτες, οι οποίοι πρό-
κειται να αποβιβαστούν στις επόµενες 5 στάσεις.
α) Ποιά η πιθανότητα να κατέβουν όλοι οι επιβάτες σε µια στάση;
β) Ποιά η πιθανότητα να µη µείνει καµιά στάση κενή;
Στο παράδειγµα αυτό, αντίθετα µε το παράδειγµα 2.17, θα θεωρήσουµε όχι
µόνο ότι οι επιβάτες είναι διακεκριµένοι, αλλά επιπλέον ότι µας ενδιαφέρει και
η σειρά µε την οποία κατέβηκαν οι επιβάτες σε κάθε στάση.
α) Τα απλά ενδεχόµενα του δειγµατοχώρου µας είναι κατανοµές n = 20 διακε-
κριµένων επιβατών στις m = 5 στάσεις, όπου µας ενδιαφέρει και η σειρά σε
κάθε στάση, άρα σύµφωνα µε το αντίστοιχο µοντέλο τοποθέτησης σφαιριδίων
σε κουτιά, το πλήθος τους είναι :
N =(m + n− 1)!
(m− 1)!=
24!
4!
Στη συνέχεια το ζητούµενο είναι να µετρήσουµε µε πόσους τρόπους µπορεί να
24 Αρχές Συνδυαστικής
κατέβουν όλοι οι επιβάτες σε µια στάση (οι στάσεις είναι διακεκριµένες). Προ-
φανώς κάτι τέτοιο µπορεί να συµβεί µε 5 τρόπους, αφού οι ευνοϊκές τοποθετήσεις
είναι να κατέβουν όλοι στην 1η στάση, στη 2η στάση, κλπ., ενώ για κάθε µια
στάση µπορεί να έχουµε 20! διατάξεις επιβατών. Άρα NA = 5× 20!.
Εποµένως η ζητούµενη πιθανότητα είναι :
P =NA
N=
5× 20!24!4!
≃ 0.4705× 10−5
β) Ο συνολικός αριθµός απλών ενδεχοµένων του δειγµατοχώρου µας είναι ί-
διος µε αυτόν του υποερωτήµατος α), δηλαδή N = 24!4! . Για να µη µείνει καµία
στάση κενή πρέπει, σε όλες τις στάσεις να κατέβει τουλάχιστον ένας επιβάτης.
Αν θεωρήσουµε ότι τοποθετούµε εξ ’αρχής από ένα ακριβώς επιβάτη σε κάθε
µια από τις 5 στάσεις, ώστε να εξασφαλιστεί ότι δεν µένουν κενές στάσεις, η
αρχική αυτή κατανοµή µπορεί να γίνει P (20, 5) τρόπους. H κατανοµή των υ-
πολοίπων 20 − 5 = 15 επιβατών µπορεί να γίνει ανεξάρτητα, σύµφωνα µε το
µοντέλο τοποθέτησης n′ = 15 διακεκριµένων σφαιριδίων, σε m = 5 διακε-
κριµένα κουτιά, όπου µας ενδιαφέρει η σειρά εµφάνισης. Άρα το πλήθος των
ευνοϊκών κατανοµών είναι
NA =(m + n′ − 1)!
(m− 1)!× P (20, 5) =
19!
4!× 20!
15!
Συνεπώς η ζητούµενη πιθανότητα είναι
P =NA
N=
19!4! × 20!
15!24!4!
= 0.36477
3 ∆εσµευµένη Πιθανότητα -
Ανεξαρτησία
∆εσµευµένη Πιθανότητα
Η έννοια της δεσµευµένης πιθανότητας ή πιθανότητας υπό συνθήκη, σχετί-
ζεται µε το γεγονός ότι συχνά η πιθανότητα πραγµατοποίησης ενός συµβάντος
A σε ένα πείραµα εξαρτάται από την πραγµατοποίηση ή όχι ενός άλλου συµ-
βάντος B. Αυτό έχει ως αποτέλεσµα, όταν είναι γνωστό ότι πραγµατοποιήθηκε
το συµβάν B, να επηρεάζεται η πιθανότητα πραγµατοποίησης του συµβάντος
A.
Παράδειγµα 3.1 Να βρεθεί η πιθανότητα να εµφανιστεί σε µια ρίψη ζαριού
αποτέλεσµα µικρότερο του 4, αν
α) δε δίνεται καµιά άλλη πληροφορία
β) είναι γνωστό ότι η ρίψη έδωσε περιττό αριθµό.
α) Σε αυτή την περίπτωση ο δειγµατοχώρος αποτελείται από N = 6 απλά
ενδεχόµενα, δηλαδή είναι Ω = 1, 2, 3, 4, 5, 6. Ας ονοµάσουµε A = 1, 2, 3το ενδεχόµενο το αποτέλεσµα της ρίψης να είναι µικρότερο του 4, το οποίο
αποτελείται από NA = 3 απλά ενδεχόµενα. Αφού όλα τα αποτελέσµατα ρίψης
του ζαριού είναι ισοπίθανα, η πιθανότητα πραγµατοποίησης του A είναι
P (A) =NA
N=
3
6=
1
2
β) Ας ονοµάσουµε τώρα B = 1, 3, 5 το ενδεχόµενο η ρίψη να έδωσε περιττό
αποτέλεσµα, το οποίο αποτελείται από NB = 3 απλά ενδεχόµενα. Το ζητούµενο
είναι να υπολογίσουµε την πιθανότητα να συµβεί το ενδεχόµενο A, γνωρίζοντας
ότι έχει πραγµατοποιηθεί το ενδεχόµενο B.
Μια πρώτη προσέγγιση στο πρόβληµα θα ήταν να σκεφτούµε ότι έχοντας σαν
δεδοµένο το περιττό αποτέλεσµα, ο δειγµατοχώρος µας περιορίστηκε σε Ω′ =1, 3, 5, που αποτελείται από N ′ = 3 απλά ενδεχόµενα, οπότε το ζητούµενο
26 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία
ενδεχόµενο είναι A′ = 1, 3 (µε NA′ = 2 απλά ενδεχόµενα), µε πιθανότητα
P (A′) =NA′
N ′=
2
3(3.1)
Θα ήταν χρήσιµο να εκφράσουµε την παραπάνω πιθανότητα σε σχέση µε πιθα-
νότητες που σχετίζονται µε ενδεχόµενα στον αρχικό δειγµατοχώρο. Το πλήθος
των απλών ενδεχοµένων του περιορισµένου δειγµατοχώρου Ω′ είναι προφανώς
ίδιο µε αυτό του B, δηλαδήN ′ = NB
Αν, θεωρήσουµε το γεγονός A∩B, εύκολα διαπιστώνουµε ότι τα απλά ενδεχό-
µενα που περιέχει ταυτίζονται µε αυτά του A′, άρα ισχύει
NA′ = NA∩B
Άρα η (3.1) θα µπορούσε εναλλακτικά να γραφεί
P (A′) =NA∩B
NB
ή αν διαιρέσουµε αριθµητή και παρονοµαστή στο κλάσµα µε N,
P (A′) =NA∩B
NNB
N
=P (A ∩B)
P (B)
Πράγµατι, στον αρχικό δειγµατοχώρο Ω, έχουµε P (A∩B) = 26 και P (B) = 1
2 ,άρα
P (A′) =2612
=4
6=
2
3
Ο υπολογισµός που πραγµατοποιήσαµε στο β) µέρος του παραπάνω παραδείγ-
µατος δίνει ουσιαστικά την δεσµευµένη ή υπό συνθήκη πιθανότητα πραγµα-
τοποίησης του ενδεχοµένου A, δεδοµένου ότι έχει πραγµατοποιηθεί το γεγονός
B. Η πιθανότητα αυτή συµβολίζεται µε P (A/B) και διαβάζεται “δεσµευµέ-
νη πιθανότητα του ενδεχοµένου A, δεδοµένου του B”. Ο υπολογισµός του
παραδείγµατος µπορεί να γενικευθεί στο ακόλουθο θεώρηµα
Θεώρηµα 4 Η δεσµευµένη πιθανότητα του ενδεχοµένου A, δεδοµένου του
ενδεχοµένου B, δίνεται από τον τύπο
P (A/B) =P (A ∩B)
P (B)(3.2)
Παράδειγµα 3.2 Σε ένα κουτί έχουµε 7 φορτισµένες και 3 άδειες µπαταρίες.
Ποια η πιθανότητα παίρνοντας διαδοχικά δύο µπαταρίες, η δεύτερη να είναι
φορτισµένη, αν η πρώτη που διαλέξαµε ήταν άδεια.
∆εσµευµένη Πιθανότητα 27
Προφανώς το ζητούµενο είναι ο υπολογισµός κάποιας δεσµευµένης πιθανότητας.
Ο δειγµατοχώρος µας αποτελείται από διατεταγµένα ζευγάρια µπαταριών, άρα
θεωρώντας ότι έχουµε συνολικά 10 διακεκριµένες µπαταρίες, υπάρχουν
N = P (10, 2) = 10× 9 = 90 απλά ενδεχόµενα
Θεωρούµε τώρα τα εξής ενδεχόµενα
A = Η δεύτερη µπαταρία είναι φορτισµένηB = Η πρώτη µπαταρία είναι άδεια
Το πλήθος των απλών ενδεχοµένων του B είναι συνολικά NB = 3 × 9 = 27,άρα
P (B) =27
90=
3
10
Αντίστοιχα, το πλήθος των απλών ενδεχοµένων του A ∩ B είναι συνολικά
NA∩B = 3× 7 = 21, άρα
P (A ∩B) =21
90=
7
30Σύµφωνα µε το θεώρηµα, η ζητούµενη πιθανότητα είναι
P (A/B) =P (A ∩B)
P (B)=
730310
=7
9
Το παρακάτω θεώρηµα είναι γνωστό ως θεώρηµα ολικής πιθανότητας :
Θεώρηµα 5 (Ολικής πιθανότητας) Αν τα ενδεχόµενα B1, B2, . . . , Bn είναι
ξένα µεταξύ τους και B = B1 ∪ B2 ∪ . . . ∪ Bn, τότε για κάθε ενδεχόµενο A,ισχύει
P (A/B) =1
P (B)
n∑
k=1
P (Bk)P (A/Bk) (3.3)
επιπλέον αν B = Ω, τότε ισχύει
P (A) =n∑
k=1
P (Bk)P (A/Bk) (3.4)
Παράδειγµα 3.3 Έχουµε τρεις κάλπες 1,2 και 3 για τις οποίες γνωρίζουµε ότι
ο υποψήφιος δήµαρχος Χ, έχει λάβει τα ακόλουθα ποσοστά :
• Η κάλπη 1 περιέχει 20% ψήφους στον Χ, σε σύνολο 50 ψηφοφόρων
• Η κάλπη 2 περιέχει 40% ψήφους στον Χ, σε σύνολο 30 ψηφοφόρων
• Η κάλπη 3 περιέχει 60% ψήφους στον Χ, σε σύνολο 70 ψηφοφόρων
Τα (συνολικά 150) ψηφοδέλτια των τριών καλπών αναµιγνύονται τελικά σε ένα
κουτί, από το οποίο τραβάµε στην τύχη ένα ψηφοδέλτιο. Ποια η πιθανότητα να
τραβήξουµε ψηφοδέλτιο µε ψήφο υπέρ του Χ;
28 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία
Θα εκµεταλλευτούµε τον τύπο (3.4), ως εξής :
• Έστω A = τραβήξαµε ψηφοδέλτιο µε ψήφο υπέρ του Χ το ζητούµενο
ενδεχόµενο και
• Έστω Bi = τραβήξαµε ψηφοδέλτιο από την κάλπη i, i = 1, 2, 3.
Τα ενδεχόµενα Bi είναι προφανώς ξένα µεταξύ τους και επιπλέον η ένωση τους
δίνει ολόκληρο τον δειγµατοχώρο επιλογής κάλπης. Η πιθανότητα του καθενός
από τα Bi είναι προφανώς
P (B1) =50
150, P (B2) =
30
150, P (B3) =
70
150ενώ η πιθανότητα να τραβήξουµε ευνοϊκό ψήφο από την κάλπη i (δεδοµένου
ότι την διαλέξαµε), είναι
P (A/B1) =20
100, P (A/B2) =
40
100, P (A/B3) =
60
100
Χρησιµοποιώντας τον τύπο (3.4), έχουµε
P (A) = P (B1)P (A/B1) + P (B2)P (A/B2) + P (B3)P (A/B3)
=50
150
20
100+
30
150
40
100+
70
150
60
100=
32
75
Ο παρακάτω πολλαπλασιαστικός νόµος είναι πολύ χρήσιµος στη θεωρία πιθα-
νοτήτων, αφού δίνει τη δυνατότητα υπολογισµού πιθανοτήτων σε πειράµατα
που εκτελούνται σε διαδοχικά βήµατα. Ουσιαστικά το πολλαπλασιαστικό θε-
ώρηµα είναι άµεση γενίκευση του τύπου P (A1 ∩A2) = P (A2)P (A1/A2).
Θεώρηµα 6 (Πολλαπλασιαστικό Θεώρηµα) Έστω τα γεγονότα A1, A2, . . . , An,µε P (A1 ∩A2 ∩ . . . ∩An) > 0. Τότε :
P (A1∩A2∩. . .∩An) = P (A1)P (A2/A1)P (A3/A1∩A2) . . . P (An/A1∩. . .∩An−1)
Στο παρακάτω παράδειγµα θα χρησιµοποιήσουµε το πολλαπλασιαστικό θεώ-
ρηµα.
Παράδειγµα 3.4 Μια αυτοκινητοποµπή αποτελείται από 5 φορτηγά και 8 ε-
πιβατικά αυτοκίνητα. Ποιά η πιθανότητα τα τέσσερα πρώτα αυτοκίνητα που
θα περάσουν από τα διόδια να περάσουν µε τη ακόλουθη σειρά : Φορτηγό,
Επιβατικό, Φορτηγό, Φορτηγό.
Θεωρούµε τα ακόλουθα ενδεχόµενα :
• Φi = Εµφανίστηκε φορτηγό στην i θέση, i = 1, 2, 3, 4
• Ei = Εµφανίστηκε επιβατικό στην i θέση, i = 1, 2, 3, 4
∆εσµευµένη Πιθανότητα 29
Το ζητούµενο ενδεχόµενο µπορεί να κωδικοποιηθεί ως Φ1 ∩ E2 ∩ Φ3 ∩ Φ4.Εφαρµόζοντας το πολλαπλασιαστικό θεώρηµα, έχουµε :
P (Φ1∩E2∩Φ3∩Φ4) = P (Φ1)P (E2/Φ1)P (Φ3/Φ1∩E2)P (Φ4/Φ1∩E2∩Φ3)
Οι πιθανότητες που εµφανίζονται στο δεξιό µέλος της τελευταίας ισότητας είναι
οι ακόλουθες :
• P (Φ1) = 513 , αφού για την 1η θέση έχουµε διαθέσιµα 5 φορτηγά από σύνολο
13 αυτοκινήτων
• P (E2/Φ1) = 812 , αφού για την 2η θέση έχουµε διαθέσιµα 8 επιβατικά από
σύνολο 12 αυτοκινήτων
• P (Φ3/Φ1 ∩ E2) = 411 , αφού για την 3η θέση έχουµε διαθέσιµα 4 φορτηγά
από σύνολο 11 αυτοκινήτων
• P (Φ4/Φ1 ∩ E2 ∩ Φ3) = 310 , αφού για την 4η θέση έχουµε διαθέσιµα 3
φορτηγά από σύνολο 10 αυτοκινήτων
Άρα
P (Φ1 ∩E2 ∩Φ3 ∩Φ4) =5
13
8
12
4
11
3
10=
4
143
Το επόµενο θεώρηµα είναι γνωστό στη βιβλιογραφία ως θεώρηµα του Bayes
και συσχετίζει δεσµευµένες πιθανότητες της µορφής P (A/B) και P (B/A).
Στην απλή του µορφή του θεώρηµα Bayes, προκύπτει εύκολα χρησιµοποιώντας
δύο φορές τον τύπο (3.2), ως εξής :
Θεωρούµε ότι P (A) > 0 και P (B) > 0, οπότε
P (A/B) =P (A ∩B)
P (B)⇔ P (A ∩B) = P (B)P (A/B)
και
P (B/A) =P (A ∩B)
P (A)⇔ P (A ∩B) = P (A)P (B/A)
Εξισώνοντας έχουµε
P (B)P (A/B) = P (A)P (B/A)
οπότε :
Θεώρηµα 7 (Bayes) Αν A,B δύο ενδεχόµενο µε P (A) > 0 και P (B) > 0,τότε
P (A/B) =P (A)P (B/A)
P (B)(3.5)
Άµεση συνέπεια του θεωρήµατος του Bayes (κάνοντας χρήση του τύπου (3.4))
είναι το παρακάτω :
30 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία
Θεώρηµα 8 Έστω τα ενδεχόµενα A1, A2, . . . , An, που είναι ξένα µεταξύ τους,
τέτοια ώστε Ω = A1 ∪ A2 ∪ . . . ∪ An και µε P (Ai) > 0, k = 1, 2, . . . , n. Γιαοποιοδήποτε ενδεχόµενο B µε P (B) > 0, ισχύει
P (Ak/B) =P (Ak)P (B/Ak)n∑
i=1P (Ai)P (B/Ai)
(3.6)
Το θεώρηµα του Bayes δίνει µερικές φορές αποτελέσµατα που δεν είναι ανα-
µενόµενα µε την πρώτη µατιά. Παρακολουθείστε το παρακάτω παράδειγµα :
Παράδειγµα 3.5 Μια ιατρική εξέταση για τη διαπίστωση ύπαρξης ή µη ενός
ιού της γρίπης έχει ποσοστό επιτυχίας 99%. ∆ηλαδή, στο 99% των κλινικών
δοκιµών που έγιναν σε φορείς του ιού το αποτέλεσµα της εξέτασης ήταν πράγµατι
θετικό. Επίσης, διαπιστώθηκε ότι η µέθοδος έδωσε εσφαλµένα θετική διάγνωση
σε 0.6% µιας οµάδας υγειών ατόµων. Η εξέταση αυτή φαίνεται εκ πρώτης
όψης πολύ αποτελεσµατική. Υπάρχει όµως µια σηµαντική ατέλεια µπορεί να
αποκαλυφθεί κάτω από συγκεκριµένες συνθήκες µε τη βοήθεια του θεωρήµατος
του Bayes.
Σε ένα σχολείο γνωρίζουµε (από κάποια αξιόπιστη πηγή) ότι το 0, 5% των
µαθητών είναι πραγµατικά φορέας του ιού. Ορίζουµε τα παρακάτω ενδεχόµενα :
A = Ο µαθητής είναι φορέαςA = Ο µαθητής δεν είναι φορέαςB = Η εξέταση είναι θετική
Μπορούµε µε βάση τα δεδοµένα που έχουµε να υπολογίσουµε τις ακόλουθες
πιθανότητες :
• P (A) = 0.005 αφού ξέρουµε ότι 0,5% των µαθητών είναι φορείς
• P (A) = 1− P (A) = 0.995 αφού τα A και A είναι συµπληρωµατικά
• P (B/A) = 0.99 όπως έχει διαπιστωθεί σε κλινικές δοκιµές
• P (B/A) = 0.006 όπως επίσης έχει διαπιστωθεί σε κλινικές δοκιµές
Με τα παραπάνω δεδοµένα και λαµβάνοντας υπόψη ότι A∩A = ∅ και A∪A =Ω, µπορούµε χρησιµοποιώντας την (3.4), να υπολογίσουµε την πιθανότητα η
εξέταση να είναι θετική στους µαθητές του συγκεκριµένου σχολείου. ∆ηλαδή
P (B) = P (A)P (B/A) + P (A)P (B/A)
= 0.005× 0.99 + 0.995× 0.006
= 0.010 92
Τώρα µπορούµε να ελέγξουµε την “αξιοπιστία” της εξέτασης χρησιµοποιώντας
τον τύπο του Bayes, για να υπολογίσουµε την πιθανότητα ένας µαθητής να είναι
Ανεξάρτητα γεγονότα 31
φορέας, µε δεδοµένο ότι η εξέταση του ήταν θετική, δηλαδή :
P (A/B) =P (A)P (B/A)
P (B)=
0.005× 0.99
0.010 92≃ 0.453 3
Παραδόξως, αποδεικνύεται ότι η πιθανότητα ένας µαθητής να είναι φορέας, µε
µόνο δεδοµένο το θετικό αποτέλεσµα της εξέτασης είναι µόλις 45.33%.
Ανεξάρτητα γεγονότα
Εξετάζουµε τώρα την περίπτωση που η πιθανότητα πραγµατοποίησης ενός
γεγονότος A, δεν επηρεάζεται από την πραγµατοποίηση ή µη ενός άλλου
γεγονότος B, δηλαδή ισχύει
P (A/B) = P (A)
Χρησιµοποιώντας τον τύπο (3.2), έχουµε
P (A/B) =P (A ∩B)
P (B)
οπότε, αφού P (A/B) = P (A), παίρνουµε
P (A) =P (A ∩B)
P (B)ή
P (A ∩B) = P (A)P (B)
Παρατηρείστε ότι αν ισχύει P (A/B) = P (A) τότε εύκολα προκύπτει ότι
Με βάση το παραπάνω σκεπτικό δίνουµε τον παρακάτω ορισµό :
Ορισµός 3.6 ∆ύο γεγονότα A,B ονοµάζονται (στοχαστικά) ανεξάρτητα, εάν
και µόνο εάν ισχύει
P (A ∩B) = P (A)P (B)
Παράδειγµα 3.7 Ρίχνουµε δύο διακεκριµένα ζάρια. Ο δειγµατοχώρος µας α-
ποτελείται από διατεταγµένες δυάδες αριθµών από το 1 ως το 6. Προφανώς το
πλήθος των διατεταγµένων δυάδων είναι 36. Εξετάζουµε τα παρακάτω ενδεχό-
µενα :
• A = Το 1o ζάρι έφερε 3• B = Το άθροισµα των ζαριών είναι άρτιο
Προφανώς είναι
P (A) =6
36=
1
6
32 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία
P (B) =18
36=
1
2και A ∩B = (3, 1), (3, 3), (3, 5) και
P (A ∩B) =3
36=
1
12Εύκολα επιβεβαιώνουµε ότι
P (A ∩B) = P (A)P (B)
άρα τα δύο ενδεχόµενα είναι ανεξάρτητα.
Γενικά παραδείγµατα στη δεσµευµένη πιθανότητα - ανεξαρτησία
Παράδειγµα 3.8 Ένα κουτί περιέχει 6 κόκκινες, 4 άσπρες και 5 µπλε σφαίρες.
Από το κουτί τραβάµε διαδοχικά τρεις σφαίρες. Να βρεθεί η πιθανότητα η τρίτη
σφαίρα να είναι µπλε, αν οι δύο πρώτες ήταν κατά σειρά κόκκινη – άσπρη όταν :
α) Η δειγµατοληψία γίνεται χωρίς επανάθεση
β) Η δειγµατοληψία γίνεται µε επανάθεση
α) Αρχικά σχηµατίζουµε το δειγµατοχώρο Ω = ∆ιατεταγµένες τριάδες από
σφαίρες, χωρίς επαναλήψεις, προφανώς ο δειγµατοχώρος αποτελείται από N =P (15, 3) = 15×14×13 = 2730 απλά ενδεχόµενα. ορίζουµε τώρα τα παρακάτω
ενδεχόµενα :
• A = 3η σφαίρα µπλε• B = 1η σφαίρα κόκκινη και 2η σφαίρα άσπρη
Προφανώς το πλήθος των απλών ενδεχοµένων του B είναι NB = 6 × 4 ×13 = 312, οπότε P (B) = NB
N = 3122730 = 4
35 .Αντίστοιχα το πλήθος των απλών
ενδεχοµένων του A∩B είναι NA∩B = 6×4×5 = 120, άρα P (A∩B) = 1202730 =
491 . Το ζητούµενο είναι η δεσµευµένη πιθανότητα
P (A/B) =P (A ∩B)
P (B)=
491435
=5
13
Παρατηρείστε, ότι ένας εναλλακτικός τρόπος υπολογισµού της παραπάνω πιθα-
νότητας, θα ήταν να σκεφτούµε ότι έχοντας 1η σφαίρα κόκκινη και 2η σφαίρα
άσπρη, µένουν συνολικά 13 σφαίρες, εκ των οποίων επιλέγουµε µια (την 3η).
Άρα τα ευνοϊκά ενδεχόµενα είναι 5 και συνεπώς η ζητούµενη πιθανότητα 513 .
β) Όταν γίνεται επανάθεση ο δειγµατοχώρος είναι διαφορετικός σε σχέση µε το
α). Ο νέος δειγµατοχώρος µας είναι Ω = ∆ιατεταγµένες τριάδες από σφαίρες,
µε επαναλήψεις. Το πλήθος των απλών ενδεχοµένων του νέου Ω είναι N =15×15×15 = 153 = 3375. Τα ενδεχόµενα A,B που µας ενδιαφέρουν ορίζονται
Γενικά παραδείγµατα στη δεσµευµένη πιθανότητα - ανεξαρτησία 33
όπως και στο α), όµως αλλάζει ο τρόπος απαρίθµησης των απλών ενδεχοµένων
τους. Έχουµε, NB = 6 × 4 × 15 = 360, οπότε P (B) = NB
N = 3603375 = 8
75 .
Αντίστοιχα NA∩B = 6×4×5 = 120, άρα P (A∩B) = 1203375 = 8
225 . Εποµένως
η δεσµευµένη πιθανότητα είναι
P (A/B) =P (A ∩B)
P (B)=
8225875
=1
3
Αντίστοιχη, εναλλακτική λύση µε αυτή του α), µπορεί επίσης να εφαρµοστεί, αλλά
κατά την επιλογή της 3ης σφαίρας έχουµε στη διάθεση µας 15 σφαίρες συνολικά,
άρα η ζητούµενη πιθανότητα είναι 515 = 1
3 .Παρατηρείστε ότι P (A/B) = P (A),άρα τα ενδεχόµενα A,B είναι στοχαστικά ανεξάρτητα.
Παράδειγµα 3.9 Ένα µήνυµα κωδικοποιείται σε δυαδικά ψηφία 0 και 1 και
στη συνέχεια στέλνεται µέσω ενός καναλιού επικοινωνίας. Η πιθανότητα να
σταλεί 0 είναι 0,4 και η πιθανότητα να σταλεί 1 είναι 0,6. Κατά τη µετάδοση
των σηµάτων όµως, συµβαίνουν τυχαία σφάλµατα, τα οποία µετατρέπουν το 1
σε 0 µε πιθανότητα 0,2 και το 0 σε 1 µε πιθανότητα 0,1. (α) Ποιά η πιθανότητα
το σήµα που λαµβάνεται να είναι 0; (β) Ποιά η πιθανότητα να είναι 1; (γ)
Ποια η πιθανότητα να έχει σταλεί 1, δεδοµένου ότι έχει ληφθεί 0. (δ) Ποια η
πιθανότητα να έχει σταλεί 0, δεδοµένου ότι έχει ληφθεί 1.
Ας ορίσουµε τα ενδεχόµενα που µας ενδιαφέρουν :
• A = Αποστολή ψηφίου 0 µε P (A) = 0.4
• A = Αποστολή ψηφίου 1 µε P (A) = 0.6
• B = Λήψη του ψηφίου 0 του οποίου η πιθανότητα είναι το ζητούµενο (α)
• B = Λήψη του ψηφίου 1 του οποίου η πιθανότητα είναι το ζητούµενο (β)
(α-β) Οι πιθανότητες εµφάνισης λαθών που δίνονται µπορούν να ερµηνευθούν
ως εξής :
Η πιθανότητα εµφάνισης σφάλµατος µετατροπής του 0 σε 1 κατά τη µετάδοση,
εκφράζεται από την δεσµευµένη πιθανότητα P (B/A) = 0.1, ενώ προφανώς η
πιθανότητα µη εµφάνισης σφάλµατος, δηλαδή όταν το 0 φθάνει αναλλίωτο στον
παραλήπτη, είναι P (B/A) = 1− 0.1 = 0.9.
Αντίστοιχα, η πιθανότητα εµφάνισης σφάλµατος µετατροπής του 1 σε 0 κατά
τη µετάδοση, εκφράζεται από την δεσµευµένη πιθανότητα P (B/A) = 0.2, ενώπροφανώς η πιθανότητα µη εµφάνισης σφάλµατος, δηλαδή όταν το 1 φθάνει
αναλλίωτο στον παραλήπτη, είναι P (B/A) = 1− 0.2 = 0.8.
Άρα σύµφωνα µε τον τύπο (3.4) έχουµε για το (α)
P (B) = P (A)P (B/A) + P (A)P (B/A) = 0.4× 0.9 + 0.6× 0.2 = 0.48
34 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία
και για το (β)
P (B) = P (A)P (B/A) + P (A)P (B/A) = 0.4× 0.1 + 0.6× 0.8 = 0.52
(γ) Το ζητούµενο είναι προφανώς η δεσµευµένη πιθανότητα P (A/B). Από το
θεώρηµα του Bayes έχουµε :
P (A/B) =P (A)P (B/A)
P (B)=
0.6× 0.2
0.48= 0.25
(δ) Αντίστοιχα µε το (γ) ζητείται η δεσµευµένη πιθανότητα P (A/B). Από το
θεώρηµα του Bayes έχουµε :
P (A/B) =P (A)P (B/A)
P (B)=
0.4× 0.1
0.52≃ 0.0769
Παράδειγµα 3.10 Αν A,B είναι δύο ανεξάρτητα ενδεχόµενα µε P (A) = 0.5και P (B) = 0.7, να υπολογιστούν οι P (A ∩B) και P (A ∪B).
Αφού τα A,B είναι ανεξάρτητα, ισχύει :
P (A ∩B) = P (A)P (B) = 0.5× 0.7 = 0.35
Επιπλέον για την ένωση των A,B είναι γνωστό ότι ισχύει
P (A ∪B) = P (A) + P (B)− P (A ∩B) = 0.5 + 0.7− 0.35 = 0.85
Παράδειγµα 3.11 (α) ∆είξτε ότι δύο γεγονότα A,B ξένα µεταξύ τους, µε
P (A) > 0 και P (B) > 0, δεν µπορεί να είναι ανεξάρτητα.
(β) ∆είξτε ότι δύο ανεξάρτητα γεγονότα A,B, µε P (A) > 0 και P (B) > 0, δενµπορεί να είναι ξένα µεταξύ τους.
(α) Έστω A,B ξένα (µε P (A) > 0 και P (B) > 0), οπότε A ∩ B = ∅. ΆραP (A ∩B) = 0.
Έστω ότι τα A,B είναι ανεξάρτητα. Θα δείξουµε ότι κάτι τέτοιο είναι αδύνατο
(απαγωγή σε άτοπο). Αφού τα A,B είναι ανεξάρτητα θα ισχύει P (A ∩ B) =P (A)P (B). Όµως από την υπόθεση P (A) > 0 και P (B) > 0, άρα P (A∩B) =P (A)P (B) > 0. Όµως αυτό είναι άτοπο αφού δείξαµε ότι P (A ∩B) = 0.
(β) Έστω A,B ανεξάρτητα µε P (A) > 0 και P (B) > 0. Από τον ορισµό
της ανεξαρτησίας έχουµε P (A ∩ B) = P (A)P (B) και αφού P (A) > 0 και
P (B) > 0, θα είναι και P (A ∩B) = P (A)P (B) > 0.
Έστω τώρα ότι τα A,B είναι ξένα. Κάτι τέτοιο θα σήµαινε ότι A ∩ B = ∅,οπότε θα ήταν P (A∩B) = 0. Όµως προηγουµένως δείξαµε ότι P (A∩B) > 0,άρα καταλήγουµε σε άτοπο.
Παράδειγµα 3.12 Ρίχνουµε δύο νοµίσµατα µια φορά, οπότε ο δειγµατοχώρος
του πειράµατος είναι Ω = KK,KΓ,ΓK,ΓΓ. Θεωρούµε ότι η πιθανότητα
Γενικά παραδείγµατα στη δεσµευµένη πιθανότητα - ανεξαρτησία 35
να εµφανιστεί κορώνα στο πρώτο νόµισµα είναι p1, ενώ στο δεύτερο p2. Άραγια κάθε στοιχειώδες ενδεχόµενο έχουµε :
P (KK) = p1p2, P (KΓ) = p1(1− p2),
P (ΓK) = (1− p1)p2, P (ΓΓ) = (1− p1)(1− p2)
Ορίζουµε δύο σύνθετα ενδεχόµενα
A = KK,KΓ = Το πρώτο νόµισµα έφερε ΚορώναB = KK,ΓK = Το δεύτερο νόµισµα έφερε Κορώνα
Είναι τα ενδεχόµενα A,B ανεξάρτητα;
Έχουµε
P (A) = p1p2 + p1(1− p2) = p1
P (B) = p1p2 + (1− p1)p2 = p2
P (A ∩B) = P (KK) = p1p2Προφανώς ισχύει
P (A ∩B) = P (A)P (B)άρα τα A,B είναι ανεξάρτητα.
4 Τυχαίες Μεταβλητές - Κατα-
νοµές
Μονοδιάστατες τυχαίες µεταβλητές
Στα προηγούµενα κεφάλαια στις περισσότερες περιπτώσεις τα αποτελέσµατα
των πειραµάτων που εξετάσαµε είτε ήταν αριθµοί (π.χ. ρίψη ενός ζαριού),
είτε µε ένα απλό τρόπο θα µπορούσαν να κωδικοποιηθούν έτσι ώστε να α-
ντιπροσωπεύονται από αριθµούς (π.χ. στη ρίψη νοµίσµατος θα µπορούσαµε
να αντιστοιχήσουµε Κ→0 και Γ→1). Κάτι τέτοιο συναντάται επίσης σε πε-
ριπτώσεις που έχουµε να χειριστούµε αποτελέσµατα πειραµάτων που έχουν
από τη φύση τους συνεχή χαρακτήρα (π.χ. µετρήσεις µήκους, βάρους κ.λπ.).
Οι αντιστοιχήσεις των αποτελεσµάτων τέτοιων πειραµάτων σε πραγµατικούς
αριθµούς ονοµάζονται µονοδιάστατες τυχαίες µεταβλητές. Σε κάποιες πιο πο-
λύπλοκες περιπτώσεις είναι πιθανό τα αποτελέσµατα των πειραµάτων να µην
µπορούν να αντιστοιχιστούν, σε ένα µόνο πραγµατικό αριθµό, αλλά σε συν-
θετότερες µορφές όπως ζεύγη αριθµών ή τριάδες αριθµών οπότε µιλάµε για
πολυδιάστατες τυχαίες µεταβλητές.
Με βάση τα παραπάνω έχουµε τον παρακάτω ορισµό :
Ορισµός 4.1 Μια µονοδιάστατη τυχαία µεταβλητή είναι µια συνάρτηση X, ηοποία απεικονίζει κάθε ενδεχόµενο ενός πειράµατος ω ∈ Ω, σε ένα πραγµατικό
αριθµό X(ω) ∈ R, δηλαδήX : Ω→ R
τέτοια ώστε για κάθε πραγµατικό αριθµό x ∈ R, το σύνολο X−1(−∞, x] να
είναι ενδεχόµενο του Ω.
Ανάλογα µε το αν ο δειγµατοχώρος που αποτελεί πεδίο ορισµού για την τυ-
χαία µεταβλητή, είναι συνεχής ή διακριτός, αντίστοιχα χαρακτηρίζεται και η
38 Τυχαίες Μεταβλητές - Κατανοµές
ίδια η τυχαία µεταβλητή σαν συνεχής ή διακριτή. Στο παρόν κεφάλαιο θα
ασχοληθούµε κυρίως µε διακριτές τυχαίες µεταβλητές.
Παράδειγµα 4.2 Στο πείραµα ρίψης ενός ζαριού η τυχαία µεταβλητή που α-
ντιστοιχεί στα στοιχεία του δειγµατοχώρου Ω = 1, 2, 3, 4, 5, 6 πραγµατικούς
αριθµούς, µπορεί να θεωρηθεί ότι είναι η ταυτοτική συνάρτηση, αφού τα στοι-
χεία του δειγµατοχώρου είναι τα ίδια αριθµοί. ∆ηλαδή, ορίζουµε την τυχαία
µεταβλητή X(ω) = ω, όπου ω = 1, 2, 3, 4, 5, 6.
Παρατηρείστε, ότι παρόλα αυτά θα µπορούσε κανείς, για λόγους που εξυπηρε-
τούν τις ανάγκες του, να ορίσει µια άλλη τυχαία µεταβλητή X1, για τα στοιχεία
του δειγµατοχώρου Ω, ως εξής :
X1(ω) = 6− ω, όπου ω = 1, 2, 3, 4, 5, 6
Παράδειγµα 4.3 Στο πείραµα ρίψης δύο διακεκριµένων ζαριών όπου ο δειγ-
µατοχώρος αποτελείται από 36 διατεταγµένες δυάδες αριθµών της µορφής ω =(i, j), όπου i, j = 1, 2, 3, 4, 5, 6, θα µπορούσαµε να ορίσουµε την τυχαία µε-
ταβλητή που δίνεται από το άθροισµα των αποτελεσµάτων των δύο ζαριών,
δηλαδή :
X(ω) = i + j
Συνάρτηση πιθανότητας διακριτής τυχαίας µεταβλητής
Ορισµός 4.4 Έστω µια διακριτή τυχαία µεταβλητή X, που παίρνει τις τιµές
x1, x2, x3, . . ., τότε η συνάρτηση
f(x) =
P (X = xi), x = x1, x2, . . .
0, x = xi, i = 1, 2, 3, . . .
ονοµάζεται συνάρτηση πιθανότητας της διακριτής τυχαίας µεταβλητής X,όπου P (X = xi) εκφράζει την πιθανότητα η τυχαία µεταβλητή X να πάρει την
τιµή xi.
Η συνάρτηση f(x) ικανοποιεί τις παρακάτω ιδιότητες :
• f(x) > 0, για x = x1, x2, . . .
• f(x) = 0, για x = xi, i = 1, 2, 3, . . .
• ∑
if(xi) = 1
Παράδειγµα 4.5 Θεωρούµε το πείραµα ρίψης δύο διακεκριµένων ζαριών ό-
που για κάθε ενδεχόµενο της µορφής ω = (i, j), όπου i, j = 1, 2, 3, 4, 5, 6,ορίζουµε την τυχαία µεταβλητή X(ω) = i + j. Ο δειγµατοχώρος αποτελείται
Συνάρτηση πιθανότητας διακριτής τυχαίας µεταβλητής 39
από 36 απλά ενδεχόµενα (διατεταγµένα ζεύγη), ενώ η τυχαία µεταβλητή X µπο-
ρεί να πάρει ακέραιες τιµές από 2 έως 12. Μας ενδιαφέρει να ορίσουµε τη
συνάρτηση πιθανότητας της τ.µ. X, δεδοµένου ότι όλα τα απλά ενδεχόµενα του
δειγµατοχώρου είναι ισοπίθανα.
Ουσιαστικά για να ορίσουµε τη συνάρτηση πιθανότητας της τ.µ. X, πρέπει ναυπολογίσουµε τις πιθανότητες εµφάνισης κάθε µιας από τις διακριτές τιµές που
µπορεί να πάρει η τ.µ. Στον παρακάτω πίνακα παρουσιάζουµε συνοπτικά τον
υπολογισµό αυτό :
xi Ευνοϊκά ζεύγη Πλήθος ζευγών P (X = xi)2 (1, 1) 1 1/363 (1, 2), (2, 1) 2 2/364 (1, 3), (2, 2), (3, 1) 3 3/365 (1, 4), (2, 3), (3, 2), (4, 1) 4 4/366 (1, 5), (2, 4), (3, 3), (4, 2), (5, 1) 5 5/367 (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) 6 6/368 (2, 6), (3, 5), (4, 4), (5, 3), (6, 2) 5 5/369 (3, 6), (4, 5), (5, 4), (6, 3) 4 4/3610 (4, 6), (5, 5), (6, 4) 3 3/3611 (5, 6), (6, 5) 2 2/3612 (6, 6) 1 1/36
Άρα η συνάρτηση πιθανότητας για την τ.µ. X είναι
f(x) = P (X = xi)
όπου το P (X = xi) δίνεται από τον παραπάνω πίνακα και η γραφική της πα-
ράσταση είναι :
0 2 4 6 8 10 12 140.0
0.1
0.2
x
f(x)
40 Τυχαίες Μεταβλητές - Κατανοµές
Συνάρτηση κατανοµής διακριτής τυχαίας µεταβλητής
Συχνά είναι χρήσιµο να µπορούµε να υπολογίσουµε άµεσα την πιθανότητα µια
δεδοµένη διακριτή τ.µ. να παίρνει τιµή µικρότερη ή ίση από µια δεδοµένη τιµή
x.Ένας τέτοιος υπολογισµός µπορεί να πραγµατοποιηθεί εύκολα αθροίζοντας
κατάλληλα τιµές της συνάρτησης πιθανότητας της τ.µ. Η νέα αυτή συνάρτηση
ορίζεται ως εξής :
Ορισµός 4.6 Έστω µια διακριτή τυχαία µεταβλητή X, που παίρνει τις τιµές
x1, x2, x3, . . . , τότε η συνάρτηση
F (x) = P (X ≤ x)
ονοµάζεται αθροιστική συνάρτηση κατανοµής ή απλά συνάρτηση κατανοµής
της τυχαίας µεταβλητής X.
Προφανώς η συνάρτηση κατανοµής της τ.µ. µεταβλητής X, µπορεί να εκφρα-
στεί µε τη βοήθεια της αντίστοιχης συνάρτησης πιθανότητας ως εξής :
F (x) =∑
u≤x
f(u) =∑
xi≤x
f(xi)
Επιπλέον, εύκολα µπορούµε να διαπιστώσουµε τις ακόλουθες ιδιότητες :
• F (−∞) = 0 και F (+∞) = 1
• Για κάθε a < b, ισχύει F (a) ≤ F (b), δηλαδή η F (.) είναι αύξουσα συνάρ-
τηση.
• P (a < X ≤ b) = P (X ≤ b)− P (X ≤ a) = F (b)− F (a)
Παράδειγµα 4.7 Στο παράδειγµα 4.5, µπορούµε να κατασκευάσουµε την συ-
νάρτηση κατανοµής ως εξής :
FX(x) =
0, x < 2136 , 2 ≤ x < 3336 , 3 ≤ x < 4636 , 4 ≤ x < 51036 , 5 ≤ x < 61536 , 6 ≤ x < 72136 , 7 ≤ x < 82636 , 8 ≤ x < 93036 , 9 ≤ x < 103336 , 10 ≤ x < 113536 , 11 ≤ x < 123636 , 12 ≤ x
της οποίας η γραφική παράσταση έχει τη µορφή :
Μέση τιµή, διασπορά διακριτής τυχαίας µεταβλητής 41
0 2 4 6 8 10 12 140.0
0.5
1.0
x
F(x)
Μέση τιµή, διασπορά διακριτής τυχαίας µεταβλητής
Κεντρικό ρόλο στις πιθανότητες, αλλά και στη στατιστική παίζει η έννοια της
µέσης τιµής. Η µέση τιµή είναι το σηµαντικότερο από τα µέτρα θέσης ή κε-
ντρικής τάσης, καθώς εκφράζει την αναµενόµενη τιµή της τυχαίας µεταβλητής
σε ένα πείραµα.
Ορισµός 4.8 Έστω X µια διακριτή τυχαία µεταβλητή που παίρνει τις τιµές
x1, x2, x3, ... µε συνάρτηση πιθανότητας f(x). Ορίζουµε ως µέση ή αναµενό-
µενη τιµή της X, την ποσότητα
E(X) = µ =∑
i
xif(xi)
Ιδιότητες της µέσης τιµής
• E(c) = c, όπου c ∈ R• E(aX + b) = aE(X) + b, όπου a, b ∈ R• Αν X είναι µια διακριτή τ.µ. µε συνάρτηση πιθανότητας f(x) και g(X)
µια οποιαδήποτε συνάρτηση της X , τότε :
E(g(X)) =∑
i
g(xi)f(xi)
• Αν g(X), h(X) είναι συναρτήσεις της διακριτής τ.µ.X, τότε
E(g(X)± h(X)) = E(g(X))±E(h(X))
42 Τυχαίες Μεταβλητές - Κατανοµές
Παράδειγµα 4.9 Να υπολογιστεί η µέση τιµή της τ.µ. X, που ορίστηκε στο
παράδειγµα 4.5.
Σύµφωνα µε τον ορισµό της µέσης τιµής, έχουµε :
EX =∑
i
xif(xi) =
= 21
36+ 3
2
36+ 4
3
36+ 5
4
36+ 6
5
36+
+76
36+ 8
5
36+ 9
4
36+ 10
3
36+ 11
2
36+ 12
1
36= 7
Επίσης, σηµαντικό ρόλο παίζει η διακύµανση, η οποία είναι το σηµαντικότερο
µέτρο διασποράς ή µεταβλητότητας, αφού εκφράζει πόσο µακριά “απλώνο-
νται” οι τιµές της τυχαίας µεταβλητής γύρω από το µέσο όρο της.
Ορισµός 4.10 Έστω X µια διακριτή τυχαία µεταβλητή που παίρνει τις τιµές
x1, x2, x3, ... µε συνάρτηση πιθανότητας f(x). Ορίζουµε ως διακύµανση ή
διασπορά της X, την ποσότητα
V ar(X) = σ2 = E(X − µ)2 =∑
i
(xi − µ)2f(xi)
όπου µ = E(X) είναι η µέση τιµή της X.
Ιδιότητες της διακύµανσης
• V ar(X) = E(X2)− (E(X))2
• V ar(aX + b) = a2V ar(X), όπου a, b ∈ R
Ορισµός 4.11 Η θετική τετραγωνική ρίζα της διακύµανσης µιας τυχαίας µετα-
βλητής X, δηλαδη η ποσότητα
σ =√
V ar(X) =√σ2
ονοµάζεται τυπική απόκλιση, ενώ η ποσότητα
CV =σ
µόπου µ η µέση τιµή της τ.µ. ονοµάζεται συντελεστής µεταβλητότητας
Η τυπική απόκλιση, σε αντίθεση µε τη διακύµανση, έχει το πλεονέκτηµα ότι
εκφράζει τη µεταβλητότητα της τ.µ. σε µονάδες ίδιες µε αυτές της τ.µ., ενώ ο
συντελεστής µεταβλητότητας εκφράζει τη µεταβλητότητα της τ.µ. σε αναλογία
µε τη µέση τιµή της (είναι κατά µια έννοια ποσοστιαία κλίµακα).
Παράδειγµα 4.12 Να υπολογιστεί η διακύµανση ης τ.µ. X, που ορίστηκε στο
παράδειγµα 4.5.
Σηµαντικές διακριτές κατανοµές 43
Σύµφωνα µε τον ορισµό της διακύµανσης και λαµβάνοντας υπόψη τον υπολο-
γισµό της µέσης τιµής που έγινε στο παράδειγµα 4.9, έχουµε :
V arX =∑
i
(xi − µ)2f(xi) =
= (2− 7)2 × 1
36+ (3− 7)2 × 2
36+ (4− 7)2 × 3
36+
+(5− 7)2 × 4
36+ (6− 7)2 × 5
36+ (7− 7)2 × 6
36+
+(8− 7)2 × 5
36+ (9− 7)2 × 4
36+ (10− 7)2 × 3
36+
+(11− 7)2 × 2
36+ (12− 7)2 × 1
36= 5.833
Σηµαντικές διακριτές κατανοµές
Παρακάτω εξετάζουµε µερικές από τις γνωστότερες κατανοµές διακριτών τυ-
χαίων µεταβλητών που παρουσιάζουν µεγάλο ενδιαφέρον λόγω των πολλών
εφαρµογών τους.
Οµοιόµορφη κατανοµή
Η οµοιόµορφη κατανοµή εµφανίζεται σε προβλήµατα όπου η τυχαία µεταβλη-
τή µπορεί να πάρει ένα πεπερασµένο πλήθος διακεκριµένες τιµές, οι οποίες
έχουν την ίδια πιθανότητα εµφάνισης. Η συνάρτηση πιθανότητας µια τυχαίας
µεταβλητής X, που παίρνει τιµές x1, x2, . . . , xn και ακολουθεί την οµοιόµορ-
φη κατανοµή είναι
f(x) =
1n , x = xi0 αλλού
Παράδειγµα 4.13 Στο πείραµα ρίψης ενός ζαριού, αν ταυτίσουµε το αποτέλε-
σµα της ρίψης µε µια τυχαία µεταβλητή X, µε τιµές 1, 2, 3, 4, 5, 6, η συνάρτηση
πιθανότητας είναι
f(x) =
1n , x = 1, 2, 3, 4, 5, 60 αλλού
αφού όλα τα ενδεχόµενα είναι ισοπίθανα. ∆ηλαδή η X ακολουθεί οµοιόµορφη
κατανοµή.
44 Τυχαίες Μεταβλητές - Κατανοµές
Κατανοµή Bernoulli
Η κατανοµή Bernoulli εµφανίζεται σε πειράµατα που έχουν δύο δυνατά α-
ποτελέσµατα, ένα που αντιπροσωπεύει την επιτυχία και πραγµατοποιείται µε
πιθανότητα p και ένα την αποτυχία µε πιθανότητα 1−p. Αντιστοιχίζοντας στα
δυο πιθανά αποτελέσµατα µε τις τιµές 1 και 0, ορίζουµε µια τυχαία µεταβλητή
X , που ακολουθεί την κατανοµή Bernoulli µε συνάρτηση πιθανότητας :
f(x) =
1− p, x = 0p, x = 10, αλλού
Η (αθροιστική) συνάρτηση κατανοµής της X είναι προφανώς :
F (x) =
0, x < 01− p, 0 ≤ x < 1
1, 1 ≤ x
Εύκολα προκύπτει ότι
E(X) = 0× (1− p) + 1× p = p
V ar(X) = (0− p)2(1− p) + (1− p)2p = p(1− p)
Παράδειγµα 4.14 Σε ένα κουτί υπάρχουν 5 κόκκινες και 10 πράσινες µπάλες.
∆ιαλέγουµε τυχαία µια µπάλα και θεωρούµε επιτυχία το ενδεχόµενο επιλογής
κόκκινης µπάλας. Η τυχαία µεταβλητή που προκύπτει αντιστοιχίζοντας τον α-
ριθµό 1 στην επιλογή κόκκινης µπάλας και τον αριθµό 0 στην επιλογή πράσινης
µπάλας, ακολουθεί την κατανοµή Bernoulli, µε συνάρτηση πιθανότητας :
f(x) =
1015 , x = 0515 , x = 10, αλλού
∆ιωνυµική κατανοµή
Η διωνυµική κατανοµή αφορά πειράµατα τα οποία αποτελούνται από µια σειρά
επαναλήψεων, η καθέ µια από τις οποίες ακολουθεί την κατανοµή Bernoulli
µε πιθανότητα επιτυχίας p. Ορίζουµε µια τυχαία µεταβλητή X που µετράει το
πλήθος των επιτυχιών, αν πραγµατοποιηθούν n επαναλήψεις. Αποδεικνύεται
ότι η συνάρτηση πιθανότητας της διωνυµικής κατανοµής είναι
f(x) =
(nx
)px(1− p)n−x, x = 0, 1, 2, . . . , n
0, αλλού
Σηµαντικές διακριτές κατανοµές 45
όπου η ποσότητα(nx
)ονοµάζεται το διωνυµικός συντελεστής και είναι
(n
x
)=
n!
(n− x)!x!Αποδεικνύεται ότι
E(X) = np
V ar(X) = np(1− p)
Παράδειγµα 4.15 Θεωρούµε ότι το πείραµα του παραδείγµατος 4.14 εκτελεί-
ται 10 φορές, όπου σε κάθε επανάληψη η µπάλα που επιλέχθηκε επανατοποθε-
τείται στο κουτί.
(α) Ποια η πιθανότητα να διαλέξουµε ακριβώς 5 κόκκινες µπάλες.
(β) Ποια η πιθανότητα να διαλέξουµε περισσότερες από 8 κόκκινες µπάλες.
(γ) Ποιος είναι ο αναµενόµενος αριθµός επιλογής κόκκινων µπαλών.
(α) Ορίζοντας την τυχαία µεταβλητή X, ως αριθµός επιτυχιών (όπου επιτυχία
θεωρείται η επιλογή κόκκινης µπάλας) στις 10 διαδοχικές επαναλήψεις, η Xακολουθεί τη διωνυµική κατανοµή, µε συνάρτηση πιθανότητας
f(x) =
(10x
)( 515)
x(1015)10−x, x = 0, 1, 2, . . . , 10
0, αλλού
Άρα το ζητούµενο είναι
P (X = 5) = f(5) =
(10
5
)(5
15)5(
10
15)5 ≃ 0.13656
(β) Με την τυχαία µεταβλητή που ορίστηκε στο (α), έχουµε
P (X > 8) = P (X = 9) + P (X = 10) = f(9) + f(10) =
=
(10
9
)(5
15)9(
10
15)1 +
(10
10
)(5
15)10(
10
15)0 ≃ 3.5564× 10−4
(γ) Το ζητούµενο είναι ο υπολογισµός της µέσης τιµής της X, η οποία είναι
E(X) = np = 10× 5
15=
10
3≃ 3.3333
Κατανοµή Poisson
Έστω ένα γεγονός, το οποίο γνωρίζουµε ότι πραγµατοποιείται κατά µέσο όρο
λ φορές στη µονάδα του χρόνου (ή του µήκους ή του όγκου). Για παράδειγµα :
• Πλήθος τηλεφωνηµάτων που δέχεται ένα τηλεφωνικό κέντρο σε ένα 5 –
λεπτο.
• Πλήθος ελαττωµατικών προϊόντων που παράγει ένα εργοστάσιο σε µία ώρα.
46 Τυχαίες Μεταβλητές - Κατανοµές
• Πλήθος λαθών σε µία σελίδα ενός βιβλίου.
• Πλήθος δένδρων σε 100 τ.µ. ενός δάσους.
Αν ονοµάσουµε X την τυχαία µεταβλητή που µετρά το πλήθος των εµφανίσεων
του γεγονότος στη µονάδα του χώρου ή του χρόνου, αποδεικνύεται ότι η τυχαία
µεταβλητή ακολουθεί την κατανοµή που είναι γνωστή ως κατανοµή Poisson,
µε συνάρτηση πιθανότητας :
f(x) =
e−λ λx
x! , x = 0, 1, 2, . . .0, αλλού
Η µέση τιµή και η διακύµανση της τ.µ. X που ακολουθεί κατανοµή Poisson
δίνονται από τους τύπους :
E(X) = λ
V ar(X) = λ
Παράδειγµα 4.16 Σε ένα τυπογραφείο έχει διαπιστωθεί ότι σε κάθε βιβλίο
εµφανίζονται κατά µέσο όρο 15 τυπογραφικά λάθη.
(α) Ποιά η πιθανότητα σε ένα βιβλίο να εµφανιστούν 13 ακριβώς τυπογραφικά
λάθη.
(β) Ποιά η πιθανότητα σε ένα βιβλίο να εµφανιστούν λιγότερα από 3 τυπογρα-
φικά λάθη.
(α) Η τυχαία µεταβλητή X, που µετράει τον αριθµό των τυπογραφικών λαθών,
ακολουθεί κατανοµή Poisson µε λ = 15. Άρα
P (X = 13) = f(13) = e−151513
13!≃ 0.0956
(β) Η πιθανότητα να εµφανιστούν λιγότερα από 3 τυπογραφικά λάθη θα είναι
P (X < 3) = P (X = 0) + P (X = 1) + P (X = 2) = f(0) + f(1) + f(2) =
= e−15150
0!+ e−15
151
1!+ e−15
152
2!≃ 3.9308× 10−5
Γενικά Παραδείγµατα
Παράδειγµα 4.17 Ένας πωλητής αυτοκινήτων υπολόγισε ότι ο αριθµός X,
των αυτοκινήτων που πουλά κάθε εβδοµάδα, ακολουθεί την παρακάτω συνάρ-
τηση πιθανότητας :
f(x) =
kx2
x! , x = 1, 2, 3, 40, αλλού
Γενικά Παραδείγµατα 47
(α) Να υπολογιστεί η τιµή της σταθεράς k
(β) Βρείτε την πιθανότητα ότι ο πωλητής σε µία εβδοµάδα, θα πουλήσει τουλά-
χιστον δύο αυτοκίνητα.
(α) Για να είναι η f(x) συνάρτηση πιθανότητας πρέπει το άθροισµα των πι-
θανοτήτων για όλες τις δυνατές τιµές της τ.µ. X, να είναι ίσο µε 1. ∆ηλαδή,
πρέπει :4∑
i=1
f(xi) = 1
12k
1!+
22k
2!+
32k
3!+
42k
4!= 1
(12
1!+
22
2!+
32
3!+
42
4!)k = 1
31
6k = 1
k =6
31
(β) Για αυτό τον υπολογισµό µπορούµε να δουλέψουµε µε δύο τρόπους. Με τον
πρώτο τρόπο θα έχουµε
P (X ≥ 2) = P (X = 2) + P (X = 3) + P (X = 4) =
= f(2) + f(3) + f(4) =6
31
22
2!+
6
31
32
3!+
6
31
42
4!=
=25
31≃ 0.806 45
Mε τον δεύτερο τρόπο υπολογίζουµε την πιθανότητα του συµπληρωµατικού εν-
δεχοµένου και την αφαιρούµε από το 1. ∆ηλαδή
P (X ≥ 2) = 1− P (X = 1) =
= 1− 6
31
12
1!=
25
31≃ 0.806 45
Παρατηρείστε ότι µε τον δεύτερο τρόπο χρειάστηκαν λιγότεροι υπολογισµοί.
Παράδειγµα 4.18 Μιά µικρή εταιρεία πώλησης µηχανών, πουλά 1 µηχανή το
µήνα µε πιθανότητα 0,3, και 2 µηχανές το µήνα µε πιθανότητα 0,1. Ποτέ δεν
πουλά περισσότερες από 2 µηχανές. Αν X παριστάνει τον αριθµό των µηχανών
που πωλούνται κάθε µήνα,
(α) Βρείτε τη µέση τιµή και τη διασπορά της X.
(β) Αν το µηνιαίο κέρδος του δίνεται από τον τύπο 2X2 +3X +1 (σε χιλιάδες
€), υπολογίστε το µηνιαίο αναµενόµενο κέρδος .
(α) Η συνάρτηση πιθανότητας της τ.µ. µεταβλητής X είναι σύµφωνα µε τα
48 Τυχαίες Μεταβλητές - Κατανοµές
δεδοµένα
f(x) =
0.6 x = 00.3 x = 10.1 x = 20 αλλού
Η µέση τιµή της X είναι
µ = E(X) = 0× 0.6 + 1× 0.3 + 2× 0.1 = 0.5
ενώ η διασπορά δίνεται από τον τύπο :
V ar(X) = E(X − µ)2 =
= 0.6× (0− 0.5)2 + 0.3× (1− 0.5)2 + 0.1× (2− 0.5)2 =
= 0.45
(β) Ουσιαστικά το ζητούµενο είναι να βρούµε τη µέση της συνάρτησης της τ.µ.
X που δίνει το κέρδος, δηλαδή :
E(2X2 + 3X + 1) =
= 0.6× (2× 02 + 3× 0 + 1)+
0.3× (2× 12 + 3× 1 + 1)+
0.1× (2× 22 + 3× 2 + 1) =
= 3.9
Παράδειγµα 4.19 Κατά τον έλεγχο της τοξικότητας ενός χηµικού ρύπου που
βρέθηκε σε µολυσµένο νερό, διαπιστώθηκε ότι σε µία συγκεκριµένη συγκέντρωση
σκοτώνει το 20% των ψαριών που κολυµπούν σε αυτό. Αν 20 ψάρια τοποθε-
τηθούν σε πισίνα που έχει την εν λόγω συγκέντρωση, ποιά η πιθανότητα µετά
από 24 ώρες να έχουν επιβιώσει ακριβώς 14;
Θεωρούµε X την τυχαία µεταβλητή που µετράει το πλήθος των ψαριών που
επιζούν στο τοξικό περιβάλλον. Η τ.µ. X ακολουθεί διωνυµική κατανοµή όπου
έχουµε n = 20 επαναλήψεις µιας δοκιµασίας Bernoulli, µε πιθανότητα επιτυχίας
(επιβίωσης του ψαριού) p = 1 − 0.20 = 0.8. Η τυχαία µεταβλητή X θα έχει
συνάρτηση πιθανότητας :
f(x) =
(20x
)(0.8)x(0.2)20−x, x = 0, 1, 2, . . . , 20
0, αλλού
Άρα η ζητούµενη πιθανότητα θα δίνεται από τον τύπο :
P (X = 14) = f(14) =
=
(20
14
)(0.8)14(0.2)20−14
= 0.109 1
Γενικά Παραδείγµατα 49
Παράδειγµα 4.20 Εργοστάσιο παραγωγής ηλεκτρικών ασφαλειών, παράγει 10%
ελαττωµατικές. Αν διαλέξουµε τυχαία τέσσερις ασφάλειες από το σύνολο της πα-
ραγωγής, ποιά η πιθανότητα
(α) Ακριβώς µία ασφάλεια να είναι ελαττωµατική;
(β) Τουλάχιστον µία να είναι ελαττωµατική;
(γ) Ας υποθέσουµε ότι οι 4 ασφάλειες που επιλέγονται τυχαία συσκευάζονται
χωρίς να ελεγχθούν, και διοχετεύονται µε εγγύηση στο εµπόριο. Αν το κόστος
επιδιόρθωσης για µία τέτοια συσκευασία δίνεται από τη σχέση K(X) = 3X2,
όπου X ο αριθµός των ελαττωµατικών ασφαλειών, να βρεθεί το αναµενόµενο
κόστος επιδιόρθωσης.
(α) Έστω X η τυχαία µεταβλητή που µετράει το πλήθος των ελαττωµατικών
ασφαλειών. Η τ.µ. X ακολουθεί διωνυµική κατανοµή όπου έχουµε n = 4επαναλήψεις µιας δοκιµασίας Bernoulli, µε πιθανότητα επιτυχίας (ελαττωµατική
ασφάλεια) p = 0.1. Η τυχαία µεταβλητή X θα έχει συνάρτηση πιθανότητας :
f(x) =
(4x
)(0.1)x(0.9)4−x, x = 0, 1, 2, 3, 4
0, αλλού
Η πιθανότητα µια ακριβώς ασφάλεια να είναι ελαττωµατική θα είναι
P (X = 1) = f(1) =
=
(4
1
)(0.1)1(0.9)4−1
= 0.2916
(β) Η πιθανότητα τουλάχιστον µία ασφάλεια να είναι ελαττωµατική µπορεί να
υπολογιστεί εύκολα µέσω του συµπληρωµατικού ενδεχοµένου. ∆ηλαδή θα υπο-
λογίσουµε την πιθανότητα καµία ασφάλεια να µην είναι ελαττωµατική και θα
την αφαιρέσουµε από την µονάδα. Άρα
P (X ≥ 1) = 1− P (X = 0) =
= 1−(4
0
)(0.1)0(0.9)4−0
= 0.3439
(γ) Θεωρώντας τη συνάρτηση κόστους K(X) = 3X2, ως συνάρτηση της τ.µ.
X, το ζητούµενο είναι να υπολογίσουµε τη µέση τιµή της. ∆ηλαδή
E(K(X)) =4∑
x=0
K(x)f(x) =
=4∑
x=0
3x2(4
x
)(0.1)x(0.9)4−x
= 1.56
50 Τυχαίες Μεταβλητές - Κατανοµές
Παράδειγµα 4.21 Παίρνουµε στην τύχη ένα – ένα µε επανάθεση, ψηφία α-
πό τα 0,1, ...., 9. Πόσα ψηφία πρέπει να πάρουµε για να έχουµε πιθανότητα
τουλάχιστον 9/10 ότι θα εµφανιστεί το ψηφίο 6, τουλάχιστον µία φορά;
Στο πείραµα αυτό θα θεωρήσουµε ότι εκτελούµε διαδοχικές δοκιµασίες Bernoulli,
όπου θεωρούµε επιτυχία την επιλογή του ψηφίου 6 και αποτυχία την επιλογή
οποιουδήποτε άλλου ψηφίου. Η πιθανότητα επιλογής του 6 είναι προφανώς
p = 110 . Θεωρούµε X την τυχαία µεταβλητή που µετράει το πλήθος των επι-
τυχιών (επιλογών του 6), σε n διαδοχικές επαναλήψεις. Η τ.µ. X ακολουθεί
διωνυµική κατανοµή µε συνάρτηση πιθανότητας
f(x) =
(nx
)( 110)
x( 910)n−x, x = 0, 1, 2, . . . , n
0, αλλού
Η πιθανότητα να εµφανιστεί το ψηφίο 6 τουλάχιστον µια φορά µπορεί να υπο-
λογιστεί ευκολότερα µε τη βοήθεια του συµπληρωµατικού ενδεχοµένου. ∆ηλαδή
θα υπολογίσουµε την πιθανότητα να µην εµφανιστεί καµιά φορά το 6 και θα την
αφαιρέσουµε από την µονάδα. Άρα
P (X ≥ 1) = 1− P (X = 0) =
= 1−(n
0
)(1
10)0(
9
10)n−0
= 1− n!
(n− 0)!0!(9
10)n
= 1− (9
10)n
Το ζητούµενο είναι η παραπάνω πιθανότητα να είναι τουλάχιστον 910 . ∆ηλαδή
P (X ≥ 1) ≥ 9
10
1− (9
10)n ≥ 9
10
(9
10)n ≤ 1
10
n ln9
10≤ ln
1
10−0.10536n ≤ −2.3026
n ≥ 21.885
Άρα πρακτικά το ζητούµενο ισχύει για n ≥ 22.
Παράδειγµα 4.22 Από µία γέφυρα περνούν κατά µέσο όρο 300 αυτοκίνητα
την ώρα. Να βρεθεί η πιθανότητα ότι κατά τη διάρκεια 2 λεπτών, θα περάσουν
από τη γέφυρα 3 αυτοκίνητα.
Θεωρώντας ότι ο µέσος αριθµός αυτοκινήτων είναι ανάλογος του χρόνου στον
οποίο αναφέρεται, µπορούµε να πούµε ότι στη διάρκεια των 2 λεπτών θα περά-
Γενικά Παραδείγµατα 51
σουν κατά µέσο όρο
λ = 3002
60= 10 αυτοκίνητα
Έστω X, η τυχαία µεταβλητή που εκφράζει τον αριθµό αυτοκινήτων που περνούν
από τη γέφυρα στη διάρκεια των 2 λεπτών. Η τυχαία µεταβλητή X ακολουθεί
κατανοµή Poisson µε µέσο όρο αφίξεων λ = 10. Άρα η συνάρτηση πιθανότητας
είναι
f(x) =
e−10 10
x
x! , x = 0, 1, 2, . . .0, αλλού
Το ζητούµενο είναι η πιθανότητα να περάσουν από τη γέφυρα 3 αυτοκίνητα, άρα
P (X = 3) = f(3) =
= e−10103
3!=
= 7.566 7× 10−3
Παράδειγµα 4.23 Το τηλέφωνο µιας γραµµατείας µιας υπηρεσίας, χτυπά κατά
µέσο όρο δύο φορές κάθε τέταρτο της ώρας. Να βρεθεί η πιθανότητα
(α) Να χτυπήσει το πολύ δύο φορές στο επόµενο τέταρτο
(β) Να χτυπήσει το πολύ δύο φορές στην επόµενη ώρα
(γ) Να χτυπήσει το πολύ δύο φορές, σε τρία από τα επόµενα τέσσερα τέταρτα.
(α) Η τυχαία µεταβλητή X, ακολουθεί κατανοµή Poisson µε µέσο όρο λ = 2χτυπήµατα ανά τέταρτο της ώρας. Η συνάρτηση πιθανότητας της X είναι
f(x) =
e−2 2
x
x! , x = 0, 1, 2, . . .0, αλλού
Άρα η ζητούµενη πιθανότητα θα είναι
P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) =
= f(0) + f(1) + f(2) =
= e−220
0!+ e−2
21
1!+ e−2
22
2!=
= e−2(1 + 2 + 2) = 5e−2 ≃ 0.676 68
(β) Θεωρώντας ότι ο µέσος αριθµός χτυπηµάτων είναι ανάλογος του χρόνου
στον οποίο αναφέρεται, µπορούµε να πούµε ότι στη διάρκεια των µιας ώρας (4
τέταρτα) θα το τηλέφωνο θα χτυπήσει κατά µέσο όρο
λ = 2× 4 = 8 φορές
Η αντίστοιχη τ.µ. που ακολουθεί κατανοµή Poisson, έχει συνάρτηση πιθανότη-
τας
f(x) =
e−8 8
x
x! , x = 0, 1, 2, . . .0, αλλού
52 Τυχαίες Μεταβλητές - Κατανοµές
Άρα η ζητούµενη πιθανότητα θα είναι
P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) =
= f(0) + f(1) + f(2) =
= e−880
0!+ e−8
81
1!+ e−8
82
2!≃ 0.01375 4
(γ) Στο υποερώτηµα (α) υπολογίσαµε την πιθανότητα να έχουµε τουλάχιστον
2 χτυπήµατα σε ένα τέταρτο. Στο παρόν ερώτηµα µπορούµε να θεωρήσουµε
ότι έχουµε τέσσερις διαδοχικές επαναλήψεις µιας δοκιµασίας Bernoulli, όπου
σε κάθε µια από τις επαναλήψεις θεωρούµε επιτυχή έκβαση του πειράµατος
να συµβεί να έχουµε τουλάχιστον 2 χτυπήµατα σε ένα τέταρτο. Η πιθανότητα
επιτυχίας είναι σύµφωνα µε το (α), p = 5e−2.
Θεωρούµε την τυχαία µεταβλητή X, που µετράει τον αριθµό επιτυχιών στις
τέσσερις επαναλήψεις του πειράµατος, δηλαδή στα τέσσερα τέταρτα. Η X ακο-
λουθεί διωνυµική κατανοµή µε συνάρτηση πιθανότητας
f(x) =
(4x
)(5e−2)x(1− 5e−2)4−x, x = 0, 1, 2, 3, 4
0, αλλού
Η ζητούµενη πιθανότητα είναι
P (X = 3) = f(3) =
=
(4
3
)(5e−2)3(1− 5e−2)4−3
≃ 0.400 72
Συνάρτηση κατανοµής και πυκνότητας πιθανότητας συνεχούς τ.µ.
Όταν η τυχαία µεταβλητή που εξετάζουµε µπορεί να πάρει σαν τιµή οποιοδή-
ποτε πραγµατικό αριθµό, τότε η τυχαία µεταβλητή ονοµάζεται συνεχής. Πα-
ραδείγµατα τέτοιων τυχαίων µεταβλητών µπορεί να είναι µετρήσεις µήκους,
χρόνου, βάρους ή γενικότερα οποιουδήποτε µεγέθους µε συνεχή χαρακτήρα
που µπορεί προκύψει σαν αποτέλεσµα ενός πειράµατος. Αντίθετα µε τις δια-
κριτές τυχαίες µεταβλητές, στις συνεχείς δεν µπορούµε να ορίσουµε την πι-
θανότητα η µεταβλητή να πάρει µια µεµονωµένη τιµή, αφού κάτι τέτοιο θα
έδινε πρακτικά πιθανότητα 0.
Για να µπορέσουµε να ορίσουµε το αντίστοιχο της συνάρτησης πιθανότητας
µιας συνεχούς τυχαίας µεταβλητής πρέπει να ορίσουµε προηγουµένως την
Συνάρτηση κατανοµής και πυκνότητας πιθανότητας συνεχούς τ.µ. 53
αθροιστική συνάρτηση κατανοµής της. Η αθροιστική συνάρτηση κατανοµής,
ορίζεται αντίστοιχα µε αυτή των διακριτών τ.µ., ως εξής :
Ορισµός 4.24 Έστω µια συνεχής τυχαία µεταβλητή X, που παίρνει πραγµατι-
κές τιµές. Τότε η συνάρτηση
F (x) = P (X ≤ x)
ονοµάζεται αθροιστική συνάρτηση κατανοµής ή απλά συνάρτηση κατανοµής
της τυχαίας µεταβλητής X.
Εύκολα µπορούµε να διαπιστώσουµε ότι η αθροιστική συνάρτηση κατανοµής
µιας συνεχούς τ.µ. έχει τις ακόλουθες ιδιότητες :
• F (−∞) = 0 και F (+∞) = 1
• Για κάθε a < b, ισχύει F (a) ≤ F (b), δηλαδή η F (.) είναι αύξουσα συνάρ-
τηση.
• P (a < X ≤ b) = P (X ≤ b)− P (X ≤ a) = F (b)− F (a)
Το αντίστοιχο της συνάρτησης πιθανότητας των διακριτών τυχαίων µεταβλη-
τών, είναι η συνάρτηση πυκνότητας πιθανότητας που ορίζεται παρακάτω :
Ορισµός 4.25 Αν F (x) είναι η αθροιστική συνάρτηση κατανοµής µιας συνε-
χούς τυχαίας µεταβλητής τότε, συνάρτηση f(x) που ορίζεται από τη σχέση
F (x) =
∫ x
−∞
f(u)du
ονοµάζεται συνάρτηση πυκνότητας πιθανότητας της τ.µ. X. Για την συνάρ-
τηση πυκνότητας πιθανότητας ισχύει :
• f(x) ≥ 0, για κάθε −∞ ≤ x ≤ +∞•∫ +∞−∞
f(x)dx = 1
Επιπλέον αν η F (x) είναι παραγωγίσιµη ισχύει
f(x) = F ′(x)
Αν f(x) είναι η συνάρτηση πυκνότητας πιθανότητας µιας συνεχούς τυχαίας
µεταβλητής, τότε προφανώς µε βάση τα παραπάνω, για κάποιο απειροστό dx,
ισχύει
P (x < X ≤ x + dx) = F (x + dx)− F (x)
Αν θεωρήσουµε ότι η F (x) είναι παραγωγίσιµη, παίρνουµε
P (x < X ≤ x + dx)
dx=
F (x + dx)− F (x)
dx= F ′(x) = f(x)
54 Τυχαίες Μεταβλητές - Κατανοµές
ή
P (x < X ≤ x + dx) = f(x)dx
Με άλλα λόγια η (απειροστή) ποσότητα f(x)dx, εκφράζει την πιθανότητα η
τυχαία µεταβλητή να βρίσκεται στο απειροστό διάστηµα (x, x + dx).
Παράδειγµα 4.26 Θεωρούµε την τυχαία µεταβλητή µε αθροιστική συνάρτηση
κατανοµής
F (x) =
0, x < 0x, 0 ≤ x ≤ 11, x > 1
Η γραφική παράσταση της F (x) είναι
x
F(x)
1
10
Η συνάρτηση πυκνότητας πιθανότητας θα είναι
f(x) = F ′(x) =
0, x < 01, 0 ≤ x ≤ 10, x > 1
της οποίας η γραφική παράσταση είναι
Μέση τιµή, διασπορά συνεχούς τυχαίας µεταβλητής 55
x
f(x)
1
10
Μέση τιµή, διασπορά συνεχούς τυχαίας µεταβλητής
Αντίστοιχα µε τις διακριτές τυχαίες µεταβλητές µπορούµε να ορίσουµε µέτρα
θέσης και διασποράς για τις συνεχείς τ.µ. Η µέση τιµή µια συνεχούς τ.µ.
ορίζεται ως εξής :
Ορισµός 4.27 Έστω X µια συνεχής τυχαία µεταβλητή που παίρνει πραγµατι-
κές τιµές, µε συνάρτηση πυκνότητας πιθανότητας f(x). Ορίζουµε ως µέση ή
αναµενόµενη τιµή της X, την ποσότητα
E(X) = µ =
∫ +∞
−∞
xf(x)dx
Ιδιότητες της µέσης τιµής
• E(c) = c, όπου c ∈ R• E(aX + b) = aE(X) + b, όπου a, b ∈ R• Αν X είναι µια συνεχής τ.µ. µε συνάρτηση πιθανότητας f(x) και g(X)
µια οποιαδήποτε συνάρτηση της X , τότε :
E(g(X)) =
∫ +∞
−∞
g(x)f(x)dx
• Αν g(X), h(X) είναι συναρτήσεις της συνεχούς τ.µ.X, τότε
E(g(X)± h(X)) = E(g(X))±E(h(X))
Παράδειγµα 4.28 Να υπολογιστεί η µέση τιµή της τ.µ. X, που ορίστηκε στο
παράδειγµα 4.26.
56 Τυχαίες Μεταβλητές - Κατανοµές
Σύµφωνα µε τον ορισµό της µέσης τιµής, έχουµε :
µ = E(X) =
∫ +∞
−∞
xf(x)dx =
=
∫ 1
0xdx =
[x2
2
]1
0
=
=1
2
Η διασπορά µιας συνεχούς τ.µ ορίζεται παρακάτω :
Ορισµός 4.29 ΈστωX µια συνεχής τυχαία µεταβλητή που παίρνει πραγµατικές
τιµές, µε συνάρτηση πυκνότητας πιθανότητας f(x). Ορίζουµε ως διακύµανση
ή διασπορά της X, την ποσότητα
V ar(X) = σ2 = E(X − µ)2 =
∫ +∞
−∞
(x− µ)2f(x)dx
όπου µ = E(X) είναι η µέση τιµή της X.
Ιδιότητες της διακύµανσης
• V ar(X) = E(X2)− (E(X))2
• V ar(aX + b) = a2V ar(X), όπου a, b ∈ R
Παράδειγµα 4.30 Να υπολογιστεί η διακύµανση ης τ.µ. X, που ορίστηκε στο
παράδειγµα 4.26.
Σύµφωνα µε τον ορισµό της διακύµανσης και λαµβάνοντας υπόψη τον υπολο-
γισµό της µέσης τιµής που έγινε στο παράδειγµα 4.28, έχουµε :
V arX =
∫ +∞
−∞
(x− µ)2f(x)dx =
=
∫ 1
0(x− 1
2)2dx =
=1
3
[(x− 1
2)3]1
0
=
=1
3(1
2)3 +
1
3(1
2)3 =
1
12
Σηµαντικές συνεχείς κατανοµές
Οι παρακάτω γνωστές κατανοµές συνεχών τυχαίων µεταβλητών, παρουσιάζουν
ιδιαίτερο ενδιαφέρον.
Σηµαντικές συνεχείς κατανοµές 57
Οµοιόµορφη κατανοµή
Πρόκειται για το συνεχές αντίστοιχο της διακριτής οµοιόµορφης κατανοµής,
µε τη διαφορά ότι τώρα θεωρούµε ότι η συνάρτηση πυκνότητας πιθανότητας
είναι σταθερή σε ένα πεπερασµένο διάστηµα (a, b). ∆ηλαδή, η συνάρτηση
πυκνότητα πιθανότητας είναι :
f(x) =
1
b−a a ≤ x ≤ b0 αλλού
x
f(x)
1/(b-a)
ba
ενώ προφανώς η αντίστοιχη αθροιστική συνάρτηση κατανοµής είναι
F (x) =
0 x < ax−ab−a a ≤ x ≤ b1 x > b
x
F(x)
1
ba
58 Τυχαίες Μεταβλητές - Κατανοµές
Όταν µια τυχαία µεταβλητή X ακολουθεί οµοιόµορφη κατανοµή, γράφουµε
X ∼ U(a, b). Εύκολα µπορούµε να αποδείξουµε ότι
E(X) =a + b
2
V ar(X) =(b− a)2
12Η οµοιόµορφη κατανοµή U(0, 1) ονοµάζεται τυποποιηµένη οµοιόµορφη κα-
τανοµή (βλ. παράδειγµα 4.26).
Κανονική Κατανοµή
Η κανονική κατανοµή που είναι επίσης γνωστής ως κατανοµή του Gauss,
είναι µια σηµαντική οικογένεια συνεχών κατανοµών, που εφαρµόζεται σε πάρα
πολλές περιπτώσεις. Κάθε µέλος της οικογένειας αυτής ορίζεται µέσω δύο
παραµέτρων, της µέσης τιµής µ της και της διασποράς της σ2 και συµβολίζεται
N(µ, σ2). Η τυποποιηµένη µορφή της κανονικής κατανοµής αντιστοιχεί στην
περίπτωση µ = 0 και σ2 = 1, δηλαδή η κατανοµή N(0, 1)
Μια τυχαία µεταβλητή X ακολουθεί την κανονική κατανοµή N(µ, σ2), αν η
συνάρτηση πυκνότητας πιθανότητας της είναι
f(x) =1
σ√
2πe−
(x−µ)2
2σ2
-4 -2 2 4
0.2
0.4
0.6
0.8
1.0
x
f(x)µ=0, σ=0.44
µ=0, σ=1.00
µ=0, σ=2.23
µ=−2,σ=0.70
Ενώ η αθροιστική συνάρτηση κατανοµής είναι
F (x) =1
σ√
2π
∫ x
−∞
e−(u−µ)2
2σ2 du
Σηµαντικές συνεχείς κατανοµές 59
-4 -2 2 4
0.2
0.4
0.6
0.8
1.0
x
F(x)µ=0, σ=0.44
µ=0, σ=1.00
µ=0, σ=2.23
µ=−2,σ=0.70
Όταν µια τυχαία µεταβλητή X ακολουθεί κανονική κατανοµή, γράφουµε X ∼N(µ, σ2). Αποδεικνύεται ότι :
E(X) = µ
V ar(X) = σ2
Επειδή το ολοκλήρωµα που δίνει την αθροιστική συνάρτηση κατανοµής, δεν
µπορεί να υπολογιστεί µε τη βοήθεια στοιχειωδών συναρτήσεων, συνήθως
ανάγουµε τους υπολογισµούς των πιθανοτήτων σε πρακτικά προβλήµατα, στην
τυποποιηµένη κανονική κατανοµή. Αποδεικνύεται ότι αν X ∼ N(µ, σ2), τότε
η τυχαία µεταβλητή
Z =X − µ
σ
ακολουθεί την τυποποιηµένη κανονική κατανοµή, δηλαδή :
Z ∼ N(0, 1)
Αξίζει να σηµειώσουµε ότι, στα περισσότερα εγχειρίδια πιθανοτήτων ή στα-
τιστικής υπάρχουν πίνακες που βοηθούν στον υπολογισµό πιθανοτήτων για
την τυποποιηµένη κανονική κατανοµή. Οι πίνακες αυτοί περιέχουν συνήθως
υπολογισµένες τις τιµές της πιθανότητας
Φ(a) = P (Z ≤ a)
για την N(0, 1). Σηµειώστε ότι λόγω συµµετρίας της N(0, 1), ισχύει Φ(−a) =
1−Φ(a).
Παράδειγµα 4.31 Έστω X ∼ N(3, 4), δηλαδή κανονική κατανοµή µε µ = 3και σ2 = 4. Να υπολογιστούν οι πιθανότητες :
60 Τυχαίες Μεταβλητές - Κατανοµές
(α) P (X > 4) (β) P (1 ≤ X < 4) (γ) Να βρεθεί το α ώστε P (|X − 3| < a) =0.95.
(α) Σχηµατίζουµε την κανονικοποιηµένη τ.µ. Z = X−32 η οποία ακολουθεί την
N(0, 1). Αφού θέλουµε
X > 4X − 3
2>
4− 3
2
Z >1
2Άρα ισοδύναµα αναζητούµε την πιθανότητα
P (X > 4) = P (Z >1
2)
= 1− P (Z ≤ 1
2)
= 1−Φ(0.5)
= 1− 0.6915 = 0.3085
(β) Αντίστοιχα
1 ≤ X < 41− 3
2≤ X − 3
2<
4− 3
2
−1 ≤ Z <1
2
Άρα η ζητούµενη πιθανότητα είναι
P (1 ≤ X < 4) = P (−1 ≤ Z <1
2)
= Φ(0.5)−Φ(−1)
= 0.6915− 1 + Φ(1)
= 0.6915− 1 + 0.8413
= 0.532 8
(γ) Πρέπει
|x− 3| < aδηλαδή
−a < x− 3 < aή
−a
2<
x− 3
2<
a
2
−a
2< Z <
a
2
Σηµαντικές συνεχείς κατανοµές 61
Υπολογίζουµε την πιθανότητα
P (−a
2< Z <
a
2) =
= Φ(a
2)−Φ(−a
2) =
= Φ(a
2)− 1 + Φ(
a
2) =
= 2Φ(a
2)− 1
Όµως θέλουµε
P (−a
2< Z <
a
2) = 0.95
2Φ(a
2)− 1 = 0.95
Φ(a
2) = 0.975
Αναζητώντας την τιµή του a2 που δίνει Φ(a2) = 0.975 στον σχετικό πίνακα της
τυποποιηµένης κανονικής κατανοµής, βρίσκουµε ότι
Φ(1.96) = 0.975
Άρα a2 = 1.96 ή a = 3.92.
5 Αριθµητική Ανάλυση - Εισα-
γωγικές Έννοιες
Εισαγωγή
Η αριθµητική ανάλυση είναι ο κλάδος των µαθηµατικών που ασχολείται µε το
σχεδιασµό και την ανάλυση αλγόριθµων για την επίλυση µαθηµατικών προ-
βληµάτων που προκύπτουν στην υπολογιστική επιστήµη και στην τεχνολογία.
Η αριθµητική ανάλυση διακρίνεται από τους περισσότερους άλλους κλάδους
της επιστήµης υπολογιστών από το γεγονός ότι ασχολείται µε συνεχείς πο-
σότητες και όχι διακριτές. Ασχολείται µε συναρτήσεις και εξισώσεις όπου
οι εµπλεκόµενες µεταβλητές, χρόνος, απόσταση, θερµοκρασία, πυκνότητα, πί-
εση κ.λπ., είναι από τη φύση τους ποσότητες µεταβλητές. Τα περισσότερα
από τα προβλήµατα των συνεχών µαθηµατικών (για παράδειγµα, σχεδόν κά-
θε πρόβληµα που εµπλέκει παραγώγους, ολοκληρώµατα ή µη γραµµικότητες)
δεν µπορούν να επιλυθούν µε πεπερασµένο αριθµό πράξεων και για το λό-
γο αυτό πρέπει να επιλυθούν µε µία (θεωρητικά επ’ άπειρον) επαναληπτική
διαδικασία, που τελικά συγκλίνει σε µια λύση του προβλήµατος. Στην πράξη
φυσικά µια τέτοια διαδικασία δεν επαναλαµβάνεται επ’ άπειρον αλλά έως ό-
του η λύση να είναι προσεγγιστικά ορθή, “αρκετά κοντά”, στο επιθυµητό για
πρακτικούς σκοπούς αποτέλεσµα. Έτσι, ένας από τους σηµαντικότερους σκο-
πούς των υπολογιστικών µαθηµατικών είναι η εύρεση ταχέως συγκλινόντων
επαναληπτικών αλγόριθµων καθώς και η εκτίµηση της ακρίβειας της προσεγ-
γιστικής λύσης. Εάν η σύγκλιση είναι ικανοποιητικά ταχεία, ακόµη και κάποια
προβλήµατα που µπορούν να επιλυθούν µε πεπερασµένο αριθµό πράξεων, ό-
πως τα συστήµατα γραµµικών αλγεβρικών εξισώσεων, σε κάποιες περιπτώσεις
είναι προτιµότερο να επιλύονται µε επαναληπτικές µεθόδους. Συνεπώς, ένας
δεύτερος παράγοντας που διακρίνει την αριθµητική ανάλυση είναι η ενασχό-
64 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες
λησή της µε προσεγγίσεις και τις επιπτώσεις τους. Πολλές τεχνικές επίλυσης
εµπλέκουν µία ολόκληρη σειρά από προσεγγίσεις διαφόρων ειδών. Ακόµη
και η αριθµητική που χρησιµοποιείται είναι προσεγγιστική, αφού οι υπολο-
γιστές δεν µπορούν να αναπαραστήσουν όλους τους πραγµατικούς αριθµούς
ακριβώς. Εκτός από τις συνήθεις ιδιότητες που χαρακτηρίζουν τους καλούς
αλγόριθµους, όπως η αποδοτικότητα, οι αριθµητικοί αλγόριθµοι πρέπει επίσης
να είναι όσο το δυνατόν πιο αξιόπιστοι και πιο ακριβείς παρά τις διάφορες
προσεγγίσεις που γίνονται στην πορεία των υπολογισµών.
Για τη λύση ενός υπολογιστικού προβλήµατος, µια βασική µεθοδολογία περι-
λαµβάνει µεταξύ των την αντικατάσταση ενός πολύπλοκου προβλήµατος από
ένα απλούστερο που έχει την ίδια ή τουλάχιστον παραπλήσια λύση. Παρα-
δείγµατα της µεθοδολογίας αυτής περιλαµβάνουν :
• Αντικατάσταση άπειρων διαδικασιών από πεπερασµένες, όπως π.χ. αντικα-
τάσταση ολοκληρωµάτων από αθροίσµατα, σειρών από µερικά αθροίσµατά
τους και παραγώγων από διαιρεµένες διαφορές.
• Αντικατάσταση γενικών πινάκων από άλλους απλούστερης µορφής.
• Αντικατάσταση πολύπλοκων συναρτήσεων µε απλούστερες όπως, οι πο-
λυωνυµικές.
• Αντικατάσταση µη γραµµικών προβληµάτων από γραµµικά.
• Αντικατάσταση διαφορικών εξισώσεων από αλγεβρικές.
• Αντικατάσταση συστηµάτων υψηλής τάξης από άλλα χαµηλότερης.
Σε γενικές γραµµές τα βασικά χαρακτηριστικά των αριθµητικών µεθόδων που
θα µας απασχολήσουν παρακάτω είναι :
• Η ακρίβεια που µπορούµε να επιτύχουµε εκτελώντας έναν υπολογισµό
• Η ταχύτητα µε την οποία επιτυγχάνεται η ζητούµενη ακρίβεια του υπολο-
γισµού
Αριθµητικά σφάλµατα
Κατά την πραγµατοποίηση υπολογισµών σε ένα πρόβληµα αριθµητικής ανά-
λυσης υπάρχουν εµφανίζονται αριθµητικά σφάλµατα, δηλαδή ανακρίβειες
στην παράσταση των πραγµατικών αριθµητικών ποσοτήτων που εµπλέκονται
στο πρόβληµα. Υπάρχουν αρκετές πηγές τέτοιων σφαλµάτων, κάποιες από τις
οποίες επηρεάζουν ήδη τα δεδοµένα του προβλήµατος, όπως οι παρακάτω :
Αριθµητικά σφάλµατα 65
• Μοντελοποίηση : Μερικά φυσικά χαρακτηριστικά του προβλήµατος ή του
συστήµατος που µελετάµε είναι δυνατόν να απλοποιηθούν ή να παραλει-
φθούν (π.χ. τριβή, πυκνότητα).
• Πειραµατικές µετρήσεις : Τα όργανα του εργαστηρίου έχουν πεπερασµένη
ακρίβεια. Η ακρίβειά τους είναι δυνατόν να περιορίζεται περαιτέρω από το
µικρό µέγεθος του δείγµατος, ή οι ενδείξεις που λαµβάνονται είναι δυνατόν
να υπόκεινται σε τυχαίο θόρυβο ή συστηµατική µεροληψία.
• Προηγούµενοι υπολογισµοί : Τα δεδοµένα του προβλήµατος είναι πιθανό
να έχουν παραχθεί από ένα προηγούµενο στάδιο του οποίου τα αποτελέ-
σµατα ήταν µόνο προσεγγιστικά.
Τα παραπάνω ονοµάζονται συνήθως σφάλµατα δεδοµένων και είναι συνή-
θως πέρα από τον έλεγχό µας. Παρόλα αυτά παίζουν ένα σπουδαίο ρόλο στον
προσδιορισµό της ακρίβειας που θα έπρεπε να αναµένουµε από έναν υπολο-
γισµό. Θα επικεντρώσουµε πολλή από την προσοχή µας σε προσεγγίσεις τις
οποίες µπορούµε να επηρεάσουµε. Αυτές οι συστηµατικές προσεγγίσεις που
πραγµατοποιούνται κατά τη διάρκεια των υπολογισµών περιλαµβάνουν :
• Αποκοπή και διακριτοποίηση : Μερικά χαρακτηριστικά ενός µαθηµατι-
κού µοντέλου µπορούν να παραλειφθούν ή να απλοποιηθούν (π.χ. αντικα-
τάσταση παραγώγου από διαιρεµένες διαφορές ή χρησιµοποίηση µερικού
αθροίσµατος στη θέση µιας σειράς).
• Στρογγυλοποίηση : Η αναπαράσταση των πραγµατικών αριθµών και οι
αριθµητικές πράξεις µεταξύ τους σε έναν υπολογιστή είναι γενικά µη ακρι-
βείς.
Αυτά τα δύο τελευταία ήδη σφαλµάτων ονοµάζονται σφάλµατα υπολογισµών.
Αξίζει να σηµειώσουµε ότι δεν υπάρχει πάντοτε σαφής διάκριση µεταξύ σφαλ-
µάτων δεδοµένων και σφαλµάτων υπολογισµών, αφού όπως εξηγήσαµε παρα-
πάνω σε πολλές περιπτώσεις τα δεδοµένα ενός προβλήµατος µπορεί να απο-
τελέσµατα προηγούµενων υπολογισµών.
Παράδειγµα 5.1 Θέλουµε να υπολογίσουµε τον αριθµό eπ. Για να γίνει ο
υπολογισµός αυτός θα χρειαστεί να προσεγγίσουµε την τιµή της συνάρτησης
f(x) = ex, στο x = π. Το αριθµητικό δεδοµένο του προβλήµατος είναι ο
άρρητος αριθµός π, ο οποίος για να παρασταθεί ακριβώς θα απαιτούσε άπειρα
δεκαδικά ψηφία. Κάτι τέτοιο δεν είναι δυνατό γι’ αυτό προσεγγίζουµε τον αριθµό
π, µέχρι ενός αριθµού δεκαδικών ψηφίων. Έτσι για παράδειγµα θα µπορούσαµε
στον υπολογισµό να αντικαταστήσουµε το x = π, µε το x = 3.14159265 που
περιέχει µόνο τα 8 πρώτα δεκαδικά ψηφία του π. Σε αυτή την περίπτωση λοιπόν
66 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες
εισάγουµε ένα σφάλµα δεδοµένων της τάξης του 10−9, αφού η απόλυτη διαφορά
|x− x| < 10−8
Από την άλλη πλευρά για τον υπολογισµό του eπ, θα χρειαστεί να υπολογίσουµε
τη συνάρτηση f(x) = ex. Η εκθετική συνάρτηση ορίζεται ως σειρά
ex =∞∑
n=0
xn
n!= 1 +
x1
1!+
x2
2!+
x3
3!+ . . .
όµως σε πραγµατικούς υπολογισµούς δεν είναι δυνατό να εκτελέσουµε αθροί-
σεις απείρων όρων, γι’ αυτό το λόγο προσεγγίζουµε την πραγµατική εκθετική
συνάρτηση ex, µε ένα µερικό άθροισµα της παραπάνω άπειρης σειράς που πε-
ριέχει µόνο πεπερασµένο πλήθος όρων. Για παράδειγµα αν χρησιµοποιήσουµε
τους 15 πρώτους όρους της παραπάνω σειράς εισάγουµε µια προσέγγιση της
πραγµατικής συνάρτησης που ορίζεται ως εξής :
f(x) =15∑
n=0
xn
n!
Προφανώς κάτι τέτοιο έχει ως αποτέλεσµα την εισαγωγή υπολογιστικού σφάλ-
µατος, στον υπολογισµό µας, αφού
f(x)− f(x) =x16
16!+
x17
17!+
x18
18!+ . . .
ενώ µπορεί να αποδειχθεί ότι για x = π η παραπάνω διαφορά είναι περίπου
5.26424603× 10−6.
Συνολικά το σφάλµα στον υπολογισµό µας οφείλεται αφενός στο σφάλµα δεδο-
µένων που είναι της τάξης του 10−9 και αφετέρου στο σφάλµα υπολογισµού.
Μπορεί να αποδειχθεί ότι το πραγµατικό συνολικό σφάλµα είναι :
f(x)− f(x) = eπ −15∑
n=0
(3.14159265)n
n!≃ 5.34731623× 10−6
Σηµειώστε ότι ακόµη και σε αυτή την περίπτωση µπορεί να θεωρηθεί ότι το
σφάλµα δεδοµένων είναι σφάλµα υπολογισµού αφού ουσιαστικά η προσέγγιση
του π, µε 8 δεκαδικά ψηφία είναι αποτέλεσµα εφαρµογής κάποιου προηγούµενου
προσεγγιστικού υπολογισµού.
Η σηµασία ενός σφάλµατος σχετίζεται προφανώς µε το µέγεθος της ποσότητας
που µετράται ή υπολογίζεται. Προφανώς ένα σφάλµα της τάξης του 10−8,
έχει εντελώς διαφορετική βαρύτητα σε ένα υπολογισµό της αστρονοµίας όπου
τα µεγέθη που χειριζόµαστε είναι συνήθως πολύ µεγάλα, σε σχέση µε ένα
υπολογισµό της ατοµικής φυσικής όπου τα µεγέθη που εµπλέκονται είναι πολύ
µικρά. Προφανώς στην πρώτη περίπτωση ένα σφάλµα της τάξης του 10−8,
Ευαισθησία και Κατάσταση 67
είναι ασήµαντο, ενώ στην ατοµική κλίµατα το µέγεθος 10−8 πρέπει σίγουρα
να ληφθεί υπόψη. Αυτό µας οδηγεί στις έννοιες του απόλυτου και σχετικού
σφάλµατος, τα οποία ορίζονται παρακάτω. Αν x είναι το πραγµατικό µέγεθος
που θέλουµε να προσεγγίσουµε και x η προσέγγιση που χρησιµοποιούµε, τότε
ορίζουµε :
• Απόλυτο σφάλµα2 : εa = x− x
• Σχετικό σφάλµα : εσ = εax = x−x
x (για x = 0)
Ένας χρήσιµος τρόπος να εκφράσουµε τη σχέση µεταξύ του σχετικού σφάλ-
µατος και προσέγγισης είναι ο ακόλουθος :
x = x(1 + εσ)
Φυσικά, συνήθως δεν γνωρίζουµε την αληθή τιµή. Αν τη γνωρίζαµε, δεν θα
χρειαζόταν να προσπαθούµε να την προσεγγίσουµε. Άρα, έτσι, συνήθως απλά
θα εκτιµούµε ή θα φράσσουµε το σφάλµα, παρά θα το υπολογίζουµε ακριβώς,
επειδή δε γνωρίζουµε την αληθή τιµή. Για τον ίδιο λόγο, το σχετικό σφάλµα
συχνά θα θεωρείται σε σχέση µε την προσεγγιστική τιµή, παρά µε την αληθή
τιµή, όπως στον προαναφερθέντα ορισµό.
Παράδειγµα 5.2 Στο παράδειγµα 5.1 υπολογίσαµε το απόλυτο σφάλµα
f(x)− f(x) ≃ 5.34731623× 10−6
Υπολογίζοντας µια προσέγγιση της τιµής του f(x) = 23.1407, µπορούµε να
εκτιµήσουµε το σχετικό σφάλµα, που είναι
εσ =f(x)− f(x)
f(x)≃ 2.31078540× 10−7
Ευαισθησία και Κατάσταση
Οι δυσκολίες στην ακριβή επίλυση ενός προβλήµατος δεν οφείλονται πάντοτε
σε έναν κακώς εφαρµοσµένο µαθηµατικό τύπο ή αλγόριθµο, αλλά µπορεί να
ενυπάρχει στο πρόβληµα που επιλύεται. Ακόµη και µε ακριβείς υπολογισµούς,
είναι δυνατόν η λύση του προβλήµατος να είναι πολύ ευαίσθητη σε διαταρα-
χές των δεδοµένων του προβλήµατος. Ένα πρόβληµα λέγεται µη ευαίσθητο,
2 Μερικοί συγγραφείς ορίζουν το απόλυτο σφάλµα ως την απόλυτη τιµή της παραπάνω
διαφοράς, δηλαδή εa = |x− x|
68 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες
ή καλής κατάστασης, αν µία δοσµένη σχετική αλλαγή (διατάραξη) στα δεδο-
µένα προκαλεί µία λογικά ανάλογη αλλαγή στη λύση. Ένα πρόβληµα λέγεται
ευαίσθητο, ή κακής κατάστασης, αν η σχετική αλλαγή στο αποτέλεσµα µπο-
ρεί να είναι πολύ µεγαλύτερη από αυτή των δεδοµένων. Μιλώντας τυπικά,
ορίζουµε το ∆είκτη Κατάστασης (∆K) ενός προβλήµατος f(x) είναι :
∆K =Σχετική Μεταβολή Αποτελέσµατος
Σχετική Μεταβολή ∆εδοµένων=
∣∣∣f(x)−f(x)f(x)
∣∣∣∣∣ x−x
x
∣∣όπου x είναι ένας αριθµός κοντά στο x. Ένα πρόβληµα είναι ευαίσθητο, ή
κακής κατάστασης, αν ο ∆K είναι πολύ µεγαλύτερος από 1.
Αξίζει να παρατηρήσουµε ότι αν η f(x) είναι παραγωγίσιµη στο σηµείο x,
τότε αν θεωρήσουµε ότι x→ x, έχουµε
f ′(x) = limx→x
f(x)− f(x)
x− xάρα για x→ x
∆K =
∣∣∣∣f(x)− f(x)
x− x
x
f(x)
∣∣∣∣ =∣∣∣∣f′(x)
x
f(x)
∣∣∣∣
Παράδειγµα 5.3 Θα υπολογίσουµε τον δείκτη κατάστασης στον υπολογισµό
του cos(π2 ). Αφού (cosx)′ = − sinx, σύµφωνα µε το παραπάνω τύπο θα έχουµε
∆K =
∣∣∣∣f′(x)
x
f(x)
∣∣∣∣ =
=
∣∣∣∣− sinπ
2
π2
cos π2
∣∣∣∣ =π
2tan
π
2= +∞
∆ηλαδή ο δείκτης κατάστασης του προβλήµατος cos(π2 ) τείνει στο άπειρο, πράγ-
µα που σηµαίνει ότι το πρόβληµα αυτό είναι ευαίσθητο ή κακής κατάστασης για
x κοντά στο π/2.
Παράδειγµα 5.4 Θα υπολογίσουµε τον δείκτη κατάστασης στον υπολογισµό
του eπ. Αφού (ex)′ = ex θα έχουµε
∆K =
∣∣∣∣f′(x)
x
f(x)
∣∣∣∣ =
= eππ
eπ= π ≃ 3.1415
που είναι αρκετά κοντά στο 1, άρα το πρόβληµα µας δεν είναι ευαίσθητο.
Μια άλλη έννοια σχετική µε αυτή της ευαισθησίας ενός προβλήµατος είναι
αυτή της ευστάθειας ενός υπολογιστικού αλγόριθµου. Οι δύο ιδέες έχουν να
κάνουν µε την ευαισθησία σε διαταραχές, αλλά ο όρος ευστάθεια χρησιµο-
Προς τα Πίσω Ανάλυση Σφαλµάτων 69
ποιείται συνήθως για αλγόριθµους και ο όρος κατάσταση για προβλήµατα.
Ένας αλγόριθµος είναι ευσταθής αν το αποτέλεσµα που προκύπτει απ’ αυτόν
δεν είναι σχετικά ευαίσθητο σε διαταράξεις, που προέρχονται από προσεγγίσεις
που έγιναν κατά τη διάρκεια των υπολογισµών. Η ευστάθεια ενός αλγόριθ-
µου από µόνη της δεν εγγυάται ότι η υπολογιζόµενη λύση θα είναι ακριβής :
η ακρίβεια εξαρτάται από την κατάσταση του προβλήµατος καθώς επίσης και
από την ευστάθεια του αλγόριθµου.
Προς τα Πίσω Ανάλυση Σφαλµάτων
Αναλύοντας σε έναν υπολογισµό τη µετάδοση των σφαλµάτων, από τα δεδο-
µένα του προβλήµατος στα αποτελέσµατα, είναι συχνά πολύ δύσκολο. Επί
πλέον, οι υποθέσεις που γίνονται σε ακραίες περιπτώσεις στο κάθε στάδιο
οδηγούν συχνά σε ένα πολύ απαισιόδοξο φράγµα για το συνολικό σφάλµα.
Μία εναλλακτική προσέγγιση είναι η προς τα πίσω ανάλυση σφαλµάτων : Θε-
ωρείστε ότι η λαµβανόµενη προσεγγιστική λύση είναι η ακριβής λύση ενός
τροποποιηµένου προβλήµατος, και τότε αναρωτηθείτε πόσο µεγάλη χρειάζεται
να είναι η τροποποίηση στο αρχικό πρόβληµα για να δώσει το ίδιο αποτέλε-
σµα. Με άλλα λόγια, πόσο µεγάλο θα έπρεπε να είναι το σφάλµα στα αρχικά
δεδοµένα, για να δικαιολογήσει όλο το σφάλµα στο τελικά υπολογιζόµενο
αποτέλεσµα; Σε όρους της προς τα πίσω ανάλυσης σφαλµάτων, µία προσεγ-
γιστική λύση σε ένα δοσµένο πρόβληµα είναι καλή αν είναι η ακριβής λύση
ενός προβλήµατος που βρίσκεται "κοντά" στο δοσµένο.
Προς τα
εµπρός
σφάλµα
Προς τα
πίσω
σφάλµα
x`
f`HxL= f Hx
`L
f`
f
f
x f H xL
70 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες
Παράδειγµα 5.5 Θεωρούµε και πάλι το πρόβληµα του παραδείγµατος 5.1, µε
τη διαφορά ότι τώρα θέλουµε να υπολογίσουµε την τιµή του e, προσεγγίζονταςτην εκθετική συνάρτηση f(x) = ex, µε τη συνάρτηση
f(x) =5∑
n=0
xn
n!
Θεωρούµε ότι η τιµή της προσέγγισης f(1), αντιστοιχεί στην ακριβή τιµή της
συνάρτησης σε µια γειτονική τιµή του x = 1. ∆ηλαδή, θεωρούµε ότι υπάρχει
ένα x, έτσι ώστε
f(1) = f(x)δηλαδή
f(1) = ex
ή
x = ln f(1)
Αλλά f(1) = 2.71667, άρα
x = ln 2.71667 = 0.999 41
Άρα πράγµατι η προσέγγιση που χρησιµοποιήσαµε δίνει την πραγµατική τιµή της
εκθετικής συνάρτησης για ένα γειτονικό πρόβληµα, όπου x = 0.999 41 και το
προς τα πίσω σφάλµα είναι
x− x = 0.999 41− 1 = −0.00059
Σηµειώστε ότι το αντίστοιχο προς τα εµπρός σφάλµα είναι
f(x)− f(x) = f(1)− f(1) =
= 2.71667− 2.718 3 =
= −0.001 63
Αριθµητική κινητής υποδιαστολής
Σε έναν ηλεκτρονικό υπολογιστή οι πραγµατικοί αριθµοί παριστάνονται προ-
σεγγιστικά από ένα σύστηµα αριθµών κινητής υποδιαστολής. Η βασική ιδέα
µοιάζει µε έναν επιστηµονικό συµβολισµό, στον οποίο ένας αριθµός πολύ µε-
γάλου ή πολύ µικρού µεγέθους εκφράζεται ως ένας αριθµός αποδεκτού µεγέ-
θους πολλαπλασιασµένος επί µία κατάλληλη δύναµη του δέκα. Για παράδειγ-
µα, οι αριθµοί 2347 και 0.0007396 γράφονται ως 2.347×103 και 7.396×10−4,
αντίστοιχα. Στη γραφή αυτή, η υποδιαστολή κινείται, καθώς η δύναµη του
δέκα αλλάζει.
Μπορούµε να πούµε ότι το σύστηµα αριθµών κινητής υποδιαστολής χαρακτη-
ρίζεται από τέσσερις ακεραίους αριθµούς :
Αριθµητική κινητής υποδιαστολής 71
• β που ονοµάζεται βάση
• t που ονοµάζεται ακρίβεια
• L που ορίζει το κάτω όριο του εκθέτη
• U που ορίζει το άνω όριο του εκθέτη
Στο σύστηµα κινητής υποδιαστολής ένας πραγµατικός αριθµός x παριστάνεται
ως
x = ±(d0 +
d1β
+d2
β2+ · · ·+ dt−1
βt−1
)βe
= ±d0.d1d2d3 · · · dt × βe
︸ ︷︷ ︸Κανονικοποιηµένη Μορφή
όπου, ± είναι το πρόσηµο του αριθµού, οι αριθµοί di, i = 0, 2, . . . , t είναι
ακέραιοι µε 0 ≤ di < β και L ≤ e ≤ U. Το µέρος d0.d1d2d3 · · · dt ονοµάζεται
mantissa ή σηµαντικό µέρος του αριθµού, ενώ ακέραιος e, ονοµάζεται εκθέτης
του αριθµού.
Ένας αριθµός κινητής υποδιαστολής λέγεται κανονικοποιηµένος αν το πρώτο
ψηφίο d0 είναι πάντα µη µηδενικό, εκτός κι αν ο αριθµός που παριστάνεται
είναι το µηδέν. Έτσι, σε ένα κανονικοποιηµένο σύστηµα κινητής υποδιαστο-
λής, το σηµαντικό µέρος m = d0.d1d2d3 · · · dt ενός δοσµένου µη µηδενικού
αριθµού κινητής υποδιαστολή ικανοποιεί πάντοτε τις σχέσεις
1 ≤ m < β
Τα συστήµατα κινητής υποδιαστολής συνήθως κανονικοποιούνται γιατί τότε :
• Η αναπαράσταση κάθε αριθµού είναι µοναδική.
• ∆ε σπαταλώνται ψηφία σε µηδενικά πριν από το σηµαντικό µέρος του
αριθµού, µεγιστοποιώντας έτσι την ακρίβεια αναπαράστασης.
• Σε ένα δυαδικό (β = 2) σύστηµα, το πρώτο bit είναι πάντοτε 1 και εποµέ-
νως δε χρειάζεται να αποθηκευτεί, κερδίζοντας έτσι ένα επί πλέον ψηφίο
στην ακρίβεια για ένα δοσµένο εύρος πεδίου αποθήκευσης.
Σε έναν υπολογιστή, το πρόσηµο, ο εκθέτης και το σηµαντικό µέρος φυλάσ-
σονται σε ξεχωριστά πεδία µίας δοσµένης λέξης κινητής υποδιαστολής, κάθε
ένα από τα οποία έχει ένα καθορισµένο εύρος. Ο αριθµός µηδέν παριστάνεται
µε µοναδικό τρόπο, έχοντας και το σηµαντικό µέρος του και τον εκθέτη ίσα µε
µηδέν. Στους περισσότερους υπολογιστές η βάση β είναι 2 καθώς το σύστη-
72 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες
µα παράστασης των αριθµών δυαδικό. Για να γίνει ευκολότερο το έργο του
ανθρώπου, ένας υπολογιστής µετατρέπει συνήθως τις αριθµητικές τιµές από
τη δεκαδική µορφή της εισόδου και στη δεκαδική µορφή της εξόδου, ανάλογα
µε τη βάση του συστήµατος αρίθµησης που χρησιµοποιεί εσωτερικά.
Σε ότι ακολουθεί θα χρησιµοποιούµε το συµβολισµό fl(x) για να συµβολί-
σουµε την παράσταση του x ως αριθµού κινητής υποδιαστολής σε ένα συγκε-
κριµένο σύστηµα.
Παράδειγµα 5.6 Ο αριθµός 5326.567 παριστάνεται σαν αριθµός κινητής υ-
ποδιαστολής µε β = 10 ως
5.326567× 103
Ο αριθµός 21.5 παριστάνεται σαν αριθµός κινητής υποδιαστολής µε β = 2,ακολουθώντας την εξής διαδικασία :
Αρχικά µετατρέπουµε τον αριθµό 21.5 του δεκαδικού συστήµατος σε δυαδική
µορφή αναλύοντας τον σε δυνάµεις του 2, δηλαδή γράφουµε 21.5 = 24+22+20+2−1. Άρα η δυαδική του µορφή είναι 10101.1, οπότε µετά την κανονικοποίηση
των σηµαντικών ψηφίων θα έχουµε
fl(21.5) = 1.01011× 24
Το πιο διαδεδοµένο σύστηµα παράστασης αριθµών κινητής υποδιαστολής είναι
το πρότυπο 754-1985 του ινστιτούτου IEEE, το οποίο προβλέπει δύο επίπεδα
ακρίβειας, των οποίων τα χαρακτηριστικά εµφανίζονται στον παρακάτω πίνακα
Σύστηµα β t L UΑπλής Ακρίβειας 2 24 -126 127
∆ιπλής Ακρίβειας 2 53 -1022 1023
Το πρότυπο IEEE-754 σχεδιάστηκε µε προσοχή για να εξαλείψει τις πολλές
ανωµαλίες και ασάφειες των προγενέστερων εκδόσεων πρότυπων αριθµών κι-
νητής υποδιαστολής συγκεκριµένων κατασκευαστών και έχει διευκολύνει πολύ
στην ανάπτυξη φορητού και αξιόπιστου αριθµητικού λογισµικού. Ακόµη, επι-
τρέπει το λογικό και συνεπή χειρισµό των εξαιρετικών περιπτώσεων, όπως η
διαίρεση µε το µηδέν.
Ένα σύστηµα αριθµών κινητής υποδιαστολής είναι πεπερασµένο και διακριτό
και το πλήθος των κανονικοποιηµένων αριθµών κινητής υποδιαστολής δίνεται
από τον τύπο
2(β − 1)βt−1(U − L + 1) + 1
Αριθµητική κινητής υποδιαστολής 73
επειδή υπάρχουν δύο επιλογές για το πρόσηµο, (β−1) επιλογές για το πρώτο
ψηφίο, βt−1 επιλογές για κάθε ένα από τα εναποµένοντα t − 1 ψηφία και
(U −L+1) δυνατές τιµές για τον εκθέτη. Το 1 προστίθεται επειδή ο αριθµός
ενδέχεται να είναι το µηδέν.
Αγνοώντας το πρόσηµο, υπάρχει ένας ελάχιστος θετικός κανονικοποιηµένος
αριθµός κινητής υποδιαστολής, και δίνεται παρακάτω
Επίπεδο Υποεκχείλισης (underflow level) = UFL = βL
ο οποίος έχει το 1 ως πρώτο σηµαντικό ψηφίο και τα υπόλοιπα ψηφία του
σηµαντικού τµήµατος είναι µηδέν, ενώ ο εκθέτης παίρνει τη µικρότερη δυνατή
τιµή. Επίσης, υπάρχει ένας µέγιστος αριθµός κινητής υποδιαστολής και είναι
ο
Επίπεδο Υπερχείλισης (overflow level) = OFL = βU+1(1− β−t)
ο οποίος έχει το β−1 ως τιµή για κάθε σηµαντικό ψηφίο και ο εκθέτης παίρνει
τη µεγαλύτερη δυνατή τιµή.
Παράδειγµα 5.7 Στο σύστηµα απλής ακρίβειας του ΙΕΕΕ, τα επίπεδα υποεκ-
χείλισης και υπερχείλισης είναι αντίστοιχα
UFL = βL = 2−126 ≃ 1.1755× 10−38
και
OFL = βU+1(1− β−t) = 2128(1− 2−24) ≃ 3.4028× 1038
Αντίστοιχα στο σύστηµα διπλής ακρίβειας του ΙΕΕΕ, έχουµε
UFL = βL = 2−1022 ≃ 2. 225 1× 10−308
και
OFL = βU+1(1− β−t) = 21024(1− 2−53) ≃ 1. 797 7× 10308
Είναι προφανές ότι δεν είναι δυνατό όλοι οι πραγµατικοί αριθµοί να παρα-
σταθούν µε ακρίβεια σε ένα σύστηµα κινητής υποδιαστολής, γι’ αυτό το λόγο
χρησιµοποιούνται δύο τρόποι προσέγγισης.
• Αποκοπή : Το ανάπτυγµα του αριθµού x ως προς βάση β αποκόπτεται
µετά το t ψηφίο.
• Στρογγύλευση στον πλησιέστερο : Ο fl(x) είναι ο πλησιέστερος στον xαριθµός κινητής υποδιαστολής. Σε περίπτωση που ο x ισαπέχει από δύο
αριθµούς κινητής υποδιαστολής, επιλέγουµε αυτόν του οποίου το τελευ-
74 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες
ταίο ψηφίο είναι άρτιο. Λόγω της τελευταίας ιδιότητας, ο κανόνας αυτός
ονοµάζεται µερικές φορές και στρογγύλευση στο άρτιο.
Η στρογγύλευση στον κοντινότερο είναι η πιο ορθή, αλλά είναι κάπως πιο
δαπανηρή για να υλοποιηθεί σωστά. Κάποια συστήµατα στο παρελθόν έχουν
χρησιµοποιήσει κανόνες στρογγύλευσης που ήταν οικονοµικότεροι στην υλο-
ποίησή τους, όπως η αποκοπή, αλλά η στρογγύλευση στον πλησιέστερο είναι
ο συνηθέστερος κανόνας στρογγύλευσης στα πρότυπα συστήµατα του ΙΕΕΕ.
Το σφάλµα που εισάγεται στους υπολογισµούς εξαιτίας των παραπάνω µεθό-
δων προσέγγισης ονοµάζεται σφάλµα στρογγύλευσης.
Η ακρίβεια ενός συστήµατος αριθµών κινητής υποδιαστολής χαρακτηρίζεται
από µια ποσότητα ευρέως γνωστή ως ακρίβεια µηχανής ή έψιλον µηχανής.
Η τιµή της, την οποία συµβολίζουµε µε εmach, εξαρτάται από τη µέθοδο
προσέγγισης :
Όταν χρησιµοποιείται η αποκοπή είναι
εmach = β1−t
ενώ όταν χρησιµοποιείται στρογγύλευση στον πλησιέστερο,
εmach =1
2β1−t
Η ακρίβεια µηχανής είναι σηµαντική επειδή προσδιορίζει το µέγιστο δυνατό
σχετικό σφάλµα στην αναπαράσταση ενός µη µηδενικού πραγµατικού αριθµού
x σε ένα σύστηµα αριθµών κινητής υποδιαστολής :∣∣∣∣fl(x)− x
x
∣∣∣∣ ≤ εmach
Παράδειγµα 5.8 Στο σύστηµα απλής ακρίβειας του ΙΕΕΕ, όπου χρησιµοποιεί-
ται η µέθοδος στρογγύλευσης στον πλησιέστερο έχουµε
εmach =1
22−23 = 5. 960 5× 10−8
ενώ αντίστοιχα στο σύστηµα διπλής ακρίβειας έχουµε
εmach =1
22−52 = 1. 110 2× 10−16
Πράξεις µε αριθµούς κινητής υποδιαστολής
Σε αυτή την ενότητα παρουσιάζουµε τον τρόπο εκτέλεσης των τεσσάρων συ-
Πράξεις µε αριθµούς κινητής υποδιαστολής 75
νήθων πράξεων πραγµατικών αριθµών, όταν αυτοί παριστάνονται από ένα σύ-
στηµα αριθµών κινητής υποδιαστολής. Για να πραγµατοποιηθεί η πρόσθεση ή
η αφαίρεση µεταξύ δύο αριθµών, σε κάποιο σύστηµα κινητής υποδιαστολής,
πρέπει οι δύο αριθµοί να έχουν κοινό εκθέτη, ώστε να η πράξη να πραγ-
µατοποιηθεί µεταξύ των σηµαντικών µερών τους. Επειδή αυτό γενικά δεν
συµβαίνει για οποιουσδήποτε δύο αριθµούς, µετατοπίζουµε την υποδιαστολή
σε έναν από τους δύο, ώστε να αποκτήσουν κοινό εκθέτη
Παράδειγµα 5.9 Έστω ότι το ζητούµενο είναι να εκτελεστεί η πρόσθεση, στο
σύστηµα κινητής υποδιαστολής µε β = 10 και t = 8 :
S1 = 5621.1234 + 34.785491
Η κανονικοποιηµένη µορφή των δύο αριθµών είναι :
5621.1234 = 5.6211234× 103
34.785491 = 3.4785491× 101
Για να πετύχουµε κοινό εκθέτη, µετατοπίζουµε την υποδιαστολή στον µικρότερο
αριθµό κατά δύο θέσεις προς αριστερά, ώστε να γραφεί σαν πολλαπλάσιο του
103. Έχουµε
34.785491 = 3.4785491× 101 = 0.034785491× 103
Έτσι η ζητούµενη πρόσθεση µπορεί να εκτελεστεί ως εξής :
S1 = 5621.1234 + 34.785491 =
= 5.6211234× 103 + 0.034785491× 103 =
= (5.6211234 + 0.034785491)× 103 =
= 5.655 908 891× 103
Παρατηρείστε ότι το παραπάνω αποτέλεσµα είναι µεν το ακριβές αποτέλεσµα της
πρόσθεσης, όµως στο σύστηµα µας έχουµε στη διάθεση µας µόνο 8 σηµαντικά
ψηφία. Άρα ο αριθµός 5.655908891 που αποτελείται από 10 σηµαντικά ψηφία
πρέπει να στρογγυλοποιηθεί στον πλησιέστερο αριθµό µε 8 σηµαντικά ψηφία.
Άρα το τελικό αποτέλεσµα της πρόσθεσης στο σύστηµα µας, είναι :
fl(S1) = 5.655 908 9× 103
Η απώλεια των δύο τελευταίων σηµαντικών ψηφίων στην παραπάνω πρόσθε-
ση µπορεί να είναι ουσιαστικά ασήµαντη, όµως σε κάποιες περιπτώσεις η
παραπάνω διαδικασία µπορεί να οδηγήσει σε µη αναµενόµενα αποτελέσµατα.
Παράδειγµα 5.10 Ζητείται να εκτελεστεί η πρόσθεση των αριθµών, στο σύ-
στηµα κινητής υποδιαστολής µε β = 10 και t = 8 :
S2 = 5621.1234 + 0.0000123456
76 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες
όπου η κανονικοποιηµένη µορφή του πρώτου αριθµού είναι :
5621.12345 = 5.62112345× 103
ενώ σύµφωνα µε τα παραπάνω ο δεύτερος αριθµός πρέπει να γραφεί σαν πολ-
λαπλάσιο του 103, δηλαδή
0.0000123456 = 0.0000000123456× 103
Άρα
S2 = 5621.1234 + 0.0000123456 =
= 5.6211234× 103 + 0.0000000123456× 103 =
= (5.6211234 + 0.0000000123456)× 103 =
= 5.621123 4123456× 103
Το ακριβές αποτέλεσµα της παραπάνω πρόσθεσης πρέπει να στρογγυλοποιηθεί
στα πρώτα 8 σηµαντικά ψηφία, δίνοντας τελικά
fl(S2) = 5.6211234× 103
όπου εύκολα διαπιστώνουµε ότι fl(S2) = 5621.1234, δηλαδή ίσο µε τον πρώτο
προσθετέο ! Το φαινόµενο αυτό ονοµάζεται απορρόφηση.
Με ακριβώς αντίστοιχο τρόπο εκτελείται και η αφαίρεση µεταξύ δύο αριθµών.
Σε αντίστοιχες προβληµατικές περιπτώσεις µπορεί να υπάρξει πρόβληµα κατα-
στροφικής απώλειας σηµαντικών ψηφίων (βλέπε παράδειγµα 5.12 παρακάτω),
όπου το αποτέλεσµα µιας αφαίρεσης στο σύστηµα κινητής υποδιαστολής µπο-
ρεί να προκύψει µηδέν, ενώ στην πραγµατικότητα η διαφορά των δύο αριθµών
µπορεί να είναι αρκετά µεγάλη.
Ο πολλαπλασιασµός σε ένα σύστηµα κινητής υποδιαστολής µπορεί να εκτε-
λεστεί µε αρκετά απλούστερο τρόπο, αφού δεν απαιτεί µετατοπίσεις της υ-
ποδιαστολής. Η πράξη του πολλαπλασιασµού πραγµατοποιείται µεταξύ των
σηµαντικών µερών των δύο παραγόντων, ενώ οι αντίστοιχοι εκθέτες αθροίζο-
νται.
Παράδειγµα 5.11 Στο σύστηµα κινητής υποδιαστολής µε β = 10 και t = 8,να εκτελεστεί ο πολλαπλασιασµός :
P = 123.45678× 87.654321
Έχουµε
123.45678 = 1.2345678× 102
87.654321 = 8.7654321× 101
Πράξεις µε αριθµούς κινητής υποδιαστολής 77
Άρα
P = 123.45678× 87.654321 =
= (1.2345678× 102)× (8.7654321× 101) =
= (1.2345678× 8.7654321)× 102+1 =
= 10.821520223746 4× 103
Το ακριβές αποτέλεσµα της πράξης πρέπει να στρογγυλοποιηθεί στα πρώτα 8σηµαντικά ψηφία, δίνοντας τελικά
fl(P ) = 1.0821520× 104
Η διαίρεση µεταξύ δυο αριθµών εκτελείται αντίστοιχα, διαιρώντας τα δύο
σηµαντικά µέρη των αριθµών και αφαιρώντας αντίστοιχα τους εκθέτες τους.
Μια άλλη κατάσταση που συναντάται συχνά και µπορεί να δηµιουργήσει ση-
µαντικά προβλήµατα στους υπολογισµούς, είναι η απώλεια σηµαντικών ψηφί-
ων η οποία συνήθως συνεπάγεται σηµαντική απώλεια πληροφορίας. Τέτοιου
είδους απώλεια σηµαντικών ψηφίων µπορεί για παράδειγµα να παρατηρηθεί
κατά την αφαίρεση αριθµών, που η διαφορά τους είναι αρκετά κοντά στην ή
µικρότερη από την ακρίβεια της µηχανής.
Παράδειγµα 5.12 Ο κλασσικός τύπος του τριωνύµου εµπεριέχει σηµαντικά
προβλήµατα απώλειας σηµαντικών ψηφίων κάτω από ορισµένες προϋποθέσεις.
Είναι γνωστό ότι οι ρίζες του τριωνύµου
ax2 + bx + c = 0
δίνονται από τον τύπο
x1,2 =−b±
√b2 − 4ac
2aΓια κάποιες τιµές των συντελεστών, απλή χρήση αυτού του τύπου µε αριθµούς
κινητής υποδιαστολής µπορεί να προκαλέσει υπερχείλιση, υποεκχείλιση, ή κα-
ταστροφική απώλεια σηµαντικών ψηφίων. Για παράδειγµα, αν οι συντελεστές
είναι
a = 1, b = 104, c = 1Υπολογίζοντας τις ρίζες µε ακρίβεια 8 ψηφίων παίρνουµε
x1 = −9.9999999× 103, x2 = −10−4
Αν δοκιµάσουµε την εφαρµογή του τύπου τριωνύµου µε ακρίβεια 4 ψηφίων η
διακρίνουσα είναι :
∆ = b2 − 4ac = (104)2 − 4× 1× 1 = 108 − 4
Όµως για να εκτελεστεί η αφαίρεση στο τελευταίο µέλος της ισότητας πρέπει το
4 να γραφεί σαν πολλαπλάσιο του 108 δηλαδή
4 = 0.00000004× 108
78 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες
Επειδή, όµως έχουµε µόνο 4 σηµαντικά ψηφία στη διάθεση µας εφαρµόζουµε
στρογγύλευση στον πλησιέστερο η οποία δίνει στη θέση του 0.00000004 τον
αριθµό 0.000. Οπότε
∆ = b2 − 4ac = 1× 108 − 0.000× 108 = 1.000× 108
Στη συνέχεια υπολογίζουµε τη ρίζα :√∆ =
√1.000× 108 = 1.000× 104
Xρησιµοποιώντας τον τύπο για τις ρίζες
x1,2 =−104 ± 104
2=
−104
0
Παρατηρήστε ότι η ρίζα x1 = −104 είναι αποδεκτή για την ακρίβεια 4 ψηφίων
µε την οποία δουλεύουµε, αφού το σχετικό σφάλµα στον υπολογισµό του x1είναι
x1 − x1x1
=−104 + 9.9999999× 103
−9.9999999× 103= 1.000× 10−8
σηµαντικά µικρότερη της ακρίβειας (δηλ. του 10−4). Αντίθετα, λόγω της απώ-
λειας σηµαντικών ψηφίων η δεύτερη ρίζα x2 = 0 είναι σηµαντικά λανθασµένη,
αφού το σχετικό σφάλµα σε αυτή την περίπτωση είναι
x2 − x2x2
=0 + 10−4
10−4= 1
Το σηµαντικό αυτό σφάλµα οφείλεται στο γεγονός ότι στη διαφορά −104 +104 εµφανίστηκε αυτό που ονοµάζουµε καταστροφική απώλεια σηµαντικών
ψηφίων.
Ένας τρόπος για να αποφύγουµε τον υπολογισµό της παραπάνω διαφοράς στον
αριθµητή θα ήταν να χρησιµοποιήσουµε το παρακάτω τέχνασµα :
x2 =−b +
√b2 − 4ac
2a=
=−b +
√b2 − 4ac
2a
−b−√b2 − 4ac
−b−√b2 − 4ac
=
= − −b2 + b2 − 4ac
2a(−b−√b2 − 4ac)
=
=−2c
−b−√b2 − 4ac
άρα τώρα η ρίζα x2 µπορεί να υπολογιστεί µε 4 σηµαντικά ψηφία :
x2 =2
−104 − 104= −10−4
6 Αριθµητικές µέθοδοι επίλυ-
σης γραµµικών συστηµά-
των
Εισαγωγή
Στο κεφάλαιο αυτό ασχολούµαστε µε την επίλυση τετράγωνων γραµµικών
συστηµάτων, δηλαδή συστηµάτων n γραµµικών εξισώσεων µε n αγνώστους,
της µορφής :
a11x1 + a12x2 + · · ·+ a1nxn = b1a21x1 + a22x2 + · · ·+ a2nxn = b2
...
an1x1 + an2x2 + · · ·+ annxn = bn
(6.1)
όπου οι αριθµοί aij ∈ R, ονοµάζονται συντελεστές των αγνώστων, οι αριθµοί
bi ∈ R, σταθεροί όροι και xi είναι οι άγνωστοι του συστήµατος. Αν θέσουµε
A =
a11 a12 · · · a1na21 a22 · · · a2n
......
...
an1 an2 · · · ann
, B =
b1b2...
bn
, X =
x1x2...
xn
τότε το γραµµικό σύστηµα (6.1) µπορεί να γραφεί ισοδύναµα σαν µια εξίσωση
πινάκων της µορφής :
AX = B (6.2)
όπου οι πίνακες A,B είναι γνωστοί και ζητείται ο υπολογισµός του πίνακα
X. Αξίζει να παρατηρήσουµε ότι το σύστηµα (6.1) χαρακτηρίζεται πλήρως
από τους πίνακες A,B, για αυτό είναι χρήσιµο να εισάγουµε τον επαυξηµένο
πίνακα του συστήµατος[A B
]
ο οποίος περιέχει όλα τα απαραίτητα δεδοµένα για τη λύση του συστήµατος.
80 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων
Είναι γνωστό ότι το σύστηµα (6.1) έχει µοναδική λύση εάν και µόνο εάν η
ορίζουσα του πίνακα A είναι µη µηδενική, δηλαδή detA = 0.
Παρακάτω παρουσιάζουµε δύο µεγάλες κατηγορίες µεθόδων για την αριθµη-
τική επίλυση γραµµικών συστηµάτων.
Άµεσες Μέθοδοι
Η πιο γνωστή και ευρέως χρησιµοποιούµενη άµεση µέθοδος επίλυσης γραµ-
µικών συστηµάτων είναι η µέθοδος απαλοιφής του Gauss µε προς τα πίσω
αντικατάσταση την οποία και παρουσιάζουµε παρακάτω.
Μέθοδος απαλοιφής του Gauss και προς τα πίσωαντικατάσταση
Η µέθοδος απαλοιφής του Gauss αποτελεί µια από τις συνηθέστερες µεθό-
δους επίλυσης γραµµικών συστηµάτων και βασίζεται στη χρήση των πράξεων
γραµµών στον επαυξηµένο πίνακα του συστήµατος. Σε ένα πίνακα µπορούµε
να εφαρµόσουµε τρία είδη πράξεων γραµµών :
1. Αντιµετάθεση µεταξύ δύο οποιωνδήποτε γραµµών του πίνακα
2. Πολλαπλασιασµός µιας οποιασδήποτε γραµµής µε οποιονδήποτε αριθµό
λ = 0.
3. Πρόσθεση πολλαπλασίου γραµµής σε κάποια άλλη γραµµή
Η γενική ιδέα πίσω από την εφαρµογή πράξεων γραµµών στον επαυξηµένο
πίνακα ενός συστήµατος, είναι ότι το σύστηµα που αντιστοιχεί στον πίνακα
που προκύπτει µετά τις πράξεις γραµµών είναι ισοδύναµο µε το αρχικό, δη-
λαδή έχει ακριβώς την ίδια λύση µε το αρχικό. Αν καταφέρουµε να φέρουµε
τον επαυξηµένο πίνακα ενός συστήµατος σε κάποια ειδική µορφή, τότε έχουµε
ουσιαστικά αντικαταστήσει το αρχικό σύστηµα µε ένα νέο που είναι πιθανόν
ευκολότερο στη λύση του. Μια τέτοια ειδική µορφή είναι η άνω τριγωνική
µορφή του πίνακα A ή γενικότερα η άνω κλιµακωτή µορφή του επαυξηµένου
πίνακα. Ένας πίνακας είναι σε άνω τριγωνική µορφή, αν τα στοιχεία που
βρίσκονται κάτω από την κύρια διαγώνιο του είναι µηδενικά. Με τη µέθο-
δο απαλοιφής του Gauss µπορούµε να επιτύχουµε µια τέτοια άνω τριγωνική
Άµεσες Μέθοδοι 81
µορφή για οποιονδήποτε πίνακα µας δοθεί.
Παράδειγµα 6.1 ∆ίνεται το σύστηµα
x1 − x2 + 2x3 − x4 = −82x1 − 2x2 + 3x3 − 3x4 = −20
x1 + x2 + x3 = −2x1 − x2 + 4x3 + 3x4 = 12
Ο επαυξηµένος πίνακας του συστήµατος είναι
1 −1 2 −1 −82 −2 3 −3 −201 1 1 0 −21 −1 4 3 12
Θα προσπαθήσουµε µε πράξεις γραµµών να φέρουµε τον παραπάνω πίνακα σε
άνω τριγωνική µορφή. Αρχικά θα µηδενίσουµε τα τρία τελευταία στοιχεία της
πρώτης στήλης. Εφαρµόζουµε τις ακόλουθες πράξεις γραµµών
Γ2 → Γ2 − 2Γ1,Γ3 → Γ3 − Γ1,Γ4 → Γ4 − Γ1οπότε ο νέος πίνακας είναι
1 −1 2 −1 −80 0 −1 −1 −40 2 −1 1 60 0 2 4 20
Αντιµεταθέτουµε τη δεύτερη και την τρίτη γραµµή, δηλαδή Γ2 ↔ Γ3, οπότε :
1 −1 2 −1 −80 2 −1 1 60 0 −1 −1 −40 0 2 4 20
παρατηρούµε ότι στη δεύτερη στήλη τα στοιχεία κάτω από την κύρια διαγώνιο
είναι µηδέν, άρα προχωρούµε στην τρίτη στήλη µε σκοπό να µηδενίσουµε το
στοιχείο στην τελευταία γραµµή. Πράγµατι εφαρµόζοντας την πράξη
Γ4 → Γ4 + 2Γ3παίρνουµε
1 −1 2 −1 −80 2 −1 1 60 0 −1 −1 −40 0 0 2 12
(6.3)
όπου ο τελευταίος πίνακας είναι σε άνω κλιµακωτή µορφή.
Ο γενικός αλγόριθµος απαλοιφής του Gauss είναι ο παρακάτω :
Αλγόριθµος Απαλοιφής του Gauss
82 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων
• ∆εδοµένα : Επαυξηµένος πίνακας του συστήµατος, διαστάσεων n×(n+1)
• Βήµα 1 : Αν όλα τα στοιχεία της πρώτης στήλης είναι µηδέν τότε ο αλγό-
ριθµος τερµατίζει και δεν υπάρχει µοναδική λύση.
• Βήµα 2 : Αν το στοιχείο στη θέση (1,1) είναι µηδέν τότε βρίσκουµε ένα
µη µηδενικό στοιχείο στην πρώτη στήλη και αντιµεταθέτουµε την γραµµή
του µε την 1η γραµµή.
• Βήµα 3 : Για κάθε i = 2, 3, . . . , n, εφαρµόζουµε τις πράξεις γραµµών
Γi → Γi − a1ia11
Γ1
• Βήµα 4 : Επιστρέφουµε στο βήµα 1, χρησιµοποιώντας σαν δεδοµένο εισό-
δου τον υποπίνακα, που προκύπτει αφαιρώντας από τον αρχικό την πρώτη
γραµµή και την πρώτη στήλη του (η διαδικασία επαναλαµβάνεται όσο υ-
πάρχει πίνακας).
Έχοντας ανάγει τον επαυξηµένο πίνακα ενός συστήµατος σε άνω τριγωνική
µορφή έχουµε ένα σηµαντικό πλεονέκτηµα. Το σύστηµα στο οποίο αντιστοιχεί
ο νέος επαυξηµένος πίνακας είναι πολύ εύκολο να λυθεί µε τη µέθοδο της προς
τα πίσω αντικατάστασης.
Παράδειγµα 6.2 Σε συνέχεια του προηγούµενου παραδείγµατος ο άνω τριγω-
νικός επαυξηµένος πίνακας (6.3), αντιστοιχεί στο σύστηµα :
x1 − x2 + 2x3 − x4 = −82x2 − x3 + x4 = 6
−x3 − x4 = 42x4 = 12
Ξεκινώντας από την τελευταία εξίσωση παίρνουµε
x4 = 6
οπότε αντικαθιστώντας το x4 στις προηγούµενες τρεις εξισώσεις µπορούµε άµεσα
(από την 3η) να υπολογίσουµε το
x3 = −2
Οµοίως, σταδιακά βρίσκουµε
x2 = −1και
x1 = 1
Γενικά έχοντας εφαρµόσει τη µέθοδο απαλοιφής του Gauss και έχοντας ένα
σύστηµα σε ένα τριγωνική µορφή µπορούµε να υπολογίσουµε τις τιµές των
αγνώστων µας σταδιακά εφαρµόζοντας τον τύπο :
xi = (bi −n∑
j=i+1
aijxj)/aii
Άµεσες Μέθοδοι 83
για i = n, n− 1, . . . , 1.
Αποδεικνύεται ότι η όλη διαδικασία της απαλοιφής του Gauss και η προς τα
πίσω αντικατάσταση για ένα σύστηµα n×n, απαιτεί ένα αριθµό πράξεων της
τάξης του n3. Ο αριθµός αυτός είναι αρκετά µικρός για προβλήµατα µικρής
διάστασης, όµως τείνει να γίνει αρκετά µεγάλος καθώς πηγαίνουµε σε προ-
βλήµατα µεγάλης διάστασης (π.χ. ένα σύστηµα 1000 × 1000 θα απαιτούσε
περίπου 109 πράξεις).
Μια δεύτερη παράµετρος της παραπάνω µεθόδου για την επίλυση γραµµικών
συστηµάτων, που αφορά την αριθµητική ανάλυση, είναι η ακρίβεια των υ-
πολογισµών. Στον υπολογιστή οι πραγµατικοί αριθµοί αποθηκεύονται µε την
µέθοδο της κινητής υποδιαστολής, οπότε τα σφάλµατα στρογγυλοποίησης ε-
πηρεάζουν τα αποτελέσµατα του αλγορίθµου. Παρακολουθείστε το παρακάτω
παράδειγµα :
Παράδειγµα 6.3 Έστω το σύστηµα0.0001x + 1.00y = 1.001.00x + 1.00y = 2.00
Η πραγµατική λύση του συστήµατος αυτού είναι
x =10000
9999≃ 1.0001
y =9998
9999≃ 0.99990
όπου οι παραπάνω προσεγγίσεις χρησιµοποιούν 5 σηµαντικά ψηφία.
Έχει ενδιαφέρον να εξετάσουµε πως συµπεριφέρεται η µέθοδος απαλοιφής του
Gauss, στο παραπάνω πρόβληµα έχοντας αυτή τη φορά στη διάθεση µας µόνο
4 σηµαντικά ψηφία. Ο επαυξηµένος πίνακας είναι[0.0001 1.00 1.001.00 1.00 2.00
]
οπότε πρέπει να εφαρµόσουµε την πράξη Γ2 −→ Γ2 − 1.000.0001Γ1 ή Γ2 −→
Γ2−10000Γ1. Εφαρµόζοντας την πράξη αυτή έχοντας µόνο 4 σηµαντικά ψηφία
θα πάρουµε [0.0001 1.00 1.000.00 −10000 −10000
]
αφού η αφαίρεση 1.00− 10000 δίνει −10000 µε 4 σηµαντικά ψηφία (οµοίως η
αφαίρεση 2.00− 10000). Άρα
y = 1.00
και χρησιµοποιώντας προς τα πίσω αντικατάσταση
x = 0.00
84 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων
Προφανώς, η απάντηση για το x είναι εντελώς λανθασµένη ! Ένας τρόπος για
να βελτιώσουµε το αποτέλεσµα σε τέτοιου είδους καταστάσεις, είναι να χρησι-
µοποιούµε πάντοτε στην κύρια διαγώνιο του επαυξηµένου πίνακα το µεγαλύτερο
κατά απόλυτη τιµή στοιχείο της αντίστοιχης στήλης. Κάτι τέτοιο µπορεί στο σύ-
στηµα µας να επιτευχθεί αντιµεταθέτοντας τις γραµµές του επαυξηµένου πίνακα :[1.00 1.00 2.00
0.0001 1.00 1.00
]
οπότε τώρα πρέπει να εφαρµόσουµε την πράξη Γ2 −→ Γ2 − 0.0001Γ1. Εφαρ-µόζοντας την πράξη αυτή έχοντας και πάλι 4 σηµαντικά ψηφία θα πάρουµε[
1.00 1.00 2.000.00 1.00 1.00
]
αφού η αφαίρεση 1.00 − 0.0001 δίνει 1.00 µε 4 σηµαντικά ψηφία (οµοίως η
αφαίρεση 1.00− 0.0002). Άρα
y = 1.00
και χρησιµοποιώντας προς τα πίσω αντικατάσταση
x = 1.00
Προφανώς το αποτέλεσµα αυτό είναι πολύ καλύτερο από το αυτό της προηγού-
µενης λύσης.
Η παραπάνω διαδικασία όπου πριν ξεκινήσει η απαλοιφή των στοιχείων µιας
στήλης µεταφέρουµε στην κύρια διαγώνιο το µέγιστο κατά απόλυτη τιµή στοι-
χείο ονοµάζεται µερική οδήγηση. Για να χρησιµοποιείται η µερική οδήγηση,
ο αλγόριθµος της απαλοιφής του Gauss, πρέπει να τροποποιηθεί µόνο στο
βήµα 2, ως εξής :
• Βήµα 2 : Αναζητούµε το µεγαλύτερο κατά απόλυτη τιµή στοιχείο της πρώ-
της στήλης και αντιµεταθέτουµε την γραµµή του µε την 1η γραµµή.
Έχει αποδειχθεί ότι η µέθοδος απαλοιφής του Gauss µε µερική οδήγηση, σε
συνδυασµό µε την προς τα πίσω αντικατάσταση δίνει λύσεις ικανοποιητικής
ακρίβειας στην πλειοψηφία των προβληµάτων.
Επαναληπτικές Μέθοδοι
Στην ενότητα αυτή παρουσιάζουµε τις δύο γνωστότερες επαναληπτικές µεθό-
δους επίλυσης γραµµικών συστηµάτων. Οι επαναληπτικές µέθοδοι παρουσιά-
ζουν σηµαντικό πλεονέκτηµα στην ταχύτητα υπολογισµού της λύσης, ειδικά
για συστήµατα µεγάλης διάστασης, σε σχέση µε τις άµεσες µεθόδους. Το βα-
σικό τους µειονέκτηµα είναι ότι ανάλογα µε το πρόβληµα, είναι πιθανό οι
Επαναληπτικές Μέθοδοι 85
αλγόριθµοι αυτοί να µην συγκλίνουν ή να συγκλίνουν µε πολύ αργό ρυθµό
οπότε πρακτικά είναι αδύνατο να δώσουν απάντηση.
Μέθοδος Jacobi
Οι επαναληπτικές µέθοδοι χρησιµοποιούν µια αρχική προσέγγιση της λύσης
του γραµµικού συστήµατος, η οποία εισάγεται σε µια σχέση που δίνει (υπό κα-
τάλληλες προϋποθέσεις) µια καλύτερη προσέγγιση της λύσης από την αρχική.
Εφαρµόζοντας, πολλές φορές τη διαδικασία αυτή είναι δυνατό να πετύχουµε
µια προσέγγιση της πραγµατικής λύσης που θα ικανοποιεί κάποια δεδοµένη
απαίτηση ακρίβειας.
Κάθε γραµµικό σύστηµα µπορεί να γραφεί υπό τη µορφή εξίσωσης πινάκων
ως
AX = B
Αν "σπάσουµε" τον πίνακα A, ως
A =
a11 a12 · · · a1na21 a22 · · · a2n
......
. . ....
an1 an2 · · · ann
= D − L− U
όπου
D =
a11 0 · · · 0
0 a22. . .
......
. . .. . . 0
0 · · · 0 ann
L =
0 0 · · · 0
−a21 0. . .
......
. . .. . . 0
−an1 · · · −an,n−1 0
, U =
0 −a12 · · · −a1n
0 0. . .
......
. . .. . . −an−1,n
0 · · · 0 0
µπορούµε να γράψουµε
DX = B + (L + U)X
ή
X = D−1B + D−1(L + U)X
(σηµειώστε ότι ο πίνακας D αντιστρέφεται εύκολα). Προφανώς η παραπάνω
σχέση δεν δίνει λύση του συστήµατος, µπορούµε όµως να τη χρησιµοποιή-
86 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων
σουµε ως επαναληπτική σχέση για να πετύχουµε διαδοχικές προσεγγίσεις της
λύσης.
Η επαναληπτική σχέση του Jacobi είναι
X(k) = D−1B + D−1(L +U)X(k−1) (6.4)
για k = 1, 2, 3, . . . , όπου X(k) είναι k−οστή προσέγγιση της λύσης. Συνήθως
"µαντεύουµε" µια αρχική προσέγγιση της λύσης και εφαρµόζοντας σταδιακά
την σχέση (6.4) υπολογίζουµε διαδοχικές προσεγγίσεις της λύσης. Όταν η
διαφορά δύο διαδοχικών προσεγγίσεων γίνει αρκετά µικρή, έχουµε ουσιαστικά
µια ικανοποιητική προσέγγιση της λύσης. Εναλλακτικά, η σχέση (6.4) µπορεί
να γραφεί ως προς τα στοιχεία των πινάκων, υπό τη µορφή :
x(k)i =
1
aii(bi −
n∑
j=1j =i
aijx(k−1)j ) (6.5)
για i = 1, 2, . . . , n και σταδιακά για k = 1, 2, 3, . . . . Συνολικά, ο αλγόριθµος
του Jacobi είναι :
Επαναληπτικός αλγόριθµος Jacobi
• ∆εδοµένα : Πίνακες A = [aij ]n×n, B = [bi]n×1, µια αρχική προσέγγιση
X(0) = [x(0)i ]n×1 και η επιθυµητή ακρίβεια ε > 0.
• Βήµα 1 : k = 1
• Βήµα 2 : Υπολόγισε
x(k)i =
1
aii(bi −
n∑
j=1j =i
aijx(k−1)j )
για i = 1, 2, . . . , n.
• Βήµα 3 : Αν maxi
∣∣∣x(k)i − x(k−1)i
∣∣∣ > ε, τότε k = k + 1 και πήγαινε στο
βήµα 1.
• Βήµα 4 : Η λύση είναι xi = x(k)i , για i = 1, 2, . . . , n.
Πρέπει να σηµειώσουµε εδώ ότι ο επαναληπτικός αλγόριθµος του Jacobi συ-
γκλίνει (δηλαδή δίνει λύσεις) µόνο για ειδικές κατηγορίες πινάκων, των οποίων
όµως ο ακριβής χαρακτηρισµός ξεφεύγει από τους σκοπούς του παρόντος συγ-
γράµµατος. Θα αρκεστούµε στην αναφορά µιας ειδικής κατηγορίας πινάκων
που µπορεί να εγγυηθεί τη σύγκλιση του αλγορίθµου του Jacobi :
Ορισµός 6.4 Ένας τετράγωνος πίνακας A = [aij]n×n λέγεται διαγώνια κυρί-
Επαναληπτικές Μέθοδοι 87
αρχος, ανν ισχύει
|aii| >n∑
j=1j =i
|aij |
για κάθε i = 1, 2, . . . , n.
Το παρακάτω θεώρηµα παρέχει µια ικανή αλλά όχι αναγκαία συνθήκη για τη
σύγκλιση του αλγορίθµου Jacobi :
Θεώρηµα 9 Αν ο πίνακας A = [aij ]n×n που περιέχει του συντελεστές των
αγνώστων στο γραµµικό σύστηµα είναι διαγώνια κυρίαρχος, τότε ο αλγόριθµος
του Jacobi συγκλίνει.
Παράδειγµα 6.5 ∆ίνεται το σύστηµα
2x1 + x2 + x3 = 10−x1 + 3x2 + 2x3 = 11x1 + x2 + 4x3 = 1
(6.6)
που περιγράφεται από τους πίνακες
A =
2 1 1−1 3 21 1 4
, B =
10111
Για να εφαρµόσουµε την επαναληπτική µέθοδο του Jacobi, λύνουµε αρχικά τις
τρεις εξισώσεις του συστήµατος διαδοχικά ως προς x1, x2 και x3. ∆ηλαδή από
την (6.6) έχουµε :
x1 = 12(10− x2 − x3)
x2 = 13(11 + x1 − 2x3)
x3 = 14(1− x1 − x2)
(6.7)
Οι σχέσεις (6.7) δίνουν ουσιαστικά τις αντίστοιχες αναδροµικές σχέσεις (6.5)
του επαναληπτικού αλγορίθµου του Jacobi :
x(k)1 = 1
2(10− x(k−1)2 − x
(k−1)3 )
x(k)2 = 1
3(11 + x(k−1)1 − 2x
(k−1)3 )
x(k)3 = 1
4(1− x(k−1)1 − x
(k−1)2 )
(6.8)
για k = 1, 2, 3, . . . και δεδοµένη µια αρχική προσέγγιση η οποία στην περίπτωση
µας δίνεται και είναι x(0)1 = x
(0)2 = x
(0)3 = 0.
Η εφαρµογή των επαναληπτικών σχέσεων (6.8), για επιθυµητό σφάλµα ε =
88 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων
10−3, συνοψίζεται στον παρακάτω πίνακα :
k x(k)1 x
(k)2 x
(k)3 max
i
∣∣∣x(k)i − x(k−1)i
∣∣∣0 0 0 0 -
1 5 3.66667 0.25 52 3.04167 5.16667 −1.91667 2.166673 3.375 5.95833 −1.80208 0.7916674 2.92188 5.99306 −2.08333 0.4531255 3.04514 6.02951 −1.97873 0.1232646 2.97461 6.00087 −2.01866 0.07052957 3.0089 6.00398 −1.99387 0.03428828 2.99495 5.99888 −2.00322 0.01395229 3.00217 6.00046 −1.99846 0.0072247510 2.999 5.99969 −2.00066 0.003172711 3.00048 6.0001 −1.99967 0.0014844412 2.99978 5.99994 −2.00015 0.000697619
Χρησιµοποιώντας οποιαδήποτε άµεση µέθοδο επίλυσης συστηµάτων η ακριβής
λύση που υπολογίζεται είναι x1 = 3, x2 = 6, x3 = −2, δηλαδή η προσέγγιση
που προκύπτει από τον αλγόριθµο του Jacobi είναι πράγµατι ικανοποιητική.
Παρατηρήστε επίσης, ότι ο πίνακας A, δεν είναι διαγώνια κυρίαρχος, αφού
στις δύο πρώτες γραµµές τα διαγώνια στοιχεία είναι ίσα κατά απόλυτη, µε το
άθροισµα των απολύτων τιµών των υπολοίπων στοιχείων της γραµµής τους και
όχι αυστηρά µεγαλύτερα. Παρόλα αυτά η µέθοδος συγκλίνει µε ικανοποιητικό
ρυθµό.
Μέθοδος Gauss - Seidel
Πρόκειται ουσιαστικά για µια βελτιωµένη µορφή της µεθόδου του Jacobi, όπου
χρησιµοποιώντας της ανάλυση του A σε D,L,U, γράφουµε το σύστηµα ως
(D − L)X = B + UX
οπότε η επαναληπτική σχέση τώρα γίνεται
(D − L)X(k) = B + UX(k−1)
αλλά λόγω της κάτω τριγωνικής µορφής του πίνακα L, µπορούµε να γράψουµε
X(k) = D−1B + D−1LX(k) +D−1UX(k−1)
Η επαναληπτική σχέση γράφεται ως προς τα στοιχεία των πινάκων
x(k)i =
1
aii(bi −
i−1∑
j=1
aijx(k)j −
n∑
j=i+1
aijx(k−1)j )
Επαναληπτικές Μέθοδοι 89
Ο επαναληπτικός αλγόριθµος είναι αντίστοιχα
Επαναληπτικός αλγόριθµος Gauss-Seidel
• ∆εδοµένα : Πίνακες A = [aij ]n×n, B = [bi]n×1, µια αρχική προσέγγιση
X(0) = [x(0)i ]n×1 και η επιθυµητή ακρίβεια ε > 0.
• Βήµα 1 : k = 1
• Βήµα 2 : Υπολόγισε
x(k)i =
1
aii(bi −
i−1∑
j=1
aijx(k)j −
n∑
j=i+1
aijx(k−1)j )
για i = 1, 2, . . . , n.
• Βήµα 3 : Αν maxi
∣∣∣x(k)i − x(k−1)i
∣∣∣ > ε, τότε k = k + 1 και πήγαινε στο
βήµα 1.
• Βήµα 4 : Η λύση είναι xi = x(k)i , για i = 1, 2, . . . , n.
Παρατήρηση 6.6 Όπως ο αλγόριθµος του Jacobi, έτσι και αυτός των Gauss-
Seidel δεν συγκλίνει για οποιοδήποτε πίνακα συντελεστών του συστήµατος, παρά
µόνο για πίνακες που πληρούν συγκεκριµένες προϋποθέσεις. Μια από αυτές τις
προϋποθέσεις είναι ο πίνακας A να είναι διαγώνια κυρίαρχος.
Παράδειγµα 6.7 Έστω το σύστηµα του παραδείγµατος 6.5. Το ζητούµενο εί-
ναι να εφαρµόσουµε τον αλγόριθµο των Gauss-Seidel, για επιθυµητό σφάλµα
ε = 10−3 και αρχική προσέγγιση x(0)1 = x
(0)2 = x
(0)3 = 0. Η αναδροµική
σχέση που δίνει τις διαδοχικές προσεγγίσεις της µεθόδου Gauss-Seidel, προκύ-
πτει άµεσα από τις σχέσεις (6.7) του παραδείγµατος 6.5. Η διαφορά σε σχέση
µε τη µέθοδο του Jacobi εντοπίζεται στο γεγονός ότι για τον υπολογισµό της
k−οστής προσέγγισης ενός αγνώστου, χρησιµοποιείται, εφόσον είναι διαθέσιµη,
η k−οστή προσέγγιση των προηγούµενων αγνώστων αντί αυτής του βήµατος
k − 1. ∆ηλαδή η (6.7) δίνει
x(k)1 = 1
2(10− x(k−1)2 − x
(k−1)3 )
x(k)2 = 1
3(11 + x(k)1 − 2x
(k−1)3 )
x(k)3 = 1
4(1− x(k)1 − x
(k)2 )
Η εφαρµογή των παραπάνω επαναληπτικών σχέσεων δίνει τα παρακάτω απο-
90 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων
τελέσµατα :
k x(k)1 x
(k)2 x
(k)3 max
i
∣∣∣x(k)i − x(k−1)i
∣∣∣0 0 0 0 -
1 5, 00000 5, 33333 −2, 33333 5, 33333332 3, 50000 6, 38889 −2, 22222 1, 50000003 2, 91667 6, 12037 −2, 00926 0, 58333334 2, 94444 5, 98765 −1, 98302 0, 13271605 2, 99769 5, 98791 −1, 99640 0, 05324076 3, 00424 5, 99901 −2, 00081 0, 01110257 3, 00090 6, 00084 −2, 00044 0, 00334368 2, 99980 6, 00022 −2, 00000 0, 00110389 2, 99989 5, 99997 −1, 99996 0, 0002558
Παρατηρήστε ότι ο αλγόριθµος Gauss-Seidel καταλήγει στο επιθυµητό αποτέλε-
σµα σε 9 βήµατα, αντί των 12 που απαιτήθηκαν από τον αλγόριθµο του Jacobi.
7 Αριθµητικές µέθοδοι επίλυ-
σης µη γραµµικών εξισώσε-
ων
Μέθοδος του Newton
Η µέθοδος του Newton (επίσης γνωστή ως µέθοδος των Newton - Rampson
ή µέθοδος των Newton - Fourier) για την επίλυση µη γραµµικών εξισώσεων,
είναι ένας επαναληπτικός αλγόριθµος για τον εντοπισµό ριζών εξισώσεων της
µορφής
f(x) = 0
όπου f(x) είναι µια παραγωγίσιµη συνάρτηση σε ένα διάστηµα [a, b].
Η βασική ιδέα της µεθόδου είναι η εξής : ξεκινώντας από µια αρχική προ-
σέγγιση x0 της πραγµατικής ρίζας, η συνάρτηση f(x) προσεγγίζεται από την
εφαπτόµενη της στο σηµείο x0. Υπολογίζοντας στη συνέχεια το σηµείο το-
µής της εφαπτόµενης µε τον άξονα x′x, παίρνουµε µια νέα προσέγγιση της
ζητούµενης ρίζας x1, η οποία συνήθως είναι κατά κανόνα καλύτερη από την
αρχική. Εφαρµόζοντας την διαδικασία επαναληπτικά, µπορούµε να επιτύχουµε
πρακτικά µια οσοδήποτε καλή προσέγγιση της ζητούµενης ρίζας.
Στο παρακάτω σχήµα απεικονίζεται µία επανάληψη της µεθόδου (µε µπλε χρώ-
µα παριστάνεται η γραφική παράσταση της f(x) και µε κόκκινο η εφαπτόµενη
της στο σηµείο xn) :
92 Αριθµητικές µέθοδοι επίλυσης µη γραµµικών εξισώσεων
xx x01
Παρατηρήστε ότι το xn+1 είναι καλύτερη προσέγγιση της ζητούµενης ρίζας
x, από την xn.
Για να παράγουµε τον επαναληπτικό τύπο της µεθόδου αρκεί να θυµηθούµε
ότι ο τύπος της εφαπτόµενης ευθείας µιας συνάρτησης σε ένα δεδοµένο σηµείο
xn του πεδίου ορισµού της είναι
y − f(xn)
x− xn= f ′(xn)
Για να υπολογίσουµε την τιµή του xn+1, αρκεί να θέσουµε στην παραπάνω
εξίσωση y = 0 και x = xn+1, οπότε
0− f(xn)
xn+1 − xn= f ′(xn)
από την οποία παίρνουµε
xn+1 = xn −f(xn)
f ′(xn)(7.1)
Η τελευταία σχέση είναι η επαναληπτική σχέση της µεθόδου του Newton.
Αποδεικνύεται, ότι αν η ζητούµενη ρίζα είναι πολλαπλότητας 1, τότε στην
γειτονιά της ρίζας ο ρυθµός σύγκλισης της παραπάνω επαναληπτικής σχέσης
είναι τουλάχιστον τετραγωνικός. Αυτό σηµαίνει πρακτικά, ότι για ικανοποιητι-
κές προσεγγίσεις της ρίζας η παραπάνω επαναληπτική διαδικασία διπλασιάζει
τον αριθµό των σωστών δεκαδικών ψηφίων του αποτελέσµατος σε κάθε βήµα.
Αλγόριθµος του Newton
Μέθοδος του Newton 93
• ∆εδοµένα : Η συνάρτηση f(x) και η παράγωγός της f ′(x). Μια αρχική
προσέγγιση της ζητούµενης ρίζας x0 και η ζητούµενη ακρίβεια ε > 0.
• Βήµα 1 : Θέτουµε n = 0.
• Βήµα 2 : Υπολόγισε την ποσότητα
xn+1 = xn −f(xn)
f ′(xn)(7.2)
• Βήµα 3 : Αν |xn+1 − xn| > ε, τότε θέτουµε n = n + 1 και επιστρέφουµε
στο βήµα 2.
• Βήµα 4 : Η ζητούµενη ρίζα είναι x = xn+1.
Παράδειγµα 7.1 Να βρεθεί η ρίζα της εξίσωσης
ex = x2 (7.3)
µε ακρίβεια τριών δεκαδικών ψηφίων (δηλαδή ε = 10−3) και αρχική προσέγγιση
x0 = 0.
Αρχικά θέτουµε
f(x) = ex − x2
οπότε η (7.3) γράφεται ισοδύναµα f(x) = 0. Στη συνέχεια υπολογίζουµε την
παράγωγο της f(x)f ′(x) = ex − 2x
οπότε η επαναληπτική σχέση (7.2) γίνεται
xn+1 = xn −exn − x2nexn − 2xn
Εφαρµόζουµε διαδοχικά τις επαναλήψεις της µεθόδου του Newton :
x1 = 0− e0 − 02
e0 − 2× 0= −1.0
x2 = −1.0− e−1.0 − (−1.0)2
e−1.0 − 2× (−1.0)= −0.733 04
x3 = −0.733 04− e−0.733 04 − (−0.733 04)2
e−0.733 04 − 2× (−0.733 04)= −0.703 81
x4 = −0.703 81− e−0.703 81 − (−0.703 81)2
e−0.703 81 − 2× (−0.703 81)= −0.703 47
Παρατηρούµε ότι στις δύο τελευταίες επαναλήψεις τα τρία πρώτα δεκαδικά ψη-
φία των x3, x4 είναι όµοια, δηλαδή
|x4 − x3| = |−0.703 47− (−0.703 81)| = 0.000 34 < 10−3 = ε
Άρα η ζητούµενη ρίζα έχει προσεγγιστεί ικανοποιητικά από την −0.703.
Παράδειγµα 7.2 Να κατασκευαστεί ένας προσεγγιστικός επαναληπτικός τύπος
για τον υπολογισµό της (θετικής) τετραγωνικής ρίζας ενός πραγµατικού αριθµού
a > 0 και στη συνέχεια µε βάση αυτό τον τύπο να υπολογιστεί µια προσέγγιση
94 Αριθµητικές µέθοδοι επίλυσης µη γραµµικών εξισώσεων
του√
2 µε ακρίβεια ε = 10−3.
Η θετική τετραγωνική ρίζα ενός αριθµού a > 0, είναι ουσιαστικά η θετική λύση
της εξίσωσης
x2 − a = 0Για να χρησιµοποιήσουµε τη µέθοδο του Newton θέτουµε
f(x) = x2 − a
και υπολογίζουµε την παράγωγο της
f ′(x) = 2x
Άρα µπορούµε να χρησιµοποιήσουµε την επαναληπτική σχέση του Newton :
xn+1 = xn −x2n − a
2xnή ισοδύναµα
xn+1 =2x2n − x2n + a
2xnή
xn+1 =xn2
+a
2xn(7.4)
Η τελευταία σχέση µπορεί να χρησιµοποιηθεί για τον υπολογισµό της θετικής
τετραγωνικής ρίζας του a και µάλιστα µια καλή αρχική προσέγγιση για να γίνει
αυτό, είναι η x0 = a2 .
Για a = 2, η σχέση (7.4) γίνεται
xn+1 =xn2
+1
xnοπότε για x0 = 1 παίρνουµε
x1 =1
2+
1
1= 1.5
x2 =1.5
2+
1
1.5= 1. 416 7
x3 =1. 416 7
2+
1
1. 416 7= 1. 414 2
x4 =1. 4142
2+
1
1. 4142= 1. 414 2
Παρατηρούµε ότι στις δύο τελευταίες επαναλήψεις τα τρία πρώτα δεκαδικά ψη-
φία των x3, x4 δεν άλλαξαν, άρα η ζητούµενη προσέγγιση είναι√2 ≃ 1. 414
Μέθοδος της τέµνουσας
Η µέθοδος της τέµνουσας χρησιµοποιεί µια αντίστοιχη λογική για την προσέγ-
Μέθοδος της τέµνουσας 95
γιση των ριζών µιας εξίσωσης, µε τη διαφορά όµως ότι δεν χρησιµοποιεί την
εφαπτόµενη σε κάποιο αρχικό σηµείο x0, για να προσεγγίσει την συνάρτηση,
αλλά την χορδή που συνδέει ένα αρχικό ζεύγος σηµείων x0, x1. Το πλεονέ-
κτηµα της µεθόδου της τέµνουσας σε σχέση µε αυτή του Newton, είναι ότι
δεν απαιτείται ο εκ των προτέρων υπολογισµός της παραγώγου της συνάρτη-
σης, γεγονός που επιτρέπει κατασκευή ενός γενικού αλγορίθµου που εντοπίζει
ρίζες για οποιαδήποτε δεδοµένη συνάρτηση. Ο ρυθµός σύγκλισης της µεθό-
δου της τέµνουσας είναι λίγο πιο αργός από αυτόν της µεθόδου του Newton,
χωρίς όµως αυτό να αποτελεί σηµαντικό µειονέκτηµα.
Στο παρακάτω σχήµα φαίνεται ο τρόπος λειτουργίας της µεθόδου :
xx
x x
0
1 2
Το x2 προκύπτει από την τοµή της χορδής που ενώνει τα σηµεία (x0, f(x0))
και (x1, f(x1)). Οµοίως προκύπτει το x3 χρησιµοποιώντας την χορδή των δύο
προηγούµενων προσεγγίσεων.
Η εξίσωση της χορδής που ενώνει τα σηµεία (x0, f(x0)) και (x1, f(x1)) είναι
y − f(x1)
x− x1=
f(x1)− f(x0)
x1 − x0Αν θέσουµε στην παραπάνω εξίσωση y = 0, τότε x = x2, άρα
x2 = x1 −x1 − x0
f(x1)− f(x0)f(x1)
Γενικότερα η επαναληπτική σχέση της µεθόδου είναι :
xn+1 = xn −xn − xn−1
f(xn)− f(xn−1)f(xn) (7.5)
Παρατηρήστε ότι η παραπάνω επαναληπτική σχέση είναι δεύτερης τάξης, δη-
λαδή στον υπολογισµό κάθε νέας προσέγγισης εµπλέκονται οι δύο προηγού-
96 Αριθµητικές µέθοδοι επίλυσης µη γραµµικών εξισώσεων
µενες, σε αντίθεση µε την επαναληπτική σχέση του Newton όπου απαιτείται
µόνο µια.
Επίσης, αξίζει να σηµειώσουµε ότι µέθοδος του Newton µπορεί να θεωρηθεί
ως οριακή περίπτωση της (7.5), αν υποθέσουµε ότι παίρνουµε το όριο της
σχέσης για xn−1 → xn.
Αλγόριθµος της µεθόδου της τέµνουσας
• ∆εδοµένα : Η συνάρτηση f(x), δύο αρχικές προσεγγίσεις της ζητούµενης
ρίζας x0, x1 και η ζητούµενη ακρίβεια ε > 0.
• Βήµα 1 : Θέτουµε n = 1.
• Βήµα 2 : Υπολόγισε την ποσότητα
xn+1 = xn −xn − xn−1
f(xn)− f(xn−1)f(xn) (7.6)
• Βήµα 3 : Αν |xn+1 − xn| > ε, τότε θέτουµε n = n + 1 και επιστρέφουµε
στο βήµα 2.
• Βήµα 4 : Η ζητούµενη ρίζα είναι x = xn+1.
Παράδειγµα 7.3 Το ζητούµενο είναι το ίδιο µε αυτό του παραδείγµατος 7.2,
όµως αυτή φορά δεν µας επιτρέπεται η χρήση της παραγώγου.
Αφού δεν επιτρέπεται η χρήση της παραγώγου της συνάρτησης θα χρησιµοποι-
ήσουµε τη µέθοδο της τέµνουσας. Η συνάρτηση f(x) είναι και πάλι η
f(x) = x2 − a
οπότε η (7.6) γίνεται
xn+1 = xn −xn − xn−1
x2n − a− x2n−1 + a(x2n − a)
ή
xn+1 = xn −xn − xn−1
(xn − xn−1)(xn + xn−1)(x2n − a)
xn+1 = xn −x2n − a
xn + xn−1οπότε
xn+1 =xnxn−1 + a
xn + xn−1(7.7)
Η τελευταία σχέση µπορεί να χρησιµοποιηθεί για τον υπολογισµό της θετικής
τετραγωνικής ρίζας του a και µάλιστα µια καλή αρχική προσέγγιση για να γίνει
αυτό, είναι η x0 = a2 και x1 = a.
Για a = 2, η σχέση (7.7) γίνεται
xn+1 =xnxn−1 + 2
xn + xn−1
Μέθοδος της διχοτόµησης 97
οπότε για x0 = 1, x1 = 2, παίρνουµε
x2 =2× 1 + 2
2 + 1= 1. 3333
x3 =1. 3333× 2 + 2
1. 3333 + 2= 1. 4000
x4 =1. 4× 1. 3333 + 2
1. 4 + 1. 3333= 1. 4146
x5 =1. 4146× 1. 4 + 2
1. 4146 + 1. 4= 1. 414 2
Στις δύο τελευταίες επαναλήψεις τα τρία πρώτα δεκαδικά ψηφία των x4, x5 δεν
άλλαξαν, άρα η ζητούµενη προσέγγιση είναι√2 ≃ 1. 414
Μέθοδος της διχοτόµησης
Η µέθοδος της διχοτόµησης εκµεταλλεύεται το θεώρηµα των ενδιαµέσων τι-
µών, για τις συνεχείς συναρτήσεις. Αν µια συνάρτηση f(x) είναι συνεχής στο
διάστηµα [a, b], τότε για οποιοδήποτε N ανάµεσα στα f(a), f(b), υπάρχει
τουλάχιστον ένα ξ ∈ [a, b] τέτοιο ώστε f(ξ) = N.
Ειδικότερα, αν η f(x) είναι συνεχής στο διάστηµα [a, b] και συµβαίνει f(a)f(b) <
0 (δηλαδή η συνάρτηση έχει ετερόσηµες τιµές στα δύο άκρα του διαστήµατος),
τότε υπάρχει τουλάχιστον µια ρίζα της f(x) στο διάστηµα αυτό.
Η βασική ιδέα της µεθόδου της διχοτόµησης, είναι η εύρεση συνεχώς µικρό-
τερων διαστηµάτων, µε την ιδιότητα η συνάρτηση να παίρνει ετερόσηµες στα
άκρα τους. Ξεκινώντας από ένα τέτοιο αρχικό διάστηµα
[a0, b0] µε f(a0)f(b0) < 0
βρίσκουµε το µέσο του διαστήµατος που είναι το
a0 + b02
και ονοµάζουµε [a1, b1] ένα από τα διαστήµατα
[a0,a0 + b0
2], [
a0 + b02
, b0]
ανάλογα µε το ποιο από τα δύο έχει τη ιδιότητα των ετερόσηµων τιµών της
συνάρτησης στα δύο άκρα του.
Η παραπάνω διαδικασία µέχρι να καταλήξουµε σε ένα αρκετά µικρό διάστηµα
που “εγκλωβίζει” τη ρίζα µε ικανοποιητική ακρίβεια. Η διαδικασία φαίνεται
98 Αριθµητικές µέθοδοι επίλυσης µη γραµµικών εξισώσεων
στο παρακάτω σχήµα :
bx
a
ba
0
0
11
Αλγόριθµος της µεθόδου της διχοτόµησης
• ∆εδοµένα : Η συνάρτηση f(x), ένα διάστηµα [a0, b0] τέτοιο ώστε f(a0)f(b0) <0 και η ζητούµενη ακρίβεια ε > 0.
• Βήµα 1 : Θέτουµε n = 0.
• Βήµα 2 : Θέτουµε
[an+1, bn+1] =
[an,
an+bn2 ], f(an)f(
an+bn2 ) < 0
[an+bn2 , bn], f(an+bn2 )f(bn) < 0(7.8)
• Βήµα 3 : Αν bn+1 − an+1 > ε, τότε θέτουµε n = n + 1 και επιστρέφουµε
στο βήµα 2.
• Βήµα 4 : Η ζητούµενη ρίζα είναι x = an+1+bn+12 .
Παράδειγµα 7.4 Ζητείται ο υπολογισµός της√
2 µε ακρίβεια ε = 10−3, χρη-σιµοποιώντας τη µέθοδο της διχοτόµησης. Ένα αρχικό διάστηµα που µπορεί
να χρησιµοποιηθεί είναι το [1, 2]. Οι επαναλήψεις του αλγορίθµου εµφανίζονται
Μέθοδος της διχοτόµησης 99
στον παρακάτω πίνακα :
n an bnan+bn2 f(an) f(bn) f(an+bn2 )
0 1 2 1.5 −1 2 0.251 1 1.5 1.25 −1 0.25 −0.43752 1.25 1.5 1.375 −0.4375 0.25 −0.1093753 1.375 1.5 1.4375 −0.109375 0.25 0.06640634 1.375 1.4375 1.40625 −0.109375 0.066406 −0.0224605 1.40625 1.4375 1.42188 −0.022460 0.066406 0.0217286 1.40625 1.42188 1.41406 −0.022460 0.021728 −0.0004277 1.41406 1.42188 1.41797 −0.0004272 0.021728 0.0106358 1.41406 1.41797 1.41602 −0.0004272 0.010635 0.005109 1.41406 1.41602 1.41504 −0.0004272 0.005100 0.00233510 1.41406 1.41504 1.41455 −0.0004272 0.002335 0.000953
Στην 10η επανάληψη το πλάτος του διαστήµατος είναι 1.41504 − 1.41406 =0.000 98 < 10−3 = ε, άρα η ζητούµενη προσέγγιση είναι το µέσο του διαστή-
µατος δηλαδήa10 + b10
2= 1.41455
Παρατηρήστε ότι ο ρυθµός σύγκλισης τους αλγορίθµου της διχοτόµησης είναι
πιο αργός από εκείνο των δύο προηγούµενων µεθόδων.
8 Παρεµβολή
Εισαγωγή
Παρεµβολή, σηµαίνει την εύρεση µιας συνάρτησης η οποία προσεγγίζει ένα
σύνολο δεδοµένων έτσι ώστε η τιµή της συνάρτησης αυτής στα δεδοµένα
σηµεία να είναι ίση µε την αντίστοιχη δεδοµένη τιµή. Γενικά, το πρόβληµα
παρεµβολής σε µία διάσταση έχει την εξής µορφή : για τα δεδοµένα
(xi, yi), i = 0, 1, . . . , n
µε x0 < x1 < . . . < xn, ζητείται µια συνάρτηση P (x), τέτοια ώστε
P (xi) = yi, i = 0, 1, . . . , n
Η συνάρτηση P (x), ονοµάζεται συνάρτηση παρεµβολής. Προβλήµατα πα-
ρεµβολής προκύπτουν µε πολλούς διαφορετικούς τρόπους και µπορεί να έχουν
διαφορετικούς σκοπούς. Μερικά παραδείγµατα είναι τα εξής :
• Η γραφική παράσταση µίας οµαλής καµπύλης η οποία να διέρχεται από
ένα σύνολο δεδοµένων σηµείων.
• Ο υπολογισµός των τιµών µιας µαθηµατικής συνάρτησης εύκολα και γρή-
γορα.
• Η αντικατάσταση µιας “δύσκολης” συνάρτησης µε µία πιο “εύκολη”
• Ολοκλήρωση και διαφόριση διακριτών δεδοµένων
Ως συνάρτηση παρεµβολής µπορεί να χρησιµοποιηθεί οποιοδήποτε είδος συ-
νάρτησης εξυπηρετεί καλύτερα τις ανάγκες ενός συγκεκριµένου προβλήµατος.
Οι πιο συνηθισµένες µορφές είναι πολυωνυµική, η εκθετική και η τριγωνοµε-
τρική. Παρακάτω θα ασχοληθούµε µε την πολυωνυµική παρεµβολή.
Πολυωνυµική παρεµβολή
Η πολυωνυµική παρεµβολή αφορά την ειδική περίπτωση παρεµβολής ενός
102 Παρεµβολή
συνόλου n + 1 δεδοµένων
(xi, yi), i = 0, 1, . . . , n
από µία πολυνωνυµική συνάρτηση P (x) βαθµού n, τέτοια ώστε
P (xi) = yi (8.1)
για i = 0, . . . , n. Αν υποθέσουµε ότι πολυώνυµο P (x) γραφεί ως
P (x) = p0 + p1x + · · ·+ pn−1xn−1 + pnx
n
το ζητούµενο είναι να υπολογιστούν οι n+ 1 συντελεστές pi, i = 0, 1, . . . , n,
δεδοµένων των n+1 σχέσεων (8.1). Έχοντας στη διάθεση µας n+1 (διαφο-
ρετικές) σχέσεις µπορούµε να υπολογίσουµε µοναδικά τους n+1 συντελεστές
pi. Μπορούµε µάλιστα να γράψουµε τις σχέσεις παρεµβολής σαν ένα σύστη-
µα γραµµικών εξισώσεων ως προς τους συντελεστές pi. ∆ηλαδή, οι σχέσεις
(8.1) γράφονται ως
p0 + p1x1 + · · ·+ pn−1xn−11 + pnx
n1 = y0
p0 + p1x2 + · · ·+ pn−1xn−12 + pnx
n2 = y1
...
p0 + p1xn + · · ·+ pn−1xn−1n + pnx
nn = yn
ή ισοδύναµα σε µορφή πινάκων
1 x1 · · · xn11 x2 · · · xn2...
......
1 xn · · · xnn
︸ ︷︷ ︸V
p0p1...
pn
︸ ︷︷ ︸P
=
y0y1...
yn
︸ ︷︷ ︸Y
Ο πίνακας V λέγεται πίνακας µορφής Vandermonde και αποδεικνύεται ότι είναι
αντιστρέψιµος εάν και µόνο εάν οι τιµές xi είναι ανά δύο διαφορετικές µεταξύ
τους. Σε µια τέτοια περίπτωση ο πίνακας P, που περιέχει του ζητούµενους
συντελεστές µπορεί να υπολογιστεί από τη σχέση
P = V −1Y
Επειδή η αντιστροφή των Vandermonde πινάκων κάθε άλλο παρά επιθυµητή
είναι, η παραπάνω σχέση είναι χρήσιµη µόνο για θεωρητικούς λόγους. Στην
πράξη ο υπολογισµός των συντελεστών του πολυωνύµου µπορεί να γίνει µε
διάφορες µεθόδους µεταξύ των οποίων οι µέθοδος του Lagrange και η µέθοδος
του Newton που παρουσιάζουµε παρακάτω.
Πολυωνυµική παρεµβολή 103
Μέθοδος του Lagrange
Για να γίνει κατανοητό πως προκύπτει η µορφή Lagrange ενός πολυωνύµου πα-
ρεµβολής µπορούµε να ξεκινήσουµε από ένα σύνολο δύο δεδοµένων (x0, y0)
και (x1, y1) και ζητούµε ένα πολυώνυµο παρεµβολής πρώτου βαθµού της µορ-
φής P (x) = p0 + p1x. Από τις σχέσεις παρεµβολής παίρνουµε
p0 + p1x0 = y0
p0 + p1x1 = y1
το οποίο είναι ένα σύστηµα εξισώσεων 2×2 µε αγνώστους τα p0, p1, τα οποία
εύκολα προκύπτουν ως
p0 =y0x1 − y1x0
x1 − x0
p1 =y1 − y0x1 − x0
Άρα το ζητούµενο πολυώνυµο γράφεται
P (x) =y0x1 − y1x0
x1 − x0+
y1 − y0x1 − x0
x =
=y0x1 − y1x0 + y1x− y0x
x1 − x0=
=x− x1x0 − x1
y0 +x− x0x1 − x0
y1 =
= L0(x)y0 + L1(x)y1
όπου θέσαµε
L0(x) =x− x1x0 − x1
και L1(x) =x− x0x1 − x0
Η τελευταία µορφή λέγεται πολυώνυµο παρεµβολής του Lagrange. Παρατη-
ρήστε ότι οι συντελεστές Li(x) εξαρτώνται µόνο από τα xi.
Γενικότερα, ένα πολυώνυµο παρεµβολής του Lagrange έχει τη µορφή
P (x) = L0(x)y0 + L1(x)y1 + · · ·+ Ln(x)yn =n∑
i=0
Li(x)yi (8.2)
όπου οι συντελεστές Li(x), δίνονται από τη σχέση
Li(x) =n∏
j=0j =i
x− xjxi − xj
(8.3)
104 Παρεµβολή
Είναι εύκολο να διαπιστώσουµε ότι
Li(xj) =
1, i = j0, i = j
γεγονός που επιβεβαιώνει ότι το πολυώνυµο (8.2) ικανοποιεί τις σχέσεις της
παρεµβολής (8.1).
Παράδειγµα 8.1 Να βρεθεί πολυώνυµο που παρεµβάλει τα σηµεία (x0, y0) =(0,−1), (x1, y1) = (1, 1), (x2, y2) = (2, 1), (x3, y3) = (5, 0). Χρησιµοποιώ-
ντας το πολυώνυµο παρεµβολής του Lagrange θα έχουµε
P (x) = L0(x)y0 + L1(x)y1 + L2(x)y2 + L3(x)y4όπου
L0(x) =(x− 1)(x− 2)(x− 5)
(0− 1)(0− 2)(0− 5)=
(x− 1) (x− 2) (x− 5)
−10= − 1
10x3+
4
5x2−17
10x+1
L1(x) =(x− 0)(x− 2)(x− 5)
(1− 0)(1− 2)(1− 5)=
x (x− 2) (x− 5)
4=
1
4x3 − 7
4x2 +
5
2x
L2(x) =(x− 0)(x− 1)(x− 5)
(2− 0)(2− 1)(2− 5)=
x(x− 1)(x− 5)
−6= −1
6x3 + x2 − 5
6x
L3(x) =(x− 0)(x− 1)(x− 2)
(5− 0)(5− 1)(5− 2)=
x (x− 1) (x− 2)
60=
1
60x3 − 1
20x2 +
1
30x
Άρα
P (x) = (−1)× (− 1
10x3 +
4
5x2 − 17
10x + 1) +
1× (1
4x3 − 7
4x2 +
5
2x) +
1× (−1
6x3 + x2 − 5
6x) +
0× (1
60x3 − 1
20x2 +
1
30x)
δηλαδή
P (x) =11
60x3 − 31
20x2 +
101
30x− 1
Η γραφική παράσταση του πολυωνύµου παρεµβολής φαίνεται παρακάτω :
Πολυωνυµική παρεµβολή 105
1 2 3 4 5 6
-1
0
1
x
P(x)
Παρατηρήστε ότι το πολυώνυµο παρεµβολής όντως περνάει από τα σηµεία
(0,−1), (1, 1), (2, 1), (5, 0).
Παράδειγµα 8.2 Θέλουµε να προσεγγίσουµε την συνάρτηση f(x) = ηµx, στοδιάστηµα [0, π2 ] µε ένα πολυώνυµο παρεµβολής χρησιµοποιώντας τις τρείς πα-
ρακάτω γνωστές τιµές του ηµιτόνου :
ηµ0 = 0, ηµπ
4=
√2
2, ηµ
π
2= 1
∆ηλαδή τα σηµεία παρεµβολής είναι
(x0, y0) = (0, 0),
(x1, y1) = (0.785 40, 0.707 11),
(x2, y2) = (1. 570 8, 1)
Το πολυώνυµο παρεµβολής του Lagrange θα είναι
P (x) = L0(x)y0 +L1(x)y1 + L2(x)y2όπου έχουµε
L0(x) =(x− π
4 )(x− π2 )
(0− π4 )(0− π
2 )= 0.810 57x2 − 1. 909 9x + 1
L1(x) =(x− 0)(x− π
2 )
(π4 − 0)(π4 − π2 )
= −1. 621 1x2 + 2. 546 5x
L2(x) =(x− 0)(x− π
4 )
(π2 − 0)(π2 − π4 )
= 0.810 57x2 − 0.636 62x
Άρα
P (x) = 0× (0.810 57x2 − 1. 909 9x + 1) +√2
2× (−1. 621 1x2 + 2. 546 5x) +
1× (0.810 57x2 − 0.636 62x)
106 Παρεµβολή
δηλαδή
P (x) = 1. 164x− 0.335 7x2
Στο παρακάτω σχήµα παρουσιάζεται η γραφική παράσταση του πολυωνύµου
παρεµβολής P (x) (συνεχής καµπύλη), σε αντιπαράθεση µε την πραγµατική συ-
νάρτηση f(x) = ηµx (διακεκοµµένη καµπύλη) :
x
P(x)
1
0.707
0
π/4 π/2
Μέθοδος του Newton
Έστω ένα σύνολο δεδοµένων σηµείων (xi, yi), i = 0, 1, . . . , n, τα οποία θέλου-
µε να θέλουµε να παρεµβάλουµε µε ένα πολυώνυµο P (x) βαθµού n. ∆ηλαδή
πρέπει
P (xi) = yi, i = 0, 1, . . . , n
Η µέθοδος παρεµβολής του Newton χρησιµοποιεί τις λεγόµενες διαιρεµένες
διαφορές, για το σχηµατισµό των συντελεστών του πολυωνύµου P (x). Ορί-
ζουµε :
• ∆ιαιρεµένη διαφορά 1ης τάξης στα σηµεία x0, x1 των παραπάνω δεδοµέ-
νων, τον λόγο
[y0, y1] =y1 − y0x1 − x0
• ∆ιαιρεµένη διαφορά 2ης τάξης στα σηµεία x0, x1, x2 των παραπάνω δε-
δοµένων, τον λόγο
[y0, y1, y2] =[y1, y2]− [y0, y1]
x2 − x0• ∆ιαιρεµένη διαφορά 3ης τάξης στα σηµεία x0, x1, x2, x3 των παραπάνω
Πολυωνυµική παρεµβολή 107
δεδοµένων, τον λόγο
[y0, y1, y2, y3] =[y1, y2, y3]− [y0, y1, y2]
x3 − x0• Γενικότερα, ονοµάζουµε διαιρεµένη διαφορά n-οστής τάξης στα σηµεία
x0, x1, . . . , xn−1, xn των παραπάνω δεδοµένων, τον λόγο
[y0, y1, . . . , yn] =[y1, y2, . . . , yn]− [y0, y1, . . . , yn−1]
xn − x0
Όπως είναι προφανές από τον παραπάνω ορισµό των διαιρεµένων διαφορών,
ο υπολογισµός µιας διαιρεµένης διαφοράς τάξης n, ανάγεται στο υπολογισµό
µιας διαιρεµένης διαφοράς πρώτης τάξης µεταξύ δύο διαδοχικών διαφορών
τάξης n− 1.
Χρησιµοποιώντας τις παραπάνω διαιρεµένες διαφορές το πολυώνυµο παρεµ-
βολής του Newton δίνεται από τον τύπο :
P (x) = y0 + (x− x0)[y0, y1] + (x− x0)(x− x1)[y0, y1, y2] + · · ·(8.4)
+(x− x0)(x− x1) . . . (x− xn−1)[y0, y1, . . . , yn]
Ο υπολογισµός των διαιρεµένων διαφορών για ένα σύνολο δεδοµένων (xi, yi),
i = 0, 1, . . . , n, µπορεί να παρασταθεί σχηµατικά στον παρακάτω πίνακα :
y0[y0, y1]
y1 [y0, y1, y2][y1, y2]
y2 [y1, y2, y3]. . .
[y2, y3] [y0, y1, . . . , yn−1]
y3 [y0, y1, . . . , yn]...
...... [y1, y2, . . . , yn]
......
yn−1 [yn−2,yn−1, yn][yn−1, yn]
yn
Παρατηρήστε ότι στο πολυώνυµο παρεµβολής τελικά χρησιµοποιούνται µόνο
οι διαιρεµένες διαφορές που εµφανίζονται µε περίγραµµα στον παραπάνω πί-
νακα, για τον υπολογισµό τους όµως είναι απαραίτητος ο υπολογισµός όλων
των διαφορών.
Παράδειγµα 8.3 Θέλουµε να προσεγγίσουµε την συνάρτηση f(x) = ηµx, στο
108 Παρεµβολή
διάστηµα [0, π2 ] µε ένα πολυώνυµο παρεµβολής χρησιµοποιώντας τις τρείς πα-
ρακάτω γνωστές τιµές του ηµιτόνου :
ηµ0 = 0, ηµπ
4=
√2
2, ηµ
π
2= 1
∆ηλαδή τα σηµεία παρεµβολής είναι
(x0, y0) = (0, 0),
(x1, y1) = (0.785 40, 0.707 11),
(x2, y2) = (1. 570 8, 1)
Αυτή τη φορά θα χρησιµοποιήσουµε τη µέθοδο παρεµβολής του Newton. Το
πολυώνυµο παρεµβολής του Newton θα είναι
P (x) = y0 + (x− x0)[y0, y1] + (x− x0)(x− x1)[y0, y1, y2]
Σχηµατίζουµε τον πίνακα των διαιρεµένων διαφορών όπως παραπάνω :
y0 = 0[y0, y1] = 0.900 32
y1 = 0.707 11 [y0, y1, y2] = −0.335 75[y1, y2] = 0.372 92
y2 = 1
Άρα, το πολυώνυµο παρεµβολής είναι
P (x) = 0 + (x− 0)× 0.900 32 + (x− 0)(x− 0.785 40)× (−0.335 75)
= 1. 164x− 0.335 7x2
Παρατηρήστε ότι το πολυώνυµο παρεµβολής του Newton είναι ακριβώς το ίδιο
µε αυτό που υπολογίσαµε µε τη µέθοδο του Lagrange στο παράδειγµα 8.2.
9 Αριθµητική Ολοκλήρωση
Συναρτήσεων
Εισαγωγή
Ο ακριβής υπολογισµός του ορισµένου ολοκληρώµατος µιας συνάρτησης της
µορφής ∫ b
af(x)dx
µε αναλυτικές µεθόδους είναι σε πολλές περιπτώσεις πολύ δύσκολη ή ακόµη
και αδύνατη. Αυτό µπορεί να συµβαίνει είτε επειδή δεν µας είναι γνωστός ο
αναλυτικός τύπος της ίδιας της συνάρτησης f(x), είτε επειδή η ολοκλήρωση
είναι πολύ δύσκολη µε αναλυτικές µεθόδους ή επειδή σε κάποιες περιπτώσεις
το ολοκλήρωµα δεν είναι δυνατό να εκφραστεί µε τη βοήθεια στοιχειωδών
συναρτήσεων. Για αυτό το λόγο πολύ συχνά, σε πραγµατικές εφαρµογές,
καταφεύγουµε σε µεθόδους αριθµητικής προσέγγισης του ολοκληρώµατος.
Η γενική µεθοδολογία από την οποία προκύπτουν οι ειδικότερες µέθοδοι που
θα παρουσιάσουµε παρακάτω, βασίζεται αρχικά στην λογική του χωρισµού
του διαστήµατος σε µία σειρά από n διαστήµατα ίσου πλάτους
h =b− a
nΘεωρούµε δηλαδή, διαδοχικά διαστήµατα της µορφής [xk−1, xk], k = 1, 2, . . . , n,
όπου xk = a + hk. Προφανώς σε αυτή την περίπτωση είναι a = x0 και
b = xn, ενώ h = xk+1− xk. Στη συνέχεια η συνάρτηση f(x) παρεµβάλλεται
στα πρώτα v +1 διαδοχικά σηµεία της παραπάνω διαµέρισης από κατάλληλο
πολυώνυµο βαθµού v, το οποίο ονοµάζουµε P (x). ∆ηλαδή κατασκευάζουµε
ένα πολυώνυµο παρεµβολής P (x) έτσι ώστε
P (xi) = f(xi), i = 0, 1, . . . , v
110 Αριθµητική Ολοκλήρωση Συναρτήσεων
Χρησιµοποιώντας τον τύπο παρεµβολής του Lagrange έχουµε
P (x) =v∑
i=0
Li(x)f(xi)
όπου
Li(x) =v∏
j=0j =i
x− xjxi − xj
Οπότε θεωρώντας ότι η συνάρτηση f(x) προσεγγίζεται στο διάστηµα [x0, xv]
από το πολυώνυµο παρεµβολής P (x) έχουµε∫ xv
x0
f(x)dx ≃∫ xv
x0
P (x)dx =
=
∫ xv
x0
v∑
i=0
Li(x)f(xi)dx =
=v∑
i=0
f(xi)
∫ xv
x0
Li(x)dx
Αν στα ολοκληρώµατα∫ xvx0
Li(x)dx, κάνουµε την αντικατάσταση x = x0+hu,
παίρνουµε ∫ xv
x0
Li(x)dx = h
∫ v
0
v∏
j=0j =i
u− j
i− jdu
Παρατηρήστε ότι το τελευταίο ολοκλήρωµα εξαρτάται µόνο από το i και το
v. Άρα αν θέσουµε
A(i, v) =
∫ v
0
v∏
j=0j =i
u− j
i− jdu, i = 0, 1, . . . , v (9.1)
παίρνουµε ∫ xv
x0
f(x)dx ≃ hv∑
i=0
A(i, v)f(xi) (9.2)
Τελικά, για να προσεγγίσουµε το ορισµένο ολοκλήρωµα της συνάρτησης στο
συνολικό διάστηµα [a, b], υποθέτοντας ότι n = kv, αρκεί να σκεφτούµε ότι∫ b
af(x)dx =
∫ xn
x0
f(x)dx =
=
∫ xv
x0
f(x)dx +
∫ x2v
xv
f(x)dx + . . . +
∫ xkv
x(k−1)v
f(x)dx
οπότε κάθε ένα από τα επιµέρους ολοκληρώµατα προσεγγίζεται από τύπους
Κανόνας του ορθογωνίου 111
της µορφής (9.2).
Ανάλογα µε τον βαθµό v του πολυωνύµου παρεµβολής που επιθυµούµε να
χρησιµοποιήσουµε, προκύπτουν οι διάφορες επιµέρους µέθοδοι αριθµητικής
ολοκλήρωσης που παρουσιάζονται παρακάτω. Όσο µεγαλύτερος ο βαθµός του
πολυωνύµου παρεµβολής τόσο καλύτερη αναµένουµε να είναι η προσέγγιση
του αντίστοιχου ολοκληρώµατος.
Κανόνας του ορθογωνίου
Στη βασική του µορφή πρόκειται ουσιαστικά για χρήση της παραπάνω γενικής
µεθοδολογίας όπου χρησιµοποιούµε πολυώνυµα παρεµβολής µηδενικής τάξης,
δηλαδή σταθερές. Αν θεωρήσουµε δηλαδή ότι στο διάστηµα [x0, x1) η συνάρ-
τηση παρεµβάλλεται από ένα πολυώνυµο µηδενικού βαθµού P (x), έτσι ώστε
P (x0) = f(x0) θα είναι P (x) = f(x0), οπότε έχουµε∫ x1
x0
f(x)dx ≃∫ x1
x0
f(x0)dx = hf(x0)
Αντίστοιχη λογική εφαρµόζεται και στα επόµενα διαστήµατα άρα∫ b
af(x)dx =
∫ x1
x0
f(x)dx +
∫ x2
x1
f(x)dx + . . . +
∫ xn
xn−1
f(x)dx
≃ hf(x0) + hf(x1) + . . . + hf(xn−1)
Άρα∫ b
af(x)dx ≃ h
n−1∑
k=0
f(xk)
Πρακτικά το ολοκλήρωµα προσεγγίζεται αθροίζοντας εµβαδά ορθογωνίων πα-
ραλληλογράµµων τα οποία έχουν βάση πλάτους h και ύψους f(xk). Η περί-
πτωση αυτή απεικονίζεται στο παρακάτω σχήµα :
112 Αριθµητική Ολοκλήρωση Συναρτήσεων
a = x xx x x = b0 1 2 n-1 n
Μια εναλλακτική λογική είναι να προσεγγίσουµε τη συνάρτηση f(x) στο διά-
στηµα (x0, x1] µε την τιµή της στο δεξιό άκρο του διαστήµατος, δηλαδή το
f(x1), οπότε θα είχαµε αντίστοιχα∫ b
af(x)dx ≃ h
n∑
k=1
f(xk)
Σε αυτή την περίπτωση τα ορθογώνια έχουν τη µορφή
a = x xx x x = b0 1 2 n-1 n
Τέλος, µια τρίτη σχετικά καλύτερη τακτική χρησιµοποιεί την τιµή της συνάρ-
τησης στο µέσο κάθε ενός από τα διαστήµατα οπότε έχουµε∫ b
af(x)dx ≃ h
n−1∑
k=0
f(xk + xk+1
2)
Παράδειγµα 9.1 Να προσεγγιστεί το ορισµένο ολοκλήρωµα∫ 10 exdx, χρησι-
µοποιώντας τις τρεις παραπάνω παραλλαγές του κανόνα του ορθογωνίου µε
Κανόνας του τραπεζίου 113
n = 10 διαµερίσεις του διαστήµατος [0, 1].
Προφανώς είναι h = b−an = 1−0
10 = 0.1. Για τις δύο πρώτες παραλλαγές της
µεθόδου σχηµατίζουµε τον ακόλουθο πίνακα τιµών :
xk 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.
f(xk) 1 1.105 1.221 1.349 1.491 1.648 1.822 2.014 2.225 2.46 2.718
οπότε σύµφωνα µε την πρώτη παραλλαγή της µεθόδου έχουµε∫ 1
0exdx ≃ 0.1
9∑
k=0
f(xk) = 1.6338
ενώ για τη δεύτερη αντίστοιχα∫ 1
0exdx ≃ 0.1
10∑
k=1
f(xk) = 1.80563
Για την τρίτη παραλλαγή θα χρειαστούµε τις τιµές της συνάρτησης στα µέσα των
διαστηµάτων, άρα σχηµατίζουµε τον πίνακα :
xk+xk+12 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95
f(xk+xk+12 ) 1.051 1.161 1.284 1.419 1.568 1.733 1.915 2.117 2.34 2.586
οπότε ∫ 1
0exdx ≃ 0.1
9∑
k=0
f(xk + xk+1
2) = 1.71757
Σηµειώστε ότι η πραγµατική τιµή του ολοκληρώµατος µπορεί να υπολογιστεί
αναλυτικά και είναι∫ 1
0exdx = [ex]10 = e1 − e0 = e− 1 ≃ 1. 718 3
Προφανώς η τρίτη παραλλαγή της µεθόδου δίνει την καλύτερη προσέγγιση.
Κανόνας του τραπεζίου
Στον κανόνα του τραπεζίου χρησιµοποιείται µια παρεµβολή πρώτης τάξης για
κάθε ένα από τα διαστήµατα [xk, xk+1]. ∆ηλαδή το πολυώνυµο παρεµβολής
έχει βαθµό v = 1, οπότε από τον τύπο (9.1) για v = 1 έχουµε
A(0, 1) =
∫ 1
0
u− 1
0− 1du =
1
2
A(1, 1) =
∫ 1
0
u− 0
1− 0du =
1
2
114 Αριθµητική Ολοκλήρωση Συναρτήσεων
ενώ από τον τύπο (9.2) παίρνουµε∫ x1
x0
f(x)dx ≃ h[A(0, 1)f(x0) + A(1, 1)f(x1)] =h
2[f(x0) + f(x1)]
Ουσιαστικά η τελευταία σχέση δίνει το εµβαδό ενός του τραπεζίου που ορί-
ζεται από τον οριζόντιο άξονα, τις δύο κατακόρυφες στα σηµεία x0, x1 και το
τµήµα που ενώνει τα σηµεία τοµής των δύο κατακόρυφων µε τη γραφική πα-
ράσταση της f(x), όπως φαίνεται στο παρακάτω σχήµα :
a = x xx x x = b0 1 2 n-1 n
Εφαρµόζοντας την ίδια λογική σε όλα τα διαστήµατα της µορφής [xk, xk+1],
έχουµε∫ b
af(x)dx ≃ h
2[f(x0) + f(x1)] +
h
2[f(x1) + f(x2)] + . . . +
h
2[f(xn−1) + f(xn)]
=h
2[f(x0) + 2f(x1) + 2f(x2) + . . . + 2f(xn−1) + f(xn)]
Η τελευταία σχέση δίνει τον κανόνα του τραπεζίου για την αριθµητική ολο-
κλήρωση, δηλαδή∫ b
af(x)dx ≃ h
2[f(x0) + f(xn) + 2
n−1∑
k=1
f(xk)]
Παράδειγµα 9.2 Να προσεγγιστεί το ορισµένο ολοκλήρωµα∫ 10 exdx, χρησι-
µοποιώντας τον κανόνα του τραπεζίου µε, n = 10 διαµερίσεις του διαστήµατος
[0, 1].
Κανόνας του Simpson 115
Χρησιµοποιώντας τα στοιχεία του πρώτου πίνακα του παραδείγµατος 9.1, έχουµε∫ 1
0exdx ≃ 0.1
2[1 + 2.718 + 2
n−1∑
k=1
f(xk)] = 1.71971
Κανόνας του Simpson
Ο κανόνας του Simpson χρησιµοποιεί την τιµή της συνάρτησης σε τρία διαδο-
χικά σηµεία της διαµέρισης του διαστήµατος, για να παράγει ένα πολυώνυµο
παρεµβολής δεύτερης τάξης. ∆ηλαδή για τα δύο πρώτα διαστήµατα της δια-
µέρισης [x0, x1] και [x1, x2], η συνάρτηση προσεγγίζεται από το πολυώνυµο
παρεµβολής P (x), για το οποίο ισχύει
P (x0) = f(x0), P (x1) = f(x1), P (x2) = f(x2)
Εφαρµόζοντας την (9.1) για v = 2 έχουµε
A(0, 2) =
∫ 2
0
(u− 1)(u− 2)
(0− 1)(0− 2)du =
1
3
A(1, 2) =
∫ 2
0
(u− 0)(u− 2)
(1− 0)(1− 2)du =
4
3
A(2, 2) =
∫ 2
0
(u− 0)(u− 1)
(2− 0)(2− 1)du =
1
3Άρα σύµφωνα µε την (9.2) θα έχουµε∫ x2
x0
f(x)dx ≃ h[A(0, 2)f(x0) + A(1, 2)f(x1) + A(2, 2)f(x2)]
=h
3[f(x0) + 4f(x1) + f(x2)]
Επεκτείνοντας την ίδια λογική και στα υπόλοιπα (ζεύγη) διαστηµάτων και
υποθέτοντας ότι το n είναι άρτιο, παίρνουµε∫ b
af(x)dx ≃ h
3[f(x0) + 4f(x1) + f(x2) +
h
3[f(x2) + 4f(x3) + f(x4)] + . . .
. . . +h
3[f(xn−2) + 4f(xn−1) + f(xn)]
=h
3[f(x0) + 4f(x1) + 2f(x2) + 4f(x3) + 2f(x4) + . . .
. . . + 2f(xn−2) + 4f(xn−1) + f(xn)]
116 Αριθµητική Ολοκλήρωση Συναρτήσεων
ή τελικά τον τύπο του κανόνα του Simpson που είναι∫ b
af(x)dx ≃ h
3f(x0) + f(xn) + 2[f(x2) + f(x4) + . . . + f(xn−2)] +
+4[f(x1) + f(x3) + . . . + f(xn−1)]
=h
3[f(x0) + f(xn) + 2
n
2−1∑
k=1
f(x2k) + 4
n
2−1∑
k=0
f(x2k+1)]
Παράδειγµα 9.3 Να προσεγγιστεί το ορισµένο ολοκλήρωµα∫ 10 exdx, χρησι-
µοποιώντας τον κανόνα του Simpson, µε n = 10 διαµερίσεις του διαστήµατος
[0, 1].
Χρησιµοποιώντας τα στοιχεία του πρώτου πίνακα του παραδείγµατος 9.1, έχουµε
∫ 1
0exdx ≃ 0.1
3[1 + 2.718 + 2
n
2−1∑
k=1
f(x2k) + 4
n
2−1∑
k=0
f(x2k+1)] = 1. 718 3
10 Αριθµητική επίλυση διαφο-
ρικών εξισώσεων
Εισαγωγή
Η προσεγγιστική λύση διαφορικών εξισώσεων αποτελεί ένα από τα σηµα-
ντικότερα ζητούµενα στον κλάδο της αριθµητικής ανάλυσης. Οι διαφορικές
εξισώσεις περιγράφουν µια πληθώρα φαινοµένων που συσχετίζουν ένα µέ-
γεθος µε τον ρυθµό µεταβολής του και εµφανίζονται σε σχεδόν όλους τους
κλάδους των µαθηµατικών, της φυσικής, της µηχανικής, της οικονοµίας και
άλλων πολλών επιστηµών. Στην πραγµατικότητα µόνο ελάχιστες µορφές δια-
φορικών εξισώσεων µπορούν να λυθούν επακριβώς µε αναλυτικές µεθόδους,
οπότε η αριθµητική ανάλυση καλείται να καλύψει το κενό αυτό, παρέχοντας
µια σειρά από προσεγγιστικές µεθόδους επίλυσης.
Ειδικότερα, στο παρόν θα ασχοληθούµε µε διαφορικές εξισώσεις πρώτης τάξης
της µορφής
y′(x) = f(x, y(x)) (10.1)
όπου επιπλέον θα µας δίνονται οι αρχικές συνθήκες του προβλήµατος, της µορ-
φής y(x0) = y0. Η διαφορική εξίσωση (10.1), σε συνδυασµό µε τη δεδοµένη
αρχική συνθήκη, ονοµάζεται πρόβληµα αρχικών συνθηκών πρώτης τάξης. Ο
χαρακτηρισµός “πρώτης τάξης”, οφείλεται στο γεγονός ότι η διαφορική εξίσω-
ση εµπλέκει την πρώτη παράγωγο της άγνωστης συνάρτησης y(x). Αντίστοιχα,
πολύ συχνά σε εφαρµογές, απαντώνται διαφορικές εξισώσεις µεγαλύτερης τά-
ξης. Με µεγαλύτερη συχνότητα µάλιστα εµφανίζονται διαφορικές εξισώσεις
δεύτερης τάξης, αφού τέτοιες είναι στη µεγάλη τους πλειοψηφία οι εξισώσεις
της µηχανικής και του ηλεκτρισµού. Στο παρόν θα περιοριστούµε µόνο στην
αριθµητική επίλυση διαφορικών εξισώσεων πρώτης τάξης.
118 Αριθµητική επίλυση διαφορικών εξισώσεων
Μέθοδος του Taylor
Έστω το πρόβληµα αρχικών συνθηκών πρώτης τάξης
y′(x) = f(x, y(x)), y(x0) = y0 (10.2)
Το ζητούµενο είναι να προσεγγίσουµε τη συνάρτηση y(x), προσδιορίζοντας
ένα σύνολο τιµών της άγνωστης συνάρτησης y(x) σε µια σειρά σηµείων
x0, x1, x2, . . .. Θεωρούµε ότι τα σηµεία x0, x1, x2, . . . ισαπέχουν µεταξύ και
xn+1 − xn = h, άρα γενικά ισχύει
xn = x0 + nh
Αν υποθέσουµε ότι η συνάρτηση y(x) είναι άπειρες φορές παραγωγίσιµη στο
x0, µπορούµε σύµφωνα µε τον τύπο του Taylor να την αναπτύξουµε σε σειρά
της µορφής
y(x) =∞∑
k=0
y(k)(x0)
k!(x− x0)
k
όπου y(k)(x0) συµβολίζει την k−οστή παράγωγο της y(x) στο x0. Για x = x1
η σειρά Taylor µπορεί να γραφεί
y(x1) =∞∑
k=0
y(k)(x0)
k!hk
αφού x1 = x0 + h. Για να απλουστεύσουµε τον συµβολισµό θα γράφουµε
y(k)n = y(k)(xn)
οπότε η σειρά Taylor γίνεται
y1 =∞∑
k=0
y(k)0
k!hk = y0 +
y(1)0
1!h +
y(2)0
2!h2 + . . .
Παρατηρούµε δηλαδή ότι η τιµή της συνάρτησης στο x1, δηλαδή η y1, µπορεί
να εκφραστεί συναρτήσει των τιµών y(k)0 . Εφαρµόζοντας αντίστοιχη λογική
µπορούµε να γράψουµε
yn+1 =∞∑
k=0
y(k)n
k!hk = yn +
y(1)n
1!h+
y(2)n
2!h2 + . . . (10.3)
Για να υπολογίσουµε τις παραγώγους y(k)n , k = 1, 2, 3, . . . , µπορούµε να α-
ξιοποιήσουµε την διαφορική εξίσωση (10.2), αφού για x = xn έχουµε
y(1)n = y′n = f(xn, yn)
ενώ µε διαδοχικές παραγωγίσεις παίρνουµε
y(2)n = y′′n = f ′(xn, yn)
Μέθοδος του Taylor 119
y(3)n = y′′′n = f ′′(xn, yn)...
∆ηλαδή γενικά
y(k)n = f (k−1)(xn, yn)
οπότε η (10.3) γίνεται
yn+1 = yn +∞∑
k=1
f (k−1)(xn, yn)
k!hk = yn +
f(xn, yn)
1!h +
f ′(xn, yn)
2!h2 + . . .
Επειδή στην πράξη η άθροιση άπειρων όρων της σειράς είναι αδύνατη και αν
θεωρήσουµε ότι το h είναι αρκετά µικρό, οπότε το σηµείο xn+1 ανήκει στη
γειτονιά του xn, µπορούµε να αποκόψουµε τους άπειρους όρους της σειράς,
παίρνοντας µια προσέγγιση τάξης m της µορφής
yn+1 = yn +m∑
k=1
f (k−1)(xn, yn)
k!hk (10.4)
Χρησιµοποιώντας την παραπάνω αναδροµική σχέση µπορούµε αν υπολογί-
σουµε τις παραγώγους µέχρι τάξης (m− 1) της f(x, y(x)), να υπολογίσουµε
διαδοχικά τις τιµές y1, y2, y3, . . . , όπως στο παρακάτω παράδειγµα. Όσο µε-
γαλύτερης τάξης προσέγγιση χρησιµοποιήσουµε τόσο ακριβέστερο θα είναι το
αποτέλεσµα.
Παράδειγµα 10.1 Να προσεγγιστεί η λύση της διαφορικής εξίσωσης
y′(x) = xy(x)
µε αρχική συνθήκη y(0) = 1, στο διάστηµα [0, 1] µε τη µέθοδο του Taylor µε
προσέγγιση 2ης τάξης και βήµα h = 0.1.
Να σηµειώσουµε εδώ ότι η παραπάνω διαφορική εξίσωση, ανήκει στη κατηγο-
ρία των δ.ε. χωριζοµένων µεταβλητών, οπότε εύκολα µπορεί να υπολογιστεί η
ακριβής λύση της, η οποία για τη συγκεκριµένη αρχική συνθήκη είναι
y(x) = ex2/2
Αφού η ακριβής λύση είναι γνωστή, µπορούµε εύκολα να συγκρίνουµε τις τιµές
της, µε αυτές που θα προκύψουν από την προσέγγιση του Taylor.
Για προσέγγιση 2ης τάξης ο τύπος (10.4) γίνεται
yn+1 = yn +f(xn, yn)
1!h+
f ′(xn, yn)
2!h2 (10.5)
όπου h = 0.1 και
f(xn, yn) = xnyn
120 Αριθµητική επίλυση διαφορικών εξισώσεων
ή αν λάβουµε υπόψη ότι xn = 0 + nh,
f(xn, yn) = nhyn
Για την παράγωγο της f, έχουµε
f ′(x, y(x)) = [xy(x)]′ = x′y(x) + xy′(x)
= y(x) + xy′(x)
όµως από την διαφορική εξίσωση έχουµε ότι y′(x) = xy(x), οπότε
f ′(x, y(x)) = y(x) + x2y(x)
Άρα
f ′(xn, yn) = yn(1 + n2h2)
Με βάση τα παραπάνω, η αναδροµική σχέση (10.5) γίνεται
yn+1 = yn + nhynh +1
2yn(1 + n2h2)h2
ή
yn+1 = yn[1 + nh2 +1
2(1 + n2h2)h2]
οπότε µε δεδοµένο ότι y0 = 1, µπορούµε διαδοχικά να υπολογίσουµε τις y1, y2, y3, . . .που υπολογίζονται στον παρακάτω πίνακα :
xn 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.
yn 1 1.005 1.02 1.046 1.083 1.132 1.196 1.276 1.375 1.496 1.644
ex2n/2 1 1.005 1.02 1.046 1.083 1.133 1.197 1.278 1.377 1.499 1.649
Στην τελευταία γραµµή υπολογίζονται οι ακριβείς τιµές της πραγµατικής λύσης
y(x) = ex2/2, για λόγους σύγκρισης.
Μέθοδος του Euler
Η µέθοδος του Euler µπορεί να θεωρηθεί ουσιαστικά σαν ειδική περίπτω-
ση της µεθόδου του Taylor, όπου χρησιµοποιούνται προσεγγίσεις 1ης τάξης.
Εναλλακτικά µπορεί κανείς να θεωρήσει ότι δεδοµένης της διαφορικής εξίσω-
σης
y′(x) = f(x, y(x))
µε αρχική συνθήκη y(x0) = y0, και δεδοµένης µιας ακολουθίας σηµείων xn =
x0+ nh, όπου το h είναι αρκετά µικρό, ότι η παράγωγος y′(x) προσεγγίζεται
από την πεπερασµένη “προς τα εµπρός” διαφορά
y′(xn) =y(xn+1)− y(xn)
h
Μέθοδος του Euler 121
ή σύµφωνα µε τον ορισµό της προηγούµενης παραγράφου
y′n =yn+1 − yn
h
Η διαφορική εξίσωση τότε γράφεταιyn+1 − yn
h= f(xn, yn)
ή ισοδύναµα
yn+1 = yn + hf(xn, yn) (10.6)
Η αναδροµική σχέση (10.6), προκύπτει επίσης άµεσα από την (10.4) για m =
1.
Μια παραλλαγή της µεθόδου του Euler που παρουσιάστηκε παραπάνω, προ-
κύπτει αν χρησιµοποιηθεί η “προς τα πίσω” διαφορά για την προσέγγιση της
παραγώγου δηλαδή
y′(xn) =y(xn)− y(xn−1)
h
οπότε προκύπτει µια ανάλογη αναδροµική σχέση. Οι δύο αυτές παραλλαγές
είναι γνωστές αντίστοιχα µε τις ονοµασίες “προς τα εµπρός” και “προς τα
πίσω” µέθοδοι του Euler.
Παράδειγµα 10.2 Να προσεγγιστεί η λύση της διαφορικής εξίσωσης
y′(x) = xy(x)
µε αρχική συνθήκη y(0) = 1, στο διάστηµα [0, 1] µε την “προς τα εµπρός”
µέθοδο του Taylor µε βήµα h = 0.1.
Από την (10.6) θα έχουµε
yn+1 = yn + hf(xn, yn)
= yn + hxnynδηλαδή αν θέσουµε xn = nh
yn+1 = yn(1 + nh2)
Τα αποτελέσµατα εµφανίζονται στον παρακάτω πίνακα :
xn 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.
yn 1 1 1.01 1.030 1.061 1.103 1.158 1.228 1.314 1.419 1.547
ex2n/2 1 1.005 1.02 1.046 1.083 1.133 1.197 1.278 1.377 1.499 1.649
Όπως είναι αναµενόµενο, η µέθοδος Euler εµφανίζει µικρότερη ακρίβεια σε
σύγκριση µε την µέθοδο Taylor 2ης τάξη που εφαρµόστηκε στο προηγούµενο
παράδειγµα.
122 Αριθµητική επίλυση διαφορικών εξισώσεων
Μέθοδος Runge - Kutta
Η µέθοδος των Runge - Kutta είναι ουσιαστικά µια οικογένεια αναδροµικών
µεθόδων, οι οποίες χαρακτηρίζονται από την τάξη τους. Παρακάτω παρουσιά-
ζουµε ενδεικτικά τους δύο πιο γνωστούς αντιπροσώπους της οικογένειας αυτής
και συγκεκριµένα τις µεθόδους Runge - Kutta 2ης και 4ης τάξης. Επειδή η
πλήρης ανάπτυξη των µεθοδολογιών αυτών απαιτεί µαθηµατικά εργαλεία που
δεν είναι γνωστά στους φοιτητές του τµήµατος αυτοµατισµού, θα σταθούµε
µόνο στην περιγραφή της εφαρµογής τους.
Μέθοδος Runge - Kutta 2ης τάξης
Η µέθοδος Runge - Kutta 2ης τάξης δίνει µια προσέγγιση της λύσης του
προβλήµατος
y′(x) = f(x, y(x)), y(x0) = y0
µέσω του αναδροµικού τύπου
yn+1 = yn + ak1 + bk2
όπου
k1 = hf(xn, yn)
k2 = hf(xn + ch, yn + dk1)
Οι σταθερές a, b, c, d προσδιορίζονται µε τη βοήθεια του αναπτύγµατος Taylor
της y(x) και είναι a = b = 12 και c = d = 1. Άρα η αναδροµική σχέση
γίνεται
yn+1 = yn +1
2(k1 + k2) (10.7)
όπου
k1 = hf(xn, yn)
k2 = hf(xn+1, yn + k1)
Παράδειγµα 10.3 Να προσεγγιστεί η λύση της διαφορικής εξίσωσης
y′(x) = xy(x)
µε αρχική συνθήκη y(0) = 1, στο διάστηµα [0, 1] µε την µέθοδο Runge - Kutta
2ης τάξης, µε βήµα h = 0.1.
Μέθοδος Runge - Kutta 123
Έχουµε
k1 = hxnyn = nh2yn
k2 = hxn+1(yn + nh2yn) = h2(n+ 1)(1 + nh2)ynΆρα η αναδροµική σχέση (10.7) γίνεται
yn+1 = yn +1
2[nh2yn + h2(n + 1)(1 + nh2)yn] =
= yn[1 +1
2h2(n + (n + 1)(1 + nh2))]
Τα αποτελέσµατα εµφανίζονται στον παρακάτω πίνακα
xn 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.
yn 1 1.005 1.02 1.047 1.084 1.135 1.199 1.281 1.381 1.505 1.656
ex2n/2 1 1.005 1.02 1.046 1.083 1.133 1.197 1.278 1.377 1.499 1.649
Μέθοδος Runge - Kutta 4ης τάξης
Αντίστοιχα µε τη µέθοδο 2ης τάξης, η µέθοδος Runge - Kutta 4ης τάξης,
χρησιµοποιεί την αναδροµική σχέση
yn+1 = yn +1
6(k1 + 2k2 + 2k3 + k4) (10.8)
µε
k1 = hf(xn, yn)
k2 = hf(xn +h
2, yn +
h
2k1)
k3 = hf(xn +h
2, yn +
h
2k2)
k4 = hf(xn+1, yn + hk3)
Η µέθοδος Runge - Kutta 4ης τάξης είναι η πιο συχνά χρησιµοποιούµενη σε
πραγµατικές εφαρµογές.