Ε.Ν.Αντωνίου - Μαθηματικά ΙΙΙ

129
Μαθηματικά ΙΙΙ Ε.Ν. Αντωνίου Γενικό Τμήμα Θετικών Επιστημών Α.Τ.Ε.Ι.Θ. Θεσσαλονίκη - 14/12/2008

description

Πιθανότητες, Α.Τ.Ε.Ι

Transcript of Ε.Ν.Αντωνίου - Μαθηματικά ΙΙΙ

Μαθηµατικά ΙΙΙ

Ε.Ν. Αντωνίου

Γενικό Τµήµα Θετικών Επιστηµών

Α.Τ.Ε.Ι.Θ.

Θεσσαλονίκη - 14/12/2008

Περιεχόµενα

1 Πιθανότητες - Εισαγωγικές Έννοιες 1

Εισαγωγή 1

∆ειγµατοχώρος - Γεγονότα 2

Πράξεις µε γεγονότα 3

Σχετική Συχνότητα και Πιθανότητα 4

2 Αρχές Συνδυαστικής 9

Εισαγωγή 9

Κανόνας Γινοµένου - Αθροίσµατος 9

Ανεξάρτητα ενδεχόµενα 9

Αµοιβαία Αποκλειόµενα ενδεχόµενα 10

Μεταθέσεις - ∆ιατάξεις 11

Μεταθέσεις n διακεκριµένων αντικειµένων, χωρίς επαναλήψεις 11

∆ιατάξεις k διακεκριµένων αντικειµένων από n, χωρίς επαναλήψεις 12

∆ιατάξεις k αντικειµένων από n, µε επαναλήψεις 13

Μεταθέσεις n αντικειµένων, χωρισµένων σε p οµάδες όµοιων αντικειµένων 14

Γενικά Παραδείγµατα στις Μεταθέσεις - ∆ιατάξεις 15

Συνδυασµοί 17

Συνδυασµοί k αντικειµένων από n, χωρίς επαναλήψεις 17

Συνδυασµοί k αντικειµένων από n, µε επαναλήψεις 18

Τοποθέτηση Σφαιριδίων σε κουτιά 19

Γενικά παραδείγµατα στη συνδυαστική - διακριτή πιθανότητα 21

3 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία 25

ii

∆εσµευµένη Πιθανότητα 25

Ανεξάρτητα γεγονότα 31

Γενικά παραδείγµατα στη δεσµευµένη πιθανότητα - ανεξαρτησία 32

4 Τυχαίες Μεταβλητές - Κατανοµές 37

Μονοδιάστατες τυχαίες µεταβλητές 37

Συνάρτηση πιθανότητας διακριτής τυχαίας µεταβλητής 38

Συνάρτηση κατανοµής διακριτής τυχαίας µεταβλητής 40

Μέση τιµή, διασπορά διακριτής τυχαίας µεταβλητής 41

Σηµαντικές διακριτές κατανοµές 43

Οµοιόµορφη κατανοµή 43

Κατανοµή Bernoulli 44

∆ιωνυµική κατανοµή 44

Κατανοµή Poisson 45

Γενικά Παραδείγµατα 46

Συνάρτηση κατανοµής και πυκνότητας πιθανότητας συνεχούς τ.µ. 52

Μέση τιµή, διασπορά συνεχούς τυχαίας µεταβλητής 55

Σηµαντικές συνεχείς κατανοµές 56

Οµοιόµορφη κατανοµή 57

Κανονική Κατανοµή 58

5 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες 63

Εισαγωγή 63

Αριθµητικά σφάλµατα 64

Ευαισθησία και Κατάσταση 67

Προς τα Πίσω Ανάλυση Σφαλµάτων 69

Αριθµητική κινητής υποδιαστολής 70

iii

Πράξεις µε αριθµούς κινητής υποδιαστολής 74

6 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων 79

Εισαγωγή 79

Άµεσες Μέθοδοι 80

Μέθοδος απαλοιφής του Gauss και προς τα πίσω αντικατάσταση 80

Επαναληπτικές Μέθοδοι 84

Μέθοδος Jacobi 85

Μέθοδος Gauss - Seidel 88

7 Αριθµητικές µέθοδοι επίλυσης µη γραµµικών εξισώσεων 91

Μέθοδος του Newton 91

Μέθοδος της τέµνουσας 94

Μέθοδος της διχοτόµησης 97

8 Παρεµβολή 101

Εισαγωγή 101

Πολυωνυµική παρεµβολή 101

Μέθοδος του Lagrange 103

Μέθοδος του Newton 106

9 Αριθµητική Ολοκλήρωση Συναρτήσεων 109

Εισαγωγή 109

Κανόνας του ορθογωνίου 111

Κανόνας του τραπεζίου 113

Κανόνας του Simpson 115

iv

10 Αριθµητική επίλυση διαφορικών εξισώσεων 117

Εισαγωγή 117

Μέθοδος του Taylor 118

Μέθοδος του Euler 120

Μέθοδος Runge - Kutta 122

Μέθοδος Runge - Kutta 2ης τάξης 122

Μέθοδος Runge - Kutta 4ης τάξης 123

1 Πιθανότητες - Εισαγωγικές

Έννοιες

Εισαγωγή

Η θεωρία πιθανοτήτων είναι ο κλάδος των µαθηµατικών που ασχολείται µε

την ανάλυση τυχαίων φαινοµένων. Τα κεντρικά αντικείµενα της θεωρίας πιθα-

νοτήτων είναι οι τυχαίες µεταβλητές και οι στοχαστικές διαδικασίες, οι οποίες

είναι µαθηµατικά µοντέλα µη αιτιοκρατικών γεγονότων ή µετρήσιµων µεγε-

θών, τα οποία εµφανίζονται είτε µια µόνο φορά είτε εξελίσσονται στο χρόνο

κατά τυχαίο τρόπο. Παρόλο που το αποτέλεσµα της ρίψης ενός νοµίσµατος

είναι ένα καθαρά τυχαίο γεγονός, η επανάληψη του πειράµατος πολλές φορές

εµφανίζει στατιστικές ιδιότητες που µπορούν να µελετηθούν και να προβλε-

φθούν. ∆ύο χαρακτηριστικά παραδείγµατα τέτοιων αποτελεσµάτων της θεω-

ρίας πιθανοτήτων είναι οι νόµοι των µεγάλων αριθµών και το κεντρικό οριακό

θεώρηµα.

Η θεωρία πιθανοτήτων παρέχει το θεωρητικό υπόβαθρο για τη στατιστική ε-

πιστήµη, ένα κλάδο που ασχολείται µε την ποσοτική και ποιοτική ανάλυση

µεγάλων ποσοτήτων δεδοµένων που µπορεί να προέρχονται από όλους τους

τοµείς της ανθρώπινης δραστηριότητας. Πιθανοκρατικές µέθοδοι εφαρµόζο-

νται στην περιγραφή πολύπλοκων συστηµάτων, των οποίων η κατάσταση µας

είναι µόνο κατά ένα µέρος γνωστή (π.χ. στατιστική µηχανική). Μια µεγά-

λη ανακάλυψη της φυσικής του εικοστού αιώνα ήταν επίσης η πιθανοκρατική

φύση των φυσικών φαινοµένων στην ατοµική κλίµακα, η οποία µελετάται και

περιγράφεται από την κβαντοµηχανική.

Η µαθηµατική θεωρία των πιθανοτήτων έχει της ρίζες της σε προσπάθειες να

αναλυθούν τυχερά παίγνια από τον Gerolamo Cardano τον δέκατο έκτο αιώνα

2 Πιθανότητες - Εισαγωγικές Έννοιες

και τον Blaise Pascal κατά τον δέκατο έβδοµο αιώνα. Αρχικά η θεωρία πι-

θανοτήτων ασχολήθηκε κυρίως µε διακριτά γεγονότα και οι µέθοδοι της ήταν

κυρίως βασισµένοι στη συνδυαστική. Σταδιακά, η αναλυτική σκέψη οδήγη-

σε στην ενσωµάτωση συνεχών µεταβλητών στη θεωρία πιθανοτήτων, που είχε

σαν αποτέλεσµα την θεµελίωση της µοντέρνας θεωρίας πιθανοτήτων από τον

Andrey Nikolaevich Kolmogorov. Το 1933 ο Kolmogorov συνδυάζοντας την

έννοια του δειγµατοχώρου, που επινοήθηκε από τον Richard von Mises, µε

τη θεωρία µέτρου, παρουσίασε την αξιωµατική θεµελίωση της θεωρίας πιθα-

νοτήτων, η οποία πολύ σύντοµα αποτέλεσε την αδιαµφισβήτητη αξιωµατική

βάση της µοντέρνας θεωρίας πιθανοτήτων.

∆ειγµατοχώρος - Γεγονότα

Βασική έννοια της θεωρίας πιθανοτήτων είναι το πείραµα και η µελέτη των

αποτελεσµάτων του.

Παράδειγµα 1.1 Μερικά παραδείγµατα πειραµάτων θα µπορούσαν να είναι

τα παρακάτω :

• Η ρίψη ενός νοµίσµατος

• Το πλήθος των παιδιών σε µια οικογένεια

• Η θερµοκρασία σε µια συγκεκριµένη περιοχή της Ελλάδας, κάποια συγκεκρι-

µένη χρονική στιγµή

• Το βάρος ενός παιδιού της 6ης δηµοτικού

Τα αναµενόµενα αποτελέσµατα των παραπάνω πειραµάτων θα µπρορούσαν να

είναι αντίστοιχα :

• Κορώνα ή Γράµµατα

• Ένας (φυσικός) αριθµός (π.χ. 0,1,2,3... κλπ)

• Ένας πραγµατικός αριθµός στην κλίµακα -10...50

• Ένας πραγµατικός αριθµός στην κλίµακα 15...35

Με βάση τα παραπάνω οδηγούµαστε στον ακόλουθο ορισµό :

Ορισµός 1.2 Το σύνολο των δυνατών αποτελεσµάτων ενός πειράµατος ονο-

µάζεται δειγµατικός χώρος ή δειγµατοχώρος και συµβολίζεται συνήθως µε το

Πράξεις µε γεγονότα 3

γράµµα Ω. Κάθε στοιχείο ω ∈ Ω του δειγµατοχώρου ονοµάζεται απλό γεγο-

νός ή απλό ενδεχόµενο του πειράµατος. Επιπλέον, µια οποιαδήποτε συλλογή

απλών γεγονότων, δηλαδή ένα υποσύνολο A ⊆ Ω, αποτελεί (σύνθετο) γεγονόςή ενδεχόµενο.

Μια σηµαντική διάκριση που προκύπτει άµεσα για τους δειγµατοχώρους του

παραδείγµατος 1.1, είναι ότι στα δύο πρώτα πειράµατα (ρίψη νοµίσµατος,

αριθµός παιδιών στην οικογένεια) οι δειγµατοχώροι είναι απαριθµήσιµοι ή

διακριτοί. Επιπλέον, ο δειγµατοχώρος του πρώτου πειράµατος περιέχει µόνο

2 ενδεχόµενα (Κ ή Γ) και λέγεται πεπερασµένος. Αντίθετα, οι δειγµατοχώ-

ροι των δύο επόµενων πειραµάτων (θερµοκρασία, βάρος) αποτελούνται από

(συνεχή) διαστήµατα του συνόλου των πραγµατικών αριθµών και δεν είναι

προφανώς ούτε διακριτοί, ούτε πεπερασµένοι.

Παράδειγµα 1.3 Ρίχνουµε ένα ζάρι. Ο δειγµατοχώρος του πειράµατος είναι

Ω = 1, 2, 3, 4, 5, 6Προφανώς ο Ω είναι διακριτός και πεπερασµένος δειγµατοχώρος, αφού τα απλά

γεγονότα του πειράµατος της ρίψης του ενός ζαριού είναι συνολικά 6. Ενδεικτι-

κά, θα µπορούσαµε επίσης να ορίσουµε σύνθετα γεγονότα ως εξής :

• Ζυγό (άρτιο) αποτέλεσµα, το οποίο αντιστοιχεί στο A = 2, 4, 6 ⊆ Ω

• Αποτέλεσµα µεγαλύτερο του 3, το οποίο αντιστοιχεί στο B = 4, 5, 6 ⊆ Ω

Πράξεις µε γεγονότα

Έστω Ω ο δειγµατοχώρος ενός πειράµατος και A,B,Γ, ... γεγονότα. Μπορού-

µε να ορίσουµε τις παρακάτω πράξεις γεγονότων :

1. Ένωση δύο γεγονότων A,B ονοµάζεται το γεγονός που συµβαίνει, όταν

συµβαίνει τουλάχιστον ένα από τα A,B και συµβολίζεται µε A∪B. Στο πα-

ράδειγµα 1.3, θα µπορούσαµε να ορίσουµε την ένωση A∪B = 2, 4, 5, 6,που εκφράζει το γεγονός “αποτέλεσµα άρτιο ή µεγαλύτερο του 3”.

2. Τοµή δύο γεγονότων A,B ονοµάζεται το γεγονός που συµβαίνει, όταν

συµβαίνουν ταυτόχρονα και το A και το B και συµβολίζεται µε A ∩ B.Στο παράδειγµα 1.3, θα µπορούσαµε να ορίσουµε την τοµή A∩B = 4, 6,που εκφράζει το γεγονός “αποτέλεσµα άρτιο και µεγαλύτερο του 3”.

3. Συµπλήρωµα του γεγονότος A, ονοµάζεται το γεγονός που συµβαίνει ό-

ταν δεν συµβαίνει το A και συµβολίζεται µε A. Στο παράδειγµα 1.3, θα

4 Πιθανότητες - Εισαγωγικές Έννοιες

µπορούσαµε να ορίσουµε το συµπλήρωµα A = 1, 3, 5, που εκφράζει το

γεγονός “αποτέλεσµα όχι άρτιο (δηλ. περιττό)”.

Παρατηρήστε ότι οι ο πράξεις γεγονότων όπως αυτές ορίστηκαν παραπάνω

ανάγονται ουσιαστικά στις αντίστοιχες πράξεις συνόλων. Εύκολα µπορούµε

να διαπιστώσουµε ότι ισχύουν οι ακόλουθες ιδιότητες :

A ∪A = A A ∩A = AA ∪Ω = Ω A ∩Ω = AA ∪∅ = A A ∩∅ = ∅

A ∪A = Ω A ∩A = ∅

A ∪B = B ∪A A ∩B = B ∩AA ∪ (B ∪ Γ) = (A ∪B) ∪ Γ A ∩ (B ∩ Γ) = (A ∩B) ∩ Γ

A ∩ (B ∪ Γ) = (A ∩B) ∪ (A ∩ Γ) A ∪ (B ∩ Γ) = (A ∪B) ∩ (A ∪ Γ)A ∪B = A ∩B A ∩B = A ∪B

Σχετική Συχνότητα και Πιθανότητα

Έστω ότι εκτελούµε το πείραµα ρίψης ενός ζαριού N = 60 φορές και παίρ-

νουµε τις παρακάτω παρατηρήσεις :

Ενδεχόµενο (ωi) 1 2 3 4 5 6

Συχνότητα εµφανίσης (Ni) 12 10 9 9 11 9

Παρατηρούµε ότι το πλήθος των εµφανίσεων το κάθε αποτελέσµατος είναι

λίγο µικρότερο ή λίγο µεγαλύτερο του 10. Κάτι τέτοιο είναι αναµενόµενο

αφού όλες οι πλευρές του ζαριού είναι ίδιες, άρα περιµένουµε στις 60 ρίψεις

να έχουµε κατά προσέγγιση 606 = 10 εµφανίσεις του κάθε ενδεχοµένου. Ο

λόγος

fi =Ni

Nονοµάζεται σχετική συχνότητα του ενδεχοµένου ωi, στο συγκεκριµένο πεί-

ραµα. Οι σχετικές συχνότητες για το πείραµα µας είναι :

Ενδεχόµενο (ωi) 1 2 3 4 5 6

Σχετική Συχνότητα (fi) 0.200 0.167 0.150 0.150 0.183 0.150

∆ιαισθητικά αντιλαµβανόµαστε ότι αν εκτελούσαµε το πείραµα της ρίψης του

ζαριού περισσότερες φορές, για παράδειγµα 600 φορές, θα έπρεπε να περι-

µένουµε σχετικές συχνότητες που συγκλίνουν όλο και περισσότερο στην τιµή16 ≃ 0.167. Με βάση αυτό το σκεπτικό ο von Mises πρότεινε η πιθανότητα

Σχετική Συχνότητα και Πιθανότητα 5

P (A) που αντιστοιχεί σε ένα ενδεχόµενο A, να οριστεί ως το όριο της σχετικής

συχνότητας εµφάνισης του ενδεχοµένου αυτού όταν το πείραµα επαναληφθεί

πάρα πολλές φορές. ∆ηλαδή, χρησιµοποιώντας µαθηµατική ορολογία

P (A) = limN→∞

Ni

N

Ο εµπειρικός αυτός ορισµός παρουσιάζει σηµαντικές µαθηµατικές δυσκολίες

(π.χ. δεν µπορούµε να εγγυηθούµε την ύπαρξη ορίου σε οποιοδήποτε πείρα-

µα) γι’ αυτό το λόγο σήµερα έχει σχεδόν εγκαταλειφθεί, δίνοντας τη θέση

του στην αξιωµατική θεµελίωση της µαθηµατικής πιθανότητας που προτάθη-

κε από τον Kolmogorov το 1933. Σύµφωνα µε αυτή την προσέγγιση, σε κάθε

ενδεχόµενο αντιστοιχεί ένας πραγµατικός αριθµός που ονοµάζεται πιθανότη-

τα του ενδεχοµένου, ο οποίος απλά πληροί κάποιες προϋποθέσεις χωρίς να

γίνεται αναφορά σε σχετική συχνότητα ή άλλα εµπειρικά αποτελέσµατα.

Έστω ο δειγµατοχώρος Ω ενός πειράµατος. Σε κάθε ενδεχόµενο A του πειρά-

µατος αυτού αντιστοιχεί ένας πραγµατικός αριθµός P (A), που επαληθεύει τα

παρακάτω αξιώµατα :

• P (Ω) = 1

• P (A) ≥ 0 για κάθε γεγονός A

• Για οποιαδήποτε ακολουθία γεγονότων A1, A2, . . . , An που είναι αν δύο

ξένα µεταξύ τους, δηλ. Ai∩Aj = ∅ για i = j, ισχύει P (A1∪A2∪...∪An) =P (A1) + P (A2) + . . . + P (An)

Παρατηρήστε ότι στα παραπάνω αξιώµατα δεν γίνεται καµιά αναφορά στον

τρόπο ορισµού της πιθανότητας των ενδεχοµένων του δειγµατοχώρου. Παρόλα

αυτά είναι προφανές ότι τα αξιώµατα των πιθανοτήτων, αφενός δεν έρχονται

σε αντίθεση µε την έννοια της σχετικής συχνότητας, αφετέρου επιτρέπουν

διαφορετικές προσεγγίσεις όπως στο παρακάτω παράδειγµα :

Παράδειγµα 1.4 Επανερχόµαστε στο πείραµα της ρίψης ενός ζαριού. Ο δειγ-

µατοχώρος του πειράµατος είναι :

Ω = 1, 2, 3, 4, 5, 6θεωρούµε τα έξι απλά ενδεχόµενα του πειράµατος A1 = 1, A2 = 2, A3 =3, A4 = 4, A5 = 5, A6 = 6, τα οποία είναι προφανώς ανά δύο ξένα

µεταξύ τους (δηλ. Ai ∩ Aj = ∅ για i = j). Λαµβάνοντας υπόψη το τρίτο

αξίωµα, θα πρέπει να ισχύει

P (A1 ∪A2 ∪ ... ∪A6) = P (A1) + P (A2) + . . . + P (A6)

6 Πιθανότητες - Εισαγωγικές Έννοιες

Επειδή όµως A1 ∪A2 ∪ ... ∪A6 = Ω, η παραπάνω σχέση γράφεται

P (Ω) = P (A1) + P (A2) + . . . + P (A6)

όµως από το πρώτο αξίωµα έχουµε P (Ω) = 1, άρα

P (A1) + P (A2) + . . . + P (A6) = 1

Αν τώρα δεχθούµε ότι το ζάρι είναι “τίµιο”, δεν υπάρχει κανένας λόγος να

θεωρούµε ότι η πιθανότητες εµφάνισης των 6 απλών ενδεχοµένων είναι δια-

φορετικές µεταξύ τους, άρα υποθέτουµε ότι P (A1) = P (A2) = . . . = P (A6).Χρησιµοποιώντας την προηγούµενη σχέση, εύκολα προκύπτει :

P (A1) = P (A2) = . . . = P (A6) =1

6

Γενικεύοντας τη λογική του παραπάνω παραδείγµατος µπορούµε να πούµε ότι

σε ένα πεπερασµένο δειγµατοχώρο Ω, που αποτελείται από N απλά ενδεχόµε-

να ωi τα όποια είναι ισοπίθανα, η πιθανότητα του καθενός από τα απλά αυτά

ενδεχόµενα είναι :

P (ωi) =1

NΕπίσης, εύκολα προκύπτει πως σε µια τέτοια περίπτωση, η πιθανότητα ενός

σύνθετου ενδεχοµένου A που αποτελείται από nA απλά ενδεχόµενα, είναι

P (A) =NA

N

Μερικές επιπλέον συνέπειες του αξιωµατικού τρόπου θεµελίωσης της έννοιας

της πιθανότητας συνοψίζονται στο παρακάτω θεώρηµα :

Θεώρηµα 1 Έστω ο δειγµατοχώρος Ω ενός πειράµατος και A,B γεγονότα

του. Τότε :

1. P (A) + P (A) = 1

2. 0 ≤ P (A) ≤ 1

3. P (∅) = 0

4. P (A ∪B) = P (A) + P (B)− P (A ∩B)

5. Αν A ⊆ B τότε P (A) ≤ P (B)

Παράδειγµα 1.5 Από µια τράπουλα 52 φύλλων τραβάµε τυχαία ένα φύλλο.

Ζητείται η πιθανότητα του ενδεχοµένου το φύλλο να είναι φιγούρα ή κούπα. Για

να απαντήσουµε στο ζητούµενο πρέπει αρχικά να διακρίνουµε ότι το ζητούµενο

ενδεχόµενο είναι ουσιαστικά ένωση δύο απλούστερων ενδεχοµένων. Τα δύο

Σχετική Συχνότητα και Πιθανότητα 7

αυτά ενδεχόµενα είναι

A = το φύλλο είναι φιγούραB = το φύλλο είναι κούπα

Άρα το ζητούµενο είναι ο υπολογισµός του P (A ∪B).

Θα υπολογίσουµε αρχικά την πιθανότητα του ενδεχοµένου A. Το πλήθος των

φιγούρων στην τράπουλα είναι συνολικά 12, άρα εφόσον όλα τα φύλλα είναι

εξίσου πιθανό να τραβηχτούν, έχουµε

P (A) =12

52

Σκεπτόµενοι αντίστοιχα το πλήθος των φύλλων κούπα είναι 13, άρα

P (B) =13

52Για να υπολογίσουµε την P (A ∪ B) θα εκµεταλλευτούµε τον τύπο 4 του θεω-

ρήµατος , οπότε θα πρέπει επιπλέον να υπολογίσουµε την P (A ∩B), δηλ. την

πιθανότητα εµφάνισης φύλλου που είναι ταυτόχρονα κούπα και φιγούρα. Τα

φύλλα που είναι ταυτόχρονα κούπα και φιγούρα είναι συνολικά 3, άρα

P (A ∩B) =3

52Τελικά, εφαρµόζοντας τον τύπο 4 του θεωρήµατος , έχουµε

P (A ∪B) = P (A) + P (B)− P (A ∩B) =

=12

52+

13

52− 3

52=

22

52≃ 0.423

2 Αρχές Συνδυαστικής

Εισαγωγή

Σε ένα πεπερασµένο δειγµατοχώρο Ω, που αποτελείται από N απλά ενδεχόµε-

να ωi τα όποια είναι ισοπίθανα, η πιθανότητα του καθενός από τα απλά αυτά

ενδεχόµενα είναι :

P (ωi) =1

NΕπίσης, εύκολα προκύπτει πως σε µια τέτοια περίπτωση, η πιθανότητα ενός

σύνθετου ενδεχοµένου A που αποτελείται από nA απλά ενδεχόµενα, είναι

P (A) =NA

NΠαρόλο που ο παραπάνω τύπος είναι πολύ απλός στον υπολογισµό του, εί-

ναι συχνά αρκετά δύσκολο τόσο να υπολογίσουµε τον συνολικό αριθµό απλών

ενδεχοµένων του Ω, όσο και του πλήθους των απλών ενδεχοµένων που αποτε-

λούν το σύνθετο ενδεχόµενο A. Με τέτοιου είδους προβλήµατα απαρίθµησης

ασχολείται ο κλάδος τον µαθηµατικών που λέγεται συνδυαστική.

Παρακάτω παρουσιάζουµε µερικές περιπτώσεις που αφορούν τα σηµαντικότε-

ρα συνδυαστικά προβλήµατα.

Κανόνας Γινοµένου - Αθροίσµατος

Ανεξάρτητα ενδεχόµενα

Συχνά είναι ζητούµενο να απαριθµήσουµε το πλήθος απλών ενδεχοµένων, τα

οποία προέρχονται από δύο ή περισσότερες “πηγές”, οι οποίες είναι ανεξάρ-

τητες µεταξύ τους. ∆ηλαδή, το πλήθος των επιλογών από την µια “πηγή”

10 Αρχές Συνδυαστικής

ενδεχοµένων, δεν επηρεάζεται από το πλήθος της άλλης. Τέτοιου είδους εν-

δεχόµενα ονοµάζονται ανεξάρτητα.

Παράδειγµα 2.1 Εξετάζουµε το πείραµα ρίψης δύο διαφορετικών σε χρώµα

ζαριών (π.χ. ένα κόκκινο και ένα µπλε).

Προφανώς υπάρχουν 6 απλά ενδεχόµενα για κάθε ζάρι, τα οποία είναι ανεξάρ-

τητα, αφού το ένα ζάρι δεν επηρεάζει το άλλο. Είναι εύκολο να αντιληφθούµε

ότι τα απλά ενδεχόµενα του δειγµατοχώρου είναι ζευγάρια τιµών (µια τιµή για

κάθε ζάρι) και προφανώς το πλήθος των ζευγαριών αυτών είναι 6× 6 = 36.

Ο παραπάνω απλός συλλογισµός γενικεύεται εύκολα στον παρακάτω κανόνα

που είναι γνωστός ως κανόνας του γινοµένου.

Ορισµός 2.2 Εάν ένα ενδεχόµενο µπορεί να πραγµατοποιηθεί µε m διαφο-

ρετικούς τρόπους ενώ ένα άλλο, ανεξάρτητο, ενδεχόµενο µπορεί να πραγµα-

τοποιηθεί µε n τρόπους, τότε ο συνδυασµός των δύο ενδεχοµένων µπορεί να

πραγµατοποιηθεί µε m×n διαφορετικούς τρόπους. Ο ίδιος κανόνας ισχύει και

για περισσότερα από δύο ανεξάρτητα ενδεχόµενα.

Αµοιβαία Αποκλειόµενα ενδεχόµενα

Μια άλλη κατηγορία προβληµάτων αφορά την απαρίθµηση ενδεχοµένων, τα

οποία προέρχονται και πάλι από δύο ή περισσότερες “πηγές”, όµως αυτή τη

φορά η επιλογή ενδεχοµένων µπορεί να γίνει από µια µόνο “πηγή”, αποκλεί-

οντας την ή τις υπόλοιπες. Τέτοιου είδους ενδεχόµενα ονοµάζονται αµοιβαία

αποκλειόµενα.

Παράδειγµα 2.3 Πρόκειται να αγοράσουµε ένα αυτοκίνητο και πρέπει να επι-

λέξουµε χρώµα. Το αυτοκίνητο που µας ενδιαφέρει διατίθεται σε δύο “εκδοχές”

την Sport και την Classic, όµως η εκδοχή Sport διατίθεται σε κόκκινο ή µαύ-

ρο, ενώ η εκδοχή Classic σε ασηµί, µπλε ή λευκό. Πόσες δυνατότητες επιλογής

χρώµατος έχουµε;

Προφανώς, συνολικά υπάρχουν 5 διαφορετικά χρώµατα (απλά ενδεχόµενα) στη

διάθεσή µας, τα οποία προκύπτουν αν προσθέσουµε των αριθµό των χρωµάτων

της Sport εκδοχής (2), µε τον αριθµό χρωµάτων της Classic (3). Αν επιλέξουµε

την εκδοχή Sport, τότε αποκλείουµε την εκδοχή Classic, αλλά και αντίστροφα.

Τέτοιου είδους ενδεχόµενα ονοµάζονται αµοιβαία αποκλειόµενα.

Μεταθέσεις - ∆ιατάξεις 11

Ο παραπάνω συλλογισµός της άθροισης του πλήθους αµοιβαία αποκλειόµενων

ενδεχοµένων γενικεύεται στον κανόνα που είναι γνωστός ως κανόνας του

αθροίσµατος.

Ορισµός 2.4 Εάν ένα ενδεχόµενο µπορεί να πραγµατοποιηθεί µε m διαφο-

ρετικούς τρόπους ενώ ένα άλλο ενδεχόµενο µπορεί να πραγµατοποιηθεί µε nτρόπους, και τα δύο ενδεχόµενα δεν µπορεί να πραγµατοποιηθούν ταυτόχρονα,

δηλαδή είναι αµοιβαία αποκλειόµενα, τότε η πραγµατοποίηση κάποιου από τα

δύο αυτά ενδεχόµενα µπορεί να γίνει µε m + n διαφορετικούς τρόπους. Ο ί-

διος κανόνας γενικεύεται και για περισσότερα από δύο αµοιβαία αποκλειόµενα

ενδεχόµενα.

Μεταθέσεις - ∆ιατάξεις

Οι έννοιες των µεταθέσεων και των διατάξεων είναι συγγενικές. Όταν µιλάµε

για µεταθέσεις n διακεκριµένων αντικειµένων αναφερόµαστε στους πιθανούς

τρόπους τοποθέτησης των n αυτών αντικειµένων σε µια συγκεκριµένη σειρά.

Όταν γενικότερα έχουµε να τοποθετήσουµε ένα υποσύνολο των n αντικείµε-

νων, που περιέχει k αντικείµενα, σε µια συγκεκριµένη σειρά, αναφερόµαστε

σε διατάξεις k αντικειµένων από n.

Η έννοια των διακεκριµένων αντικειµένων που αναφέρθηκε παραπάνω, έχει

να κάνει µε το γεγονός ότι τα αντικείµενα του προβλήµατος µας µπορούν να

διακριθούν µε κάποιο τρόπο. Για παράδειγµα µπορεί να είναι σφαιρίδια που

έχουν διαφορετικά χρώµατα, καθίσµατα µε αρίθµηση, άνθρωποι που έχουν

ονόµατα κ.λ.π. Παρακάτω παρουσιάζουµε τις σηµαντικότερες περιπτώσεις

µεταθέσεων - διατάξεων.

Μεταθέσεις n διακεκριµένων αντικειµένων, χωρίςεπαναλήψεις

Ένα χαρακτηριστικό παράδειγµα µεταθέσεων n διακεκριµένων αντικειµένων,

χωρίς επαναλήψεις είναι το παρακάτω :

Παράδειγµα 2.5 ∆ιαθέτουµε τα γράµµατα Α, ∆, Κ, Μ πόσες διαφορετικές

λέξεις (χωρίς οι λέξεις αυτές να έχουν κατ’ ανάγκη νόηµα) µπορούµε να κατα-

σκευάσουµε µε τα γράµµατα αυτά, χρησιµοποιώντας καθένα τους ακριβώς µια

φορά;

12 Αρχές Συνδυαστικής

Σε ένα τέτοιο πρόβληµα το ζητούµενο είναι να µετρήσουµε τον αριθµό των

µεταθέσεων τεσσάρων διακεκριµένων αντικειµένων (Α, ∆, Κ, Μ), χωρίς επανά-

ληψη. Το ζητούµενο της µη επανάληψης αφορά την απαίτηση το κάθε γράµµα

να χρησιµοποιηθεί ακριβώς µια φορά. Το σκεπτικό της απαρίθµησης είναι το

εξής :

• Για την 1η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα, άρα υπάρχουν

4 ενδεχόµενα

• Για την 2η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα από τα 3 που

απέµειναν, άρα υπάρχουν 3 ενδεχόµενα

• Για την 3η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα από τα 2 που

απέµειναν, άρα υπάρχουν 2 ενδεχόµενα

• Για την 4η θέση πρέπει να επιλέξουµε το 1 γράµµα που απέµεινε, άρα υπάρχει

1 ενδεχόµενο

Οι τέσσερις παραπάνω επιλογές είναι ανεξάρτητες µεταξύ τους, άρα εφαρµόζο-

ντας τον κανόνα του γινοµένου έχουµε :

4× 3× 2× 1 = 24 ενδεχόµενα

Γενικότερα,

Ορισµός 2.6 Μια τοποθέτηση n διακεκριµένων αντικειµένων σε µια σειρά

ονοµάζεται µετάθεση των αντικειµένων αυτών, και ο αριθµός των δυνατών

µεταθέσεών τους είναι ίσος µε n× (n−1)× . . .×1.Ο αριθµός των µεταθέσεων

n διαφορετικών αντικειµένων γράφεται, πιο σύντοµα, ως n! και διαβάζεται “nπαραγοντικό”. Όταν n = 0, τότε ορίζεται 0! = 1.

∆ιατάξεις k διακεκριµένων αντικειµένων από n, χωρίςεπαναλήψεις

Γενικότερα µπορεί να τεθεί σαν ζητούµενο να διατάξουµε µόνο ένα υποσύνολο

από τα αντικείµενα που µας δίνονται. Σε µια τέτοια περίπτωση µιλάµε για

διατάξεις k διακεκριµένων αντικειµένων από n, χωρίς επαναλήψεις.

Παράδειγµα 2.7 ∆ιαθέτουµε τα γράµµατα Α, ∆, Κ, Μ, Ε, Ζ, Π πόσες διαφο-

ρετικές λέξεις (χωρίς οι λέξεις αυτές να έχουν κατ’ ανάγκη νόηµα) µήκους 4,

µπορούµε να κατασκευάσουµε µε τα γράµµατα αυτά, χρησιµοποιώντας καθένα

τους ακριβώς µια φορά;

Μεταθέσεις - ∆ιατάξεις 13

Η διαφορά σε σχέση µε το προηγούµενο παράδειγµα είναι ότι αυτή φορά δεν

θα εξαντλήσουµε το σύνολο 7 γραµµάτων, αφού χρειαζόµαστε µόνο 4 από αυτά.

Το σκεπτικό της απαρίθµησης είναι αντίστοιχο :

• Για την 1η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα, άρα υπάρχουν

7 ενδεχόµενα

• Για την 2η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα από τα 6 που

απέµειναν, άρα υπάρχουν 6 ενδεχόµενα

• Για την 3η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα από τα 5 που

απέµειναν, άρα υπάρχουν 5 ενδεχόµενα

• Για την 4η θέση µπορούµε να επιλέξουµε οποιοδήποτε γράµµα από τα 4 που

απέµειναν, άρα υπάρχουν 4 ενδεχόµενα

Οι τέσσερις παραπάνω επιλογές είναι ανεξάρτητες µεταξύ τους, άρα εφαρµόζο-

ντας τον κανόνα του γινοµένου έχουµε :

7× 6× 5× 4 = 840 ενδεχόµενα

Γενικότερα,

Ορισµός 2.8 Μια τοποθέτηση k αντικειµένων από n διακεκριµένα αντικείµενα

σε µια σειρά ονοµάζεται διάταξη k αντικειµένων από n, και ο αριθµός των

δυνατών τέτοιων διατάξεων είναι ίσος µε n× (n− 1)× . . .× (n− k + 1). Ο

αριθµός των διατάξεων k αντικειµένων (k ≤ n) από n συµβολίζεται µε P (n, k)και εύκολα µπορεί να διαπιστωθεί ότι

P (n, k) =n!

(n− k)!

∆ιατάξεις k αντικειµένων από n, µε επαναλήψεις

Σε αυτή την κατηγορία προβληµάτων µας ενδιαφέρουν διατάξεις k αντικει-

µένων από n, όµως αυτή τη φορά επιτρέπουµε σε οποιοδήποτε από τα n

αντικείµενα µας να συµµετέχουν στη διάταξη όσες φορές θέλουµε.

Παράδειγµα 2.9 Πόσοι διαφορετικοί τετραψήφιοι δυαδικοί αριθµοί υπάρχουν;

Το πρόβληµα έχει αρκετές οµοιότητες, αλλά και αρκετές διαφορές µε αυτό του

παραδείγµατος 2.7. Στο δυαδικό σύστηµα έχουµε στη διάθεση µας n = 2 αντι-

κείµενα (0 ή 1). Αντίστοιχα στο παράδειγµα 2.7 είχαµε n = 7 γράµµατα. Το

ζητούµενο είναι (όπως και στο παράδειγµα 2.7 να σχηµατίσουµε διατάξεις µή-

κους k = 4. Η βασική διαφορά όµως σε σχέση µε το παράδειγµα 2.7, είναι ότι

14 Αρχές Συνδυαστικής

η χρησιµοποίηση οποιουδήποτε από τα δύο διαθέσιµα σύµβολα (0 ή 1), δεν το

καθιστά πλέον µη διαθέσιµο, αφού επιτρέπονται απεριόριστες επαναλήψεις. Το

σκεπτικό της απαρίθµησης είναι το εξής :

• Για την 1η θέση µπορούµε να επιλέξουµε οποιοδήποτε από τα 0 ή 1, άρα

υπάρχουν 2 ενδεχόµενα

• Για την 2η θέση µπορούµε να επιλέξουµε οποιοδήποτε από τα 0 ή 1, άρα

υπάρχουν 2 ενδεχόµενα

• Για την 3η θέση µπορούµε να επιλέξουµε οποιοδήποτε από τα 0 ή 1, άρα

υπάρχουν 2 ενδεχόµενα

• Για την 4η θέση µπορούµε να επιλέξουµε οποιοδήποτε από τα 0 ή 1, άρα

υπάρχουν 2 ενδεχόµενα

Οι τέσσερις παραπάνω επιλογές είναι ανεξάρτητες µεταξύ τους, άρα εφαρµόζο-

ντας τον κανόνα του γινοµένου έχουµε :

2× 2× 2× 2 = 24 = 16 ενδεχόµενα

Άρα,

Ορισµός 2.10 Μια τοποθέτηση k αντικειµένων από n αντικείµενα, όπου επι-

τρέπεται η επανάληψη σε µια σειρά ονοµάζεται διάταξη k αντικειµένων απόn µε επαναλήψεις και ο αριθµός των δυνατών διατάξεων είναι ίσος µε nk.

Μεταθέσεις n αντικειµένων, χωρισµένων σε p οµάδεςόµοιων αντικειµένων

Μια άλλη γνωστή παραλλαγή του προβλήµατος των µεταθέσεων n αντικει-

µένων, αφορά περιπτώσεις όπου τα n αντικείµενα δεν είναι όλα διαφορετικά

µεταξύ τους αλλά υπάρχουν p οµάδες οµοίων αντικειµένων. Παρακολουθείστε

το παρακάτω παράδειγµα :

Παράδειγµα 2.11 Πόσες λέξεις µπορούν να κατασκευαστούν µε τα γράµµατα

της λέξης ΚΑΚΑΟ;

Παρατηρήστε ότι έχουµε στη διάθεση µας n = 5 γράµµατα, τα οποία όµως

είναι χωρισµένα σε p = 3 οµάδες. Συγκεκριµένα έχουµε 2Κ, 2Α και 1Ο. Το

ζητούµενο είναι πόσες µεταθέσεις µπορούµε να κατασκευάσουµε µε τα γράµµατα

αυτά.

Μεταθέσεις - ∆ιατάξεις 15

Αν τα γράµµατα ήταν όλα διαφορετικά µεταξύ τους θα είχαµε προφανώς 5!λέξεις. Ας υποθέσουµε ότι κάτι τέτοιο συµβαίνει και για να το πετύχουµε, µετο-

νοµάζουµε τα γράµµατα µας σε Κ1, Κ2, Α1, Α2, Ο, ώστε να διακρίνονται µεταξύ

τους. Ανάµεσα σε αυτές τις 5! λέξεις θα υπάρχουν ζεύγη όπως το παρακάτω :

Κ1Α1Κ2Α2Ο και Κ1Α2Κ2Α1Ο

οι δύο λέξεις διαφέρουν µεταξύ τους µόνο στο ότι τα δύο “Α”, είναι τοπο-

θετηµένα αντίστροφα. Αν αφαιρέσουµε τους δείκτες από τα Α, οι δύο λέξεις

ταυτίζονται.

Αν λάβουµε υπόψη µας ότι ανάµεσα σε όλες τις 5! υπάρχουν πάντα ζεύγη που

απλά διαφέρουν στην αντιµετάθεση των δύο Α, θα πρέπει συνολικά αν δεν δια-

κρίνουµε τα δύο Α να κρατήσουµε µόνο τις µισές, δηλ. 5!2 . Όµως µια αντίστοιχη

λογική µπορεί να εφαρµοστεί και για τις δύο εµφανίσεις του Κ, οπότε και πάλι

πρέπει να κρατήσουµε µόνο

5!

2× 2=

1× 2× 3× 4× 5

2× 2= 30 ενδεχόµενα

Γενικότερα,

Θεώρηµα 2 Ο αριθµός µεταθέσεων n αντικειµένων, χωρισµένων σε p ο-µάδες όµοιων αντικειµένων που η κάθε µια τους περιέχει ni αντικείµενα, έτσι

ώστε n1 + n2 + ... + np = n, είναιn!

n1!n2!...np!

Γενικά Παραδείγµατα στις Μεταθέσεις - ∆ιατάξεις

Παράδειγµα 2.12 Έχοντας στην διάθεσή µας τα ψηφία 0 έως και 9 πόσους

αριθµούς µήκους1 k µπορούµε να σχηµατίσουµε (µε απεριόριστη επανάληψη

των ψηφίων) οι οποίοι περιέχουν µία τουλάχιστον φορά το 0 (σε οποιαδήποτε

θέση);

Για να µετρήσουµε το ζητούµενο πλήθος θα µπορούσαµε να αναλύσουµε το

πρόβληµα σε ένα µεγάλο αριθµό αµοιβαία αποκλειόµενων περιπτώσεων, που

αφορούν το πλήθος των εµφανίσεων του 0 (προσέξτε ότι η εκφώνηση απαιτεί

τουλάχιστον µια εµφάνιση του 0 και όχι ακριβώς µία). Αυτό σηµαίνει ότι θα

έπρεπε να καταµετρήσουµε το πλήθος των k-ψήφιων αριθµών µε 1 µηδενικό, στη

συνέχεια µε 2 µηδενικά, 3 µηδενικά κλπ. Κάτι τέτοιο είναι αρκετά δύσκολο (όχι

όµως αδύνατο !) γι’ αυτό προτιµούµε να εφαρµόσουµε το παρακάτω τέχνασµα :

1 Σε αυτό το παράδειγµα, για λόγους απλότητας θεωρούµε ότι οι αριθµοί µήκους k που

ξεκινούν µε 0, είναι k-ψήφιοι (π.χ. θεωρούµε το 01234 είναι πενταψήφιο και όχι τετραψήφιο)

16 Αρχές Συνδυαστικής

Το πλήθος των αριθµών µήκους k που µπορούν να σχηµατιστούν χωρίς τον

περιορισµό σχετικά µε την εµφάνιση του 0 είναι 10k (αριθµός διατάξεων kστοιχείων από 10 διακεκριµένα στοιχεία µε επανάληψη). Στη συνέχεια υπολογί-

ζουµε το πλήθος των αριθµών που ικανοποιούν τη “συµπληρωµατική” συνθήκη

σχετικά µε το πλήθος των εµφανίσεων του 0. Η συµπληρωµατική της συνθήκης

“. . . τουλάχιστον µια φορά το 0”, είναι προφανώς “. . . καµιά φορά το 0”.

Οι αριθµοί µήκους k που δεν περιέχουν καµία φορά το 0 είναι αντίστοιχα 9k

(αριθµός διατάξεων k στοιχείων από 9 διακεκριµένα στοιχεία µε επανάληψη).

Εφόσον οι συµπληρωµατικές συνθήκες είναι αµοιβαία αποκλειόµενες, εφαρµό-

ζουµε τον κανόνα του αθροίσµατος. (δηλαδή, αν A είναι το ζητούµενο πλήθος

αριθµών µε τουλάχιστον ένα µηδενικό, πρέπει να ισχύει

A+ 9k = 10k

άρα

A = 10k − 9k

Παράδειγµα 2.13 α) Με πόσους τρόπους µπορούν 5 άνθρωποι (ο Γιάννης, ο

Πέτρος, η Μαρία, ο Άρης και η ∆ήµητρα) να δειπνήσουν σε ένα κυκλικό τραπέζι

5 (διακεκριµένων) θέσεων έτσι ώστε ο Γιάννης και η Μαρία να µην είναι ποτέ

σε διπλανές θέσεις;

β) Ποια η διαφορά αν το τραπέζι δεν ήταν κυκλικό;

γ) Με πόσους τρόπους µπορούν να καθίσουν τα 5 παραπάνω άτοµα σε ένα µη

κυκλικό τραπέζι 10 θέσεων, αν πρέπει αναγκαστικά ανάµεσα στο Γιάννη και στη

Μαρία να µεσολαβούν ακριβώς δύο κενές θέσεις;

α) Αν δεν υπήρχε ο περιορισµός που περιγράφεται στην εκφώνηση θα είχαµε

ένα απλό πρόβληµα µεταθέσεων 5 µη διακεκριµένων αντικειµένων, αφού κάθε

συνδαιτυµόνας θα µπορούσε να καθίσει σε οποιαδήποτε θέση µε λύση

5! = 120

Από αυτές θα πρέπει να εξαιρέσουµε τις περιπτώσεις όπου ο Γιάννης και η Μα-

ρία κάθονται σε διπλανές θέσεις. Αν ονοµάσουµε τις διακεκριµένες θέσεις του

κυκλικού τραπεζιού Α, Β, Γ, ∆, Ε τότε υπάρχουν 5 επιλογές διπλανών θέσεων :

A-B, Β-Γ, Γ-∆, ∆-Ε, Ε-Α. Οι δυνατές όµως τοποθετήσεις της Μαρίας δίπλα

στο Γιάννη είναι 10 αφού για κάθε µια από τις προηγούµενες επιλογές µπο-

ρεί να κάθεται πρώτα ο Γιάννης και µετά η Μαρία και αντιστρόφως. Για κάθε

τοποθέτηση του Γιάννη και της Μαρίας µένουν 3 διακεκριµένες θέσεις για να

καθίσουν οι υπόλοιποι συνδαιτυµόνες. Αυτό είναι ένα πρόβληµα µεταθέσεων 3

αντικειµένων και έχει λύση

3! = 6Σύµφωνα µε τον κανόνα του γινοµένου οι τρόποι µε τους οποίους µπορούν να

τοποθετηθούν οι συνδαιτυµόνες ώστε ο Γιάννης να καθίσει δίπλα στη Μαρία

Συνδυασµοί 17

είναι

10× 6 = 60Εποµένως, οι τρόποι µε τους οποίους µπορούν να τοποθετηθούν οι συνδαιτυ-

µόνες ώστε ο Γιάννης να µην καθίσει δίπλα στη Μαρία είναι

120− 60 = 60

β) Αν το τραπέζι δεν είναι κυκλικό τότε οι θέσεις Ε-Α δεν είναι γειτονικές, άρα

έχουµε 2× 4 = 8 “απαγορευµένες” τοποθετήσεις για τον Γιάννη και τη Μαρία.

Σκεπτόµενοι αντίστοιχα µε την περίπτωση α), θα έχουµε

5!− 8× 3! = 120− 48 = 72 τοποθετήσεις

γ) Θα θεωρήσουµε την ακολουθία “Γ - - Μ” σαν ένα νέο άτοµο, οπότε το

πρόβληµα µας θα ήταν ισοδύναµο µε το να τοποθετήσουµε 4 άτοµα σε 7 θέσεις,

άρα

P (7, 4) = 840 τοποθετήσεις

Αντίστοιχα θεωρώντας την ακολουθία “Μ - - Γ” σαν ένα νέο άτοµο έχουµε

επίσης 840 τοποθετήσεις. Άρα συνολικά

840 + 840 = 1680 τοποθετήσεις

Συνδυασµοί

Μια άλλη σηµαντική κατηγορία συνδυαστικών προβληµάτων αφορά τη δη-

µιουργία συνδυασµών. Η βασική διαφορά της έννοιας των συνδυασµών σε

σχέση µε αυτή των διατάξεων, είναι ότι αντίθετα µε τις δεύτερες στους συν-

δυασµούς δεν ενδιαφερόµαστε για τη συγκεκριµένη σειρά εµφάνισης των α-

ντικειµένων που επιλέγουµε από το σύνολο των αντικειµένων.

Συνδυασµοί k αντικειµένων από n, χωρίς επαναλήψεις

Το τυπικό παράδειγµα δηµιουργίας συνδυασµών χωρίς επανάληψη είναι η κλή-

ρωση του ΛΟΤΤΟ, που εµφανίζεται στο παρακάτω παράδειγµα :

Παράδειγµα 2.14 Στην κλήρωση του ΛΟΤΤΟ στην κληρωτίδα υπάρχουν n =49 διακεκριµένα σφαιρίδια (αριθµηµένα από 1 έως 49) από τα οποία επιλέγουµε

k = 6. Η τυχερή ακολουθία αποτελείται από 6 νούµερα, διαφορετικά µεταξύ

τους (δηλ. χωρίς επαναλήψεις), αλλά το σηµαντικό είναι ότι πλέον δεν µας

ενδιαφέρει η σειρά εµφάνισης τους. Για παράδειγµα, δεν µας ενδιαφέρει αν

οι τυχεροί αριθµοί ήταν 5,23,7,40,17,11 και εµφανίστηκαν µε τη συγκεκριµένη

σειρά ή µε οποιαδήποτε άλλη σειρά (π.χ. 17,5,23,11,40,17).

18 Αρχές Συνδυαστικής

Ορισµός 2.15 ∆οθέντος ενός συνόλου n διαφορετικών αντικειµένων, η επι-

λογή k αντικειµένων από αυτά χωρίς επαναλήψεις ονοµάζεται συνδυασµός kαντικειµένων από n. Αποδεικνύεται ότι το πλήθος των συνδυασµών k από n,δίνεται από τον τύπο

C(n, k) =n!

k!(n− k)!οι αριθµοί C(n, k) ονοµάζονται διωνυµικοί συντελεστές.

Στο παράδειγµα της κλήρωσης του ΛΟΤΤΟ ο συνολικός αριθµός συνδυασµών

είναι

C(49, 6) =49!

6!(49− 6)!=

49!

6!43!= 13.983.816

Συνδυασµοί k αντικειµένων από n, µε επαναλήψεις

Όπως είδαµε παραπάνω το πλήθος των συνδυασµών k αντικειµένων από n,

χωρίς επαναλήψεις, είναι C(n, k). Πως θα µπορούσαµε να παράγουµε ένα α-

ντίστοιχο αποτέλεσµα για την περίπτωση που το ζητούµενο είναι συνδυασµοί

k αντικειµένων από n, επιτρέποντας αυτή τη φορά επαναλήψεις; Παρακολου-

θείστε το παρακάτω παράδειγµα

Παράδειγµα 2.16 Υποθέτουµε ότι έχουµε ένα σύνολο από n = 4 διακεκριµένα

αντικείµενα. Έστω ότι αυτό το σύνολο είναι το A = 1, 2, 3, 4. Το πλήθος των

συνδυασµών k = 3 αριθµών από τα 4, όταν δεν επιτρέπουµε επαναλήψεις είναι

C(4, 3) = 4, οι οποίοι είναι οι παρακάτω :

1, 2, 3, 1, 2, 4, 1, 3, 4, 2, 3, 4

Αν επιτρέψουµε τις επαναλήψεις πρέπει να λάβουµε υπόψη ότι υπάρχουν κάποιοι

επιπλέον συνδυασµοί. Τέτοιοι συνδυασµοί θα µπορούσαν να είναι, για παρά-

δειγµα, οι 1, 1, 3, 2, 2, 2.Ένας τρόπος υπολογισµού του συνολικού πλήθους

των συνδυασµών µε επανάληψη είναι ο ακόλουθος :

Επεκτείνουµε το σύνολο A έτσι ώστε να περιέχει k − 1 = 3− 1 = 2 επιπλέον

στοιχεία. Έστω ότι το νέο σύνολο στοιχείων είναι το A′ = 1, 2, 3, 4, 5, 6 και

από το νέο αυτό σύνολο επιλέγουµε συνδυασµούς 3 αριθµών χωρίς επανάληψη.

Κάθε τέτοια επιλογή συνδυασµού από το A′, χωρίς επαναλήψεις µπορεί να αντι-

στοιχιστεί µοναδικά σε κάποιο συνδυασµό 3 αριθµών από το A µε επανάληψη,

χρησιµοποιώντας της εξής λογική :

• H εµφάνιση του 5 αντιπροσωπεύει επανάληψη του πρώτου αριθµού στο συν-

δυασµό µε επαναλήψεις (δηλ. ο αριθµός στη θέση 5− 4 = 1)

Τοποθέτηση Σφαιριδίων σε κουτιά 19

• H εµφάνιση του 6 αντιπροσωπεύει επανάληψη του δεύτερου αριθµού στο

συνδυασµό µε επαναλήψεις (δηλ. ο αριθµός στη θέση 6− 4 = 2)

Για παράδειγµα ο συνδυασµός 1, 1, 3 από το A, µπορεί να αντιστοιχιστεί στο

συνδυασµό 1, 3, 5 από το A′, ή αντίστοιχα ο συνδυασµός 2, 2, 2 από το A,µπορεί να αντιστοιχιστεί στο συνδυασµό 2, 5, 6 από το A′.

Άρα ο αριθµός των συνδυασµών 3 αντικειµένων από 4, µε επαναλήψεις, είναι

ίσος µε τον αριθµό των συνδυασµών 3 αντικειµένων από 6, χωρίς επαναλήψεις.

∆ηλαδή στην περίπτωση µας C(6, 3) = 6!(6−3)!3! = 20

Η παραπάνω λογική γενικεύεται και δίνει το παρακάτω θεώρηµα :

Θεώρηµα 3 Ο αριθµός συνδυασµών k στοιχείων από n, µε επαναλήψεις είναι

C(n + k − 1, k)

Τοποθέτηση Σφαιριδίων σε κουτιά

Μια πολύ σηµαντική κατηγορία συνδυαστικών µοντέλων που χρησιµοποιεί-

ται πολύ συχνά για την επίλυση συνδυαστικών προβληµάτων είναι γνωστή

ως “τοποθέτηση σφαιριδίων σε κουτιά”. Τα βασικά συστατικά στοιχεία των

µοντέλων “σφαιρίδια σε κουτιά” είναι δύο οµάδες από αντικείµενα : η µία ο-

µάδα περιέχει n σφαιρίδια και η άλλη περιέχει m κουτιά. Ο αρχικός µας (και

βασικός) στόχος είναι να µετρήσουµε µε πόσους τρόπους είναι δυνατόν να το-

ποθετηθούν τα σφαιρίδια αυτά στα κουτιά όταν επιτρέπουµε στα κουτιά να

περιέχουν οσαδήποτε σφαιρίδια, χωρίς περιορισµούς. Τα σφαιρίδια µπορεί α-

νάλογα µε το µοντέλο να θεωρηθεί ότι είναι διακεκριµένα ή όχι, ενώ αντίθετα

τα κουτιά είναι σε όλα τα µοντέλα που εξετάζουµε διακεκριµένα. Επιπλέον,

σε κάποια από τα µοντέλα (όπου τα σφαιρίδια είναι διακεκριµένα) µπορεί να

µας ενδιαφέρει η σειρά εµφάνισης των σφαιριδίων στα κουτιά ή όχι.

Τα µοντέλα αυτά συνοψίζονται στον παρακάτω πίνακα, όπου σε όλες τις πε-

ριπτώσεις θεωρούµε ότι τοποθέτηση των n σφαιριδίων γίνεται σε m διακε-

κριµένα κουτιά :

20 Αρχές Συνδυαστικής

Σφαιρίδια Περιορισµός Πλήθος

∆ιακεκριµένα ∆εν έχει σηµασία η σειρά των σφαιριδίων mn

∆ιακεκριµένα Έχει σηµασία η σειρά των σφαιριδίων(m+n−1)!(m−1)!

Όµοια ∆εν έχει σηµασία η σειρά των σφαιριδίων(m+n−1)!(m−1)!n!

Όµοια Το πολύ ένα σφαιρίδιο σε κάθε κουτί (m ≥ n) m!n!(m−n)!

Για να γίνουν ξεκάθαρες οι οµοιότητες και οι διαφορές των µοντέλων του

πίνακα, παρακολουθείστε τα παρακάτω παραδείγµατα :

Παράδειγµα 2.17 Σε ένα λεωφορείο ταξιδεύουν 20 επιβάτες, οι οποίοι πρό-

κειται να αποβιβαστούν στις επόµενες 5 στάσεις. Με πόσους διαφορετικούς

τρόπους µπορεί να γίνει η αποβίβαση αν δεν µας ενδιαφέρει η σειρά αποβίβα-

σης των επιβατών σε κάθε στάση;

Το δεδοµένο πρόβληµα µπορεί να θεωρηθεί σαν πρόβληµα τοποθέτησης σφαι-

ριδίων σε κουτιά. Το ισοδύναµο µοντέλο είναι να έχουµε n = 20 διακεκριµένα

σφαιρίδια (τα 20 άτοµα που είναι άνθρωποι άρα διακεκριµένα πρόσωπα), που

θέλουµε να τα τοποθετήσουµε σε m = 5 διακεκριµένα κουτιά (στις 5 διαφορε-

τικές στάσεις). Άρα σύµφωνα µε το πρώτο µοντέλο του πίνακα, αυτό µπορεί να

γίνει µε

mn = 520 τρόπους

Παράδειγµα 2.18 Σε µια τράπεζα υπάρχουν 20 πελάτες που περιµένουν να

εξυπηρετηθούν από 5 διαφορετικά ταµεία. Με πόσους διαφορετικούς τρόπους

µπορούν οι 20 πελάτες δηµιουργήσουν ουρές σε κάθε ένα από τα 5 ταµεία

(υποθέτουµε ότι όλοι οι πελάτες είναι ήδη στην τράπεζα);

Αντίστοιχα µε το προηγούµενο παράδειγµα έχουµε να τοποθετήσουµε n = 20διακεκριµένα σφαιρίδια (τα 20 άτοµα που είναι άνθρωποι άρα διακεκριµένα

πρόσωπα), σε m = 5 διακεκριµένα κουτιά (στις 5 διαφορετικές ουρές), όµως

αυτή τη φορά µας ενδιαφέρει η σειρά των σφαιριδίων (πελατών) σε κάθε κουτί

(ουρά). Σύµφωνα µε το δεύτερο µοντέλο του πίνακα, αυτό µπορεί να γίνει µε

(m + n− 1)!

(m− 1)!=

(5 + 20− 1)!

(5− 1)!=

24!

4!τρόπους

Παράδειγµα 2.19 Έχουµε να µοιράσουµε 20 νοµίσµατα του 1 ευρώ, σε 5

παιδιά. Με πόσους τρόπους µπορεί να γίνει η κατανοµή των νοµισµάτων;

Σε αυτή την περίπτωση έχουµε να τοποθετήσουµε n = 20 όµοια σφαιρίδια (τα

20 νοµίσµατα που είναι ίδια), σε m = 5 διακεκριµένα κουτιά (στα 5 διαφορετικά

παιδιά). Άρα χρησιµοποιώντας το τρίτο µοντέλο του πίνακα, η κατανοµή µπορεί

Γενικά παραδείγµατα στη συνδυαστική - διακριτή πιθανότητα 21

να γίνει µε

(m + n− 1)!

(m− 1)!n!=

(5 + 20− 1)!

(5− 1)!20!=

24!

4!20!τρόπους

Παράδειγµα 2.20 Πόσοι είναι οι 8-ψήφιοι δυαδικοί αριθµούς που περιέχουν

ακριβώς 5 µονάδες (και φυσικά 3 µηδενικά);

Σε αυτή την περίπτωση µπορούµε να αντιστοιχήσουµε τις 8 θέσεις του δυαδικού

αριθµού µε m = 8 διακεκριµένα κουτιά και να θεωρήσουµε έχουµε n = 5όµοια σφαιρίδια (τις µονάδες), που πρέπει να κατανεµηθούν στα κουτιά υπό

τον περιορισµό ότι σε κάθε κουτί θα µπει το πολύ ένα σφαιρίδιο (εννοείται ότι

στα 3 κουτιά που θα µείνουν άδεια αντιστοιχούν τα 3 µηδενικά του αριθµού).

Χρησιµοποιώντας το τέταρτο µοντέλο του πίνακα έχουµε

m!

n!(m− n)!=

8!

5!(8− 5)!=

8!

5!3!τρόπους

Παρατηρείστε ότι θα µπορούσαµε να εφαρµόσουµε το ίδιο µοντέλο, βλέποντας το

πρόβληµα σαν τοποθέτηση n = 3 σφαιριδίων, στα οποία τώρα αντιστοιχίζουµε

τα 3 µηδενικά, στα m = 8 κουτιά. Η απάντηση σε αυτή την περίπτωση είναι η

ίδια µε παραπάνω, αφού θα είχαµε 8!3!(8−3)! =

8!3!5! τρόπους.

Γενικά παραδείγµατα στη συνδυαστική - διακριτή πιθανότητα

Παράδειγµα 2.21 Θεωρούµε τη ρίψη δύο τίµιων ζαριών.

α) Ποια είναι η πιθανότητα και τα δύο ζάρια να εµφανίσουν τον ίδιο αριθµό;

β) Ποια είναι η πιθανότητα να εµφανιστεί τουλάχιστον ένα “εξάρι”;

Αρχικά καθορίζουµε το πλήθος των δυνατών αποτελεσµάτων που µπορεί να

φέρουν τα δύο ζάρια. Ο δειγµατοχώρος Ω, αποτελείται από ζεύγη αριθµών από

το 1 ως το 6, άρα σύµφωνα µε τον κανόνα του γινοµένου το πλήθος των απλών

ενδεχοµένων του Ω, είναι n = 6× 6 = 36.

α) Εξετάζουµε τώρα το πλήθος των ευνοϊκών ενδεχοµένων, δηλαδή µε πόσους

τρόπους τα δύο ζάρια έχουν ίδιο αποτέλεσµα. Προφανώς, τα πιθανά ζευγάρια

είναι (1, 1), (2, 2), . . . , (6, 6). Άρα το πλήθος των ευνοϊκών ενδεχοµένων είναι

nA = 6. Αφού όλα τα (απλά) ενδεχόµενα του πειράµατος µας είναι ισοπίθανα

η ζητούµενη πιθανότητα είναι

P =6

36=

1

6

β) Αντίστοιχα, θα µετρήσουµε το πλήθος των περιπτώσεων που εµφανίζεται

σε τουλάχιστον ένα από τα έξι ζάρια. Ένα πρώτο ευνοϊκό ενδεχόµενο είναι

το ζεύγος (6, 6). Επιπλέον, υπάρχουν 5 ευνοϊκά ενδεχόµενα της µορφής (6, X),

22 Αρχές Συνδυαστικής

όπου X = 1, 2, 3, 4, 5 αντίστοιχα άλλα 5 ευνοϊκά ενδεχόµενα της µορφής (X, 6),όπου επίσης όπου X = 1, 2, 3, 4, 5. Άρα συνολικά τα ευνοϊκά ενδεχόµενα είναι

nA = 1 + 5 + 5 = 11, συνεπώς η ζητούµενη πιθανότητα είναι

P =11

36

Παράδειγµα 2.22 α) Από τα 52 χαρτιά που υπάρχουν σε µια τράπουλα επιλέ-

γουµε τυχαία τέσσερα από αυτά. Ποια είναι η πιθανότητα να έχουµε τραβήξει

τέσσερις άσους (µια τράπουλα περιέχει µόνο τέσσερις άσους);

β) Επιλέγουµε πέντε φύλλα στην τύχη. Ποια είναι η πιθανότητα ανάµεσα στα

πέντε αυτά φύλλα να περιέχονται τέσσερις άσοι;

α) Ο δειγµατοχώρος Ω του πειράµατος µας, αποτελείται από διατεταγµένες τε-

τράδες χαρτιών. ∆ηλαδή ουσιαστικά κάθε απλό ενδεχόµενο είναι ένας διάταξη

k = 4 χαρτιών από n = 52, χωρίς επανάληψη αφού τα φύλλα που τραβάµε

δεν υπάρχει περίπτωση να ξαναεµφανιστούν. Το πλήθος των διατάξεων αυτών

είναι :

P (52, 4) =52!

48!= 6497400

Το ζητούµενο ευνοϊκό ενδεχόµενο είναι να τραβήξουµε 4 άσσους. Από τη στιγµή

που η τράπουλα περιέχει ακριβώς 4 άσσους, υπάρχουν 4! πιθανές διατάξεις τους.Άρα η ζητούµενη πιθανότητα είναι

P =4!

6497400≃ 3.6938× 10−6

β) Αντίστοιχα µε το υποερώτηµα α) ο δειγµατοχώρος µας αποτελείται P (52, 5)διατεταγµένες πεντάδες φύλλων. Οι ευνοϊκές πεντάδες θα περιέχουν τους 4

άσσους και ένα πέµπτο φύλλο το οποίο µπορεί να είναι οποιοδήποτε από τα υ-

πόλοιπα 48 (52 φύλλα µείον τους 4 άσσους), το οποίο στη διατεταγµένη πεντάδα

µπορεί να τοποθετηθεί σε 5 διαφορετικές θέσεις, ενώ επιπλέον πρέπει να λά-

βουµε υπόψη τις 4! πιθανές διατάξεις των 4 άσσων. Άρα οι ευνοϊκές πεντάδες

θα είναι συνολικά 48× 5× 4!. Συνεπώς η ζητούµενη πιθανότητα είναι

P =48× 5× 4!

P (52, 5)=

48× 5× 4!52!47!

≃ 1. 846 9× 10−5

Παράδειγµα 2.23 Ποια είναι η πιθανότητα ανάµεσα σε 23 διακεκριµένα άτο-

µα, να υπάρχουν τουλάχιστον δύο που έχουν γενέθλια την ίδια ηµέρα. (Θεωρού-

µε ότι όλες οι ηµέρες του έτους είναι ισοπίθανες για τη γέννηση των ανθρώπων)

Ο δειγµατοχώρος Ω του πειράµατος µας αποτελείται από διατεταγµένες 23-άδες

αριθµών, οι οποίοι µπορούν να πάρουν τιµές από 1 έως 365, όσες δηλαδή οι

ηµέρες ενός έτους. Το πλήθος των 23-άδων αυτών µπορεί εύκολα να υπολογιστεί

αν σκεφτούµε ότι ουσιαστικά πρόκειται για διατάξεις k = 23 αριθµών από

n = 365, όπου επιτρέπονται επαναλήψεις. ∆ηλαδή, συνολικά ο δειγµατοχώρος

Γενικά παραδείγµατα στη συνδυαστική - διακριτή πιθανότητα 23

µας αποτελείται από

N = nk = 36523

απλά ενδεχόµενα.

Επειδή είναι δύσκολο να µετρήσουµε πόσα είναι τα ευνοϊκά απλά ενδεχόµενα για

το ζητούµενο να υπάρχουν τουλάχιστον δύο άτοµα που έχουν γενέθλια την ίδια

ηµέρα, θα υπολογίσουµε το πλήθος των απλών ενδεχοµένων στο συµπληρωµατι-

κό σύνθετο ενδεχόµενο. ∆ηλαδή, θα υπολογίσουµε πόσες περιπτώσεις υπάρχουν

ώστε τα 23 άτοµα να έχουν γενέθλια σε διαφορετική ηµέρα το καθένα.

Προφανώς σε αυτή την περίπτωση έχουµε να απαριθµήσουµε το πλήθος των

διατάξεων k′ = 23 αριθµών από n = 365, όπου δεν επιτρέπονται επαναλήψεις,των οποίων το πλήθος είναι

NA = P (n, k′) =n!

(n′ − k′)!=

365!

342!

Άρα η πιθανότητα όλα τα άτοµα να έχουν γενέθλια σε διαφορετικές ηµέρες είναι

P ′ =NA

N=

365!342!

36523≃ 0.492 7

Αν τώρα επιστρέψουµε στο αρχικό ζητούµενο, δηλαδή την πιθανότητα δύο του-

λάχιστον άτοµα να έχουν γενέθλια την ίδια ηµέρα, έχουµε

P = 1− P ′ ≃ 1− 0.4921 ≃ 0.508

Το παραπάνω γεγονός είναι γνωστό στη βιβλιογραφία ως “παράδοξο των γενε-

θλίων”. Ο χαρακτηρισµός παράδοξο δικαιολογείται από το γεγονός ότι αρκούν

µόλις 23 άτοµα για να έχουµε πιθανότητα οριακά µεγαλύτερη από 50%, ώστε

ανάµεσα τους τουλάχιστον δύο άτοµα να έχουν γενέθλια την ίδια ηµέρα.

Παράδειγµα 2.24 Σε ένα λεωφορείο ταξιδεύουν 20 επιβάτες, οι οποίοι πρό-

κειται να αποβιβαστούν στις επόµενες 5 στάσεις.

α) Ποιά η πιθανότητα να κατέβουν όλοι οι επιβάτες σε µια στάση;

β) Ποιά η πιθανότητα να µη µείνει καµιά στάση κενή;

Στο παράδειγµα αυτό, αντίθετα µε το παράδειγµα 2.17, θα θεωρήσουµε όχι

µόνο ότι οι επιβάτες είναι διακεκριµένοι, αλλά επιπλέον ότι µας ενδιαφέρει και

η σειρά µε την οποία κατέβηκαν οι επιβάτες σε κάθε στάση.

α) Τα απλά ενδεχόµενα του δειγµατοχώρου µας είναι κατανοµές n = 20 διακε-

κριµένων επιβατών στις m = 5 στάσεις, όπου µας ενδιαφέρει και η σειρά σε

κάθε στάση, άρα σύµφωνα µε το αντίστοιχο µοντέλο τοποθέτησης σφαιριδίων

σε κουτιά, το πλήθος τους είναι :

N =(m + n− 1)!

(m− 1)!=

24!

4!

Στη συνέχεια το ζητούµενο είναι να µετρήσουµε µε πόσους τρόπους µπορεί να

24 Αρχές Συνδυαστικής

κατέβουν όλοι οι επιβάτες σε µια στάση (οι στάσεις είναι διακεκριµένες). Προ-

φανώς κάτι τέτοιο µπορεί να συµβεί µε 5 τρόπους, αφού οι ευνοϊκές τοποθετήσεις

είναι να κατέβουν όλοι στην 1η στάση, στη 2η στάση, κλπ., ενώ για κάθε µια

στάση µπορεί να έχουµε 20! διατάξεις επιβατών. Άρα NA = 5× 20!.

Εποµένως η ζητούµενη πιθανότητα είναι :

P =NA

N=

5× 20!24!4!

≃ 0.4705× 10−5

β) Ο συνολικός αριθµός απλών ενδεχοµένων του δειγµατοχώρου µας είναι ί-

διος µε αυτόν του υποερωτήµατος α), δηλαδή N = 24!4! . Για να µη µείνει καµία

στάση κενή πρέπει, σε όλες τις στάσεις να κατέβει τουλάχιστον ένας επιβάτης.

Αν θεωρήσουµε ότι τοποθετούµε εξ ’αρχής από ένα ακριβώς επιβάτη σε κάθε

µια από τις 5 στάσεις, ώστε να εξασφαλιστεί ότι δεν µένουν κενές στάσεις, η

αρχική αυτή κατανοµή µπορεί να γίνει P (20, 5) τρόπους. H κατανοµή των υ-

πολοίπων 20 − 5 = 15 επιβατών µπορεί να γίνει ανεξάρτητα, σύµφωνα µε το

µοντέλο τοποθέτησης n′ = 15 διακεκριµένων σφαιριδίων, σε m = 5 διακε-

κριµένα κουτιά, όπου µας ενδιαφέρει η σειρά εµφάνισης. Άρα το πλήθος των

ευνοϊκών κατανοµών είναι

NA =(m + n′ − 1)!

(m− 1)!× P (20, 5) =

19!

4!× 20!

15!

Συνεπώς η ζητούµενη πιθανότητα είναι

P =NA

N=

19!4! × 20!

15!24!4!

= 0.36477

3 ∆εσµευµένη Πιθανότητα -

Ανεξαρτησία

∆εσµευµένη Πιθανότητα

Η έννοια της δεσµευµένης πιθανότητας ή πιθανότητας υπό συνθήκη, σχετί-

ζεται µε το γεγονός ότι συχνά η πιθανότητα πραγµατοποίησης ενός συµβάντος

A σε ένα πείραµα εξαρτάται από την πραγµατοποίηση ή όχι ενός άλλου συµ-

βάντος B. Αυτό έχει ως αποτέλεσµα, όταν είναι γνωστό ότι πραγµατοποιήθηκε

το συµβάν B, να επηρεάζεται η πιθανότητα πραγµατοποίησης του συµβάντος

A.

Παράδειγµα 3.1 Να βρεθεί η πιθανότητα να εµφανιστεί σε µια ρίψη ζαριού

αποτέλεσµα µικρότερο του 4, αν

α) δε δίνεται καµιά άλλη πληροφορία

β) είναι γνωστό ότι η ρίψη έδωσε περιττό αριθµό.

α) Σε αυτή την περίπτωση ο δειγµατοχώρος αποτελείται από N = 6 απλά

ενδεχόµενα, δηλαδή είναι Ω = 1, 2, 3, 4, 5, 6. Ας ονοµάσουµε A = 1, 2, 3το ενδεχόµενο το αποτέλεσµα της ρίψης να είναι µικρότερο του 4, το οποίο

αποτελείται από NA = 3 απλά ενδεχόµενα. Αφού όλα τα αποτελέσµατα ρίψης

του ζαριού είναι ισοπίθανα, η πιθανότητα πραγµατοποίησης του A είναι

P (A) =NA

N=

3

6=

1

2

β) Ας ονοµάσουµε τώρα B = 1, 3, 5 το ενδεχόµενο η ρίψη να έδωσε περιττό

αποτέλεσµα, το οποίο αποτελείται από NB = 3 απλά ενδεχόµενα. Το ζητούµενο

είναι να υπολογίσουµε την πιθανότητα να συµβεί το ενδεχόµενο A, γνωρίζοντας

ότι έχει πραγµατοποιηθεί το ενδεχόµενο B.

Μια πρώτη προσέγγιση στο πρόβληµα θα ήταν να σκεφτούµε ότι έχοντας σαν

δεδοµένο το περιττό αποτέλεσµα, ο δειγµατοχώρος µας περιορίστηκε σε Ω′ =1, 3, 5, που αποτελείται από N ′ = 3 απλά ενδεχόµενα, οπότε το ζητούµενο

26 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία

ενδεχόµενο είναι A′ = 1, 3 (µε NA′ = 2 απλά ενδεχόµενα), µε πιθανότητα

P (A′) =NA′

N ′=

2

3(3.1)

Θα ήταν χρήσιµο να εκφράσουµε την παραπάνω πιθανότητα σε σχέση µε πιθα-

νότητες που σχετίζονται µε ενδεχόµενα στον αρχικό δειγµατοχώρο. Το πλήθος

των απλών ενδεχοµένων του περιορισµένου δειγµατοχώρου Ω′ είναι προφανώς

ίδιο µε αυτό του B, δηλαδήN ′ = NB

Αν, θεωρήσουµε το γεγονός A∩B, εύκολα διαπιστώνουµε ότι τα απλά ενδεχό-

µενα που περιέχει ταυτίζονται µε αυτά του A′, άρα ισχύει

NA′ = NA∩B

Άρα η (3.1) θα µπορούσε εναλλακτικά να γραφεί

P (A′) =NA∩B

NB

ή αν διαιρέσουµε αριθµητή και παρονοµαστή στο κλάσµα µε N,

P (A′) =NA∩B

NNB

N

=P (A ∩B)

P (B)

Πράγµατι, στον αρχικό δειγµατοχώρο Ω, έχουµε P (A∩B) = 26 και P (B) = 1

2 ,άρα

P (A′) =2612

=4

6=

2

3

Ο υπολογισµός που πραγµατοποιήσαµε στο β) µέρος του παραπάνω παραδείγ-

µατος δίνει ουσιαστικά την δεσµευµένη ή υπό συνθήκη πιθανότητα πραγµα-

τοποίησης του ενδεχοµένου A, δεδοµένου ότι έχει πραγµατοποιηθεί το γεγονός

B. Η πιθανότητα αυτή συµβολίζεται µε P (A/B) και διαβάζεται “δεσµευµέ-

νη πιθανότητα του ενδεχοµένου A, δεδοµένου του B”. Ο υπολογισµός του

παραδείγµατος µπορεί να γενικευθεί στο ακόλουθο θεώρηµα

Θεώρηµα 4 Η δεσµευµένη πιθανότητα του ενδεχοµένου A, δεδοµένου του

ενδεχοµένου B, δίνεται από τον τύπο

P (A/B) =P (A ∩B)

P (B)(3.2)

Παράδειγµα 3.2 Σε ένα κουτί έχουµε 7 φορτισµένες και 3 άδειες µπαταρίες.

Ποια η πιθανότητα παίρνοντας διαδοχικά δύο µπαταρίες, η δεύτερη να είναι

φορτισµένη, αν η πρώτη που διαλέξαµε ήταν άδεια.

∆εσµευµένη Πιθανότητα 27

Προφανώς το ζητούµενο είναι ο υπολογισµός κάποιας δεσµευµένης πιθανότητας.

Ο δειγµατοχώρος µας αποτελείται από διατεταγµένα ζευγάρια µπαταριών, άρα

θεωρώντας ότι έχουµε συνολικά 10 διακεκριµένες µπαταρίες, υπάρχουν

N = P (10, 2) = 10× 9 = 90 απλά ενδεχόµενα

Θεωρούµε τώρα τα εξής ενδεχόµενα

A = Η δεύτερη µπαταρία είναι φορτισµένηB = Η πρώτη µπαταρία είναι άδεια

Το πλήθος των απλών ενδεχοµένων του B είναι συνολικά NB = 3 × 9 = 27,άρα

P (B) =27

90=

3

10

Αντίστοιχα, το πλήθος των απλών ενδεχοµένων του A ∩ B είναι συνολικά

NA∩B = 3× 7 = 21, άρα

P (A ∩B) =21

90=

7

30Σύµφωνα µε το θεώρηµα, η ζητούµενη πιθανότητα είναι

P (A/B) =P (A ∩B)

P (B)=

730310

=7

9

Το παρακάτω θεώρηµα είναι γνωστό ως θεώρηµα ολικής πιθανότητας :

Θεώρηµα 5 (Ολικής πιθανότητας) Αν τα ενδεχόµενα B1, B2, . . . , Bn είναι

ξένα µεταξύ τους και B = B1 ∪ B2 ∪ . . . ∪ Bn, τότε για κάθε ενδεχόµενο A,ισχύει

P (A/B) =1

P (B)

n∑

k=1

P (Bk)P (A/Bk) (3.3)

επιπλέον αν B = Ω, τότε ισχύει

P (A) =n∑

k=1

P (Bk)P (A/Bk) (3.4)

Παράδειγµα 3.3 Έχουµε τρεις κάλπες 1,2 και 3 για τις οποίες γνωρίζουµε ότι

ο υποψήφιος δήµαρχος Χ, έχει λάβει τα ακόλουθα ποσοστά :

• Η κάλπη 1 περιέχει 20% ψήφους στον Χ, σε σύνολο 50 ψηφοφόρων

• Η κάλπη 2 περιέχει 40% ψήφους στον Χ, σε σύνολο 30 ψηφοφόρων

• Η κάλπη 3 περιέχει 60% ψήφους στον Χ, σε σύνολο 70 ψηφοφόρων

Τα (συνολικά 150) ψηφοδέλτια των τριών καλπών αναµιγνύονται τελικά σε ένα

κουτί, από το οποίο τραβάµε στην τύχη ένα ψηφοδέλτιο. Ποια η πιθανότητα να

τραβήξουµε ψηφοδέλτιο µε ψήφο υπέρ του Χ;

28 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία

Θα εκµεταλλευτούµε τον τύπο (3.4), ως εξής :

• Έστω A = τραβήξαµε ψηφοδέλτιο µε ψήφο υπέρ του Χ το ζητούµενο

ενδεχόµενο και

• Έστω Bi = τραβήξαµε ψηφοδέλτιο από την κάλπη i, i = 1, 2, 3.

Τα ενδεχόµενα Bi είναι προφανώς ξένα µεταξύ τους και επιπλέον η ένωση τους

δίνει ολόκληρο τον δειγµατοχώρο επιλογής κάλπης. Η πιθανότητα του καθενός

από τα Bi είναι προφανώς

P (B1) =50

150, P (B2) =

30

150, P (B3) =

70

150ενώ η πιθανότητα να τραβήξουµε ευνοϊκό ψήφο από την κάλπη i (δεδοµένου

ότι την διαλέξαµε), είναι

P (A/B1) =20

100, P (A/B2) =

40

100, P (A/B3) =

60

100

Χρησιµοποιώντας τον τύπο (3.4), έχουµε

P (A) = P (B1)P (A/B1) + P (B2)P (A/B2) + P (B3)P (A/B3)

=50

150

20

100+

30

150

40

100+

70

150

60

100=

32

75

Ο παρακάτω πολλαπλασιαστικός νόµος είναι πολύ χρήσιµος στη θεωρία πιθα-

νοτήτων, αφού δίνει τη δυνατότητα υπολογισµού πιθανοτήτων σε πειράµατα

που εκτελούνται σε διαδοχικά βήµατα. Ουσιαστικά το πολλαπλασιαστικό θε-

ώρηµα είναι άµεση γενίκευση του τύπου P (A1 ∩A2) = P (A2)P (A1/A2).

Θεώρηµα 6 (Πολλαπλασιαστικό Θεώρηµα) Έστω τα γεγονότα A1, A2, . . . , An,µε P (A1 ∩A2 ∩ . . . ∩An) > 0. Τότε :

P (A1∩A2∩. . .∩An) = P (A1)P (A2/A1)P (A3/A1∩A2) . . . P (An/A1∩. . .∩An−1)

Στο παρακάτω παράδειγµα θα χρησιµοποιήσουµε το πολλαπλασιαστικό θεώ-

ρηµα.

Παράδειγµα 3.4 Μια αυτοκινητοποµπή αποτελείται από 5 φορτηγά και 8 ε-

πιβατικά αυτοκίνητα. Ποιά η πιθανότητα τα τέσσερα πρώτα αυτοκίνητα που

θα περάσουν από τα διόδια να περάσουν µε τη ακόλουθη σειρά : Φορτηγό,

Επιβατικό, Φορτηγό, Φορτηγό.

Θεωρούµε τα ακόλουθα ενδεχόµενα :

• Φi = Εµφανίστηκε φορτηγό στην i θέση, i = 1, 2, 3, 4

• Ei = Εµφανίστηκε επιβατικό στην i θέση, i = 1, 2, 3, 4

∆εσµευµένη Πιθανότητα 29

Το ζητούµενο ενδεχόµενο µπορεί να κωδικοποιηθεί ως Φ1 ∩ E2 ∩ Φ3 ∩ Φ4.Εφαρµόζοντας το πολλαπλασιαστικό θεώρηµα, έχουµε :

P (Φ1∩E2∩Φ3∩Φ4) = P (Φ1)P (E2/Φ1)P (Φ3/Φ1∩E2)P (Φ4/Φ1∩E2∩Φ3)

Οι πιθανότητες που εµφανίζονται στο δεξιό µέλος της τελευταίας ισότητας είναι

οι ακόλουθες :

• P (Φ1) = 513 , αφού για την 1η θέση έχουµε διαθέσιµα 5 φορτηγά από σύνολο

13 αυτοκινήτων

• P (E2/Φ1) = 812 , αφού για την 2η θέση έχουµε διαθέσιµα 8 επιβατικά από

σύνολο 12 αυτοκινήτων

• P (Φ3/Φ1 ∩ E2) = 411 , αφού για την 3η θέση έχουµε διαθέσιµα 4 φορτηγά

από σύνολο 11 αυτοκινήτων

• P (Φ4/Φ1 ∩ E2 ∩ Φ3) = 310 , αφού για την 4η θέση έχουµε διαθέσιµα 3

φορτηγά από σύνολο 10 αυτοκινήτων

Άρα

P (Φ1 ∩E2 ∩Φ3 ∩Φ4) =5

13

8

12

4

11

3

10=

4

143

Το επόµενο θεώρηµα είναι γνωστό στη βιβλιογραφία ως θεώρηµα του Bayes

και συσχετίζει δεσµευµένες πιθανότητες της µορφής P (A/B) και P (B/A).

Στην απλή του µορφή του θεώρηµα Bayes, προκύπτει εύκολα χρησιµοποιώντας

δύο φορές τον τύπο (3.2), ως εξής :

Θεωρούµε ότι P (A) > 0 και P (B) > 0, οπότε

P (A/B) =P (A ∩B)

P (B)⇔ P (A ∩B) = P (B)P (A/B)

και

P (B/A) =P (A ∩B)

P (A)⇔ P (A ∩B) = P (A)P (B/A)

Εξισώνοντας έχουµε

P (B)P (A/B) = P (A)P (B/A)

οπότε :

Θεώρηµα 7 (Bayes) Αν A,B δύο ενδεχόµενο µε P (A) > 0 και P (B) > 0,τότε

P (A/B) =P (A)P (B/A)

P (B)(3.5)

Άµεση συνέπεια του θεωρήµατος του Bayes (κάνοντας χρήση του τύπου (3.4))

είναι το παρακάτω :

30 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία

Θεώρηµα 8 Έστω τα ενδεχόµενα A1, A2, . . . , An, που είναι ξένα µεταξύ τους,

τέτοια ώστε Ω = A1 ∪ A2 ∪ . . . ∪ An και µε P (Ai) > 0, k = 1, 2, . . . , n. Γιαοποιοδήποτε ενδεχόµενο B µε P (B) > 0, ισχύει

P (Ak/B) =P (Ak)P (B/Ak)n∑

i=1P (Ai)P (B/Ai)

(3.6)

Το θεώρηµα του Bayes δίνει µερικές φορές αποτελέσµατα που δεν είναι ανα-

µενόµενα µε την πρώτη µατιά. Παρακολουθείστε το παρακάτω παράδειγµα :

Παράδειγµα 3.5 Μια ιατρική εξέταση για τη διαπίστωση ύπαρξης ή µη ενός

ιού της γρίπης έχει ποσοστό επιτυχίας 99%. ∆ηλαδή, στο 99% των κλινικών

δοκιµών που έγιναν σε φορείς του ιού το αποτέλεσµα της εξέτασης ήταν πράγµατι

θετικό. Επίσης, διαπιστώθηκε ότι η µέθοδος έδωσε εσφαλµένα θετική διάγνωση

σε 0.6% µιας οµάδας υγειών ατόµων. Η εξέταση αυτή φαίνεται εκ πρώτης

όψης πολύ αποτελεσµατική. Υπάρχει όµως µια σηµαντική ατέλεια µπορεί να

αποκαλυφθεί κάτω από συγκεκριµένες συνθήκες µε τη βοήθεια του θεωρήµατος

του Bayes.

Σε ένα σχολείο γνωρίζουµε (από κάποια αξιόπιστη πηγή) ότι το 0, 5% των

µαθητών είναι πραγµατικά φορέας του ιού. Ορίζουµε τα παρακάτω ενδεχόµενα :

A = Ο µαθητής είναι φορέαςA = Ο µαθητής δεν είναι φορέαςB = Η εξέταση είναι θετική

Μπορούµε µε βάση τα δεδοµένα που έχουµε να υπολογίσουµε τις ακόλουθες

πιθανότητες :

• P (A) = 0.005 αφού ξέρουµε ότι 0,5% των µαθητών είναι φορείς

• P (A) = 1− P (A) = 0.995 αφού τα A και A είναι συµπληρωµατικά

• P (B/A) = 0.99 όπως έχει διαπιστωθεί σε κλινικές δοκιµές

• P (B/A) = 0.006 όπως επίσης έχει διαπιστωθεί σε κλινικές δοκιµές

Με τα παραπάνω δεδοµένα και λαµβάνοντας υπόψη ότι A∩A = ∅ και A∪A =Ω, µπορούµε χρησιµοποιώντας την (3.4), να υπολογίσουµε την πιθανότητα η

εξέταση να είναι θετική στους µαθητές του συγκεκριµένου σχολείου. ∆ηλαδή

P (B) = P (A)P (B/A) + P (A)P (B/A)

= 0.005× 0.99 + 0.995× 0.006

= 0.010 92

Τώρα µπορούµε να ελέγξουµε την “αξιοπιστία” της εξέτασης χρησιµοποιώντας

τον τύπο του Bayes, για να υπολογίσουµε την πιθανότητα ένας µαθητής να είναι

Ανεξάρτητα γεγονότα 31

φορέας, µε δεδοµένο ότι η εξέταση του ήταν θετική, δηλαδή :

P (A/B) =P (A)P (B/A)

P (B)=

0.005× 0.99

0.010 92≃ 0.453 3

Παραδόξως, αποδεικνύεται ότι η πιθανότητα ένας µαθητής να είναι φορέας, µε

µόνο δεδοµένο το θετικό αποτέλεσµα της εξέτασης είναι µόλις 45.33%.

Ανεξάρτητα γεγονότα

Εξετάζουµε τώρα την περίπτωση που η πιθανότητα πραγµατοποίησης ενός

γεγονότος A, δεν επηρεάζεται από την πραγµατοποίηση ή µη ενός άλλου

γεγονότος B, δηλαδή ισχύει

P (A/B) = P (A)

Χρησιµοποιώντας τον τύπο (3.2), έχουµε

P (A/B) =P (A ∩B)

P (B)

οπότε, αφού P (A/B) = P (A), παίρνουµε

P (A) =P (A ∩B)

P (B)ή

P (A ∩B) = P (A)P (B)

Παρατηρείστε ότι αν ισχύει P (A/B) = P (A) τότε εύκολα προκύπτει ότι

Με βάση το παραπάνω σκεπτικό δίνουµε τον παρακάτω ορισµό :

Ορισµός 3.6 ∆ύο γεγονότα A,B ονοµάζονται (στοχαστικά) ανεξάρτητα, εάν

και µόνο εάν ισχύει

P (A ∩B) = P (A)P (B)

Παράδειγµα 3.7 Ρίχνουµε δύο διακεκριµένα ζάρια. Ο δειγµατοχώρος µας α-

ποτελείται από διατεταγµένες δυάδες αριθµών από το 1 ως το 6. Προφανώς το

πλήθος των διατεταγµένων δυάδων είναι 36. Εξετάζουµε τα παρακάτω ενδεχό-

µενα :

• A = Το 1o ζάρι έφερε 3• B = Το άθροισµα των ζαριών είναι άρτιο

Προφανώς είναι

P (A) =6

36=

1

6

32 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία

P (B) =18

36=

1

2και A ∩B = (3, 1), (3, 3), (3, 5) και

P (A ∩B) =3

36=

1

12Εύκολα επιβεβαιώνουµε ότι

P (A ∩B) = P (A)P (B)

άρα τα δύο ενδεχόµενα είναι ανεξάρτητα.

Γενικά παραδείγµατα στη δεσµευµένη πιθανότητα - ανεξαρτησία

Παράδειγµα 3.8 Ένα κουτί περιέχει 6 κόκκινες, 4 άσπρες και 5 µπλε σφαίρες.

Από το κουτί τραβάµε διαδοχικά τρεις σφαίρες. Να βρεθεί η πιθανότητα η τρίτη

σφαίρα να είναι µπλε, αν οι δύο πρώτες ήταν κατά σειρά κόκκινη – άσπρη όταν :

α) Η δειγµατοληψία γίνεται χωρίς επανάθεση

β) Η δειγµατοληψία γίνεται µε επανάθεση

α) Αρχικά σχηµατίζουµε το δειγµατοχώρο Ω = ∆ιατεταγµένες τριάδες από

σφαίρες, χωρίς επαναλήψεις, προφανώς ο δειγµατοχώρος αποτελείται από N =P (15, 3) = 15×14×13 = 2730 απλά ενδεχόµενα. ορίζουµε τώρα τα παρακάτω

ενδεχόµενα :

• A = 3η σφαίρα µπλε• B = 1η σφαίρα κόκκινη και 2η σφαίρα άσπρη

Προφανώς το πλήθος των απλών ενδεχοµένων του B είναι NB = 6 × 4 ×13 = 312, οπότε P (B) = NB

N = 3122730 = 4

35 .Αντίστοιχα το πλήθος των απλών

ενδεχοµένων του A∩B είναι NA∩B = 6×4×5 = 120, άρα P (A∩B) = 1202730 =

491 . Το ζητούµενο είναι η δεσµευµένη πιθανότητα

P (A/B) =P (A ∩B)

P (B)=

491435

=5

13

Παρατηρείστε, ότι ένας εναλλακτικός τρόπος υπολογισµού της παραπάνω πιθα-

νότητας, θα ήταν να σκεφτούµε ότι έχοντας 1η σφαίρα κόκκινη και 2η σφαίρα

άσπρη, µένουν συνολικά 13 σφαίρες, εκ των οποίων επιλέγουµε µια (την 3η).

Άρα τα ευνοϊκά ενδεχόµενα είναι 5 και συνεπώς η ζητούµενη πιθανότητα 513 .

β) Όταν γίνεται επανάθεση ο δειγµατοχώρος είναι διαφορετικός σε σχέση µε το

α). Ο νέος δειγµατοχώρος µας είναι Ω = ∆ιατεταγµένες τριάδες από σφαίρες,

µε επαναλήψεις. Το πλήθος των απλών ενδεχοµένων του νέου Ω είναι N =15×15×15 = 153 = 3375. Τα ενδεχόµενα A,B που µας ενδιαφέρουν ορίζονται

Γενικά παραδείγµατα στη δεσµευµένη πιθανότητα - ανεξαρτησία 33

όπως και στο α), όµως αλλάζει ο τρόπος απαρίθµησης των απλών ενδεχοµένων

τους. Έχουµε, NB = 6 × 4 × 15 = 360, οπότε P (B) = NB

N = 3603375 = 8

75 .

Αντίστοιχα NA∩B = 6×4×5 = 120, άρα P (A∩B) = 1203375 = 8

225 . Εποµένως

η δεσµευµένη πιθανότητα είναι

P (A/B) =P (A ∩B)

P (B)=

8225875

=1

3

Αντίστοιχη, εναλλακτική λύση µε αυτή του α), µπορεί επίσης να εφαρµοστεί, αλλά

κατά την επιλογή της 3ης σφαίρας έχουµε στη διάθεση µας 15 σφαίρες συνολικά,

άρα η ζητούµενη πιθανότητα είναι 515 = 1

3 .Παρατηρείστε ότι P (A/B) = P (A),άρα τα ενδεχόµενα A,B είναι στοχαστικά ανεξάρτητα.

Παράδειγµα 3.9 Ένα µήνυµα κωδικοποιείται σε δυαδικά ψηφία 0 και 1 και

στη συνέχεια στέλνεται µέσω ενός καναλιού επικοινωνίας. Η πιθανότητα να

σταλεί 0 είναι 0,4 και η πιθανότητα να σταλεί 1 είναι 0,6. Κατά τη µετάδοση

των σηµάτων όµως, συµβαίνουν τυχαία σφάλµατα, τα οποία µετατρέπουν το 1

σε 0 µε πιθανότητα 0,2 και το 0 σε 1 µε πιθανότητα 0,1. (α) Ποιά η πιθανότητα

το σήµα που λαµβάνεται να είναι 0; (β) Ποιά η πιθανότητα να είναι 1; (γ)

Ποια η πιθανότητα να έχει σταλεί 1, δεδοµένου ότι έχει ληφθεί 0. (δ) Ποια η

πιθανότητα να έχει σταλεί 0, δεδοµένου ότι έχει ληφθεί 1.

Ας ορίσουµε τα ενδεχόµενα που µας ενδιαφέρουν :

• A = Αποστολή ψηφίου 0 µε P (A) = 0.4

• A = Αποστολή ψηφίου 1 µε P (A) = 0.6

• B = Λήψη του ψηφίου 0 του οποίου η πιθανότητα είναι το ζητούµενο (α)

• B = Λήψη του ψηφίου 1 του οποίου η πιθανότητα είναι το ζητούµενο (β)

(α-β) Οι πιθανότητες εµφάνισης λαθών που δίνονται µπορούν να ερµηνευθούν

ως εξής :

Η πιθανότητα εµφάνισης σφάλµατος µετατροπής του 0 σε 1 κατά τη µετάδοση,

εκφράζεται από την δεσµευµένη πιθανότητα P (B/A) = 0.1, ενώ προφανώς η

πιθανότητα µη εµφάνισης σφάλµατος, δηλαδή όταν το 0 φθάνει αναλλίωτο στον

παραλήπτη, είναι P (B/A) = 1− 0.1 = 0.9.

Αντίστοιχα, η πιθανότητα εµφάνισης σφάλµατος µετατροπής του 1 σε 0 κατά

τη µετάδοση, εκφράζεται από την δεσµευµένη πιθανότητα P (B/A) = 0.2, ενώπροφανώς η πιθανότητα µη εµφάνισης σφάλµατος, δηλαδή όταν το 1 φθάνει

αναλλίωτο στον παραλήπτη, είναι P (B/A) = 1− 0.2 = 0.8.

Άρα σύµφωνα µε τον τύπο (3.4) έχουµε για το (α)

P (B) = P (A)P (B/A) + P (A)P (B/A) = 0.4× 0.9 + 0.6× 0.2 = 0.48

34 ∆εσµευµένη Πιθανότητα - Ανεξαρτησία

και για το (β)

P (B) = P (A)P (B/A) + P (A)P (B/A) = 0.4× 0.1 + 0.6× 0.8 = 0.52

(γ) Το ζητούµενο είναι προφανώς η δεσµευµένη πιθανότητα P (A/B). Από το

θεώρηµα του Bayes έχουµε :

P (A/B) =P (A)P (B/A)

P (B)=

0.6× 0.2

0.48= 0.25

(δ) Αντίστοιχα µε το (γ) ζητείται η δεσµευµένη πιθανότητα P (A/B). Από το

θεώρηµα του Bayes έχουµε :

P (A/B) =P (A)P (B/A)

P (B)=

0.4× 0.1

0.52≃ 0.0769

Παράδειγµα 3.10 Αν A,B είναι δύο ανεξάρτητα ενδεχόµενα µε P (A) = 0.5και P (B) = 0.7, να υπολογιστούν οι P (A ∩B) και P (A ∪B).

Αφού τα A,B είναι ανεξάρτητα, ισχύει :

P (A ∩B) = P (A)P (B) = 0.5× 0.7 = 0.35

Επιπλέον για την ένωση των A,B είναι γνωστό ότι ισχύει

P (A ∪B) = P (A) + P (B)− P (A ∩B) = 0.5 + 0.7− 0.35 = 0.85

Παράδειγµα 3.11 (α) ∆είξτε ότι δύο γεγονότα A,B ξένα µεταξύ τους, µε

P (A) > 0 και P (B) > 0, δεν µπορεί να είναι ανεξάρτητα.

(β) ∆είξτε ότι δύο ανεξάρτητα γεγονότα A,B, µε P (A) > 0 και P (B) > 0, δενµπορεί να είναι ξένα µεταξύ τους.

(α) Έστω A,B ξένα (µε P (A) > 0 και P (B) > 0), οπότε A ∩ B = ∅. ΆραP (A ∩B) = 0.

Έστω ότι τα A,B είναι ανεξάρτητα. Θα δείξουµε ότι κάτι τέτοιο είναι αδύνατο

(απαγωγή σε άτοπο). Αφού τα A,B είναι ανεξάρτητα θα ισχύει P (A ∩ B) =P (A)P (B). Όµως από την υπόθεση P (A) > 0 και P (B) > 0, άρα P (A∩B) =P (A)P (B) > 0. Όµως αυτό είναι άτοπο αφού δείξαµε ότι P (A ∩B) = 0.

(β) Έστω A,B ανεξάρτητα µε P (A) > 0 και P (B) > 0. Από τον ορισµό

της ανεξαρτησίας έχουµε P (A ∩ B) = P (A)P (B) και αφού P (A) > 0 και

P (B) > 0, θα είναι και P (A ∩B) = P (A)P (B) > 0.

Έστω τώρα ότι τα A,B είναι ξένα. Κάτι τέτοιο θα σήµαινε ότι A ∩ B = ∅,οπότε θα ήταν P (A∩B) = 0. Όµως προηγουµένως δείξαµε ότι P (A∩B) > 0,άρα καταλήγουµε σε άτοπο.

Παράδειγµα 3.12 Ρίχνουµε δύο νοµίσµατα µια φορά, οπότε ο δειγµατοχώρος

του πειράµατος είναι Ω = KK,KΓ,ΓK,ΓΓ. Θεωρούµε ότι η πιθανότητα

Γενικά παραδείγµατα στη δεσµευµένη πιθανότητα - ανεξαρτησία 35

να εµφανιστεί κορώνα στο πρώτο νόµισµα είναι p1, ενώ στο δεύτερο p2. Άραγια κάθε στοιχειώδες ενδεχόµενο έχουµε :

P (KK) = p1p2, P (KΓ) = p1(1− p2),

P (ΓK) = (1− p1)p2, P (ΓΓ) = (1− p1)(1− p2)

Ορίζουµε δύο σύνθετα ενδεχόµενα

A = KK,KΓ = Το πρώτο νόµισµα έφερε ΚορώναB = KK,ΓK = Το δεύτερο νόµισµα έφερε Κορώνα

Είναι τα ενδεχόµενα A,B ανεξάρτητα;

Έχουµε

P (A) = p1p2 + p1(1− p2) = p1

P (B) = p1p2 + (1− p1)p2 = p2

P (A ∩B) = P (KK) = p1p2Προφανώς ισχύει

P (A ∩B) = P (A)P (B)άρα τα A,B είναι ανεξάρτητα.

4 Τυχαίες Μεταβλητές - Κατα-

νοµές

Μονοδιάστατες τυχαίες µεταβλητές

Στα προηγούµενα κεφάλαια στις περισσότερες περιπτώσεις τα αποτελέσµατα

των πειραµάτων που εξετάσαµε είτε ήταν αριθµοί (π.χ. ρίψη ενός ζαριού),

είτε µε ένα απλό τρόπο θα µπορούσαν να κωδικοποιηθούν έτσι ώστε να α-

ντιπροσωπεύονται από αριθµούς (π.χ. στη ρίψη νοµίσµατος θα µπορούσαµε

να αντιστοιχήσουµε Κ→0 και Γ→1). Κάτι τέτοιο συναντάται επίσης σε πε-

ριπτώσεις που έχουµε να χειριστούµε αποτελέσµατα πειραµάτων που έχουν

από τη φύση τους συνεχή χαρακτήρα (π.χ. µετρήσεις µήκους, βάρους κ.λπ.).

Οι αντιστοιχήσεις των αποτελεσµάτων τέτοιων πειραµάτων σε πραγµατικούς

αριθµούς ονοµάζονται µονοδιάστατες τυχαίες µεταβλητές. Σε κάποιες πιο πο-

λύπλοκες περιπτώσεις είναι πιθανό τα αποτελέσµατα των πειραµάτων να µην

µπορούν να αντιστοιχιστούν, σε ένα µόνο πραγµατικό αριθµό, αλλά σε συν-

θετότερες µορφές όπως ζεύγη αριθµών ή τριάδες αριθµών οπότε µιλάµε για

πολυδιάστατες τυχαίες µεταβλητές.

Με βάση τα παραπάνω έχουµε τον παρακάτω ορισµό :

Ορισµός 4.1 Μια µονοδιάστατη τυχαία µεταβλητή είναι µια συνάρτηση X, ηοποία απεικονίζει κάθε ενδεχόµενο ενός πειράµατος ω ∈ Ω, σε ένα πραγµατικό

αριθµό X(ω) ∈ R, δηλαδήX : Ω→ R

τέτοια ώστε για κάθε πραγµατικό αριθµό x ∈ R, το σύνολο X−1(−∞, x] να

είναι ενδεχόµενο του Ω.

Ανάλογα µε το αν ο δειγµατοχώρος που αποτελεί πεδίο ορισµού για την τυ-

χαία µεταβλητή, είναι συνεχής ή διακριτός, αντίστοιχα χαρακτηρίζεται και η

38 Τυχαίες Μεταβλητές - Κατανοµές

ίδια η τυχαία µεταβλητή σαν συνεχής ή διακριτή. Στο παρόν κεφάλαιο θα

ασχοληθούµε κυρίως µε διακριτές τυχαίες µεταβλητές.

Παράδειγµα 4.2 Στο πείραµα ρίψης ενός ζαριού η τυχαία µεταβλητή που α-

ντιστοιχεί στα στοιχεία του δειγµατοχώρου Ω = 1, 2, 3, 4, 5, 6 πραγµατικούς

αριθµούς, µπορεί να θεωρηθεί ότι είναι η ταυτοτική συνάρτηση, αφού τα στοι-

χεία του δειγµατοχώρου είναι τα ίδια αριθµοί. ∆ηλαδή, ορίζουµε την τυχαία

µεταβλητή X(ω) = ω, όπου ω = 1, 2, 3, 4, 5, 6.

Παρατηρείστε, ότι παρόλα αυτά θα µπορούσε κανείς, για λόγους που εξυπηρε-

τούν τις ανάγκες του, να ορίσει µια άλλη τυχαία µεταβλητή X1, για τα στοιχεία

του δειγµατοχώρου Ω, ως εξής :

X1(ω) = 6− ω, όπου ω = 1, 2, 3, 4, 5, 6

Παράδειγµα 4.3 Στο πείραµα ρίψης δύο διακεκριµένων ζαριών όπου ο δειγ-

µατοχώρος αποτελείται από 36 διατεταγµένες δυάδες αριθµών της µορφής ω =(i, j), όπου i, j = 1, 2, 3, 4, 5, 6, θα µπορούσαµε να ορίσουµε την τυχαία µε-

ταβλητή που δίνεται από το άθροισµα των αποτελεσµάτων των δύο ζαριών,

δηλαδή :

X(ω) = i + j

Συνάρτηση πιθανότητας διακριτής τυχαίας µεταβλητής

Ορισµός 4.4 Έστω µια διακριτή τυχαία µεταβλητή X, που παίρνει τις τιµές

x1, x2, x3, . . ., τότε η συνάρτηση

f(x) =

P (X = xi), x = x1, x2, . . .

0, x = xi, i = 1, 2, 3, . . .

ονοµάζεται συνάρτηση πιθανότητας της διακριτής τυχαίας µεταβλητής X,όπου P (X = xi) εκφράζει την πιθανότητα η τυχαία µεταβλητή X να πάρει την

τιµή xi.

Η συνάρτηση f(x) ικανοποιεί τις παρακάτω ιδιότητες :

• f(x) > 0, για x = x1, x2, . . .

• f(x) = 0, για x = xi, i = 1, 2, 3, . . .

• ∑

if(xi) = 1

Παράδειγµα 4.5 Θεωρούµε το πείραµα ρίψης δύο διακεκριµένων ζαριών ό-

που για κάθε ενδεχόµενο της µορφής ω = (i, j), όπου i, j = 1, 2, 3, 4, 5, 6,ορίζουµε την τυχαία µεταβλητή X(ω) = i + j. Ο δειγµατοχώρος αποτελείται

Συνάρτηση πιθανότητας διακριτής τυχαίας µεταβλητής 39

από 36 απλά ενδεχόµενα (διατεταγµένα ζεύγη), ενώ η τυχαία µεταβλητή X µπο-

ρεί να πάρει ακέραιες τιµές από 2 έως 12. Μας ενδιαφέρει να ορίσουµε τη

συνάρτηση πιθανότητας της τ.µ. X, δεδοµένου ότι όλα τα απλά ενδεχόµενα του

δειγµατοχώρου είναι ισοπίθανα.

Ουσιαστικά για να ορίσουµε τη συνάρτηση πιθανότητας της τ.µ. X, πρέπει ναυπολογίσουµε τις πιθανότητες εµφάνισης κάθε µιας από τις διακριτές τιµές που

µπορεί να πάρει η τ.µ. Στον παρακάτω πίνακα παρουσιάζουµε συνοπτικά τον

υπολογισµό αυτό :

xi Ευνοϊκά ζεύγη Πλήθος ζευγών P (X = xi)2 (1, 1) 1 1/363 (1, 2), (2, 1) 2 2/364 (1, 3), (2, 2), (3, 1) 3 3/365 (1, 4), (2, 3), (3, 2), (4, 1) 4 4/366 (1, 5), (2, 4), (3, 3), (4, 2), (5, 1) 5 5/367 (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) 6 6/368 (2, 6), (3, 5), (4, 4), (5, 3), (6, 2) 5 5/369 (3, 6), (4, 5), (5, 4), (6, 3) 4 4/3610 (4, 6), (5, 5), (6, 4) 3 3/3611 (5, 6), (6, 5) 2 2/3612 (6, 6) 1 1/36

Άρα η συνάρτηση πιθανότητας για την τ.µ. X είναι

f(x) = P (X = xi)

όπου το P (X = xi) δίνεται από τον παραπάνω πίνακα και η γραφική της πα-

ράσταση είναι :

0 2 4 6 8 10 12 140.0

0.1

0.2

x

f(x)

40 Τυχαίες Μεταβλητές - Κατανοµές

Συνάρτηση κατανοµής διακριτής τυχαίας µεταβλητής

Συχνά είναι χρήσιµο να µπορούµε να υπολογίσουµε άµεσα την πιθανότητα µια

δεδοµένη διακριτή τ.µ. να παίρνει τιµή µικρότερη ή ίση από µια δεδοµένη τιµή

x.Ένας τέτοιος υπολογισµός µπορεί να πραγµατοποιηθεί εύκολα αθροίζοντας

κατάλληλα τιµές της συνάρτησης πιθανότητας της τ.µ. Η νέα αυτή συνάρτηση

ορίζεται ως εξής :

Ορισµός 4.6 Έστω µια διακριτή τυχαία µεταβλητή X, που παίρνει τις τιµές

x1, x2, x3, . . . , τότε η συνάρτηση

F (x) = P (X ≤ x)

ονοµάζεται αθροιστική συνάρτηση κατανοµής ή απλά συνάρτηση κατανοµής

της τυχαίας µεταβλητής X.

Προφανώς η συνάρτηση κατανοµής της τ.µ. µεταβλητής X, µπορεί να εκφρα-

στεί µε τη βοήθεια της αντίστοιχης συνάρτησης πιθανότητας ως εξής :

F (x) =∑

u≤x

f(u) =∑

xi≤x

f(xi)

Επιπλέον, εύκολα µπορούµε να διαπιστώσουµε τις ακόλουθες ιδιότητες :

• F (−∞) = 0 και F (+∞) = 1

• Για κάθε a < b, ισχύει F (a) ≤ F (b), δηλαδή η F (.) είναι αύξουσα συνάρ-

τηση.

• P (a < X ≤ b) = P (X ≤ b)− P (X ≤ a) = F (b)− F (a)

Παράδειγµα 4.7 Στο παράδειγµα 4.5, µπορούµε να κατασκευάσουµε την συ-

νάρτηση κατανοµής ως εξής :

FX(x) =

0, x < 2136 , 2 ≤ x < 3336 , 3 ≤ x < 4636 , 4 ≤ x < 51036 , 5 ≤ x < 61536 , 6 ≤ x < 72136 , 7 ≤ x < 82636 , 8 ≤ x < 93036 , 9 ≤ x < 103336 , 10 ≤ x < 113536 , 11 ≤ x < 123636 , 12 ≤ x

της οποίας η γραφική παράσταση έχει τη µορφή :

Μέση τιµή, διασπορά διακριτής τυχαίας µεταβλητής 41

0 2 4 6 8 10 12 140.0

0.5

1.0

x

F(x)

Μέση τιµή, διασπορά διακριτής τυχαίας µεταβλητής

Κεντρικό ρόλο στις πιθανότητες, αλλά και στη στατιστική παίζει η έννοια της

µέσης τιµής. Η µέση τιµή είναι το σηµαντικότερο από τα µέτρα θέσης ή κε-

ντρικής τάσης, καθώς εκφράζει την αναµενόµενη τιµή της τυχαίας µεταβλητής

σε ένα πείραµα.

Ορισµός 4.8 Έστω X µια διακριτή τυχαία µεταβλητή που παίρνει τις τιµές

x1, x2, x3, ... µε συνάρτηση πιθανότητας f(x). Ορίζουµε ως µέση ή αναµενό-

µενη τιµή της X, την ποσότητα

E(X) = µ =∑

i

xif(xi)

Ιδιότητες της µέσης τιµής

• E(c) = c, όπου c ∈ R• E(aX + b) = aE(X) + b, όπου a, b ∈ R• Αν X είναι µια διακριτή τ.µ. µε συνάρτηση πιθανότητας f(x) και g(X)

µια οποιαδήποτε συνάρτηση της X , τότε :

E(g(X)) =∑

i

g(xi)f(xi)

• Αν g(X), h(X) είναι συναρτήσεις της διακριτής τ.µ.X, τότε

E(g(X)± h(X)) = E(g(X))±E(h(X))

42 Τυχαίες Μεταβλητές - Κατανοµές

Παράδειγµα 4.9 Να υπολογιστεί η µέση τιµή της τ.µ. X, που ορίστηκε στο

παράδειγµα 4.5.

Σύµφωνα µε τον ορισµό της µέσης τιµής, έχουµε :

EX =∑

i

xif(xi) =

= 21

36+ 3

2

36+ 4

3

36+ 5

4

36+ 6

5

36+

+76

36+ 8

5

36+ 9

4

36+ 10

3

36+ 11

2

36+ 12

1

36= 7

Επίσης, σηµαντικό ρόλο παίζει η διακύµανση, η οποία είναι το σηµαντικότερο

µέτρο διασποράς ή µεταβλητότητας, αφού εκφράζει πόσο µακριά “απλώνο-

νται” οι τιµές της τυχαίας µεταβλητής γύρω από το µέσο όρο της.

Ορισµός 4.10 Έστω X µια διακριτή τυχαία µεταβλητή που παίρνει τις τιµές

x1, x2, x3, ... µε συνάρτηση πιθανότητας f(x). Ορίζουµε ως διακύµανση ή

διασπορά της X, την ποσότητα

V ar(X) = σ2 = E(X − µ)2 =∑

i

(xi − µ)2f(xi)

όπου µ = E(X) είναι η µέση τιµή της X.

Ιδιότητες της διακύµανσης

• V ar(X) = E(X2)− (E(X))2

• V ar(aX + b) = a2V ar(X), όπου a, b ∈ R

Ορισµός 4.11 Η θετική τετραγωνική ρίζα της διακύµανσης µιας τυχαίας µετα-

βλητής X, δηλαδη η ποσότητα

σ =√

V ar(X) =√σ2

ονοµάζεται τυπική απόκλιση, ενώ η ποσότητα

CV =σ

µόπου µ η µέση τιµή της τ.µ. ονοµάζεται συντελεστής µεταβλητότητας

Η τυπική απόκλιση, σε αντίθεση µε τη διακύµανση, έχει το πλεονέκτηµα ότι

εκφράζει τη µεταβλητότητα της τ.µ. σε µονάδες ίδιες µε αυτές της τ.µ., ενώ ο

συντελεστής µεταβλητότητας εκφράζει τη µεταβλητότητα της τ.µ. σε αναλογία

µε τη µέση τιµή της (είναι κατά µια έννοια ποσοστιαία κλίµακα).

Παράδειγµα 4.12 Να υπολογιστεί η διακύµανση ης τ.µ. X, που ορίστηκε στο

παράδειγµα 4.5.

Σηµαντικές διακριτές κατανοµές 43

Σύµφωνα µε τον ορισµό της διακύµανσης και λαµβάνοντας υπόψη τον υπολο-

γισµό της µέσης τιµής που έγινε στο παράδειγµα 4.9, έχουµε :

V arX =∑

i

(xi − µ)2f(xi) =

= (2− 7)2 × 1

36+ (3− 7)2 × 2

36+ (4− 7)2 × 3

36+

+(5− 7)2 × 4

36+ (6− 7)2 × 5

36+ (7− 7)2 × 6

36+

+(8− 7)2 × 5

36+ (9− 7)2 × 4

36+ (10− 7)2 × 3

36+

+(11− 7)2 × 2

36+ (12− 7)2 × 1

36= 5.833

Σηµαντικές διακριτές κατανοµές

Παρακάτω εξετάζουµε µερικές από τις γνωστότερες κατανοµές διακριτών τυ-

χαίων µεταβλητών που παρουσιάζουν µεγάλο ενδιαφέρον λόγω των πολλών

εφαρµογών τους.

Οµοιόµορφη κατανοµή

Η οµοιόµορφη κατανοµή εµφανίζεται σε προβλήµατα όπου η τυχαία µεταβλη-

τή µπορεί να πάρει ένα πεπερασµένο πλήθος διακεκριµένες τιµές, οι οποίες

έχουν την ίδια πιθανότητα εµφάνισης. Η συνάρτηση πιθανότητας µια τυχαίας

µεταβλητής X, που παίρνει τιµές x1, x2, . . . , xn και ακολουθεί την οµοιόµορ-

φη κατανοµή είναι

f(x) =

1n , x = xi0 αλλού

Παράδειγµα 4.13 Στο πείραµα ρίψης ενός ζαριού, αν ταυτίσουµε το αποτέλε-

σµα της ρίψης µε µια τυχαία µεταβλητή X, µε τιµές 1, 2, 3, 4, 5, 6, η συνάρτηση

πιθανότητας είναι

f(x) =

1n , x = 1, 2, 3, 4, 5, 60 αλλού

αφού όλα τα ενδεχόµενα είναι ισοπίθανα. ∆ηλαδή η X ακολουθεί οµοιόµορφη

κατανοµή.

44 Τυχαίες Μεταβλητές - Κατανοµές

Κατανοµή Bernoulli

Η κατανοµή Bernoulli εµφανίζεται σε πειράµατα που έχουν δύο δυνατά α-

ποτελέσµατα, ένα που αντιπροσωπεύει την επιτυχία και πραγµατοποιείται µε

πιθανότητα p και ένα την αποτυχία µε πιθανότητα 1−p. Αντιστοιχίζοντας στα

δυο πιθανά αποτελέσµατα µε τις τιµές 1 και 0, ορίζουµε µια τυχαία µεταβλητή

X , που ακολουθεί την κατανοµή Bernoulli µε συνάρτηση πιθανότητας :

f(x) =

1− p, x = 0p, x = 10, αλλού

Η (αθροιστική) συνάρτηση κατανοµής της X είναι προφανώς :

F (x) =

0, x < 01− p, 0 ≤ x < 1

1, 1 ≤ x

Εύκολα προκύπτει ότι

E(X) = 0× (1− p) + 1× p = p

V ar(X) = (0− p)2(1− p) + (1− p)2p = p(1− p)

Παράδειγµα 4.14 Σε ένα κουτί υπάρχουν 5 κόκκινες και 10 πράσινες µπάλες.

∆ιαλέγουµε τυχαία µια µπάλα και θεωρούµε επιτυχία το ενδεχόµενο επιλογής

κόκκινης µπάλας. Η τυχαία µεταβλητή που προκύπτει αντιστοιχίζοντας τον α-

ριθµό 1 στην επιλογή κόκκινης µπάλας και τον αριθµό 0 στην επιλογή πράσινης

µπάλας, ακολουθεί την κατανοµή Bernoulli, µε συνάρτηση πιθανότητας :

f(x) =

1015 , x = 0515 , x = 10, αλλού

∆ιωνυµική κατανοµή

Η διωνυµική κατανοµή αφορά πειράµατα τα οποία αποτελούνται από µια σειρά

επαναλήψεων, η καθέ µια από τις οποίες ακολουθεί την κατανοµή Bernoulli

µε πιθανότητα επιτυχίας p. Ορίζουµε µια τυχαία µεταβλητή X που µετράει το

πλήθος των επιτυχιών, αν πραγµατοποιηθούν n επαναλήψεις. Αποδεικνύεται

ότι η συνάρτηση πιθανότητας της διωνυµικής κατανοµής είναι

f(x) =

(nx

)px(1− p)n−x, x = 0, 1, 2, . . . , n

0, αλλού

Σηµαντικές διακριτές κατανοµές 45

όπου η ποσότητα(nx

)ονοµάζεται το διωνυµικός συντελεστής και είναι

(n

x

)=

n!

(n− x)!x!Αποδεικνύεται ότι

E(X) = np

V ar(X) = np(1− p)

Παράδειγµα 4.15 Θεωρούµε ότι το πείραµα του παραδείγµατος 4.14 εκτελεί-

ται 10 φορές, όπου σε κάθε επανάληψη η µπάλα που επιλέχθηκε επανατοποθε-

τείται στο κουτί.

(α) Ποια η πιθανότητα να διαλέξουµε ακριβώς 5 κόκκινες µπάλες.

(β) Ποια η πιθανότητα να διαλέξουµε περισσότερες από 8 κόκκινες µπάλες.

(γ) Ποιος είναι ο αναµενόµενος αριθµός επιλογής κόκκινων µπαλών.

(α) Ορίζοντας την τυχαία µεταβλητή X, ως αριθµός επιτυχιών (όπου επιτυχία

θεωρείται η επιλογή κόκκινης µπάλας) στις 10 διαδοχικές επαναλήψεις, η Xακολουθεί τη διωνυµική κατανοµή, µε συνάρτηση πιθανότητας

f(x) =

(10x

)( 515)

x(1015)10−x, x = 0, 1, 2, . . . , 10

0, αλλού

Άρα το ζητούµενο είναι

P (X = 5) = f(5) =

(10

5

)(5

15)5(

10

15)5 ≃ 0.13656

(β) Με την τυχαία µεταβλητή που ορίστηκε στο (α), έχουµε

P (X > 8) = P (X = 9) + P (X = 10) = f(9) + f(10) =

=

(10

9

)(5

15)9(

10

15)1 +

(10

10

)(5

15)10(

10

15)0 ≃ 3.5564× 10−4

(γ) Το ζητούµενο είναι ο υπολογισµός της µέσης τιµής της X, η οποία είναι

E(X) = np = 10× 5

15=

10

3≃ 3.3333

Κατανοµή Poisson

Έστω ένα γεγονός, το οποίο γνωρίζουµε ότι πραγµατοποιείται κατά µέσο όρο

λ φορές στη µονάδα του χρόνου (ή του µήκους ή του όγκου). Για παράδειγµα :

• Πλήθος τηλεφωνηµάτων που δέχεται ένα τηλεφωνικό κέντρο σε ένα 5 –

λεπτο.

• Πλήθος ελαττωµατικών προϊόντων που παράγει ένα εργοστάσιο σε µία ώρα.

46 Τυχαίες Μεταβλητές - Κατανοµές

• Πλήθος λαθών σε µία σελίδα ενός βιβλίου.

• Πλήθος δένδρων σε 100 τ.µ. ενός δάσους.

Αν ονοµάσουµε X την τυχαία µεταβλητή που µετρά το πλήθος των εµφανίσεων

του γεγονότος στη µονάδα του χώρου ή του χρόνου, αποδεικνύεται ότι η τυχαία

µεταβλητή ακολουθεί την κατανοµή που είναι γνωστή ως κατανοµή Poisson,

µε συνάρτηση πιθανότητας :

f(x) =

e−λ λx

x! , x = 0, 1, 2, . . .0, αλλού

Η µέση τιµή και η διακύµανση της τ.µ. X που ακολουθεί κατανοµή Poisson

δίνονται από τους τύπους :

E(X) = λ

V ar(X) = λ

Παράδειγµα 4.16 Σε ένα τυπογραφείο έχει διαπιστωθεί ότι σε κάθε βιβλίο

εµφανίζονται κατά µέσο όρο 15 τυπογραφικά λάθη.

(α) Ποιά η πιθανότητα σε ένα βιβλίο να εµφανιστούν 13 ακριβώς τυπογραφικά

λάθη.

(β) Ποιά η πιθανότητα σε ένα βιβλίο να εµφανιστούν λιγότερα από 3 τυπογρα-

φικά λάθη.

(α) Η τυχαία µεταβλητή X, που µετράει τον αριθµό των τυπογραφικών λαθών,

ακολουθεί κατανοµή Poisson µε λ = 15. Άρα

P (X = 13) = f(13) = e−151513

13!≃ 0.0956

(β) Η πιθανότητα να εµφανιστούν λιγότερα από 3 τυπογραφικά λάθη θα είναι

P (X < 3) = P (X = 0) + P (X = 1) + P (X = 2) = f(0) + f(1) + f(2) =

= e−15150

0!+ e−15

151

1!+ e−15

152

2!≃ 3.9308× 10−5

Γενικά Παραδείγµατα

Παράδειγµα 4.17 Ένας πωλητής αυτοκινήτων υπολόγισε ότι ο αριθµός X,

των αυτοκινήτων που πουλά κάθε εβδοµάδα, ακολουθεί την παρακάτω συνάρ-

τηση πιθανότητας :

f(x) =

kx2

x! , x = 1, 2, 3, 40, αλλού

Γενικά Παραδείγµατα 47

(α) Να υπολογιστεί η τιµή της σταθεράς k

(β) Βρείτε την πιθανότητα ότι ο πωλητής σε µία εβδοµάδα, θα πουλήσει τουλά-

χιστον δύο αυτοκίνητα.

(α) Για να είναι η f(x) συνάρτηση πιθανότητας πρέπει το άθροισµα των πι-

θανοτήτων για όλες τις δυνατές τιµές της τ.µ. X, να είναι ίσο µε 1. ∆ηλαδή,

πρέπει :4∑

i=1

f(xi) = 1

12k

1!+

22k

2!+

32k

3!+

42k

4!= 1

(12

1!+

22

2!+

32

3!+

42

4!)k = 1

31

6k = 1

k =6

31

(β) Για αυτό τον υπολογισµό µπορούµε να δουλέψουµε µε δύο τρόπους. Με τον

πρώτο τρόπο θα έχουµε

P (X ≥ 2) = P (X = 2) + P (X = 3) + P (X = 4) =

= f(2) + f(3) + f(4) =6

31

22

2!+

6

31

32

3!+

6

31

42

4!=

=25

31≃ 0.806 45

Mε τον δεύτερο τρόπο υπολογίζουµε την πιθανότητα του συµπληρωµατικού εν-

δεχοµένου και την αφαιρούµε από το 1. ∆ηλαδή

P (X ≥ 2) = 1− P (X = 1) =

= 1− 6

31

12

1!=

25

31≃ 0.806 45

Παρατηρείστε ότι µε τον δεύτερο τρόπο χρειάστηκαν λιγότεροι υπολογισµοί.

Παράδειγµα 4.18 Μιά µικρή εταιρεία πώλησης µηχανών, πουλά 1 µηχανή το

µήνα µε πιθανότητα 0,3, και 2 µηχανές το µήνα µε πιθανότητα 0,1. Ποτέ δεν

πουλά περισσότερες από 2 µηχανές. Αν X παριστάνει τον αριθµό των µηχανών

που πωλούνται κάθε µήνα,

(α) Βρείτε τη µέση τιµή και τη διασπορά της X.

(β) Αν το µηνιαίο κέρδος του δίνεται από τον τύπο 2X2 +3X +1 (σε χιλιάδες

€), υπολογίστε το µηνιαίο αναµενόµενο κέρδος .

(α) Η συνάρτηση πιθανότητας της τ.µ. µεταβλητής X είναι σύµφωνα µε τα

48 Τυχαίες Μεταβλητές - Κατανοµές

δεδοµένα

f(x) =

0.6 x = 00.3 x = 10.1 x = 20 αλλού

Η µέση τιµή της X είναι

µ = E(X) = 0× 0.6 + 1× 0.3 + 2× 0.1 = 0.5

ενώ η διασπορά δίνεται από τον τύπο :

V ar(X) = E(X − µ)2 =

= 0.6× (0− 0.5)2 + 0.3× (1− 0.5)2 + 0.1× (2− 0.5)2 =

= 0.45

(β) Ουσιαστικά το ζητούµενο είναι να βρούµε τη µέση της συνάρτησης της τ.µ.

X που δίνει το κέρδος, δηλαδή :

E(2X2 + 3X + 1) =

= 0.6× (2× 02 + 3× 0 + 1)+

0.3× (2× 12 + 3× 1 + 1)+

0.1× (2× 22 + 3× 2 + 1) =

= 3.9

Παράδειγµα 4.19 Κατά τον έλεγχο της τοξικότητας ενός χηµικού ρύπου που

βρέθηκε σε µολυσµένο νερό, διαπιστώθηκε ότι σε µία συγκεκριµένη συγκέντρωση

σκοτώνει το 20% των ψαριών που κολυµπούν σε αυτό. Αν 20 ψάρια τοποθε-

τηθούν σε πισίνα που έχει την εν λόγω συγκέντρωση, ποιά η πιθανότητα µετά

από 24 ώρες να έχουν επιβιώσει ακριβώς 14;

Θεωρούµε X την τυχαία µεταβλητή που µετράει το πλήθος των ψαριών που

επιζούν στο τοξικό περιβάλλον. Η τ.µ. X ακολουθεί διωνυµική κατανοµή όπου

έχουµε n = 20 επαναλήψεις µιας δοκιµασίας Bernoulli, µε πιθανότητα επιτυχίας

(επιβίωσης του ψαριού) p = 1 − 0.20 = 0.8. Η τυχαία µεταβλητή X θα έχει

συνάρτηση πιθανότητας :

f(x) =

(20x

)(0.8)x(0.2)20−x, x = 0, 1, 2, . . . , 20

0, αλλού

Άρα η ζητούµενη πιθανότητα θα δίνεται από τον τύπο :

P (X = 14) = f(14) =

=

(20

14

)(0.8)14(0.2)20−14

= 0.109 1

Γενικά Παραδείγµατα 49

Παράδειγµα 4.20 Εργοστάσιο παραγωγής ηλεκτρικών ασφαλειών, παράγει 10%

ελαττωµατικές. Αν διαλέξουµε τυχαία τέσσερις ασφάλειες από το σύνολο της πα-

ραγωγής, ποιά η πιθανότητα

(α) Ακριβώς µία ασφάλεια να είναι ελαττωµατική;

(β) Τουλάχιστον µία να είναι ελαττωµατική;

(γ) Ας υποθέσουµε ότι οι 4 ασφάλειες που επιλέγονται τυχαία συσκευάζονται

χωρίς να ελεγχθούν, και διοχετεύονται µε εγγύηση στο εµπόριο. Αν το κόστος

επιδιόρθωσης για µία τέτοια συσκευασία δίνεται από τη σχέση K(X) = 3X2,

όπου X ο αριθµός των ελαττωµατικών ασφαλειών, να βρεθεί το αναµενόµενο

κόστος επιδιόρθωσης.

(α) Έστω X η τυχαία µεταβλητή που µετράει το πλήθος των ελαττωµατικών

ασφαλειών. Η τ.µ. X ακολουθεί διωνυµική κατανοµή όπου έχουµε n = 4επαναλήψεις µιας δοκιµασίας Bernoulli, µε πιθανότητα επιτυχίας (ελαττωµατική

ασφάλεια) p = 0.1. Η τυχαία µεταβλητή X θα έχει συνάρτηση πιθανότητας :

f(x) =

(4x

)(0.1)x(0.9)4−x, x = 0, 1, 2, 3, 4

0, αλλού

Η πιθανότητα µια ακριβώς ασφάλεια να είναι ελαττωµατική θα είναι

P (X = 1) = f(1) =

=

(4

1

)(0.1)1(0.9)4−1

= 0.2916

(β) Η πιθανότητα τουλάχιστον µία ασφάλεια να είναι ελαττωµατική µπορεί να

υπολογιστεί εύκολα µέσω του συµπληρωµατικού ενδεχοµένου. ∆ηλαδή θα υπο-

λογίσουµε την πιθανότητα καµία ασφάλεια να µην είναι ελαττωµατική και θα

την αφαιρέσουµε από την µονάδα. Άρα

P (X ≥ 1) = 1− P (X = 0) =

= 1−(4

0

)(0.1)0(0.9)4−0

= 0.3439

(γ) Θεωρώντας τη συνάρτηση κόστους K(X) = 3X2, ως συνάρτηση της τ.µ.

X, το ζητούµενο είναι να υπολογίσουµε τη µέση τιµή της. ∆ηλαδή

E(K(X)) =4∑

x=0

K(x)f(x) =

=4∑

x=0

3x2(4

x

)(0.1)x(0.9)4−x

= 1.56

50 Τυχαίες Μεταβλητές - Κατανοµές

Παράδειγµα 4.21 Παίρνουµε στην τύχη ένα – ένα µε επανάθεση, ψηφία α-

πό τα 0,1, ...., 9. Πόσα ψηφία πρέπει να πάρουµε για να έχουµε πιθανότητα

τουλάχιστον 9/10 ότι θα εµφανιστεί το ψηφίο 6, τουλάχιστον µία φορά;

Στο πείραµα αυτό θα θεωρήσουµε ότι εκτελούµε διαδοχικές δοκιµασίες Bernoulli,

όπου θεωρούµε επιτυχία την επιλογή του ψηφίου 6 και αποτυχία την επιλογή

οποιουδήποτε άλλου ψηφίου. Η πιθανότητα επιλογής του 6 είναι προφανώς

p = 110 . Θεωρούµε X την τυχαία µεταβλητή που µετράει το πλήθος των επι-

τυχιών (επιλογών του 6), σε n διαδοχικές επαναλήψεις. Η τ.µ. X ακολουθεί

διωνυµική κατανοµή µε συνάρτηση πιθανότητας

f(x) =

(nx

)( 110)

x( 910)n−x, x = 0, 1, 2, . . . , n

0, αλλού

Η πιθανότητα να εµφανιστεί το ψηφίο 6 τουλάχιστον µια φορά µπορεί να υπο-

λογιστεί ευκολότερα µε τη βοήθεια του συµπληρωµατικού ενδεχοµένου. ∆ηλαδή

θα υπολογίσουµε την πιθανότητα να µην εµφανιστεί καµιά φορά το 6 και θα την

αφαιρέσουµε από την µονάδα. Άρα

P (X ≥ 1) = 1− P (X = 0) =

= 1−(n

0

)(1

10)0(

9

10)n−0

= 1− n!

(n− 0)!0!(9

10)n

= 1− (9

10)n

Το ζητούµενο είναι η παραπάνω πιθανότητα να είναι τουλάχιστον 910 . ∆ηλαδή

P (X ≥ 1) ≥ 9

10

1− (9

10)n ≥ 9

10

(9

10)n ≤ 1

10

n ln9

10≤ ln

1

10−0.10536n ≤ −2.3026

n ≥ 21.885

Άρα πρακτικά το ζητούµενο ισχύει για n ≥ 22.

Παράδειγµα 4.22 Από µία γέφυρα περνούν κατά µέσο όρο 300 αυτοκίνητα

την ώρα. Να βρεθεί η πιθανότητα ότι κατά τη διάρκεια 2 λεπτών, θα περάσουν

από τη γέφυρα 3 αυτοκίνητα.

Θεωρώντας ότι ο µέσος αριθµός αυτοκινήτων είναι ανάλογος του χρόνου στον

οποίο αναφέρεται, µπορούµε να πούµε ότι στη διάρκεια των 2 λεπτών θα περά-

Γενικά Παραδείγµατα 51

σουν κατά µέσο όρο

λ = 3002

60= 10 αυτοκίνητα

Έστω X, η τυχαία µεταβλητή που εκφράζει τον αριθµό αυτοκινήτων που περνούν

από τη γέφυρα στη διάρκεια των 2 λεπτών. Η τυχαία µεταβλητή X ακολουθεί

κατανοµή Poisson µε µέσο όρο αφίξεων λ = 10. Άρα η συνάρτηση πιθανότητας

είναι

f(x) =

e−10 10

x

x! , x = 0, 1, 2, . . .0, αλλού

Το ζητούµενο είναι η πιθανότητα να περάσουν από τη γέφυρα 3 αυτοκίνητα, άρα

P (X = 3) = f(3) =

= e−10103

3!=

= 7.566 7× 10−3

Παράδειγµα 4.23 Το τηλέφωνο µιας γραµµατείας µιας υπηρεσίας, χτυπά κατά

µέσο όρο δύο φορές κάθε τέταρτο της ώρας. Να βρεθεί η πιθανότητα

(α) Να χτυπήσει το πολύ δύο φορές στο επόµενο τέταρτο

(β) Να χτυπήσει το πολύ δύο φορές στην επόµενη ώρα

(γ) Να χτυπήσει το πολύ δύο φορές, σε τρία από τα επόµενα τέσσερα τέταρτα.

(α) Η τυχαία µεταβλητή X, ακολουθεί κατανοµή Poisson µε µέσο όρο λ = 2χτυπήµατα ανά τέταρτο της ώρας. Η συνάρτηση πιθανότητας της X είναι

f(x) =

e−2 2

x

x! , x = 0, 1, 2, . . .0, αλλού

Άρα η ζητούµενη πιθανότητα θα είναι

P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) =

= f(0) + f(1) + f(2) =

= e−220

0!+ e−2

21

1!+ e−2

22

2!=

= e−2(1 + 2 + 2) = 5e−2 ≃ 0.676 68

(β) Θεωρώντας ότι ο µέσος αριθµός χτυπηµάτων είναι ανάλογος του χρόνου

στον οποίο αναφέρεται, µπορούµε να πούµε ότι στη διάρκεια των µιας ώρας (4

τέταρτα) θα το τηλέφωνο θα χτυπήσει κατά µέσο όρο

λ = 2× 4 = 8 φορές

Η αντίστοιχη τ.µ. που ακολουθεί κατανοµή Poisson, έχει συνάρτηση πιθανότη-

τας

f(x) =

e−8 8

x

x! , x = 0, 1, 2, . . .0, αλλού

52 Τυχαίες Μεταβλητές - Κατανοµές

Άρα η ζητούµενη πιθανότητα θα είναι

P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) =

= f(0) + f(1) + f(2) =

= e−880

0!+ e−8

81

1!+ e−8

82

2!≃ 0.01375 4

(γ) Στο υποερώτηµα (α) υπολογίσαµε την πιθανότητα να έχουµε τουλάχιστον

2 χτυπήµατα σε ένα τέταρτο. Στο παρόν ερώτηµα µπορούµε να θεωρήσουµε

ότι έχουµε τέσσερις διαδοχικές επαναλήψεις µιας δοκιµασίας Bernoulli, όπου

σε κάθε µια από τις επαναλήψεις θεωρούµε επιτυχή έκβαση του πειράµατος

να συµβεί να έχουµε τουλάχιστον 2 χτυπήµατα σε ένα τέταρτο. Η πιθανότητα

επιτυχίας είναι σύµφωνα µε το (α), p = 5e−2.

Θεωρούµε την τυχαία µεταβλητή X, που µετράει τον αριθµό επιτυχιών στις

τέσσερις επαναλήψεις του πειράµατος, δηλαδή στα τέσσερα τέταρτα. Η X ακο-

λουθεί διωνυµική κατανοµή µε συνάρτηση πιθανότητας

f(x) =

(4x

)(5e−2)x(1− 5e−2)4−x, x = 0, 1, 2, 3, 4

0, αλλού

Η ζητούµενη πιθανότητα είναι

P (X = 3) = f(3) =

=

(4

3

)(5e−2)3(1− 5e−2)4−3

≃ 0.400 72

Συνάρτηση κατανοµής και πυκνότητας πιθανότητας συνεχούς τ.µ.

Όταν η τυχαία µεταβλητή που εξετάζουµε µπορεί να πάρει σαν τιµή οποιοδή-

ποτε πραγµατικό αριθµό, τότε η τυχαία µεταβλητή ονοµάζεται συνεχής. Πα-

ραδείγµατα τέτοιων τυχαίων µεταβλητών µπορεί να είναι µετρήσεις µήκους,

χρόνου, βάρους ή γενικότερα οποιουδήποτε µεγέθους µε συνεχή χαρακτήρα

που µπορεί προκύψει σαν αποτέλεσµα ενός πειράµατος. Αντίθετα µε τις δια-

κριτές τυχαίες µεταβλητές, στις συνεχείς δεν µπορούµε να ορίσουµε την πι-

θανότητα η µεταβλητή να πάρει µια µεµονωµένη τιµή, αφού κάτι τέτοιο θα

έδινε πρακτικά πιθανότητα 0.

Για να µπορέσουµε να ορίσουµε το αντίστοιχο της συνάρτησης πιθανότητας

µιας συνεχούς τυχαίας µεταβλητής πρέπει να ορίσουµε προηγουµένως την

Συνάρτηση κατανοµής και πυκνότητας πιθανότητας συνεχούς τ.µ. 53

αθροιστική συνάρτηση κατανοµής της. Η αθροιστική συνάρτηση κατανοµής,

ορίζεται αντίστοιχα µε αυτή των διακριτών τ.µ., ως εξής :

Ορισµός 4.24 Έστω µια συνεχής τυχαία µεταβλητή X, που παίρνει πραγµατι-

κές τιµές. Τότε η συνάρτηση

F (x) = P (X ≤ x)

ονοµάζεται αθροιστική συνάρτηση κατανοµής ή απλά συνάρτηση κατανοµής

της τυχαίας µεταβλητής X.

Εύκολα µπορούµε να διαπιστώσουµε ότι η αθροιστική συνάρτηση κατανοµής

µιας συνεχούς τ.µ. έχει τις ακόλουθες ιδιότητες :

• F (−∞) = 0 και F (+∞) = 1

• Για κάθε a < b, ισχύει F (a) ≤ F (b), δηλαδή η F (.) είναι αύξουσα συνάρ-

τηση.

• P (a < X ≤ b) = P (X ≤ b)− P (X ≤ a) = F (b)− F (a)

Το αντίστοιχο της συνάρτησης πιθανότητας των διακριτών τυχαίων µεταβλη-

τών, είναι η συνάρτηση πυκνότητας πιθανότητας που ορίζεται παρακάτω :

Ορισµός 4.25 Αν F (x) είναι η αθροιστική συνάρτηση κατανοµής µιας συνε-

χούς τυχαίας µεταβλητής τότε, συνάρτηση f(x) που ορίζεται από τη σχέση

F (x) =

∫ x

−∞

f(u)du

ονοµάζεται συνάρτηση πυκνότητας πιθανότητας της τ.µ. X. Για την συνάρ-

τηση πυκνότητας πιθανότητας ισχύει :

• f(x) ≥ 0, για κάθε −∞ ≤ x ≤ +∞•∫ +∞−∞

f(x)dx = 1

Επιπλέον αν η F (x) είναι παραγωγίσιµη ισχύει

f(x) = F ′(x)

Αν f(x) είναι η συνάρτηση πυκνότητας πιθανότητας µιας συνεχούς τυχαίας

µεταβλητής, τότε προφανώς µε βάση τα παραπάνω, για κάποιο απειροστό dx,

ισχύει

P (x < X ≤ x + dx) = F (x + dx)− F (x)

Αν θεωρήσουµε ότι η F (x) είναι παραγωγίσιµη, παίρνουµε

P (x < X ≤ x + dx)

dx=

F (x + dx)− F (x)

dx= F ′(x) = f(x)

54 Τυχαίες Μεταβλητές - Κατανοµές

ή

P (x < X ≤ x + dx) = f(x)dx

Με άλλα λόγια η (απειροστή) ποσότητα f(x)dx, εκφράζει την πιθανότητα η

τυχαία µεταβλητή να βρίσκεται στο απειροστό διάστηµα (x, x + dx).

Παράδειγµα 4.26 Θεωρούµε την τυχαία µεταβλητή µε αθροιστική συνάρτηση

κατανοµής

F (x) =

0, x < 0x, 0 ≤ x ≤ 11, x > 1

Η γραφική παράσταση της F (x) είναι

x

F(x)

1

10

Η συνάρτηση πυκνότητας πιθανότητας θα είναι

f(x) = F ′(x) =

0, x < 01, 0 ≤ x ≤ 10, x > 1

της οποίας η γραφική παράσταση είναι

Μέση τιµή, διασπορά συνεχούς τυχαίας µεταβλητής 55

x

f(x)

1

10

Μέση τιµή, διασπορά συνεχούς τυχαίας µεταβλητής

Αντίστοιχα µε τις διακριτές τυχαίες µεταβλητές µπορούµε να ορίσουµε µέτρα

θέσης και διασποράς για τις συνεχείς τ.µ. Η µέση τιµή µια συνεχούς τ.µ.

ορίζεται ως εξής :

Ορισµός 4.27 Έστω X µια συνεχής τυχαία µεταβλητή που παίρνει πραγµατι-

κές τιµές, µε συνάρτηση πυκνότητας πιθανότητας f(x). Ορίζουµε ως µέση ή

αναµενόµενη τιµή της X, την ποσότητα

E(X) = µ =

∫ +∞

−∞

xf(x)dx

Ιδιότητες της µέσης τιµής

• E(c) = c, όπου c ∈ R• E(aX + b) = aE(X) + b, όπου a, b ∈ R• Αν X είναι µια συνεχής τ.µ. µε συνάρτηση πιθανότητας f(x) και g(X)

µια οποιαδήποτε συνάρτηση της X , τότε :

E(g(X)) =

∫ +∞

−∞

g(x)f(x)dx

• Αν g(X), h(X) είναι συναρτήσεις της συνεχούς τ.µ.X, τότε

E(g(X)± h(X)) = E(g(X))±E(h(X))

Παράδειγµα 4.28 Να υπολογιστεί η µέση τιµή της τ.µ. X, που ορίστηκε στο

παράδειγµα 4.26.

56 Τυχαίες Μεταβλητές - Κατανοµές

Σύµφωνα µε τον ορισµό της µέσης τιµής, έχουµε :

µ = E(X) =

∫ +∞

−∞

xf(x)dx =

=

∫ 1

0xdx =

[x2

2

]1

0

=

=1

2

Η διασπορά µιας συνεχούς τ.µ ορίζεται παρακάτω :

Ορισµός 4.29 ΈστωX µια συνεχής τυχαία µεταβλητή που παίρνει πραγµατικές

τιµές, µε συνάρτηση πυκνότητας πιθανότητας f(x). Ορίζουµε ως διακύµανση

ή διασπορά της X, την ποσότητα

V ar(X) = σ2 = E(X − µ)2 =

∫ +∞

−∞

(x− µ)2f(x)dx

όπου µ = E(X) είναι η µέση τιµή της X.

Ιδιότητες της διακύµανσης

• V ar(X) = E(X2)− (E(X))2

• V ar(aX + b) = a2V ar(X), όπου a, b ∈ R

Παράδειγµα 4.30 Να υπολογιστεί η διακύµανση ης τ.µ. X, που ορίστηκε στο

παράδειγµα 4.26.

Σύµφωνα µε τον ορισµό της διακύµανσης και λαµβάνοντας υπόψη τον υπολο-

γισµό της µέσης τιµής που έγινε στο παράδειγµα 4.28, έχουµε :

V arX =

∫ +∞

−∞

(x− µ)2f(x)dx =

=

∫ 1

0(x− 1

2)2dx =

=1

3

[(x− 1

2)3]1

0

=

=1

3(1

2)3 +

1

3(1

2)3 =

1

12

Σηµαντικές συνεχείς κατανοµές

Οι παρακάτω γνωστές κατανοµές συνεχών τυχαίων µεταβλητών, παρουσιάζουν

ιδιαίτερο ενδιαφέρον.

Σηµαντικές συνεχείς κατανοµές 57

Οµοιόµορφη κατανοµή

Πρόκειται για το συνεχές αντίστοιχο της διακριτής οµοιόµορφης κατανοµής,

µε τη διαφορά ότι τώρα θεωρούµε ότι η συνάρτηση πυκνότητας πιθανότητας

είναι σταθερή σε ένα πεπερασµένο διάστηµα (a, b). ∆ηλαδή, η συνάρτηση

πυκνότητα πιθανότητας είναι :

f(x) =

1

b−a a ≤ x ≤ b0 αλλού

x

f(x)

1/(b-a)

ba

ενώ προφανώς η αντίστοιχη αθροιστική συνάρτηση κατανοµής είναι

F (x) =

0 x < ax−ab−a a ≤ x ≤ b1 x > b

x

F(x)

1

ba

58 Τυχαίες Μεταβλητές - Κατανοµές

Όταν µια τυχαία µεταβλητή X ακολουθεί οµοιόµορφη κατανοµή, γράφουµε

X ∼ U(a, b). Εύκολα µπορούµε να αποδείξουµε ότι

E(X) =a + b

2

V ar(X) =(b− a)2

12Η οµοιόµορφη κατανοµή U(0, 1) ονοµάζεται τυποποιηµένη οµοιόµορφη κα-

τανοµή (βλ. παράδειγµα 4.26).

Κανονική Κατανοµή

Η κανονική κατανοµή που είναι επίσης γνωστής ως κατανοµή του Gauss,

είναι µια σηµαντική οικογένεια συνεχών κατανοµών, που εφαρµόζεται σε πάρα

πολλές περιπτώσεις. Κάθε µέλος της οικογένειας αυτής ορίζεται µέσω δύο

παραµέτρων, της µέσης τιµής µ της και της διασποράς της σ2 και συµβολίζεται

N(µ, σ2). Η τυποποιηµένη µορφή της κανονικής κατανοµής αντιστοιχεί στην

περίπτωση µ = 0 και σ2 = 1, δηλαδή η κατανοµή N(0, 1)

Μια τυχαία µεταβλητή X ακολουθεί την κανονική κατανοµή N(µ, σ2), αν η

συνάρτηση πυκνότητας πιθανότητας της είναι

f(x) =1

σ√

2πe−

(x−µ)2

2σ2

-4 -2 2 4

0.2

0.4

0.6

0.8

1.0

x

f(x)µ=0, σ=0.44

µ=0, σ=1.00

µ=0, σ=2.23

µ=−2,σ=0.70

Ενώ η αθροιστική συνάρτηση κατανοµής είναι

F (x) =1

σ√

∫ x

−∞

e−(u−µ)2

2σ2 du

Σηµαντικές συνεχείς κατανοµές 59

-4 -2 2 4

0.2

0.4

0.6

0.8

1.0

x

F(x)µ=0, σ=0.44

µ=0, σ=1.00

µ=0, σ=2.23

µ=−2,σ=0.70

Όταν µια τυχαία µεταβλητή X ακολουθεί κανονική κατανοµή, γράφουµε X ∼N(µ, σ2). Αποδεικνύεται ότι :

E(X) = µ

V ar(X) = σ2

Επειδή το ολοκλήρωµα που δίνει την αθροιστική συνάρτηση κατανοµής, δεν

µπορεί να υπολογιστεί µε τη βοήθεια στοιχειωδών συναρτήσεων, συνήθως

ανάγουµε τους υπολογισµούς των πιθανοτήτων σε πρακτικά προβλήµατα, στην

τυποποιηµένη κανονική κατανοµή. Αποδεικνύεται ότι αν X ∼ N(µ, σ2), τότε

η τυχαία µεταβλητή

Z =X − µ

σ

ακολουθεί την τυποποιηµένη κανονική κατανοµή, δηλαδή :

Z ∼ N(0, 1)

Αξίζει να σηµειώσουµε ότι, στα περισσότερα εγχειρίδια πιθανοτήτων ή στα-

τιστικής υπάρχουν πίνακες που βοηθούν στον υπολογισµό πιθανοτήτων για

την τυποποιηµένη κανονική κατανοµή. Οι πίνακες αυτοί περιέχουν συνήθως

υπολογισµένες τις τιµές της πιθανότητας

Φ(a) = P (Z ≤ a)

για την N(0, 1). Σηµειώστε ότι λόγω συµµετρίας της N(0, 1), ισχύει Φ(−a) =

1−Φ(a).

Παράδειγµα 4.31 Έστω X ∼ N(3, 4), δηλαδή κανονική κατανοµή µε µ = 3και σ2 = 4. Να υπολογιστούν οι πιθανότητες :

60 Τυχαίες Μεταβλητές - Κατανοµές

(α) P (X > 4) (β) P (1 ≤ X < 4) (γ) Να βρεθεί το α ώστε P (|X − 3| < a) =0.95.

(α) Σχηµατίζουµε την κανονικοποιηµένη τ.µ. Z = X−32 η οποία ακολουθεί την

N(0, 1). Αφού θέλουµε

X > 4X − 3

2>

4− 3

2

Z >1

2Άρα ισοδύναµα αναζητούµε την πιθανότητα

P (X > 4) = P (Z >1

2)

= 1− P (Z ≤ 1

2)

= 1−Φ(0.5)

= 1− 0.6915 = 0.3085

(β) Αντίστοιχα

1 ≤ X < 41− 3

2≤ X − 3

2<

4− 3

2

−1 ≤ Z <1

2

Άρα η ζητούµενη πιθανότητα είναι

P (1 ≤ X < 4) = P (−1 ≤ Z <1

2)

= Φ(0.5)−Φ(−1)

= 0.6915− 1 + Φ(1)

= 0.6915− 1 + 0.8413

= 0.532 8

(γ) Πρέπει

|x− 3| < aδηλαδή

−a < x− 3 < aή

−a

2<

x− 3

2<

a

2

−a

2< Z <

a

2

Σηµαντικές συνεχείς κατανοµές 61

Υπολογίζουµε την πιθανότητα

P (−a

2< Z <

a

2) =

= Φ(a

2)−Φ(−a

2) =

= Φ(a

2)− 1 + Φ(

a

2) =

= 2Φ(a

2)− 1

Όµως θέλουµε

P (−a

2< Z <

a

2) = 0.95

2Φ(a

2)− 1 = 0.95

Φ(a

2) = 0.975

Αναζητώντας την τιµή του a2 που δίνει Φ(a2) = 0.975 στον σχετικό πίνακα της

τυποποιηµένης κανονικής κατανοµής, βρίσκουµε ότι

Φ(1.96) = 0.975

Άρα a2 = 1.96 ή a = 3.92.

5 Αριθµητική Ανάλυση - Εισα-

γωγικές Έννοιες

Εισαγωγή

Η αριθµητική ανάλυση είναι ο κλάδος των µαθηµατικών που ασχολείται µε το

σχεδιασµό και την ανάλυση αλγόριθµων για την επίλυση µαθηµατικών προ-

βληµάτων που προκύπτουν στην υπολογιστική επιστήµη και στην τεχνολογία.

Η αριθµητική ανάλυση διακρίνεται από τους περισσότερους άλλους κλάδους

της επιστήµης υπολογιστών από το γεγονός ότι ασχολείται µε συνεχείς πο-

σότητες και όχι διακριτές. Ασχολείται µε συναρτήσεις και εξισώσεις όπου

οι εµπλεκόµενες µεταβλητές, χρόνος, απόσταση, θερµοκρασία, πυκνότητα, πί-

εση κ.λπ., είναι από τη φύση τους ποσότητες µεταβλητές. Τα περισσότερα

από τα προβλήµατα των συνεχών µαθηµατικών (για παράδειγµα, σχεδόν κά-

θε πρόβληµα που εµπλέκει παραγώγους, ολοκληρώµατα ή µη γραµµικότητες)

δεν µπορούν να επιλυθούν µε πεπερασµένο αριθµό πράξεων και για το λό-

γο αυτό πρέπει να επιλυθούν µε µία (θεωρητικά επ’ άπειρον) επαναληπτική

διαδικασία, που τελικά συγκλίνει σε µια λύση του προβλήµατος. Στην πράξη

φυσικά µια τέτοια διαδικασία δεν επαναλαµβάνεται επ’ άπειρον αλλά έως ό-

του η λύση να είναι προσεγγιστικά ορθή, “αρκετά κοντά”, στο επιθυµητό για

πρακτικούς σκοπούς αποτέλεσµα. Έτσι, ένας από τους σηµαντικότερους σκο-

πούς των υπολογιστικών µαθηµατικών είναι η εύρεση ταχέως συγκλινόντων

επαναληπτικών αλγόριθµων καθώς και η εκτίµηση της ακρίβειας της προσεγ-

γιστικής λύσης. Εάν η σύγκλιση είναι ικανοποιητικά ταχεία, ακόµη και κάποια

προβλήµατα που µπορούν να επιλυθούν µε πεπερασµένο αριθµό πράξεων, ό-

πως τα συστήµατα γραµµικών αλγεβρικών εξισώσεων, σε κάποιες περιπτώσεις

είναι προτιµότερο να επιλύονται µε επαναληπτικές µεθόδους. Συνεπώς, ένας

δεύτερος παράγοντας που διακρίνει την αριθµητική ανάλυση είναι η ενασχό-

64 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες

λησή της µε προσεγγίσεις και τις επιπτώσεις τους. Πολλές τεχνικές επίλυσης

εµπλέκουν µία ολόκληρη σειρά από προσεγγίσεις διαφόρων ειδών. Ακόµη

και η αριθµητική που χρησιµοποιείται είναι προσεγγιστική, αφού οι υπολο-

γιστές δεν µπορούν να αναπαραστήσουν όλους τους πραγµατικούς αριθµούς

ακριβώς. Εκτός από τις συνήθεις ιδιότητες που χαρακτηρίζουν τους καλούς

αλγόριθµους, όπως η αποδοτικότητα, οι αριθµητικοί αλγόριθµοι πρέπει επίσης

να είναι όσο το δυνατόν πιο αξιόπιστοι και πιο ακριβείς παρά τις διάφορες

προσεγγίσεις που γίνονται στην πορεία των υπολογισµών.

Για τη λύση ενός υπολογιστικού προβλήµατος, µια βασική µεθοδολογία περι-

λαµβάνει µεταξύ των την αντικατάσταση ενός πολύπλοκου προβλήµατος από

ένα απλούστερο που έχει την ίδια ή τουλάχιστον παραπλήσια λύση. Παρα-

δείγµατα της µεθοδολογίας αυτής περιλαµβάνουν :

• Αντικατάσταση άπειρων διαδικασιών από πεπερασµένες, όπως π.χ. αντικα-

τάσταση ολοκληρωµάτων από αθροίσµατα, σειρών από µερικά αθροίσµατά

τους και παραγώγων από διαιρεµένες διαφορές.

• Αντικατάσταση γενικών πινάκων από άλλους απλούστερης µορφής.

• Αντικατάσταση πολύπλοκων συναρτήσεων µε απλούστερες όπως, οι πο-

λυωνυµικές.

• Αντικατάσταση µη γραµµικών προβληµάτων από γραµµικά.

• Αντικατάσταση διαφορικών εξισώσεων από αλγεβρικές.

• Αντικατάσταση συστηµάτων υψηλής τάξης από άλλα χαµηλότερης.

Σε γενικές γραµµές τα βασικά χαρακτηριστικά των αριθµητικών µεθόδων που

θα µας απασχολήσουν παρακάτω είναι :

• Η ακρίβεια που µπορούµε να επιτύχουµε εκτελώντας έναν υπολογισµό

• Η ταχύτητα µε την οποία επιτυγχάνεται η ζητούµενη ακρίβεια του υπολο-

γισµού

Αριθµητικά σφάλµατα

Κατά την πραγµατοποίηση υπολογισµών σε ένα πρόβληµα αριθµητικής ανά-

λυσης υπάρχουν εµφανίζονται αριθµητικά σφάλµατα, δηλαδή ανακρίβειες

στην παράσταση των πραγµατικών αριθµητικών ποσοτήτων που εµπλέκονται

στο πρόβληµα. Υπάρχουν αρκετές πηγές τέτοιων σφαλµάτων, κάποιες από τις

οποίες επηρεάζουν ήδη τα δεδοµένα του προβλήµατος, όπως οι παρακάτω :

Αριθµητικά σφάλµατα 65

• Μοντελοποίηση : Μερικά φυσικά χαρακτηριστικά του προβλήµατος ή του

συστήµατος που µελετάµε είναι δυνατόν να απλοποιηθούν ή να παραλει-

φθούν (π.χ. τριβή, πυκνότητα).

• Πειραµατικές µετρήσεις : Τα όργανα του εργαστηρίου έχουν πεπερασµένη

ακρίβεια. Η ακρίβειά τους είναι δυνατόν να περιορίζεται περαιτέρω από το

µικρό µέγεθος του δείγµατος, ή οι ενδείξεις που λαµβάνονται είναι δυνατόν

να υπόκεινται σε τυχαίο θόρυβο ή συστηµατική µεροληψία.

• Προηγούµενοι υπολογισµοί : Τα δεδοµένα του προβλήµατος είναι πιθανό

να έχουν παραχθεί από ένα προηγούµενο στάδιο του οποίου τα αποτελέ-

σµατα ήταν µόνο προσεγγιστικά.

Τα παραπάνω ονοµάζονται συνήθως σφάλµατα δεδοµένων και είναι συνή-

θως πέρα από τον έλεγχό µας. Παρόλα αυτά παίζουν ένα σπουδαίο ρόλο στον

προσδιορισµό της ακρίβειας που θα έπρεπε να αναµένουµε από έναν υπολο-

γισµό. Θα επικεντρώσουµε πολλή από την προσοχή µας σε προσεγγίσεις τις

οποίες µπορούµε να επηρεάσουµε. Αυτές οι συστηµατικές προσεγγίσεις που

πραγµατοποιούνται κατά τη διάρκεια των υπολογισµών περιλαµβάνουν :

• Αποκοπή και διακριτοποίηση : Μερικά χαρακτηριστικά ενός µαθηµατι-

κού µοντέλου µπορούν να παραλειφθούν ή να απλοποιηθούν (π.χ. αντικα-

τάσταση παραγώγου από διαιρεµένες διαφορές ή χρησιµοποίηση µερικού

αθροίσµατος στη θέση µιας σειράς).

• Στρογγυλοποίηση : Η αναπαράσταση των πραγµατικών αριθµών και οι

αριθµητικές πράξεις µεταξύ τους σε έναν υπολογιστή είναι γενικά µη ακρι-

βείς.

Αυτά τα δύο τελευταία ήδη σφαλµάτων ονοµάζονται σφάλµατα υπολογισµών.

Αξίζει να σηµειώσουµε ότι δεν υπάρχει πάντοτε σαφής διάκριση µεταξύ σφαλ-

µάτων δεδοµένων και σφαλµάτων υπολογισµών, αφού όπως εξηγήσαµε παρα-

πάνω σε πολλές περιπτώσεις τα δεδοµένα ενός προβλήµατος µπορεί να απο-

τελέσµατα προηγούµενων υπολογισµών.

Παράδειγµα 5.1 Θέλουµε να υπολογίσουµε τον αριθµό eπ. Για να γίνει ο

υπολογισµός αυτός θα χρειαστεί να προσεγγίσουµε την τιµή της συνάρτησης

f(x) = ex, στο x = π. Το αριθµητικό δεδοµένο του προβλήµατος είναι ο

άρρητος αριθµός π, ο οποίος για να παρασταθεί ακριβώς θα απαιτούσε άπειρα

δεκαδικά ψηφία. Κάτι τέτοιο δεν είναι δυνατό γι’ αυτό προσεγγίζουµε τον αριθµό

π, µέχρι ενός αριθµού δεκαδικών ψηφίων. Έτσι για παράδειγµα θα µπορούσαµε

στον υπολογισµό να αντικαταστήσουµε το x = π, µε το x = 3.14159265 που

περιέχει µόνο τα 8 πρώτα δεκαδικά ψηφία του π. Σε αυτή την περίπτωση λοιπόν

66 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες

εισάγουµε ένα σφάλµα δεδοµένων της τάξης του 10−9, αφού η απόλυτη διαφορά

|x− x| < 10−8

Από την άλλη πλευρά για τον υπολογισµό του eπ, θα χρειαστεί να υπολογίσουµε

τη συνάρτηση f(x) = ex. Η εκθετική συνάρτηση ορίζεται ως σειρά

ex =∞∑

n=0

xn

n!= 1 +

x1

1!+

x2

2!+

x3

3!+ . . .

όµως σε πραγµατικούς υπολογισµούς δεν είναι δυνατό να εκτελέσουµε αθροί-

σεις απείρων όρων, γι’ αυτό το λόγο προσεγγίζουµε την πραγµατική εκθετική

συνάρτηση ex, µε ένα µερικό άθροισµα της παραπάνω άπειρης σειράς που πε-

ριέχει µόνο πεπερασµένο πλήθος όρων. Για παράδειγµα αν χρησιµοποιήσουµε

τους 15 πρώτους όρους της παραπάνω σειράς εισάγουµε µια προσέγγιση της

πραγµατικής συνάρτησης που ορίζεται ως εξής :

f(x) =15∑

n=0

xn

n!

Προφανώς κάτι τέτοιο έχει ως αποτέλεσµα την εισαγωγή υπολογιστικού σφάλ-

µατος, στον υπολογισµό µας, αφού

f(x)− f(x) =x16

16!+

x17

17!+

x18

18!+ . . .

ενώ µπορεί να αποδειχθεί ότι για x = π η παραπάνω διαφορά είναι περίπου

5.26424603× 10−6.

Συνολικά το σφάλµα στον υπολογισµό µας οφείλεται αφενός στο σφάλµα δεδο-

µένων που είναι της τάξης του 10−9 και αφετέρου στο σφάλµα υπολογισµού.

Μπορεί να αποδειχθεί ότι το πραγµατικό συνολικό σφάλµα είναι :

f(x)− f(x) = eπ −15∑

n=0

(3.14159265)n

n!≃ 5.34731623× 10−6

Σηµειώστε ότι ακόµη και σε αυτή την περίπτωση µπορεί να θεωρηθεί ότι το

σφάλµα δεδοµένων είναι σφάλµα υπολογισµού αφού ουσιαστικά η προσέγγιση

του π, µε 8 δεκαδικά ψηφία είναι αποτέλεσµα εφαρµογής κάποιου προηγούµενου

προσεγγιστικού υπολογισµού.

Η σηµασία ενός σφάλµατος σχετίζεται προφανώς µε το µέγεθος της ποσότητας

που µετράται ή υπολογίζεται. Προφανώς ένα σφάλµα της τάξης του 10−8,

έχει εντελώς διαφορετική βαρύτητα σε ένα υπολογισµό της αστρονοµίας όπου

τα µεγέθη που χειριζόµαστε είναι συνήθως πολύ µεγάλα, σε σχέση µε ένα

υπολογισµό της ατοµικής φυσικής όπου τα µεγέθη που εµπλέκονται είναι πολύ

µικρά. Προφανώς στην πρώτη περίπτωση ένα σφάλµα της τάξης του 10−8,

Ευαισθησία και Κατάσταση 67

είναι ασήµαντο, ενώ στην ατοµική κλίµατα το µέγεθος 10−8 πρέπει σίγουρα

να ληφθεί υπόψη. Αυτό µας οδηγεί στις έννοιες του απόλυτου και σχετικού

σφάλµατος, τα οποία ορίζονται παρακάτω. Αν x είναι το πραγµατικό µέγεθος

που θέλουµε να προσεγγίσουµε και x η προσέγγιση που χρησιµοποιούµε, τότε

ορίζουµε :

• Απόλυτο σφάλµα2 : εa = x− x

• Σχετικό σφάλµα : εσ = εax = x−x

x (για x = 0)

Ένας χρήσιµος τρόπος να εκφράσουµε τη σχέση µεταξύ του σχετικού σφάλ-

µατος και προσέγγισης είναι ο ακόλουθος :

x = x(1 + εσ)

Φυσικά, συνήθως δεν γνωρίζουµε την αληθή τιµή. Αν τη γνωρίζαµε, δεν θα

χρειαζόταν να προσπαθούµε να την προσεγγίσουµε. Άρα, έτσι, συνήθως απλά

θα εκτιµούµε ή θα φράσσουµε το σφάλµα, παρά θα το υπολογίζουµε ακριβώς,

επειδή δε γνωρίζουµε την αληθή τιµή. Για τον ίδιο λόγο, το σχετικό σφάλµα

συχνά θα θεωρείται σε σχέση µε την προσεγγιστική τιµή, παρά µε την αληθή

τιµή, όπως στον προαναφερθέντα ορισµό.

Παράδειγµα 5.2 Στο παράδειγµα 5.1 υπολογίσαµε το απόλυτο σφάλµα

f(x)− f(x) ≃ 5.34731623× 10−6

Υπολογίζοντας µια προσέγγιση της τιµής του f(x) = 23.1407, µπορούµε να

εκτιµήσουµε το σχετικό σφάλµα, που είναι

εσ =f(x)− f(x)

f(x)≃ 2.31078540× 10−7

Ευαισθησία και Κατάσταση

Οι δυσκολίες στην ακριβή επίλυση ενός προβλήµατος δεν οφείλονται πάντοτε

σε έναν κακώς εφαρµοσµένο µαθηµατικό τύπο ή αλγόριθµο, αλλά µπορεί να

ενυπάρχει στο πρόβληµα που επιλύεται. Ακόµη και µε ακριβείς υπολογισµούς,

είναι δυνατόν η λύση του προβλήµατος να είναι πολύ ευαίσθητη σε διαταρα-

χές των δεδοµένων του προβλήµατος. Ένα πρόβληµα λέγεται µη ευαίσθητο,

2 Μερικοί συγγραφείς ορίζουν το απόλυτο σφάλµα ως την απόλυτη τιµή της παραπάνω

διαφοράς, δηλαδή εa = |x− x|

68 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες

ή καλής κατάστασης, αν µία δοσµένη σχετική αλλαγή (διατάραξη) στα δεδο-

µένα προκαλεί µία λογικά ανάλογη αλλαγή στη λύση. Ένα πρόβληµα λέγεται

ευαίσθητο, ή κακής κατάστασης, αν η σχετική αλλαγή στο αποτέλεσµα µπο-

ρεί να είναι πολύ µεγαλύτερη από αυτή των δεδοµένων. Μιλώντας τυπικά,

ορίζουµε το ∆είκτη Κατάστασης (∆K) ενός προβλήµατος f(x) είναι :

∆K =Σχετική Μεταβολή Αποτελέσµατος

Σχετική Μεταβολή ∆εδοµένων=

∣∣∣f(x)−f(x)f(x)

∣∣∣∣∣ x−x

x

∣∣όπου x είναι ένας αριθµός κοντά στο x. Ένα πρόβληµα είναι ευαίσθητο, ή

κακής κατάστασης, αν ο ∆K είναι πολύ µεγαλύτερος από 1.

Αξίζει να παρατηρήσουµε ότι αν η f(x) είναι παραγωγίσιµη στο σηµείο x,

τότε αν θεωρήσουµε ότι x→ x, έχουµε

f ′(x) = limx→x

f(x)− f(x)

x− xάρα για x→ x

∆K =

∣∣∣∣f(x)− f(x)

x− x

x

f(x)

∣∣∣∣ =∣∣∣∣f′(x)

x

f(x)

∣∣∣∣

Παράδειγµα 5.3 Θα υπολογίσουµε τον δείκτη κατάστασης στον υπολογισµό

του cos(π2 ). Αφού (cosx)′ = − sinx, σύµφωνα µε το παραπάνω τύπο θα έχουµε

∆K =

∣∣∣∣f′(x)

x

f(x)

∣∣∣∣ =

=

∣∣∣∣− sinπ

2

π2

cos π2

∣∣∣∣ =π

2tan

π

2= +∞

∆ηλαδή ο δείκτης κατάστασης του προβλήµατος cos(π2 ) τείνει στο άπειρο, πράγ-

µα που σηµαίνει ότι το πρόβληµα αυτό είναι ευαίσθητο ή κακής κατάστασης για

x κοντά στο π/2.

Παράδειγµα 5.4 Θα υπολογίσουµε τον δείκτη κατάστασης στον υπολογισµό

του eπ. Αφού (ex)′ = ex θα έχουµε

∆K =

∣∣∣∣f′(x)

x

f(x)

∣∣∣∣ =

= eππ

eπ= π ≃ 3.1415

που είναι αρκετά κοντά στο 1, άρα το πρόβληµα µας δεν είναι ευαίσθητο.

Μια άλλη έννοια σχετική µε αυτή της ευαισθησίας ενός προβλήµατος είναι

αυτή της ευστάθειας ενός υπολογιστικού αλγόριθµου. Οι δύο ιδέες έχουν να

κάνουν µε την ευαισθησία σε διαταραχές, αλλά ο όρος ευστάθεια χρησιµο-

Προς τα Πίσω Ανάλυση Σφαλµάτων 69

ποιείται συνήθως για αλγόριθµους και ο όρος κατάσταση για προβλήµατα.

Ένας αλγόριθµος είναι ευσταθής αν το αποτέλεσµα που προκύπτει απ’ αυτόν

δεν είναι σχετικά ευαίσθητο σε διαταράξεις, που προέρχονται από προσεγγίσεις

που έγιναν κατά τη διάρκεια των υπολογισµών. Η ευστάθεια ενός αλγόριθ-

µου από µόνη της δεν εγγυάται ότι η υπολογιζόµενη λύση θα είναι ακριβής :

η ακρίβεια εξαρτάται από την κατάσταση του προβλήµατος καθώς επίσης και

από την ευστάθεια του αλγόριθµου.

Προς τα Πίσω Ανάλυση Σφαλµάτων

Αναλύοντας σε έναν υπολογισµό τη µετάδοση των σφαλµάτων, από τα δεδο-

µένα του προβλήµατος στα αποτελέσµατα, είναι συχνά πολύ δύσκολο. Επί

πλέον, οι υποθέσεις που γίνονται σε ακραίες περιπτώσεις στο κάθε στάδιο

οδηγούν συχνά σε ένα πολύ απαισιόδοξο φράγµα για το συνολικό σφάλµα.

Μία εναλλακτική προσέγγιση είναι η προς τα πίσω ανάλυση σφαλµάτων : Θε-

ωρείστε ότι η λαµβανόµενη προσεγγιστική λύση είναι η ακριβής λύση ενός

τροποποιηµένου προβλήµατος, και τότε αναρωτηθείτε πόσο µεγάλη χρειάζεται

να είναι η τροποποίηση στο αρχικό πρόβληµα για να δώσει το ίδιο αποτέλε-

σµα. Με άλλα λόγια, πόσο µεγάλο θα έπρεπε να είναι το σφάλµα στα αρχικά

δεδοµένα, για να δικαιολογήσει όλο το σφάλµα στο τελικά υπολογιζόµενο

αποτέλεσµα; Σε όρους της προς τα πίσω ανάλυσης σφαλµάτων, µία προσεγ-

γιστική λύση σε ένα δοσµένο πρόβληµα είναι καλή αν είναι η ακριβής λύση

ενός προβλήµατος που βρίσκεται "κοντά" στο δοσµένο.

Προς τα

εµπρός

σφάλµα

Προς τα

πίσω

σφάλµα

x`

f`HxL= f Hx

`L

f`

f

f

x f H xL

70 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες

Παράδειγµα 5.5 Θεωρούµε και πάλι το πρόβληµα του παραδείγµατος 5.1, µε

τη διαφορά ότι τώρα θέλουµε να υπολογίσουµε την τιµή του e, προσεγγίζονταςτην εκθετική συνάρτηση f(x) = ex, µε τη συνάρτηση

f(x) =5∑

n=0

xn

n!

Θεωρούµε ότι η τιµή της προσέγγισης f(1), αντιστοιχεί στην ακριβή τιµή της

συνάρτησης σε µια γειτονική τιµή του x = 1. ∆ηλαδή, θεωρούµε ότι υπάρχει

ένα x, έτσι ώστε

f(1) = f(x)δηλαδή

f(1) = ex

ή

x = ln f(1)

Αλλά f(1) = 2.71667, άρα

x = ln 2.71667 = 0.999 41

Άρα πράγµατι η προσέγγιση που χρησιµοποιήσαµε δίνει την πραγµατική τιµή της

εκθετικής συνάρτησης για ένα γειτονικό πρόβληµα, όπου x = 0.999 41 και το

προς τα πίσω σφάλµα είναι

x− x = 0.999 41− 1 = −0.00059

Σηµειώστε ότι το αντίστοιχο προς τα εµπρός σφάλµα είναι

f(x)− f(x) = f(1)− f(1) =

= 2.71667− 2.718 3 =

= −0.001 63

Αριθµητική κινητής υποδιαστολής

Σε έναν ηλεκτρονικό υπολογιστή οι πραγµατικοί αριθµοί παριστάνονται προ-

σεγγιστικά από ένα σύστηµα αριθµών κινητής υποδιαστολής. Η βασική ιδέα

µοιάζει µε έναν επιστηµονικό συµβολισµό, στον οποίο ένας αριθµός πολύ µε-

γάλου ή πολύ µικρού µεγέθους εκφράζεται ως ένας αριθµός αποδεκτού µεγέ-

θους πολλαπλασιασµένος επί µία κατάλληλη δύναµη του δέκα. Για παράδειγ-

µα, οι αριθµοί 2347 και 0.0007396 γράφονται ως 2.347×103 και 7.396×10−4,

αντίστοιχα. Στη γραφή αυτή, η υποδιαστολή κινείται, καθώς η δύναµη του

δέκα αλλάζει.

Μπορούµε να πούµε ότι το σύστηµα αριθµών κινητής υποδιαστολής χαρακτη-

ρίζεται από τέσσερις ακεραίους αριθµούς :

Αριθµητική κινητής υποδιαστολής 71

• β που ονοµάζεται βάση

• t που ονοµάζεται ακρίβεια

• L που ορίζει το κάτω όριο του εκθέτη

• U που ορίζει το άνω όριο του εκθέτη

Στο σύστηµα κινητής υποδιαστολής ένας πραγµατικός αριθµός x παριστάνεται

ως

x = ±(d0 +

d1β

+d2

β2+ · · ·+ dt−1

βt−1

)βe

= ±d0.d1d2d3 · · · dt × βe

︸ ︷︷ ︸Κανονικοποιηµένη Μορφή

όπου, ± είναι το πρόσηµο του αριθµού, οι αριθµοί di, i = 0, 2, . . . , t είναι

ακέραιοι µε 0 ≤ di < β και L ≤ e ≤ U. Το µέρος d0.d1d2d3 · · · dt ονοµάζεται

mantissa ή σηµαντικό µέρος του αριθµού, ενώ ακέραιος e, ονοµάζεται εκθέτης

του αριθµού.

Ένας αριθµός κινητής υποδιαστολής λέγεται κανονικοποιηµένος αν το πρώτο

ψηφίο d0 είναι πάντα µη µηδενικό, εκτός κι αν ο αριθµός που παριστάνεται

είναι το µηδέν. Έτσι, σε ένα κανονικοποιηµένο σύστηµα κινητής υποδιαστο-

λής, το σηµαντικό µέρος m = d0.d1d2d3 · · · dt ενός δοσµένου µη µηδενικού

αριθµού κινητής υποδιαστολή ικανοποιεί πάντοτε τις σχέσεις

1 ≤ m < β

Τα συστήµατα κινητής υποδιαστολής συνήθως κανονικοποιούνται γιατί τότε :

• Η αναπαράσταση κάθε αριθµού είναι µοναδική.

• ∆ε σπαταλώνται ψηφία σε µηδενικά πριν από το σηµαντικό µέρος του

αριθµού, µεγιστοποιώντας έτσι την ακρίβεια αναπαράστασης.

• Σε ένα δυαδικό (β = 2) σύστηµα, το πρώτο bit είναι πάντοτε 1 και εποµέ-

νως δε χρειάζεται να αποθηκευτεί, κερδίζοντας έτσι ένα επί πλέον ψηφίο

στην ακρίβεια για ένα δοσµένο εύρος πεδίου αποθήκευσης.

Σε έναν υπολογιστή, το πρόσηµο, ο εκθέτης και το σηµαντικό µέρος φυλάσ-

σονται σε ξεχωριστά πεδία µίας δοσµένης λέξης κινητής υποδιαστολής, κάθε

ένα από τα οποία έχει ένα καθορισµένο εύρος. Ο αριθµός µηδέν παριστάνεται

µε µοναδικό τρόπο, έχοντας και το σηµαντικό µέρος του και τον εκθέτη ίσα µε

µηδέν. Στους περισσότερους υπολογιστές η βάση β είναι 2 καθώς το σύστη-

72 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες

µα παράστασης των αριθµών δυαδικό. Για να γίνει ευκολότερο το έργο του

ανθρώπου, ένας υπολογιστής µετατρέπει συνήθως τις αριθµητικές τιµές από

τη δεκαδική µορφή της εισόδου και στη δεκαδική µορφή της εξόδου, ανάλογα

µε τη βάση του συστήµατος αρίθµησης που χρησιµοποιεί εσωτερικά.

Σε ότι ακολουθεί θα χρησιµοποιούµε το συµβολισµό fl(x) για να συµβολί-

σουµε την παράσταση του x ως αριθµού κινητής υποδιαστολής σε ένα συγκε-

κριµένο σύστηµα.

Παράδειγµα 5.6 Ο αριθµός 5326.567 παριστάνεται σαν αριθµός κινητής υ-

ποδιαστολής µε β = 10 ως

5.326567× 103

Ο αριθµός 21.5 παριστάνεται σαν αριθµός κινητής υποδιαστολής µε β = 2,ακολουθώντας την εξής διαδικασία :

Αρχικά µετατρέπουµε τον αριθµό 21.5 του δεκαδικού συστήµατος σε δυαδική

µορφή αναλύοντας τον σε δυνάµεις του 2, δηλαδή γράφουµε 21.5 = 24+22+20+2−1. Άρα η δυαδική του µορφή είναι 10101.1, οπότε µετά την κανονικοποίηση

των σηµαντικών ψηφίων θα έχουµε

fl(21.5) = 1.01011× 24

Το πιο διαδεδοµένο σύστηµα παράστασης αριθµών κινητής υποδιαστολής είναι

το πρότυπο 754-1985 του ινστιτούτου IEEE, το οποίο προβλέπει δύο επίπεδα

ακρίβειας, των οποίων τα χαρακτηριστικά εµφανίζονται στον παρακάτω πίνακα

Σύστηµα β t L UΑπλής Ακρίβειας 2 24 -126 127

∆ιπλής Ακρίβειας 2 53 -1022 1023

Το πρότυπο IEEE-754 σχεδιάστηκε µε προσοχή για να εξαλείψει τις πολλές

ανωµαλίες και ασάφειες των προγενέστερων εκδόσεων πρότυπων αριθµών κι-

νητής υποδιαστολής συγκεκριµένων κατασκευαστών και έχει διευκολύνει πολύ

στην ανάπτυξη φορητού και αξιόπιστου αριθµητικού λογισµικού. Ακόµη, επι-

τρέπει το λογικό και συνεπή χειρισµό των εξαιρετικών περιπτώσεων, όπως η

διαίρεση µε το µηδέν.

Ένα σύστηµα αριθµών κινητής υποδιαστολής είναι πεπερασµένο και διακριτό

και το πλήθος των κανονικοποιηµένων αριθµών κινητής υποδιαστολής δίνεται

από τον τύπο

2(β − 1)βt−1(U − L + 1) + 1

Αριθµητική κινητής υποδιαστολής 73

επειδή υπάρχουν δύο επιλογές για το πρόσηµο, (β−1) επιλογές για το πρώτο

ψηφίο, βt−1 επιλογές για κάθε ένα από τα εναποµένοντα t − 1 ψηφία και

(U −L+1) δυνατές τιµές για τον εκθέτη. Το 1 προστίθεται επειδή ο αριθµός

ενδέχεται να είναι το µηδέν.

Αγνοώντας το πρόσηµο, υπάρχει ένας ελάχιστος θετικός κανονικοποιηµένος

αριθµός κινητής υποδιαστολής, και δίνεται παρακάτω

Επίπεδο Υποεκχείλισης (underflow level) = UFL = βL

ο οποίος έχει το 1 ως πρώτο σηµαντικό ψηφίο και τα υπόλοιπα ψηφία του

σηµαντικού τµήµατος είναι µηδέν, ενώ ο εκθέτης παίρνει τη µικρότερη δυνατή

τιµή. Επίσης, υπάρχει ένας µέγιστος αριθµός κινητής υποδιαστολής και είναι

ο

Επίπεδο Υπερχείλισης (overflow level) = OFL = βU+1(1− β−t)

ο οποίος έχει το β−1 ως τιµή για κάθε σηµαντικό ψηφίο και ο εκθέτης παίρνει

τη µεγαλύτερη δυνατή τιµή.

Παράδειγµα 5.7 Στο σύστηµα απλής ακρίβειας του ΙΕΕΕ, τα επίπεδα υποεκ-

χείλισης και υπερχείλισης είναι αντίστοιχα

UFL = βL = 2−126 ≃ 1.1755× 10−38

και

OFL = βU+1(1− β−t) = 2128(1− 2−24) ≃ 3.4028× 1038

Αντίστοιχα στο σύστηµα διπλής ακρίβειας του ΙΕΕΕ, έχουµε

UFL = βL = 2−1022 ≃ 2. 225 1× 10−308

και

OFL = βU+1(1− β−t) = 21024(1− 2−53) ≃ 1. 797 7× 10308

Είναι προφανές ότι δεν είναι δυνατό όλοι οι πραγµατικοί αριθµοί να παρα-

σταθούν µε ακρίβεια σε ένα σύστηµα κινητής υποδιαστολής, γι’ αυτό το λόγο

χρησιµοποιούνται δύο τρόποι προσέγγισης.

• Αποκοπή : Το ανάπτυγµα του αριθµού x ως προς βάση β αποκόπτεται

µετά το t ψηφίο.

• Στρογγύλευση στον πλησιέστερο : Ο fl(x) είναι ο πλησιέστερος στον xαριθµός κινητής υποδιαστολής. Σε περίπτωση που ο x ισαπέχει από δύο

αριθµούς κινητής υποδιαστολής, επιλέγουµε αυτόν του οποίου το τελευ-

74 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες

ταίο ψηφίο είναι άρτιο. Λόγω της τελευταίας ιδιότητας, ο κανόνας αυτός

ονοµάζεται µερικές φορές και στρογγύλευση στο άρτιο.

Η στρογγύλευση στον κοντινότερο είναι η πιο ορθή, αλλά είναι κάπως πιο

δαπανηρή για να υλοποιηθεί σωστά. Κάποια συστήµατα στο παρελθόν έχουν

χρησιµοποιήσει κανόνες στρογγύλευσης που ήταν οικονοµικότεροι στην υλο-

ποίησή τους, όπως η αποκοπή, αλλά η στρογγύλευση στον πλησιέστερο είναι

ο συνηθέστερος κανόνας στρογγύλευσης στα πρότυπα συστήµατα του ΙΕΕΕ.

Το σφάλµα που εισάγεται στους υπολογισµούς εξαιτίας των παραπάνω µεθό-

δων προσέγγισης ονοµάζεται σφάλµα στρογγύλευσης.

Η ακρίβεια ενός συστήµατος αριθµών κινητής υποδιαστολής χαρακτηρίζεται

από µια ποσότητα ευρέως γνωστή ως ακρίβεια µηχανής ή έψιλον µηχανής.

Η τιµή της, την οποία συµβολίζουµε µε εmach, εξαρτάται από τη µέθοδο

προσέγγισης :

Όταν χρησιµοποιείται η αποκοπή είναι

εmach = β1−t

ενώ όταν χρησιµοποιείται στρογγύλευση στον πλησιέστερο,

εmach =1

2β1−t

Η ακρίβεια µηχανής είναι σηµαντική επειδή προσδιορίζει το µέγιστο δυνατό

σχετικό σφάλµα στην αναπαράσταση ενός µη µηδενικού πραγµατικού αριθµού

x σε ένα σύστηµα αριθµών κινητής υποδιαστολής :∣∣∣∣fl(x)− x

x

∣∣∣∣ ≤ εmach

Παράδειγµα 5.8 Στο σύστηµα απλής ακρίβειας του ΙΕΕΕ, όπου χρησιµοποιεί-

ται η µέθοδος στρογγύλευσης στον πλησιέστερο έχουµε

εmach =1

22−23 = 5. 960 5× 10−8

ενώ αντίστοιχα στο σύστηµα διπλής ακρίβειας έχουµε

εmach =1

22−52 = 1. 110 2× 10−16

Πράξεις µε αριθµούς κινητής υποδιαστολής

Σε αυτή την ενότητα παρουσιάζουµε τον τρόπο εκτέλεσης των τεσσάρων συ-

Πράξεις µε αριθµούς κινητής υποδιαστολής 75

νήθων πράξεων πραγµατικών αριθµών, όταν αυτοί παριστάνονται από ένα σύ-

στηµα αριθµών κινητής υποδιαστολής. Για να πραγµατοποιηθεί η πρόσθεση ή

η αφαίρεση µεταξύ δύο αριθµών, σε κάποιο σύστηµα κινητής υποδιαστολής,

πρέπει οι δύο αριθµοί να έχουν κοινό εκθέτη, ώστε να η πράξη να πραγ-

µατοποιηθεί µεταξύ των σηµαντικών µερών τους. Επειδή αυτό γενικά δεν

συµβαίνει για οποιουσδήποτε δύο αριθµούς, µετατοπίζουµε την υποδιαστολή

σε έναν από τους δύο, ώστε να αποκτήσουν κοινό εκθέτη

Παράδειγµα 5.9 Έστω ότι το ζητούµενο είναι να εκτελεστεί η πρόσθεση, στο

σύστηµα κινητής υποδιαστολής µε β = 10 και t = 8 :

S1 = 5621.1234 + 34.785491

Η κανονικοποιηµένη µορφή των δύο αριθµών είναι :

5621.1234 = 5.6211234× 103

34.785491 = 3.4785491× 101

Για να πετύχουµε κοινό εκθέτη, µετατοπίζουµε την υποδιαστολή στον µικρότερο

αριθµό κατά δύο θέσεις προς αριστερά, ώστε να γραφεί σαν πολλαπλάσιο του

103. Έχουµε

34.785491 = 3.4785491× 101 = 0.034785491× 103

Έτσι η ζητούµενη πρόσθεση µπορεί να εκτελεστεί ως εξής :

S1 = 5621.1234 + 34.785491 =

= 5.6211234× 103 + 0.034785491× 103 =

= (5.6211234 + 0.034785491)× 103 =

= 5.655 908 891× 103

Παρατηρείστε ότι το παραπάνω αποτέλεσµα είναι µεν το ακριβές αποτέλεσµα της

πρόσθεσης, όµως στο σύστηµα µας έχουµε στη διάθεση µας µόνο 8 σηµαντικά

ψηφία. Άρα ο αριθµός 5.655908891 που αποτελείται από 10 σηµαντικά ψηφία

πρέπει να στρογγυλοποιηθεί στον πλησιέστερο αριθµό µε 8 σηµαντικά ψηφία.

Άρα το τελικό αποτέλεσµα της πρόσθεσης στο σύστηµα µας, είναι :

fl(S1) = 5.655 908 9× 103

Η απώλεια των δύο τελευταίων σηµαντικών ψηφίων στην παραπάνω πρόσθε-

ση µπορεί να είναι ουσιαστικά ασήµαντη, όµως σε κάποιες περιπτώσεις η

παραπάνω διαδικασία µπορεί να οδηγήσει σε µη αναµενόµενα αποτελέσµατα.

Παράδειγµα 5.10 Ζητείται να εκτελεστεί η πρόσθεση των αριθµών, στο σύ-

στηµα κινητής υποδιαστολής µε β = 10 και t = 8 :

S2 = 5621.1234 + 0.0000123456

76 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες

όπου η κανονικοποιηµένη µορφή του πρώτου αριθµού είναι :

5621.12345 = 5.62112345× 103

ενώ σύµφωνα µε τα παραπάνω ο δεύτερος αριθµός πρέπει να γραφεί σαν πολ-

λαπλάσιο του 103, δηλαδή

0.0000123456 = 0.0000000123456× 103

Άρα

S2 = 5621.1234 + 0.0000123456 =

= 5.6211234× 103 + 0.0000000123456× 103 =

= (5.6211234 + 0.0000000123456)× 103 =

= 5.621123 4123456× 103

Το ακριβές αποτέλεσµα της παραπάνω πρόσθεσης πρέπει να στρογγυλοποιηθεί

στα πρώτα 8 σηµαντικά ψηφία, δίνοντας τελικά

fl(S2) = 5.6211234× 103

όπου εύκολα διαπιστώνουµε ότι fl(S2) = 5621.1234, δηλαδή ίσο µε τον πρώτο

προσθετέο ! Το φαινόµενο αυτό ονοµάζεται απορρόφηση.

Με ακριβώς αντίστοιχο τρόπο εκτελείται και η αφαίρεση µεταξύ δύο αριθµών.

Σε αντίστοιχες προβληµατικές περιπτώσεις µπορεί να υπάρξει πρόβληµα κατα-

στροφικής απώλειας σηµαντικών ψηφίων (βλέπε παράδειγµα 5.12 παρακάτω),

όπου το αποτέλεσµα µιας αφαίρεσης στο σύστηµα κινητής υποδιαστολής µπο-

ρεί να προκύψει µηδέν, ενώ στην πραγµατικότητα η διαφορά των δύο αριθµών

µπορεί να είναι αρκετά µεγάλη.

Ο πολλαπλασιασµός σε ένα σύστηµα κινητής υποδιαστολής µπορεί να εκτε-

λεστεί µε αρκετά απλούστερο τρόπο, αφού δεν απαιτεί µετατοπίσεις της υ-

ποδιαστολής. Η πράξη του πολλαπλασιασµού πραγµατοποιείται µεταξύ των

σηµαντικών µερών των δύο παραγόντων, ενώ οι αντίστοιχοι εκθέτες αθροίζο-

νται.

Παράδειγµα 5.11 Στο σύστηµα κινητής υποδιαστολής µε β = 10 και t = 8,να εκτελεστεί ο πολλαπλασιασµός :

P = 123.45678× 87.654321

Έχουµε

123.45678 = 1.2345678× 102

87.654321 = 8.7654321× 101

Πράξεις µε αριθµούς κινητής υποδιαστολής 77

Άρα

P = 123.45678× 87.654321 =

= (1.2345678× 102)× (8.7654321× 101) =

= (1.2345678× 8.7654321)× 102+1 =

= 10.821520223746 4× 103

Το ακριβές αποτέλεσµα της πράξης πρέπει να στρογγυλοποιηθεί στα πρώτα 8σηµαντικά ψηφία, δίνοντας τελικά

fl(P ) = 1.0821520× 104

Η διαίρεση µεταξύ δυο αριθµών εκτελείται αντίστοιχα, διαιρώντας τα δύο

σηµαντικά µέρη των αριθµών και αφαιρώντας αντίστοιχα τους εκθέτες τους.

Μια άλλη κατάσταση που συναντάται συχνά και µπορεί να δηµιουργήσει ση-

µαντικά προβλήµατα στους υπολογισµούς, είναι η απώλεια σηµαντικών ψηφί-

ων η οποία συνήθως συνεπάγεται σηµαντική απώλεια πληροφορίας. Τέτοιου

είδους απώλεια σηµαντικών ψηφίων µπορεί για παράδειγµα να παρατηρηθεί

κατά την αφαίρεση αριθµών, που η διαφορά τους είναι αρκετά κοντά στην ή

µικρότερη από την ακρίβεια της µηχανής.

Παράδειγµα 5.12 Ο κλασσικός τύπος του τριωνύµου εµπεριέχει σηµαντικά

προβλήµατα απώλειας σηµαντικών ψηφίων κάτω από ορισµένες προϋποθέσεις.

Είναι γνωστό ότι οι ρίζες του τριωνύµου

ax2 + bx + c = 0

δίνονται από τον τύπο

x1,2 =−b±

√b2 − 4ac

2aΓια κάποιες τιµές των συντελεστών, απλή χρήση αυτού του τύπου µε αριθµούς

κινητής υποδιαστολής µπορεί να προκαλέσει υπερχείλιση, υποεκχείλιση, ή κα-

ταστροφική απώλεια σηµαντικών ψηφίων. Για παράδειγµα, αν οι συντελεστές

είναι

a = 1, b = 104, c = 1Υπολογίζοντας τις ρίζες µε ακρίβεια 8 ψηφίων παίρνουµε

x1 = −9.9999999× 103, x2 = −10−4

Αν δοκιµάσουµε την εφαρµογή του τύπου τριωνύµου µε ακρίβεια 4 ψηφίων η

διακρίνουσα είναι :

∆ = b2 − 4ac = (104)2 − 4× 1× 1 = 108 − 4

Όµως για να εκτελεστεί η αφαίρεση στο τελευταίο µέλος της ισότητας πρέπει το

4 να γραφεί σαν πολλαπλάσιο του 108 δηλαδή

4 = 0.00000004× 108

78 Αριθµητική Ανάλυση - Εισαγωγικές Έννοιες

Επειδή, όµως έχουµε µόνο 4 σηµαντικά ψηφία στη διάθεση µας εφαρµόζουµε

στρογγύλευση στον πλησιέστερο η οποία δίνει στη θέση του 0.00000004 τον

αριθµό 0.000. Οπότε

∆ = b2 − 4ac = 1× 108 − 0.000× 108 = 1.000× 108

Στη συνέχεια υπολογίζουµε τη ρίζα :√∆ =

√1.000× 108 = 1.000× 104

Xρησιµοποιώντας τον τύπο για τις ρίζες

x1,2 =−104 ± 104

2=

−104

0

Παρατηρήστε ότι η ρίζα x1 = −104 είναι αποδεκτή για την ακρίβεια 4 ψηφίων

µε την οποία δουλεύουµε, αφού το σχετικό σφάλµα στον υπολογισµό του x1είναι

x1 − x1x1

=−104 + 9.9999999× 103

−9.9999999× 103= 1.000× 10−8

σηµαντικά µικρότερη της ακρίβειας (δηλ. του 10−4). Αντίθετα, λόγω της απώ-

λειας σηµαντικών ψηφίων η δεύτερη ρίζα x2 = 0 είναι σηµαντικά λανθασµένη,

αφού το σχετικό σφάλµα σε αυτή την περίπτωση είναι

x2 − x2x2

=0 + 10−4

10−4= 1

Το σηµαντικό αυτό σφάλµα οφείλεται στο γεγονός ότι στη διαφορά −104 +104 εµφανίστηκε αυτό που ονοµάζουµε καταστροφική απώλεια σηµαντικών

ψηφίων.

Ένας τρόπος για να αποφύγουµε τον υπολογισµό της παραπάνω διαφοράς στον

αριθµητή θα ήταν να χρησιµοποιήσουµε το παρακάτω τέχνασµα :

x2 =−b +

√b2 − 4ac

2a=

=−b +

√b2 − 4ac

2a

−b−√b2 − 4ac

−b−√b2 − 4ac

=

= − −b2 + b2 − 4ac

2a(−b−√b2 − 4ac)

=

=−2c

−b−√b2 − 4ac

άρα τώρα η ρίζα x2 µπορεί να υπολογιστεί µε 4 σηµαντικά ψηφία :

x2 =2

−104 − 104= −10−4

6 Αριθµητικές µέθοδοι επίλυ-

σης γραµµικών συστηµά-

των

Εισαγωγή

Στο κεφάλαιο αυτό ασχολούµαστε µε την επίλυση τετράγωνων γραµµικών

συστηµάτων, δηλαδή συστηµάτων n γραµµικών εξισώσεων µε n αγνώστους,

της µορφής :

a11x1 + a12x2 + · · ·+ a1nxn = b1a21x1 + a22x2 + · · ·+ a2nxn = b2

...

an1x1 + an2x2 + · · ·+ annxn = bn

(6.1)

όπου οι αριθµοί aij ∈ R, ονοµάζονται συντελεστές των αγνώστων, οι αριθµοί

bi ∈ R, σταθεροί όροι και xi είναι οι άγνωστοι του συστήµατος. Αν θέσουµε

A =

a11 a12 · · · a1na21 a22 · · · a2n

......

...

an1 an2 · · · ann

, B =

b1b2...

bn

, X =

x1x2...

xn

τότε το γραµµικό σύστηµα (6.1) µπορεί να γραφεί ισοδύναµα σαν µια εξίσωση

πινάκων της µορφής :

AX = B (6.2)

όπου οι πίνακες A,B είναι γνωστοί και ζητείται ο υπολογισµός του πίνακα

X. Αξίζει να παρατηρήσουµε ότι το σύστηµα (6.1) χαρακτηρίζεται πλήρως

από τους πίνακες A,B, για αυτό είναι χρήσιµο να εισάγουµε τον επαυξηµένο

πίνακα του συστήµατος[A B

]

ο οποίος περιέχει όλα τα απαραίτητα δεδοµένα για τη λύση του συστήµατος.

80 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων

Είναι γνωστό ότι το σύστηµα (6.1) έχει µοναδική λύση εάν και µόνο εάν η

ορίζουσα του πίνακα A είναι µη µηδενική, δηλαδή detA = 0.

Παρακάτω παρουσιάζουµε δύο µεγάλες κατηγορίες µεθόδων για την αριθµη-

τική επίλυση γραµµικών συστηµάτων.

Άµεσες Μέθοδοι

Η πιο γνωστή και ευρέως χρησιµοποιούµενη άµεση µέθοδος επίλυσης γραµ-

µικών συστηµάτων είναι η µέθοδος απαλοιφής του Gauss µε προς τα πίσω

αντικατάσταση την οποία και παρουσιάζουµε παρακάτω.

Μέθοδος απαλοιφής του Gauss και προς τα πίσωαντικατάσταση

Η µέθοδος απαλοιφής του Gauss αποτελεί µια από τις συνηθέστερες µεθό-

δους επίλυσης γραµµικών συστηµάτων και βασίζεται στη χρήση των πράξεων

γραµµών στον επαυξηµένο πίνακα του συστήµατος. Σε ένα πίνακα µπορούµε

να εφαρµόσουµε τρία είδη πράξεων γραµµών :

1. Αντιµετάθεση µεταξύ δύο οποιωνδήποτε γραµµών του πίνακα

2. Πολλαπλασιασµός µιας οποιασδήποτε γραµµής µε οποιονδήποτε αριθµό

λ = 0.

3. Πρόσθεση πολλαπλασίου γραµµής σε κάποια άλλη γραµµή

Η γενική ιδέα πίσω από την εφαρµογή πράξεων γραµµών στον επαυξηµένο

πίνακα ενός συστήµατος, είναι ότι το σύστηµα που αντιστοιχεί στον πίνακα

που προκύπτει µετά τις πράξεις γραµµών είναι ισοδύναµο µε το αρχικό, δη-

λαδή έχει ακριβώς την ίδια λύση µε το αρχικό. Αν καταφέρουµε να φέρουµε

τον επαυξηµένο πίνακα ενός συστήµατος σε κάποια ειδική µορφή, τότε έχουµε

ουσιαστικά αντικαταστήσει το αρχικό σύστηµα µε ένα νέο που είναι πιθανόν

ευκολότερο στη λύση του. Μια τέτοια ειδική µορφή είναι η άνω τριγωνική

µορφή του πίνακα A ή γενικότερα η άνω κλιµακωτή µορφή του επαυξηµένου

πίνακα. Ένας πίνακας είναι σε άνω τριγωνική µορφή, αν τα στοιχεία που

βρίσκονται κάτω από την κύρια διαγώνιο του είναι µηδενικά. Με τη µέθο-

δο απαλοιφής του Gauss µπορούµε να επιτύχουµε µια τέτοια άνω τριγωνική

Άµεσες Μέθοδοι 81

µορφή για οποιονδήποτε πίνακα µας δοθεί.

Παράδειγµα 6.1 ∆ίνεται το σύστηµα

x1 − x2 + 2x3 − x4 = −82x1 − 2x2 + 3x3 − 3x4 = −20

x1 + x2 + x3 = −2x1 − x2 + 4x3 + 3x4 = 12

Ο επαυξηµένος πίνακας του συστήµατος είναι

1 −1 2 −1 −82 −2 3 −3 −201 1 1 0 −21 −1 4 3 12

Θα προσπαθήσουµε µε πράξεις γραµµών να φέρουµε τον παραπάνω πίνακα σε

άνω τριγωνική µορφή. Αρχικά θα µηδενίσουµε τα τρία τελευταία στοιχεία της

πρώτης στήλης. Εφαρµόζουµε τις ακόλουθες πράξεις γραµµών

Γ2 → Γ2 − 2Γ1,Γ3 → Γ3 − Γ1,Γ4 → Γ4 − Γ1οπότε ο νέος πίνακας είναι

1 −1 2 −1 −80 0 −1 −1 −40 2 −1 1 60 0 2 4 20

Αντιµεταθέτουµε τη δεύτερη και την τρίτη γραµµή, δηλαδή Γ2 ↔ Γ3, οπότε :

1 −1 2 −1 −80 2 −1 1 60 0 −1 −1 −40 0 2 4 20

παρατηρούµε ότι στη δεύτερη στήλη τα στοιχεία κάτω από την κύρια διαγώνιο

είναι µηδέν, άρα προχωρούµε στην τρίτη στήλη µε σκοπό να µηδενίσουµε το

στοιχείο στην τελευταία γραµµή. Πράγµατι εφαρµόζοντας την πράξη

Γ4 → Γ4 + 2Γ3παίρνουµε

1 −1 2 −1 −80 2 −1 1 60 0 −1 −1 −40 0 0 2 12

(6.3)

όπου ο τελευταίος πίνακας είναι σε άνω κλιµακωτή µορφή.

Ο γενικός αλγόριθµος απαλοιφής του Gauss είναι ο παρακάτω :

Αλγόριθµος Απαλοιφής του Gauss

82 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων

• ∆εδοµένα : Επαυξηµένος πίνακας του συστήµατος, διαστάσεων n×(n+1)

• Βήµα 1 : Αν όλα τα στοιχεία της πρώτης στήλης είναι µηδέν τότε ο αλγό-

ριθµος τερµατίζει και δεν υπάρχει µοναδική λύση.

• Βήµα 2 : Αν το στοιχείο στη θέση (1,1) είναι µηδέν τότε βρίσκουµε ένα

µη µηδενικό στοιχείο στην πρώτη στήλη και αντιµεταθέτουµε την γραµµή

του µε την 1η γραµµή.

• Βήµα 3 : Για κάθε i = 2, 3, . . . , n, εφαρµόζουµε τις πράξεις γραµµών

Γi → Γi − a1ia11

Γ1

• Βήµα 4 : Επιστρέφουµε στο βήµα 1, χρησιµοποιώντας σαν δεδοµένο εισό-

δου τον υποπίνακα, που προκύπτει αφαιρώντας από τον αρχικό την πρώτη

γραµµή και την πρώτη στήλη του (η διαδικασία επαναλαµβάνεται όσο υ-

πάρχει πίνακας).

Έχοντας ανάγει τον επαυξηµένο πίνακα ενός συστήµατος σε άνω τριγωνική

µορφή έχουµε ένα σηµαντικό πλεονέκτηµα. Το σύστηµα στο οποίο αντιστοιχεί

ο νέος επαυξηµένος πίνακας είναι πολύ εύκολο να λυθεί µε τη µέθοδο της προς

τα πίσω αντικατάστασης.

Παράδειγµα 6.2 Σε συνέχεια του προηγούµενου παραδείγµατος ο άνω τριγω-

νικός επαυξηµένος πίνακας (6.3), αντιστοιχεί στο σύστηµα :

x1 − x2 + 2x3 − x4 = −82x2 − x3 + x4 = 6

−x3 − x4 = 42x4 = 12

Ξεκινώντας από την τελευταία εξίσωση παίρνουµε

x4 = 6

οπότε αντικαθιστώντας το x4 στις προηγούµενες τρεις εξισώσεις µπορούµε άµεσα

(από την 3η) να υπολογίσουµε το

x3 = −2

Οµοίως, σταδιακά βρίσκουµε

x2 = −1και

x1 = 1

Γενικά έχοντας εφαρµόσει τη µέθοδο απαλοιφής του Gauss και έχοντας ένα

σύστηµα σε ένα τριγωνική µορφή µπορούµε να υπολογίσουµε τις τιµές των

αγνώστων µας σταδιακά εφαρµόζοντας τον τύπο :

xi = (bi −n∑

j=i+1

aijxj)/aii

Άµεσες Μέθοδοι 83

για i = n, n− 1, . . . , 1.

Αποδεικνύεται ότι η όλη διαδικασία της απαλοιφής του Gauss και η προς τα

πίσω αντικατάσταση για ένα σύστηµα n×n, απαιτεί ένα αριθµό πράξεων της

τάξης του n3. Ο αριθµός αυτός είναι αρκετά µικρός για προβλήµατα µικρής

διάστασης, όµως τείνει να γίνει αρκετά µεγάλος καθώς πηγαίνουµε σε προ-

βλήµατα µεγάλης διάστασης (π.χ. ένα σύστηµα 1000 × 1000 θα απαιτούσε

περίπου 109 πράξεις).

Μια δεύτερη παράµετρος της παραπάνω µεθόδου για την επίλυση γραµµικών

συστηµάτων, που αφορά την αριθµητική ανάλυση, είναι η ακρίβεια των υ-

πολογισµών. Στον υπολογιστή οι πραγµατικοί αριθµοί αποθηκεύονται µε την

µέθοδο της κινητής υποδιαστολής, οπότε τα σφάλµατα στρογγυλοποίησης ε-

πηρεάζουν τα αποτελέσµατα του αλγορίθµου. Παρακολουθείστε το παρακάτω

παράδειγµα :

Παράδειγµα 6.3 Έστω το σύστηµα0.0001x + 1.00y = 1.001.00x + 1.00y = 2.00

Η πραγµατική λύση του συστήµατος αυτού είναι

x =10000

9999≃ 1.0001

y =9998

9999≃ 0.99990

όπου οι παραπάνω προσεγγίσεις χρησιµοποιούν 5 σηµαντικά ψηφία.

Έχει ενδιαφέρον να εξετάσουµε πως συµπεριφέρεται η µέθοδος απαλοιφής του

Gauss, στο παραπάνω πρόβληµα έχοντας αυτή τη φορά στη διάθεση µας µόνο

4 σηµαντικά ψηφία. Ο επαυξηµένος πίνακας είναι[0.0001 1.00 1.001.00 1.00 2.00

]

οπότε πρέπει να εφαρµόσουµε την πράξη Γ2 −→ Γ2 − 1.000.0001Γ1 ή Γ2 −→

Γ2−10000Γ1. Εφαρµόζοντας την πράξη αυτή έχοντας µόνο 4 σηµαντικά ψηφία

θα πάρουµε [0.0001 1.00 1.000.00 −10000 −10000

]

αφού η αφαίρεση 1.00− 10000 δίνει −10000 µε 4 σηµαντικά ψηφία (οµοίως η

αφαίρεση 2.00− 10000). Άρα

y = 1.00

και χρησιµοποιώντας προς τα πίσω αντικατάσταση

x = 0.00

84 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων

Προφανώς, η απάντηση για το x είναι εντελώς λανθασµένη ! Ένας τρόπος για

να βελτιώσουµε το αποτέλεσµα σε τέτοιου είδους καταστάσεις, είναι να χρησι-

µοποιούµε πάντοτε στην κύρια διαγώνιο του επαυξηµένου πίνακα το µεγαλύτερο

κατά απόλυτη τιµή στοιχείο της αντίστοιχης στήλης. Κάτι τέτοιο µπορεί στο σύ-

στηµα µας να επιτευχθεί αντιµεταθέτοντας τις γραµµές του επαυξηµένου πίνακα :[1.00 1.00 2.00

0.0001 1.00 1.00

]

οπότε τώρα πρέπει να εφαρµόσουµε την πράξη Γ2 −→ Γ2 − 0.0001Γ1. Εφαρ-µόζοντας την πράξη αυτή έχοντας και πάλι 4 σηµαντικά ψηφία θα πάρουµε[

1.00 1.00 2.000.00 1.00 1.00

]

αφού η αφαίρεση 1.00 − 0.0001 δίνει 1.00 µε 4 σηµαντικά ψηφία (οµοίως η

αφαίρεση 1.00− 0.0002). Άρα

y = 1.00

και χρησιµοποιώντας προς τα πίσω αντικατάσταση

x = 1.00

Προφανώς το αποτέλεσµα αυτό είναι πολύ καλύτερο από το αυτό της προηγού-

µενης λύσης.

Η παραπάνω διαδικασία όπου πριν ξεκινήσει η απαλοιφή των στοιχείων µιας

στήλης µεταφέρουµε στην κύρια διαγώνιο το µέγιστο κατά απόλυτη τιµή στοι-

χείο ονοµάζεται µερική οδήγηση. Για να χρησιµοποιείται η µερική οδήγηση,

ο αλγόριθµος της απαλοιφής του Gauss, πρέπει να τροποποιηθεί µόνο στο

βήµα 2, ως εξής :

• Βήµα 2 : Αναζητούµε το µεγαλύτερο κατά απόλυτη τιµή στοιχείο της πρώ-

της στήλης και αντιµεταθέτουµε την γραµµή του µε την 1η γραµµή.

Έχει αποδειχθεί ότι η µέθοδος απαλοιφής του Gauss µε µερική οδήγηση, σε

συνδυασµό µε την προς τα πίσω αντικατάσταση δίνει λύσεις ικανοποιητικής

ακρίβειας στην πλειοψηφία των προβληµάτων.

Επαναληπτικές Μέθοδοι

Στην ενότητα αυτή παρουσιάζουµε τις δύο γνωστότερες επαναληπτικές µεθό-

δους επίλυσης γραµµικών συστηµάτων. Οι επαναληπτικές µέθοδοι παρουσιά-

ζουν σηµαντικό πλεονέκτηµα στην ταχύτητα υπολογισµού της λύσης, ειδικά

για συστήµατα µεγάλης διάστασης, σε σχέση µε τις άµεσες µεθόδους. Το βα-

σικό τους µειονέκτηµα είναι ότι ανάλογα µε το πρόβληµα, είναι πιθανό οι

Επαναληπτικές Μέθοδοι 85

αλγόριθµοι αυτοί να µην συγκλίνουν ή να συγκλίνουν µε πολύ αργό ρυθµό

οπότε πρακτικά είναι αδύνατο να δώσουν απάντηση.

Μέθοδος Jacobi

Οι επαναληπτικές µέθοδοι χρησιµοποιούν µια αρχική προσέγγιση της λύσης

του γραµµικού συστήµατος, η οποία εισάγεται σε µια σχέση που δίνει (υπό κα-

τάλληλες προϋποθέσεις) µια καλύτερη προσέγγιση της λύσης από την αρχική.

Εφαρµόζοντας, πολλές φορές τη διαδικασία αυτή είναι δυνατό να πετύχουµε

µια προσέγγιση της πραγµατικής λύσης που θα ικανοποιεί κάποια δεδοµένη

απαίτηση ακρίβειας.

Κάθε γραµµικό σύστηµα µπορεί να γραφεί υπό τη µορφή εξίσωσης πινάκων

ως

AX = B

Αν "σπάσουµε" τον πίνακα A, ως

A =

a11 a12 · · · a1na21 a22 · · · a2n

......

. . ....

an1 an2 · · · ann

= D − L− U

όπου

D =

a11 0 · · · 0

0 a22. . .

......

. . .. . . 0

0 · · · 0 ann

L =

0 0 · · · 0

−a21 0. . .

......

. . .. . . 0

−an1 · · · −an,n−1 0

, U =

0 −a12 · · · −a1n

0 0. . .

......

. . .. . . −an−1,n

0 · · · 0 0

µπορούµε να γράψουµε

DX = B + (L + U)X

ή

X = D−1B + D−1(L + U)X

(σηµειώστε ότι ο πίνακας D αντιστρέφεται εύκολα). Προφανώς η παραπάνω

σχέση δεν δίνει λύση του συστήµατος, µπορούµε όµως να τη χρησιµοποιή-

86 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων

σουµε ως επαναληπτική σχέση για να πετύχουµε διαδοχικές προσεγγίσεις της

λύσης.

Η επαναληπτική σχέση του Jacobi είναι

X(k) = D−1B + D−1(L +U)X(k−1) (6.4)

για k = 1, 2, 3, . . . , όπου X(k) είναι k−οστή προσέγγιση της λύσης. Συνήθως

"µαντεύουµε" µια αρχική προσέγγιση της λύσης και εφαρµόζοντας σταδιακά

την σχέση (6.4) υπολογίζουµε διαδοχικές προσεγγίσεις της λύσης. Όταν η

διαφορά δύο διαδοχικών προσεγγίσεων γίνει αρκετά µικρή, έχουµε ουσιαστικά

µια ικανοποιητική προσέγγιση της λύσης. Εναλλακτικά, η σχέση (6.4) µπορεί

να γραφεί ως προς τα στοιχεία των πινάκων, υπό τη µορφή :

x(k)i =

1

aii(bi −

n∑

j=1j =i

aijx(k−1)j ) (6.5)

για i = 1, 2, . . . , n και σταδιακά για k = 1, 2, 3, . . . . Συνολικά, ο αλγόριθµος

του Jacobi είναι :

Επαναληπτικός αλγόριθµος Jacobi

• ∆εδοµένα : Πίνακες A = [aij ]n×n, B = [bi]n×1, µια αρχική προσέγγιση

X(0) = [x(0)i ]n×1 και η επιθυµητή ακρίβεια ε > 0.

• Βήµα 1 : k = 1

• Βήµα 2 : Υπολόγισε

x(k)i =

1

aii(bi −

n∑

j=1j =i

aijx(k−1)j )

για i = 1, 2, . . . , n.

• Βήµα 3 : Αν maxi

∣∣∣x(k)i − x(k−1)i

∣∣∣ > ε, τότε k = k + 1 και πήγαινε στο

βήµα 1.

• Βήµα 4 : Η λύση είναι xi = x(k)i , για i = 1, 2, . . . , n.

Πρέπει να σηµειώσουµε εδώ ότι ο επαναληπτικός αλγόριθµος του Jacobi συ-

γκλίνει (δηλαδή δίνει λύσεις) µόνο για ειδικές κατηγορίες πινάκων, των οποίων

όµως ο ακριβής χαρακτηρισµός ξεφεύγει από τους σκοπούς του παρόντος συγ-

γράµµατος. Θα αρκεστούµε στην αναφορά µιας ειδικής κατηγορίας πινάκων

που µπορεί να εγγυηθεί τη σύγκλιση του αλγορίθµου του Jacobi :

Ορισµός 6.4 Ένας τετράγωνος πίνακας A = [aij]n×n λέγεται διαγώνια κυρί-

Επαναληπτικές Μέθοδοι 87

αρχος, ανν ισχύει

|aii| >n∑

j=1j =i

|aij |

για κάθε i = 1, 2, . . . , n.

Το παρακάτω θεώρηµα παρέχει µια ικανή αλλά όχι αναγκαία συνθήκη για τη

σύγκλιση του αλγορίθµου Jacobi :

Θεώρηµα 9 Αν ο πίνακας A = [aij ]n×n που περιέχει του συντελεστές των

αγνώστων στο γραµµικό σύστηµα είναι διαγώνια κυρίαρχος, τότε ο αλγόριθµος

του Jacobi συγκλίνει.

Παράδειγµα 6.5 ∆ίνεται το σύστηµα

2x1 + x2 + x3 = 10−x1 + 3x2 + 2x3 = 11x1 + x2 + 4x3 = 1

(6.6)

που περιγράφεται από τους πίνακες

A =

2 1 1−1 3 21 1 4

, B =

10111

Για να εφαρµόσουµε την επαναληπτική µέθοδο του Jacobi, λύνουµε αρχικά τις

τρεις εξισώσεις του συστήµατος διαδοχικά ως προς x1, x2 και x3. ∆ηλαδή από

την (6.6) έχουµε :

x1 = 12(10− x2 − x3)

x2 = 13(11 + x1 − 2x3)

x3 = 14(1− x1 − x2)

(6.7)

Οι σχέσεις (6.7) δίνουν ουσιαστικά τις αντίστοιχες αναδροµικές σχέσεις (6.5)

του επαναληπτικού αλγορίθµου του Jacobi :

x(k)1 = 1

2(10− x(k−1)2 − x

(k−1)3 )

x(k)2 = 1

3(11 + x(k−1)1 − 2x

(k−1)3 )

x(k)3 = 1

4(1− x(k−1)1 − x

(k−1)2 )

(6.8)

για k = 1, 2, 3, . . . και δεδοµένη µια αρχική προσέγγιση η οποία στην περίπτωση

µας δίνεται και είναι x(0)1 = x

(0)2 = x

(0)3 = 0.

Η εφαρµογή των επαναληπτικών σχέσεων (6.8), για επιθυµητό σφάλµα ε =

88 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων

10−3, συνοψίζεται στον παρακάτω πίνακα :

k x(k)1 x

(k)2 x

(k)3 max

i

∣∣∣x(k)i − x(k−1)i

∣∣∣0 0 0 0 -

1 5 3.66667 0.25 52 3.04167 5.16667 −1.91667 2.166673 3.375 5.95833 −1.80208 0.7916674 2.92188 5.99306 −2.08333 0.4531255 3.04514 6.02951 −1.97873 0.1232646 2.97461 6.00087 −2.01866 0.07052957 3.0089 6.00398 −1.99387 0.03428828 2.99495 5.99888 −2.00322 0.01395229 3.00217 6.00046 −1.99846 0.0072247510 2.999 5.99969 −2.00066 0.003172711 3.00048 6.0001 −1.99967 0.0014844412 2.99978 5.99994 −2.00015 0.000697619

Χρησιµοποιώντας οποιαδήποτε άµεση µέθοδο επίλυσης συστηµάτων η ακριβής

λύση που υπολογίζεται είναι x1 = 3, x2 = 6, x3 = −2, δηλαδή η προσέγγιση

που προκύπτει από τον αλγόριθµο του Jacobi είναι πράγµατι ικανοποιητική.

Παρατηρήστε επίσης, ότι ο πίνακας A, δεν είναι διαγώνια κυρίαρχος, αφού

στις δύο πρώτες γραµµές τα διαγώνια στοιχεία είναι ίσα κατά απόλυτη, µε το

άθροισµα των απολύτων τιµών των υπολοίπων στοιχείων της γραµµής τους και

όχι αυστηρά µεγαλύτερα. Παρόλα αυτά η µέθοδος συγκλίνει µε ικανοποιητικό

ρυθµό.

Μέθοδος Gauss - Seidel

Πρόκειται ουσιαστικά για µια βελτιωµένη µορφή της µεθόδου του Jacobi, όπου

χρησιµοποιώντας της ανάλυση του A σε D,L,U, γράφουµε το σύστηµα ως

(D − L)X = B + UX

οπότε η επαναληπτική σχέση τώρα γίνεται

(D − L)X(k) = B + UX(k−1)

αλλά λόγω της κάτω τριγωνικής µορφής του πίνακα L, µπορούµε να γράψουµε

X(k) = D−1B + D−1LX(k) +D−1UX(k−1)

Η επαναληπτική σχέση γράφεται ως προς τα στοιχεία των πινάκων

x(k)i =

1

aii(bi −

i−1∑

j=1

aijx(k)j −

n∑

j=i+1

aijx(k−1)j )

Επαναληπτικές Μέθοδοι 89

Ο επαναληπτικός αλγόριθµος είναι αντίστοιχα

Επαναληπτικός αλγόριθµος Gauss-Seidel

• ∆εδοµένα : Πίνακες A = [aij ]n×n, B = [bi]n×1, µια αρχική προσέγγιση

X(0) = [x(0)i ]n×1 και η επιθυµητή ακρίβεια ε > 0.

• Βήµα 1 : k = 1

• Βήµα 2 : Υπολόγισε

x(k)i =

1

aii(bi −

i−1∑

j=1

aijx(k)j −

n∑

j=i+1

aijx(k−1)j )

για i = 1, 2, . . . , n.

• Βήµα 3 : Αν maxi

∣∣∣x(k)i − x(k−1)i

∣∣∣ > ε, τότε k = k + 1 και πήγαινε στο

βήµα 1.

• Βήµα 4 : Η λύση είναι xi = x(k)i , για i = 1, 2, . . . , n.

Παρατήρηση 6.6 Όπως ο αλγόριθµος του Jacobi, έτσι και αυτός των Gauss-

Seidel δεν συγκλίνει για οποιοδήποτε πίνακα συντελεστών του συστήµατος, παρά

µόνο για πίνακες που πληρούν συγκεκριµένες προϋποθέσεις. Μια από αυτές τις

προϋποθέσεις είναι ο πίνακας A να είναι διαγώνια κυρίαρχος.

Παράδειγµα 6.7 Έστω το σύστηµα του παραδείγµατος 6.5. Το ζητούµενο εί-

ναι να εφαρµόσουµε τον αλγόριθµο των Gauss-Seidel, για επιθυµητό σφάλµα

ε = 10−3 και αρχική προσέγγιση x(0)1 = x

(0)2 = x

(0)3 = 0. Η αναδροµική

σχέση που δίνει τις διαδοχικές προσεγγίσεις της µεθόδου Gauss-Seidel, προκύ-

πτει άµεσα από τις σχέσεις (6.7) του παραδείγµατος 6.5. Η διαφορά σε σχέση

µε τη µέθοδο του Jacobi εντοπίζεται στο γεγονός ότι για τον υπολογισµό της

k−οστής προσέγγισης ενός αγνώστου, χρησιµοποιείται, εφόσον είναι διαθέσιµη,

η k−οστή προσέγγιση των προηγούµενων αγνώστων αντί αυτής του βήµατος

k − 1. ∆ηλαδή η (6.7) δίνει

x(k)1 = 1

2(10− x(k−1)2 − x

(k−1)3 )

x(k)2 = 1

3(11 + x(k)1 − 2x

(k−1)3 )

x(k)3 = 1

4(1− x(k)1 − x

(k)2 )

Η εφαρµογή των παραπάνω επαναληπτικών σχέσεων δίνει τα παρακάτω απο-

90 Αριθµητικές µέθοδοι επίλυσης γραµµικών συστηµάτων

τελέσµατα :

k x(k)1 x

(k)2 x

(k)3 max

i

∣∣∣x(k)i − x(k−1)i

∣∣∣0 0 0 0 -

1 5, 00000 5, 33333 −2, 33333 5, 33333332 3, 50000 6, 38889 −2, 22222 1, 50000003 2, 91667 6, 12037 −2, 00926 0, 58333334 2, 94444 5, 98765 −1, 98302 0, 13271605 2, 99769 5, 98791 −1, 99640 0, 05324076 3, 00424 5, 99901 −2, 00081 0, 01110257 3, 00090 6, 00084 −2, 00044 0, 00334368 2, 99980 6, 00022 −2, 00000 0, 00110389 2, 99989 5, 99997 −1, 99996 0, 0002558

Παρατηρήστε ότι ο αλγόριθµος Gauss-Seidel καταλήγει στο επιθυµητό αποτέλε-

σµα σε 9 βήµατα, αντί των 12 που απαιτήθηκαν από τον αλγόριθµο του Jacobi.

7 Αριθµητικές µέθοδοι επίλυ-

σης µη γραµµικών εξισώσε-

ων

Μέθοδος του Newton

Η µέθοδος του Newton (επίσης γνωστή ως µέθοδος των Newton - Rampson

ή µέθοδος των Newton - Fourier) για την επίλυση µη γραµµικών εξισώσεων,

είναι ένας επαναληπτικός αλγόριθµος για τον εντοπισµό ριζών εξισώσεων της

µορφής

f(x) = 0

όπου f(x) είναι µια παραγωγίσιµη συνάρτηση σε ένα διάστηµα [a, b].

Η βασική ιδέα της µεθόδου είναι η εξής : ξεκινώντας από µια αρχική προ-

σέγγιση x0 της πραγµατικής ρίζας, η συνάρτηση f(x) προσεγγίζεται από την

εφαπτόµενη της στο σηµείο x0. Υπολογίζοντας στη συνέχεια το σηµείο το-

µής της εφαπτόµενης µε τον άξονα x′x, παίρνουµε µια νέα προσέγγιση της

ζητούµενης ρίζας x1, η οποία συνήθως είναι κατά κανόνα καλύτερη από την

αρχική. Εφαρµόζοντας την διαδικασία επαναληπτικά, µπορούµε να επιτύχουµε

πρακτικά µια οσοδήποτε καλή προσέγγιση της ζητούµενης ρίζας.

Στο παρακάτω σχήµα απεικονίζεται µία επανάληψη της µεθόδου (µε µπλε χρώ-

µα παριστάνεται η γραφική παράσταση της f(x) και µε κόκκινο η εφαπτόµενη

της στο σηµείο xn) :

92 Αριθµητικές µέθοδοι επίλυσης µη γραµµικών εξισώσεων

xx x01

Παρατηρήστε ότι το xn+1 είναι καλύτερη προσέγγιση της ζητούµενης ρίζας

x, από την xn.

Για να παράγουµε τον επαναληπτικό τύπο της µεθόδου αρκεί να θυµηθούµε

ότι ο τύπος της εφαπτόµενης ευθείας µιας συνάρτησης σε ένα δεδοµένο σηµείο

xn του πεδίου ορισµού της είναι

y − f(xn)

x− xn= f ′(xn)

Για να υπολογίσουµε την τιµή του xn+1, αρκεί να θέσουµε στην παραπάνω

εξίσωση y = 0 και x = xn+1, οπότε

0− f(xn)

xn+1 − xn= f ′(xn)

από την οποία παίρνουµε

xn+1 = xn −f(xn)

f ′(xn)(7.1)

Η τελευταία σχέση είναι η επαναληπτική σχέση της µεθόδου του Newton.

Αποδεικνύεται, ότι αν η ζητούµενη ρίζα είναι πολλαπλότητας 1, τότε στην

γειτονιά της ρίζας ο ρυθµός σύγκλισης της παραπάνω επαναληπτικής σχέσης

είναι τουλάχιστον τετραγωνικός. Αυτό σηµαίνει πρακτικά, ότι για ικανοποιητι-

κές προσεγγίσεις της ρίζας η παραπάνω επαναληπτική διαδικασία διπλασιάζει

τον αριθµό των σωστών δεκαδικών ψηφίων του αποτελέσµατος σε κάθε βήµα.

Αλγόριθµος του Newton

Μέθοδος του Newton 93

• ∆εδοµένα : Η συνάρτηση f(x) και η παράγωγός της f ′(x). Μια αρχική

προσέγγιση της ζητούµενης ρίζας x0 και η ζητούµενη ακρίβεια ε > 0.

• Βήµα 1 : Θέτουµε n = 0.

• Βήµα 2 : Υπολόγισε την ποσότητα

xn+1 = xn −f(xn)

f ′(xn)(7.2)

• Βήµα 3 : Αν |xn+1 − xn| > ε, τότε θέτουµε n = n + 1 και επιστρέφουµε

στο βήµα 2.

• Βήµα 4 : Η ζητούµενη ρίζα είναι x = xn+1.

Παράδειγµα 7.1 Να βρεθεί η ρίζα της εξίσωσης

ex = x2 (7.3)

µε ακρίβεια τριών δεκαδικών ψηφίων (δηλαδή ε = 10−3) και αρχική προσέγγιση

x0 = 0.

Αρχικά θέτουµε

f(x) = ex − x2

οπότε η (7.3) γράφεται ισοδύναµα f(x) = 0. Στη συνέχεια υπολογίζουµε την

παράγωγο της f(x)f ′(x) = ex − 2x

οπότε η επαναληπτική σχέση (7.2) γίνεται

xn+1 = xn −exn − x2nexn − 2xn

Εφαρµόζουµε διαδοχικά τις επαναλήψεις της µεθόδου του Newton :

x1 = 0− e0 − 02

e0 − 2× 0= −1.0

x2 = −1.0− e−1.0 − (−1.0)2

e−1.0 − 2× (−1.0)= −0.733 04

x3 = −0.733 04− e−0.733 04 − (−0.733 04)2

e−0.733 04 − 2× (−0.733 04)= −0.703 81

x4 = −0.703 81− e−0.703 81 − (−0.703 81)2

e−0.703 81 − 2× (−0.703 81)= −0.703 47

Παρατηρούµε ότι στις δύο τελευταίες επαναλήψεις τα τρία πρώτα δεκαδικά ψη-

φία των x3, x4 είναι όµοια, δηλαδή

|x4 − x3| = |−0.703 47− (−0.703 81)| = 0.000 34 < 10−3 = ε

Άρα η ζητούµενη ρίζα έχει προσεγγιστεί ικανοποιητικά από την −0.703.

Παράδειγµα 7.2 Να κατασκευαστεί ένας προσεγγιστικός επαναληπτικός τύπος

για τον υπολογισµό της (θετικής) τετραγωνικής ρίζας ενός πραγµατικού αριθµού

a > 0 και στη συνέχεια µε βάση αυτό τον τύπο να υπολογιστεί µια προσέγγιση

94 Αριθµητικές µέθοδοι επίλυσης µη γραµµικών εξισώσεων

του√

2 µε ακρίβεια ε = 10−3.

Η θετική τετραγωνική ρίζα ενός αριθµού a > 0, είναι ουσιαστικά η θετική λύση

της εξίσωσης

x2 − a = 0Για να χρησιµοποιήσουµε τη µέθοδο του Newton θέτουµε

f(x) = x2 − a

και υπολογίζουµε την παράγωγο της

f ′(x) = 2x

Άρα µπορούµε να χρησιµοποιήσουµε την επαναληπτική σχέση του Newton :

xn+1 = xn −x2n − a

2xnή ισοδύναµα

xn+1 =2x2n − x2n + a

2xnή

xn+1 =xn2

+a

2xn(7.4)

Η τελευταία σχέση µπορεί να χρησιµοποιηθεί για τον υπολογισµό της θετικής

τετραγωνικής ρίζας του a και µάλιστα µια καλή αρχική προσέγγιση για να γίνει

αυτό, είναι η x0 = a2 .

Για a = 2, η σχέση (7.4) γίνεται

xn+1 =xn2

+1

xnοπότε για x0 = 1 παίρνουµε

x1 =1

2+

1

1= 1.5

x2 =1.5

2+

1

1.5= 1. 416 7

x3 =1. 416 7

2+

1

1. 416 7= 1. 414 2

x4 =1. 4142

2+

1

1. 4142= 1. 414 2

Παρατηρούµε ότι στις δύο τελευταίες επαναλήψεις τα τρία πρώτα δεκαδικά ψη-

φία των x3, x4 δεν άλλαξαν, άρα η ζητούµενη προσέγγιση είναι√2 ≃ 1. 414

Μέθοδος της τέµνουσας

Η µέθοδος της τέµνουσας χρησιµοποιεί µια αντίστοιχη λογική για την προσέγ-

Μέθοδος της τέµνουσας 95

γιση των ριζών µιας εξίσωσης, µε τη διαφορά όµως ότι δεν χρησιµοποιεί την

εφαπτόµενη σε κάποιο αρχικό σηµείο x0, για να προσεγγίσει την συνάρτηση,

αλλά την χορδή που συνδέει ένα αρχικό ζεύγος σηµείων x0, x1. Το πλεονέ-

κτηµα της µεθόδου της τέµνουσας σε σχέση µε αυτή του Newton, είναι ότι

δεν απαιτείται ο εκ των προτέρων υπολογισµός της παραγώγου της συνάρτη-

σης, γεγονός που επιτρέπει κατασκευή ενός γενικού αλγορίθµου που εντοπίζει

ρίζες για οποιαδήποτε δεδοµένη συνάρτηση. Ο ρυθµός σύγκλισης της µεθό-

δου της τέµνουσας είναι λίγο πιο αργός από αυτόν της µεθόδου του Newton,

χωρίς όµως αυτό να αποτελεί σηµαντικό µειονέκτηµα.

Στο παρακάτω σχήµα φαίνεται ο τρόπος λειτουργίας της µεθόδου :

xx

x x

0

1 2

Το x2 προκύπτει από την τοµή της χορδής που ενώνει τα σηµεία (x0, f(x0))

και (x1, f(x1)). Οµοίως προκύπτει το x3 χρησιµοποιώντας την χορδή των δύο

προηγούµενων προσεγγίσεων.

Η εξίσωση της χορδής που ενώνει τα σηµεία (x0, f(x0)) και (x1, f(x1)) είναι

y − f(x1)

x− x1=

f(x1)− f(x0)

x1 − x0Αν θέσουµε στην παραπάνω εξίσωση y = 0, τότε x = x2, άρα

x2 = x1 −x1 − x0

f(x1)− f(x0)f(x1)

Γενικότερα η επαναληπτική σχέση της µεθόδου είναι :

xn+1 = xn −xn − xn−1

f(xn)− f(xn−1)f(xn) (7.5)

Παρατηρήστε ότι η παραπάνω επαναληπτική σχέση είναι δεύτερης τάξης, δη-

λαδή στον υπολογισµό κάθε νέας προσέγγισης εµπλέκονται οι δύο προηγού-

96 Αριθµητικές µέθοδοι επίλυσης µη γραµµικών εξισώσεων

µενες, σε αντίθεση µε την επαναληπτική σχέση του Newton όπου απαιτείται

µόνο µια.

Επίσης, αξίζει να σηµειώσουµε ότι µέθοδος του Newton µπορεί να θεωρηθεί

ως οριακή περίπτωση της (7.5), αν υποθέσουµε ότι παίρνουµε το όριο της

σχέσης για xn−1 → xn.

Αλγόριθµος της µεθόδου της τέµνουσας

• ∆εδοµένα : Η συνάρτηση f(x), δύο αρχικές προσεγγίσεις της ζητούµενης

ρίζας x0, x1 και η ζητούµενη ακρίβεια ε > 0.

• Βήµα 1 : Θέτουµε n = 1.

• Βήµα 2 : Υπολόγισε την ποσότητα

xn+1 = xn −xn − xn−1

f(xn)− f(xn−1)f(xn) (7.6)

• Βήµα 3 : Αν |xn+1 − xn| > ε, τότε θέτουµε n = n + 1 και επιστρέφουµε

στο βήµα 2.

• Βήµα 4 : Η ζητούµενη ρίζα είναι x = xn+1.

Παράδειγµα 7.3 Το ζητούµενο είναι το ίδιο µε αυτό του παραδείγµατος 7.2,

όµως αυτή φορά δεν µας επιτρέπεται η χρήση της παραγώγου.

Αφού δεν επιτρέπεται η χρήση της παραγώγου της συνάρτησης θα χρησιµοποι-

ήσουµε τη µέθοδο της τέµνουσας. Η συνάρτηση f(x) είναι και πάλι η

f(x) = x2 − a

οπότε η (7.6) γίνεται

xn+1 = xn −xn − xn−1

x2n − a− x2n−1 + a(x2n − a)

ή

xn+1 = xn −xn − xn−1

(xn − xn−1)(xn + xn−1)(x2n − a)

xn+1 = xn −x2n − a

xn + xn−1οπότε

xn+1 =xnxn−1 + a

xn + xn−1(7.7)

Η τελευταία σχέση µπορεί να χρησιµοποιηθεί για τον υπολογισµό της θετικής

τετραγωνικής ρίζας του a και µάλιστα µια καλή αρχική προσέγγιση για να γίνει

αυτό, είναι η x0 = a2 και x1 = a.

Για a = 2, η σχέση (7.7) γίνεται

xn+1 =xnxn−1 + 2

xn + xn−1

Μέθοδος της διχοτόµησης 97

οπότε για x0 = 1, x1 = 2, παίρνουµε

x2 =2× 1 + 2

2 + 1= 1. 3333

x3 =1. 3333× 2 + 2

1. 3333 + 2= 1. 4000

x4 =1. 4× 1. 3333 + 2

1. 4 + 1. 3333= 1. 4146

x5 =1. 4146× 1. 4 + 2

1. 4146 + 1. 4= 1. 414 2

Στις δύο τελευταίες επαναλήψεις τα τρία πρώτα δεκαδικά ψηφία των x4, x5 δεν

άλλαξαν, άρα η ζητούµενη προσέγγιση είναι√2 ≃ 1. 414

Μέθοδος της διχοτόµησης

Η µέθοδος της διχοτόµησης εκµεταλλεύεται το θεώρηµα των ενδιαµέσων τι-

µών, για τις συνεχείς συναρτήσεις. Αν µια συνάρτηση f(x) είναι συνεχής στο

διάστηµα [a, b], τότε για οποιοδήποτε N ανάµεσα στα f(a), f(b), υπάρχει

τουλάχιστον ένα ξ ∈ [a, b] τέτοιο ώστε f(ξ) = N.

Ειδικότερα, αν η f(x) είναι συνεχής στο διάστηµα [a, b] και συµβαίνει f(a)f(b) <

0 (δηλαδή η συνάρτηση έχει ετερόσηµες τιµές στα δύο άκρα του διαστήµατος),

τότε υπάρχει τουλάχιστον µια ρίζα της f(x) στο διάστηµα αυτό.

Η βασική ιδέα της µεθόδου της διχοτόµησης, είναι η εύρεση συνεχώς µικρό-

τερων διαστηµάτων, µε την ιδιότητα η συνάρτηση να παίρνει ετερόσηµες στα

άκρα τους. Ξεκινώντας από ένα τέτοιο αρχικό διάστηµα

[a0, b0] µε f(a0)f(b0) < 0

βρίσκουµε το µέσο του διαστήµατος που είναι το

a0 + b02

και ονοµάζουµε [a1, b1] ένα από τα διαστήµατα

[a0,a0 + b0

2], [

a0 + b02

, b0]

ανάλογα µε το ποιο από τα δύο έχει τη ιδιότητα των ετερόσηµων τιµών της

συνάρτησης στα δύο άκρα του.

Η παραπάνω διαδικασία µέχρι να καταλήξουµε σε ένα αρκετά µικρό διάστηµα

που “εγκλωβίζει” τη ρίζα µε ικανοποιητική ακρίβεια. Η διαδικασία φαίνεται

98 Αριθµητικές µέθοδοι επίλυσης µη γραµµικών εξισώσεων

στο παρακάτω σχήµα :

bx

a

ba

0

0

11

Αλγόριθµος της µεθόδου της διχοτόµησης

• ∆εδοµένα : Η συνάρτηση f(x), ένα διάστηµα [a0, b0] τέτοιο ώστε f(a0)f(b0) <0 και η ζητούµενη ακρίβεια ε > 0.

• Βήµα 1 : Θέτουµε n = 0.

• Βήµα 2 : Θέτουµε

[an+1, bn+1] =

[an,

an+bn2 ], f(an)f(

an+bn2 ) < 0

[an+bn2 , bn], f(an+bn2 )f(bn) < 0(7.8)

• Βήµα 3 : Αν bn+1 − an+1 > ε, τότε θέτουµε n = n + 1 και επιστρέφουµε

στο βήµα 2.

• Βήµα 4 : Η ζητούµενη ρίζα είναι x = an+1+bn+12 .

Παράδειγµα 7.4 Ζητείται ο υπολογισµός της√

2 µε ακρίβεια ε = 10−3, χρη-σιµοποιώντας τη µέθοδο της διχοτόµησης. Ένα αρχικό διάστηµα που µπορεί

να χρησιµοποιηθεί είναι το [1, 2]. Οι επαναλήψεις του αλγορίθµου εµφανίζονται

Μέθοδος της διχοτόµησης 99

στον παρακάτω πίνακα :

n an bnan+bn2 f(an) f(bn) f(an+bn2 )

0 1 2 1.5 −1 2 0.251 1 1.5 1.25 −1 0.25 −0.43752 1.25 1.5 1.375 −0.4375 0.25 −0.1093753 1.375 1.5 1.4375 −0.109375 0.25 0.06640634 1.375 1.4375 1.40625 −0.109375 0.066406 −0.0224605 1.40625 1.4375 1.42188 −0.022460 0.066406 0.0217286 1.40625 1.42188 1.41406 −0.022460 0.021728 −0.0004277 1.41406 1.42188 1.41797 −0.0004272 0.021728 0.0106358 1.41406 1.41797 1.41602 −0.0004272 0.010635 0.005109 1.41406 1.41602 1.41504 −0.0004272 0.005100 0.00233510 1.41406 1.41504 1.41455 −0.0004272 0.002335 0.000953

Στην 10η επανάληψη το πλάτος του διαστήµατος είναι 1.41504 − 1.41406 =0.000 98 < 10−3 = ε, άρα η ζητούµενη προσέγγιση είναι το µέσο του διαστή-

µατος δηλαδήa10 + b10

2= 1.41455

Παρατηρήστε ότι ο ρυθµός σύγκλισης τους αλγορίθµου της διχοτόµησης είναι

πιο αργός από εκείνο των δύο προηγούµενων µεθόδων.

8 Παρεµβολή

Εισαγωγή

Παρεµβολή, σηµαίνει την εύρεση µιας συνάρτησης η οποία προσεγγίζει ένα

σύνολο δεδοµένων έτσι ώστε η τιµή της συνάρτησης αυτής στα δεδοµένα

σηµεία να είναι ίση µε την αντίστοιχη δεδοµένη τιµή. Γενικά, το πρόβληµα

παρεµβολής σε µία διάσταση έχει την εξής µορφή : για τα δεδοµένα

(xi, yi), i = 0, 1, . . . , n

µε x0 < x1 < . . . < xn, ζητείται µια συνάρτηση P (x), τέτοια ώστε

P (xi) = yi, i = 0, 1, . . . , n

Η συνάρτηση P (x), ονοµάζεται συνάρτηση παρεµβολής. Προβλήµατα πα-

ρεµβολής προκύπτουν µε πολλούς διαφορετικούς τρόπους και µπορεί να έχουν

διαφορετικούς σκοπούς. Μερικά παραδείγµατα είναι τα εξής :

• Η γραφική παράσταση µίας οµαλής καµπύλης η οποία να διέρχεται από

ένα σύνολο δεδοµένων σηµείων.

• Ο υπολογισµός των τιµών µιας µαθηµατικής συνάρτησης εύκολα και γρή-

γορα.

• Η αντικατάσταση µιας “δύσκολης” συνάρτησης µε µία πιο “εύκολη”

• Ολοκλήρωση και διαφόριση διακριτών δεδοµένων

Ως συνάρτηση παρεµβολής µπορεί να χρησιµοποιηθεί οποιοδήποτε είδος συ-

νάρτησης εξυπηρετεί καλύτερα τις ανάγκες ενός συγκεκριµένου προβλήµατος.

Οι πιο συνηθισµένες µορφές είναι πολυωνυµική, η εκθετική και η τριγωνοµε-

τρική. Παρακάτω θα ασχοληθούµε µε την πολυωνυµική παρεµβολή.

Πολυωνυµική παρεµβολή

Η πολυωνυµική παρεµβολή αφορά την ειδική περίπτωση παρεµβολής ενός

102 Παρεµβολή

συνόλου n + 1 δεδοµένων

(xi, yi), i = 0, 1, . . . , n

από µία πολυνωνυµική συνάρτηση P (x) βαθµού n, τέτοια ώστε

P (xi) = yi (8.1)

για i = 0, . . . , n. Αν υποθέσουµε ότι πολυώνυµο P (x) γραφεί ως

P (x) = p0 + p1x + · · ·+ pn−1xn−1 + pnx

n

το ζητούµενο είναι να υπολογιστούν οι n+ 1 συντελεστές pi, i = 0, 1, . . . , n,

δεδοµένων των n+1 σχέσεων (8.1). Έχοντας στη διάθεση µας n+1 (διαφο-

ρετικές) σχέσεις µπορούµε να υπολογίσουµε µοναδικά τους n+1 συντελεστές

pi. Μπορούµε µάλιστα να γράψουµε τις σχέσεις παρεµβολής σαν ένα σύστη-

µα γραµµικών εξισώσεων ως προς τους συντελεστές pi. ∆ηλαδή, οι σχέσεις

(8.1) γράφονται ως

p0 + p1x1 + · · ·+ pn−1xn−11 + pnx

n1 = y0

p0 + p1x2 + · · ·+ pn−1xn−12 + pnx

n2 = y1

...

p0 + p1xn + · · ·+ pn−1xn−1n + pnx

nn = yn

ή ισοδύναµα σε µορφή πινάκων

1 x1 · · · xn11 x2 · · · xn2...

......

1 xn · · · xnn

︸ ︷︷ ︸V

p0p1...

pn

︸ ︷︷ ︸P

=

y0y1...

yn

︸ ︷︷ ︸Y

Ο πίνακας V λέγεται πίνακας µορφής Vandermonde και αποδεικνύεται ότι είναι

αντιστρέψιµος εάν και µόνο εάν οι τιµές xi είναι ανά δύο διαφορετικές µεταξύ

τους. Σε µια τέτοια περίπτωση ο πίνακας P, που περιέχει του ζητούµενους

συντελεστές µπορεί να υπολογιστεί από τη σχέση

P = V −1Y

Επειδή η αντιστροφή των Vandermonde πινάκων κάθε άλλο παρά επιθυµητή

είναι, η παραπάνω σχέση είναι χρήσιµη µόνο για θεωρητικούς λόγους. Στην

πράξη ο υπολογισµός των συντελεστών του πολυωνύµου µπορεί να γίνει µε

διάφορες µεθόδους µεταξύ των οποίων οι µέθοδος του Lagrange και η µέθοδος

του Newton που παρουσιάζουµε παρακάτω.

Πολυωνυµική παρεµβολή 103

Μέθοδος του Lagrange

Για να γίνει κατανοητό πως προκύπτει η µορφή Lagrange ενός πολυωνύµου πα-

ρεµβολής µπορούµε να ξεκινήσουµε από ένα σύνολο δύο δεδοµένων (x0, y0)

και (x1, y1) και ζητούµε ένα πολυώνυµο παρεµβολής πρώτου βαθµού της µορ-

φής P (x) = p0 + p1x. Από τις σχέσεις παρεµβολής παίρνουµε

p0 + p1x0 = y0

p0 + p1x1 = y1

το οποίο είναι ένα σύστηµα εξισώσεων 2×2 µε αγνώστους τα p0, p1, τα οποία

εύκολα προκύπτουν ως

p0 =y0x1 − y1x0

x1 − x0

p1 =y1 − y0x1 − x0

Άρα το ζητούµενο πολυώνυµο γράφεται

P (x) =y0x1 − y1x0

x1 − x0+

y1 − y0x1 − x0

x =

=y0x1 − y1x0 + y1x− y0x

x1 − x0=

=x− x1x0 − x1

y0 +x− x0x1 − x0

y1 =

= L0(x)y0 + L1(x)y1

όπου θέσαµε

L0(x) =x− x1x0 − x1

και L1(x) =x− x0x1 − x0

Η τελευταία µορφή λέγεται πολυώνυµο παρεµβολής του Lagrange. Παρατη-

ρήστε ότι οι συντελεστές Li(x) εξαρτώνται µόνο από τα xi.

Γενικότερα, ένα πολυώνυµο παρεµβολής του Lagrange έχει τη µορφή

P (x) = L0(x)y0 + L1(x)y1 + · · ·+ Ln(x)yn =n∑

i=0

Li(x)yi (8.2)

όπου οι συντελεστές Li(x), δίνονται από τη σχέση

Li(x) =n∏

j=0j =i

x− xjxi − xj

(8.3)

104 Παρεµβολή

Είναι εύκολο να διαπιστώσουµε ότι

Li(xj) =

1, i = j0, i = j

γεγονός που επιβεβαιώνει ότι το πολυώνυµο (8.2) ικανοποιεί τις σχέσεις της

παρεµβολής (8.1).

Παράδειγµα 8.1 Να βρεθεί πολυώνυµο που παρεµβάλει τα σηµεία (x0, y0) =(0,−1), (x1, y1) = (1, 1), (x2, y2) = (2, 1), (x3, y3) = (5, 0). Χρησιµοποιώ-

ντας το πολυώνυµο παρεµβολής του Lagrange θα έχουµε

P (x) = L0(x)y0 + L1(x)y1 + L2(x)y2 + L3(x)y4όπου

L0(x) =(x− 1)(x− 2)(x− 5)

(0− 1)(0− 2)(0− 5)=

(x− 1) (x− 2) (x− 5)

−10= − 1

10x3+

4

5x2−17

10x+1

L1(x) =(x− 0)(x− 2)(x− 5)

(1− 0)(1− 2)(1− 5)=

x (x− 2) (x− 5)

4=

1

4x3 − 7

4x2 +

5

2x

L2(x) =(x− 0)(x− 1)(x− 5)

(2− 0)(2− 1)(2− 5)=

x(x− 1)(x− 5)

−6= −1

6x3 + x2 − 5

6x

L3(x) =(x− 0)(x− 1)(x− 2)

(5− 0)(5− 1)(5− 2)=

x (x− 1) (x− 2)

60=

1

60x3 − 1

20x2 +

1

30x

Άρα

P (x) = (−1)× (− 1

10x3 +

4

5x2 − 17

10x + 1) +

1× (1

4x3 − 7

4x2 +

5

2x) +

1× (−1

6x3 + x2 − 5

6x) +

0× (1

60x3 − 1

20x2 +

1

30x)

δηλαδή

P (x) =11

60x3 − 31

20x2 +

101

30x− 1

Η γραφική παράσταση του πολυωνύµου παρεµβολής φαίνεται παρακάτω :

Πολυωνυµική παρεµβολή 105

1 2 3 4 5 6

-1

0

1

x

P(x)

Παρατηρήστε ότι το πολυώνυµο παρεµβολής όντως περνάει από τα σηµεία

(0,−1), (1, 1), (2, 1), (5, 0).

Παράδειγµα 8.2 Θέλουµε να προσεγγίσουµε την συνάρτηση f(x) = ηµx, στοδιάστηµα [0, π2 ] µε ένα πολυώνυµο παρεµβολής χρησιµοποιώντας τις τρείς πα-

ρακάτω γνωστές τιµές του ηµιτόνου :

ηµ0 = 0, ηµπ

4=

√2

2, ηµ

π

2= 1

∆ηλαδή τα σηµεία παρεµβολής είναι

(x0, y0) = (0, 0),

(x1, y1) = (0.785 40, 0.707 11),

(x2, y2) = (1. 570 8, 1)

Το πολυώνυµο παρεµβολής του Lagrange θα είναι

P (x) = L0(x)y0 +L1(x)y1 + L2(x)y2όπου έχουµε

L0(x) =(x− π

4 )(x− π2 )

(0− π4 )(0− π

2 )= 0.810 57x2 − 1. 909 9x + 1

L1(x) =(x− 0)(x− π

2 )

(π4 − 0)(π4 − π2 )

= −1. 621 1x2 + 2. 546 5x

L2(x) =(x− 0)(x− π

4 )

(π2 − 0)(π2 − π4 )

= 0.810 57x2 − 0.636 62x

Άρα

P (x) = 0× (0.810 57x2 − 1. 909 9x + 1) +√2

2× (−1. 621 1x2 + 2. 546 5x) +

1× (0.810 57x2 − 0.636 62x)

106 Παρεµβολή

δηλαδή

P (x) = 1. 164x− 0.335 7x2

Στο παρακάτω σχήµα παρουσιάζεται η γραφική παράσταση του πολυωνύµου

παρεµβολής P (x) (συνεχής καµπύλη), σε αντιπαράθεση µε την πραγµατική συ-

νάρτηση f(x) = ηµx (διακεκοµµένη καµπύλη) :

x

P(x)

1

0.707

0

π/4 π/2

Μέθοδος του Newton

Έστω ένα σύνολο δεδοµένων σηµείων (xi, yi), i = 0, 1, . . . , n, τα οποία θέλου-

µε να θέλουµε να παρεµβάλουµε µε ένα πολυώνυµο P (x) βαθµού n. ∆ηλαδή

πρέπει

P (xi) = yi, i = 0, 1, . . . , n

Η µέθοδος παρεµβολής του Newton χρησιµοποιεί τις λεγόµενες διαιρεµένες

διαφορές, για το σχηµατισµό των συντελεστών του πολυωνύµου P (x). Ορί-

ζουµε :

• ∆ιαιρεµένη διαφορά 1ης τάξης στα σηµεία x0, x1 των παραπάνω δεδοµέ-

νων, τον λόγο

[y0, y1] =y1 − y0x1 − x0

• ∆ιαιρεµένη διαφορά 2ης τάξης στα σηµεία x0, x1, x2 των παραπάνω δε-

δοµένων, τον λόγο

[y0, y1, y2] =[y1, y2]− [y0, y1]

x2 − x0• ∆ιαιρεµένη διαφορά 3ης τάξης στα σηµεία x0, x1, x2, x3 των παραπάνω

Πολυωνυµική παρεµβολή 107

δεδοµένων, τον λόγο

[y0, y1, y2, y3] =[y1, y2, y3]− [y0, y1, y2]

x3 − x0• Γενικότερα, ονοµάζουµε διαιρεµένη διαφορά n-οστής τάξης στα σηµεία

x0, x1, . . . , xn−1, xn των παραπάνω δεδοµένων, τον λόγο

[y0, y1, . . . , yn] =[y1, y2, . . . , yn]− [y0, y1, . . . , yn−1]

xn − x0

Όπως είναι προφανές από τον παραπάνω ορισµό των διαιρεµένων διαφορών,

ο υπολογισµός µιας διαιρεµένης διαφοράς τάξης n, ανάγεται στο υπολογισµό

µιας διαιρεµένης διαφοράς πρώτης τάξης µεταξύ δύο διαδοχικών διαφορών

τάξης n− 1.

Χρησιµοποιώντας τις παραπάνω διαιρεµένες διαφορές το πολυώνυµο παρεµ-

βολής του Newton δίνεται από τον τύπο :

P (x) = y0 + (x− x0)[y0, y1] + (x− x0)(x− x1)[y0, y1, y2] + · · ·(8.4)

+(x− x0)(x− x1) . . . (x− xn−1)[y0, y1, . . . , yn]

Ο υπολογισµός των διαιρεµένων διαφορών για ένα σύνολο δεδοµένων (xi, yi),

i = 0, 1, . . . , n, µπορεί να παρασταθεί σχηµατικά στον παρακάτω πίνακα :

y0[y0, y1]

y1 [y0, y1, y2][y1, y2]

y2 [y1, y2, y3]. . .

[y2, y3] [y0, y1, . . . , yn−1]

y3 [y0, y1, . . . , yn]...

...... [y1, y2, . . . , yn]

......

yn−1 [yn−2,yn−1, yn][yn−1, yn]

yn

Παρατηρήστε ότι στο πολυώνυµο παρεµβολής τελικά χρησιµοποιούνται µόνο

οι διαιρεµένες διαφορές που εµφανίζονται µε περίγραµµα στον παραπάνω πί-

νακα, για τον υπολογισµό τους όµως είναι απαραίτητος ο υπολογισµός όλων

των διαφορών.

Παράδειγµα 8.3 Θέλουµε να προσεγγίσουµε την συνάρτηση f(x) = ηµx, στο

108 Παρεµβολή

διάστηµα [0, π2 ] µε ένα πολυώνυµο παρεµβολής χρησιµοποιώντας τις τρείς πα-

ρακάτω γνωστές τιµές του ηµιτόνου :

ηµ0 = 0, ηµπ

4=

√2

2, ηµ

π

2= 1

∆ηλαδή τα σηµεία παρεµβολής είναι

(x0, y0) = (0, 0),

(x1, y1) = (0.785 40, 0.707 11),

(x2, y2) = (1. 570 8, 1)

Αυτή τη φορά θα χρησιµοποιήσουµε τη µέθοδο παρεµβολής του Newton. Το

πολυώνυµο παρεµβολής του Newton θα είναι

P (x) = y0 + (x− x0)[y0, y1] + (x− x0)(x− x1)[y0, y1, y2]

Σχηµατίζουµε τον πίνακα των διαιρεµένων διαφορών όπως παραπάνω :

y0 = 0[y0, y1] = 0.900 32

y1 = 0.707 11 [y0, y1, y2] = −0.335 75[y1, y2] = 0.372 92

y2 = 1

Άρα, το πολυώνυµο παρεµβολής είναι

P (x) = 0 + (x− 0)× 0.900 32 + (x− 0)(x− 0.785 40)× (−0.335 75)

= 1. 164x− 0.335 7x2

Παρατηρήστε ότι το πολυώνυµο παρεµβολής του Newton είναι ακριβώς το ίδιο

µε αυτό που υπολογίσαµε µε τη µέθοδο του Lagrange στο παράδειγµα 8.2.

9 Αριθµητική Ολοκλήρωση

Συναρτήσεων

Εισαγωγή

Ο ακριβής υπολογισµός του ορισµένου ολοκληρώµατος µιας συνάρτησης της

µορφής ∫ b

af(x)dx

µε αναλυτικές µεθόδους είναι σε πολλές περιπτώσεις πολύ δύσκολη ή ακόµη

και αδύνατη. Αυτό µπορεί να συµβαίνει είτε επειδή δεν µας είναι γνωστός ο

αναλυτικός τύπος της ίδιας της συνάρτησης f(x), είτε επειδή η ολοκλήρωση

είναι πολύ δύσκολη µε αναλυτικές µεθόδους ή επειδή σε κάποιες περιπτώσεις

το ολοκλήρωµα δεν είναι δυνατό να εκφραστεί µε τη βοήθεια στοιχειωδών

συναρτήσεων. Για αυτό το λόγο πολύ συχνά, σε πραγµατικές εφαρµογές,

καταφεύγουµε σε µεθόδους αριθµητικής προσέγγισης του ολοκληρώµατος.

Η γενική µεθοδολογία από την οποία προκύπτουν οι ειδικότερες µέθοδοι που

θα παρουσιάσουµε παρακάτω, βασίζεται αρχικά στην λογική του χωρισµού

του διαστήµατος σε µία σειρά από n διαστήµατα ίσου πλάτους

h =b− a

nΘεωρούµε δηλαδή, διαδοχικά διαστήµατα της µορφής [xk−1, xk], k = 1, 2, . . . , n,

όπου xk = a + hk. Προφανώς σε αυτή την περίπτωση είναι a = x0 και

b = xn, ενώ h = xk+1− xk. Στη συνέχεια η συνάρτηση f(x) παρεµβάλλεται

στα πρώτα v +1 διαδοχικά σηµεία της παραπάνω διαµέρισης από κατάλληλο

πολυώνυµο βαθµού v, το οποίο ονοµάζουµε P (x). ∆ηλαδή κατασκευάζουµε

ένα πολυώνυµο παρεµβολής P (x) έτσι ώστε

P (xi) = f(xi), i = 0, 1, . . . , v

110 Αριθµητική Ολοκλήρωση Συναρτήσεων

Χρησιµοποιώντας τον τύπο παρεµβολής του Lagrange έχουµε

P (x) =v∑

i=0

Li(x)f(xi)

όπου

Li(x) =v∏

j=0j =i

x− xjxi − xj

Οπότε θεωρώντας ότι η συνάρτηση f(x) προσεγγίζεται στο διάστηµα [x0, xv]

από το πολυώνυµο παρεµβολής P (x) έχουµε∫ xv

x0

f(x)dx ≃∫ xv

x0

P (x)dx =

=

∫ xv

x0

v∑

i=0

Li(x)f(xi)dx =

=v∑

i=0

f(xi)

∫ xv

x0

Li(x)dx

Αν στα ολοκληρώµατα∫ xvx0

Li(x)dx, κάνουµε την αντικατάσταση x = x0+hu,

παίρνουµε ∫ xv

x0

Li(x)dx = h

∫ v

0

v∏

j=0j =i

u− j

i− jdu

Παρατηρήστε ότι το τελευταίο ολοκλήρωµα εξαρτάται µόνο από το i και το

v. Άρα αν θέσουµε

A(i, v) =

∫ v

0

v∏

j=0j =i

u− j

i− jdu, i = 0, 1, . . . , v (9.1)

παίρνουµε ∫ xv

x0

f(x)dx ≃ hv∑

i=0

A(i, v)f(xi) (9.2)

Τελικά, για να προσεγγίσουµε το ορισµένο ολοκλήρωµα της συνάρτησης στο

συνολικό διάστηµα [a, b], υποθέτοντας ότι n = kv, αρκεί να σκεφτούµε ότι∫ b

af(x)dx =

∫ xn

x0

f(x)dx =

=

∫ xv

x0

f(x)dx +

∫ x2v

xv

f(x)dx + . . . +

∫ xkv

x(k−1)v

f(x)dx

οπότε κάθε ένα από τα επιµέρους ολοκληρώµατα προσεγγίζεται από τύπους

Κανόνας του ορθογωνίου 111

της µορφής (9.2).

Ανάλογα µε τον βαθµό v του πολυωνύµου παρεµβολής που επιθυµούµε να

χρησιµοποιήσουµε, προκύπτουν οι διάφορες επιµέρους µέθοδοι αριθµητικής

ολοκλήρωσης που παρουσιάζονται παρακάτω. Όσο µεγαλύτερος ο βαθµός του

πολυωνύµου παρεµβολής τόσο καλύτερη αναµένουµε να είναι η προσέγγιση

του αντίστοιχου ολοκληρώµατος.

Κανόνας του ορθογωνίου

Στη βασική του µορφή πρόκειται ουσιαστικά για χρήση της παραπάνω γενικής

µεθοδολογίας όπου χρησιµοποιούµε πολυώνυµα παρεµβολής µηδενικής τάξης,

δηλαδή σταθερές. Αν θεωρήσουµε δηλαδή ότι στο διάστηµα [x0, x1) η συνάρ-

τηση παρεµβάλλεται από ένα πολυώνυµο µηδενικού βαθµού P (x), έτσι ώστε

P (x0) = f(x0) θα είναι P (x) = f(x0), οπότε έχουµε∫ x1

x0

f(x)dx ≃∫ x1

x0

f(x0)dx = hf(x0)

Αντίστοιχη λογική εφαρµόζεται και στα επόµενα διαστήµατα άρα∫ b

af(x)dx =

∫ x1

x0

f(x)dx +

∫ x2

x1

f(x)dx + . . . +

∫ xn

xn−1

f(x)dx

≃ hf(x0) + hf(x1) + . . . + hf(xn−1)

Άρα∫ b

af(x)dx ≃ h

n−1∑

k=0

f(xk)

Πρακτικά το ολοκλήρωµα προσεγγίζεται αθροίζοντας εµβαδά ορθογωνίων πα-

ραλληλογράµµων τα οποία έχουν βάση πλάτους h και ύψους f(xk). Η περί-

πτωση αυτή απεικονίζεται στο παρακάτω σχήµα :

112 Αριθµητική Ολοκλήρωση Συναρτήσεων

a = x xx x x = b0 1 2 n-1 n

Μια εναλλακτική λογική είναι να προσεγγίσουµε τη συνάρτηση f(x) στο διά-

στηµα (x0, x1] µε την τιµή της στο δεξιό άκρο του διαστήµατος, δηλαδή το

f(x1), οπότε θα είχαµε αντίστοιχα∫ b

af(x)dx ≃ h

n∑

k=1

f(xk)

Σε αυτή την περίπτωση τα ορθογώνια έχουν τη µορφή

a = x xx x x = b0 1 2 n-1 n

Τέλος, µια τρίτη σχετικά καλύτερη τακτική χρησιµοποιεί την τιµή της συνάρ-

τησης στο µέσο κάθε ενός από τα διαστήµατα οπότε έχουµε∫ b

af(x)dx ≃ h

n−1∑

k=0

f(xk + xk+1

2)

Παράδειγµα 9.1 Να προσεγγιστεί το ορισµένο ολοκλήρωµα∫ 10 exdx, χρησι-

µοποιώντας τις τρεις παραπάνω παραλλαγές του κανόνα του ορθογωνίου µε

Κανόνας του τραπεζίου 113

n = 10 διαµερίσεις του διαστήµατος [0, 1].

Προφανώς είναι h = b−an = 1−0

10 = 0.1. Για τις δύο πρώτες παραλλαγές της

µεθόδου σχηµατίζουµε τον ακόλουθο πίνακα τιµών :

xk 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.

f(xk) 1 1.105 1.221 1.349 1.491 1.648 1.822 2.014 2.225 2.46 2.718

οπότε σύµφωνα µε την πρώτη παραλλαγή της µεθόδου έχουµε∫ 1

0exdx ≃ 0.1

9∑

k=0

f(xk) = 1.6338

ενώ για τη δεύτερη αντίστοιχα∫ 1

0exdx ≃ 0.1

10∑

k=1

f(xk) = 1.80563

Για την τρίτη παραλλαγή θα χρειαστούµε τις τιµές της συνάρτησης στα µέσα των

διαστηµάτων, άρα σχηµατίζουµε τον πίνακα :

xk+xk+12 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95

f(xk+xk+12 ) 1.051 1.161 1.284 1.419 1.568 1.733 1.915 2.117 2.34 2.586

οπότε ∫ 1

0exdx ≃ 0.1

9∑

k=0

f(xk + xk+1

2) = 1.71757

Σηµειώστε ότι η πραγµατική τιµή του ολοκληρώµατος µπορεί να υπολογιστεί

αναλυτικά και είναι∫ 1

0exdx = [ex]10 = e1 − e0 = e− 1 ≃ 1. 718 3

Προφανώς η τρίτη παραλλαγή της µεθόδου δίνει την καλύτερη προσέγγιση.

Κανόνας του τραπεζίου

Στον κανόνα του τραπεζίου χρησιµοποιείται µια παρεµβολή πρώτης τάξης για

κάθε ένα από τα διαστήµατα [xk, xk+1]. ∆ηλαδή το πολυώνυµο παρεµβολής

έχει βαθµό v = 1, οπότε από τον τύπο (9.1) για v = 1 έχουµε

A(0, 1) =

∫ 1

0

u− 1

0− 1du =

1

2

A(1, 1) =

∫ 1

0

u− 0

1− 0du =

1

2

114 Αριθµητική Ολοκλήρωση Συναρτήσεων

ενώ από τον τύπο (9.2) παίρνουµε∫ x1

x0

f(x)dx ≃ h[A(0, 1)f(x0) + A(1, 1)f(x1)] =h

2[f(x0) + f(x1)]

Ουσιαστικά η τελευταία σχέση δίνει το εµβαδό ενός του τραπεζίου που ορί-

ζεται από τον οριζόντιο άξονα, τις δύο κατακόρυφες στα σηµεία x0, x1 και το

τµήµα που ενώνει τα σηµεία τοµής των δύο κατακόρυφων µε τη γραφική πα-

ράσταση της f(x), όπως φαίνεται στο παρακάτω σχήµα :

a = x xx x x = b0 1 2 n-1 n

Εφαρµόζοντας την ίδια λογική σε όλα τα διαστήµατα της µορφής [xk, xk+1],

έχουµε∫ b

af(x)dx ≃ h

2[f(x0) + f(x1)] +

h

2[f(x1) + f(x2)] + . . . +

h

2[f(xn−1) + f(xn)]

=h

2[f(x0) + 2f(x1) + 2f(x2) + . . . + 2f(xn−1) + f(xn)]

Η τελευταία σχέση δίνει τον κανόνα του τραπεζίου για την αριθµητική ολο-

κλήρωση, δηλαδή∫ b

af(x)dx ≃ h

2[f(x0) + f(xn) + 2

n−1∑

k=1

f(xk)]

Παράδειγµα 9.2 Να προσεγγιστεί το ορισµένο ολοκλήρωµα∫ 10 exdx, χρησι-

µοποιώντας τον κανόνα του τραπεζίου µε, n = 10 διαµερίσεις του διαστήµατος

[0, 1].

Κανόνας του Simpson 115

Χρησιµοποιώντας τα στοιχεία του πρώτου πίνακα του παραδείγµατος 9.1, έχουµε∫ 1

0exdx ≃ 0.1

2[1 + 2.718 + 2

n−1∑

k=1

f(xk)] = 1.71971

Κανόνας του Simpson

Ο κανόνας του Simpson χρησιµοποιεί την τιµή της συνάρτησης σε τρία διαδο-

χικά σηµεία της διαµέρισης του διαστήµατος, για να παράγει ένα πολυώνυµο

παρεµβολής δεύτερης τάξης. ∆ηλαδή για τα δύο πρώτα διαστήµατα της δια-

µέρισης [x0, x1] και [x1, x2], η συνάρτηση προσεγγίζεται από το πολυώνυµο

παρεµβολής P (x), για το οποίο ισχύει

P (x0) = f(x0), P (x1) = f(x1), P (x2) = f(x2)

Εφαρµόζοντας την (9.1) για v = 2 έχουµε

A(0, 2) =

∫ 2

0

(u− 1)(u− 2)

(0− 1)(0− 2)du =

1

3

A(1, 2) =

∫ 2

0

(u− 0)(u− 2)

(1− 0)(1− 2)du =

4

3

A(2, 2) =

∫ 2

0

(u− 0)(u− 1)

(2− 0)(2− 1)du =

1

3Άρα σύµφωνα µε την (9.2) θα έχουµε∫ x2

x0

f(x)dx ≃ h[A(0, 2)f(x0) + A(1, 2)f(x1) + A(2, 2)f(x2)]

=h

3[f(x0) + 4f(x1) + f(x2)]

Επεκτείνοντας την ίδια λογική και στα υπόλοιπα (ζεύγη) διαστηµάτων και

υποθέτοντας ότι το n είναι άρτιο, παίρνουµε∫ b

af(x)dx ≃ h

3[f(x0) + 4f(x1) + f(x2) +

h

3[f(x2) + 4f(x3) + f(x4)] + . . .

. . . +h

3[f(xn−2) + 4f(xn−1) + f(xn)]

=h

3[f(x0) + 4f(x1) + 2f(x2) + 4f(x3) + 2f(x4) + . . .

. . . + 2f(xn−2) + 4f(xn−1) + f(xn)]

116 Αριθµητική Ολοκλήρωση Συναρτήσεων

ή τελικά τον τύπο του κανόνα του Simpson που είναι∫ b

af(x)dx ≃ h

3f(x0) + f(xn) + 2[f(x2) + f(x4) + . . . + f(xn−2)] +

+4[f(x1) + f(x3) + . . . + f(xn−1)]

=h

3[f(x0) + f(xn) + 2

n

2−1∑

k=1

f(x2k) + 4

n

2−1∑

k=0

f(x2k+1)]

Παράδειγµα 9.3 Να προσεγγιστεί το ορισµένο ολοκλήρωµα∫ 10 exdx, χρησι-

µοποιώντας τον κανόνα του Simpson, µε n = 10 διαµερίσεις του διαστήµατος

[0, 1].

Χρησιµοποιώντας τα στοιχεία του πρώτου πίνακα του παραδείγµατος 9.1, έχουµε

∫ 1

0exdx ≃ 0.1

3[1 + 2.718 + 2

n

2−1∑

k=1

f(x2k) + 4

n

2−1∑

k=0

f(x2k+1)] = 1. 718 3

10 Αριθµητική επίλυση διαφο-

ρικών εξισώσεων

Εισαγωγή

Η προσεγγιστική λύση διαφορικών εξισώσεων αποτελεί ένα από τα σηµα-

ντικότερα ζητούµενα στον κλάδο της αριθµητικής ανάλυσης. Οι διαφορικές

εξισώσεις περιγράφουν µια πληθώρα φαινοµένων που συσχετίζουν ένα µέ-

γεθος µε τον ρυθµό µεταβολής του και εµφανίζονται σε σχεδόν όλους τους

κλάδους των µαθηµατικών, της φυσικής, της µηχανικής, της οικονοµίας και

άλλων πολλών επιστηµών. Στην πραγµατικότητα µόνο ελάχιστες µορφές δια-

φορικών εξισώσεων µπορούν να λυθούν επακριβώς µε αναλυτικές µεθόδους,

οπότε η αριθµητική ανάλυση καλείται να καλύψει το κενό αυτό, παρέχοντας

µια σειρά από προσεγγιστικές µεθόδους επίλυσης.

Ειδικότερα, στο παρόν θα ασχοληθούµε µε διαφορικές εξισώσεις πρώτης τάξης

της µορφής

y′(x) = f(x, y(x)) (10.1)

όπου επιπλέον θα µας δίνονται οι αρχικές συνθήκες του προβλήµατος, της µορ-

φής y(x0) = y0. Η διαφορική εξίσωση (10.1), σε συνδυασµό µε τη δεδοµένη

αρχική συνθήκη, ονοµάζεται πρόβληµα αρχικών συνθηκών πρώτης τάξης. Ο

χαρακτηρισµός “πρώτης τάξης”, οφείλεται στο γεγονός ότι η διαφορική εξίσω-

ση εµπλέκει την πρώτη παράγωγο της άγνωστης συνάρτησης y(x). Αντίστοιχα,

πολύ συχνά σε εφαρµογές, απαντώνται διαφορικές εξισώσεις µεγαλύτερης τά-

ξης. Με µεγαλύτερη συχνότητα µάλιστα εµφανίζονται διαφορικές εξισώσεις

δεύτερης τάξης, αφού τέτοιες είναι στη µεγάλη τους πλειοψηφία οι εξισώσεις

της µηχανικής και του ηλεκτρισµού. Στο παρόν θα περιοριστούµε µόνο στην

αριθµητική επίλυση διαφορικών εξισώσεων πρώτης τάξης.

118 Αριθµητική επίλυση διαφορικών εξισώσεων

Μέθοδος του Taylor

Έστω το πρόβληµα αρχικών συνθηκών πρώτης τάξης

y′(x) = f(x, y(x)), y(x0) = y0 (10.2)

Το ζητούµενο είναι να προσεγγίσουµε τη συνάρτηση y(x), προσδιορίζοντας

ένα σύνολο τιµών της άγνωστης συνάρτησης y(x) σε µια σειρά σηµείων

x0, x1, x2, . . .. Θεωρούµε ότι τα σηµεία x0, x1, x2, . . . ισαπέχουν µεταξύ και

xn+1 − xn = h, άρα γενικά ισχύει

xn = x0 + nh

Αν υποθέσουµε ότι η συνάρτηση y(x) είναι άπειρες φορές παραγωγίσιµη στο

x0, µπορούµε σύµφωνα µε τον τύπο του Taylor να την αναπτύξουµε σε σειρά

της µορφής

y(x) =∞∑

k=0

y(k)(x0)

k!(x− x0)

k

όπου y(k)(x0) συµβολίζει την k−οστή παράγωγο της y(x) στο x0. Για x = x1

η σειρά Taylor µπορεί να γραφεί

y(x1) =∞∑

k=0

y(k)(x0)

k!hk

αφού x1 = x0 + h. Για να απλουστεύσουµε τον συµβολισµό θα γράφουµε

y(k)n = y(k)(xn)

οπότε η σειρά Taylor γίνεται

y1 =∞∑

k=0

y(k)0

k!hk = y0 +

y(1)0

1!h +

y(2)0

2!h2 + . . .

Παρατηρούµε δηλαδή ότι η τιµή της συνάρτησης στο x1, δηλαδή η y1, µπορεί

να εκφραστεί συναρτήσει των τιµών y(k)0 . Εφαρµόζοντας αντίστοιχη λογική

µπορούµε να γράψουµε

yn+1 =∞∑

k=0

y(k)n

k!hk = yn +

y(1)n

1!h+

y(2)n

2!h2 + . . . (10.3)

Για να υπολογίσουµε τις παραγώγους y(k)n , k = 1, 2, 3, . . . , µπορούµε να α-

ξιοποιήσουµε την διαφορική εξίσωση (10.2), αφού για x = xn έχουµε

y(1)n = y′n = f(xn, yn)

ενώ µε διαδοχικές παραγωγίσεις παίρνουµε

y(2)n = y′′n = f ′(xn, yn)

Μέθοδος του Taylor 119

y(3)n = y′′′n = f ′′(xn, yn)...

∆ηλαδή γενικά

y(k)n = f (k−1)(xn, yn)

οπότε η (10.3) γίνεται

yn+1 = yn +∞∑

k=1

f (k−1)(xn, yn)

k!hk = yn +

f(xn, yn)

1!h +

f ′(xn, yn)

2!h2 + . . .

Επειδή στην πράξη η άθροιση άπειρων όρων της σειράς είναι αδύνατη και αν

θεωρήσουµε ότι το h είναι αρκετά µικρό, οπότε το σηµείο xn+1 ανήκει στη

γειτονιά του xn, µπορούµε να αποκόψουµε τους άπειρους όρους της σειράς,

παίρνοντας µια προσέγγιση τάξης m της µορφής

yn+1 = yn +m∑

k=1

f (k−1)(xn, yn)

k!hk (10.4)

Χρησιµοποιώντας την παραπάνω αναδροµική σχέση µπορούµε αν υπολογί-

σουµε τις παραγώγους µέχρι τάξης (m− 1) της f(x, y(x)), να υπολογίσουµε

διαδοχικά τις τιµές y1, y2, y3, . . . , όπως στο παρακάτω παράδειγµα. Όσο µε-

γαλύτερης τάξης προσέγγιση χρησιµοποιήσουµε τόσο ακριβέστερο θα είναι το

αποτέλεσµα.

Παράδειγµα 10.1 Να προσεγγιστεί η λύση της διαφορικής εξίσωσης

y′(x) = xy(x)

µε αρχική συνθήκη y(0) = 1, στο διάστηµα [0, 1] µε τη µέθοδο του Taylor µε

προσέγγιση 2ης τάξης και βήµα h = 0.1.

Να σηµειώσουµε εδώ ότι η παραπάνω διαφορική εξίσωση, ανήκει στη κατηγο-

ρία των δ.ε. χωριζοµένων µεταβλητών, οπότε εύκολα µπορεί να υπολογιστεί η

ακριβής λύση της, η οποία για τη συγκεκριµένη αρχική συνθήκη είναι

y(x) = ex2/2

Αφού η ακριβής λύση είναι γνωστή, µπορούµε εύκολα να συγκρίνουµε τις τιµές

της, µε αυτές που θα προκύψουν από την προσέγγιση του Taylor.

Για προσέγγιση 2ης τάξης ο τύπος (10.4) γίνεται

yn+1 = yn +f(xn, yn)

1!h+

f ′(xn, yn)

2!h2 (10.5)

όπου h = 0.1 και

f(xn, yn) = xnyn

120 Αριθµητική επίλυση διαφορικών εξισώσεων

ή αν λάβουµε υπόψη ότι xn = 0 + nh,

f(xn, yn) = nhyn

Για την παράγωγο της f, έχουµε

f ′(x, y(x)) = [xy(x)]′ = x′y(x) + xy′(x)

= y(x) + xy′(x)

όµως από την διαφορική εξίσωση έχουµε ότι y′(x) = xy(x), οπότε

f ′(x, y(x)) = y(x) + x2y(x)

Άρα

f ′(xn, yn) = yn(1 + n2h2)

Με βάση τα παραπάνω, η αναδροµική σχέση (10.5) γίνεται

yn+1 = yn + nhynh +1

2yn(1 + n2h2)h2

ή

yn+1 = yn[1 + nh2 +1

2(1 + n2h2)h2]

οπότε µε δεδοµένο ότι y0 = 1, µπορούµε διαδοχικά να υπολογίσουµε τις y1, y2, y3, . . .που υπολογίζονται στον παρακάτω πίνακα :

xn 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.

yn 1 1.005 1.02 1.046 1.083 1.132 1.196 1.276 1.375 1.496 1.644

ex2n/2 1 1.005 1.02 1.046 1.083 1.133 1.197 1.278 1.377 1.499 1.649

Στην τελευταία γραµµή υπολογίζονται οι ακριβείς τιµές της πραγµατικής λύσης

y(x) = ex2/2, για λόγους σύγκρισης.

Μέθοδος του Euler

Η µέθοδος του Euler µπορεί να θεωρηθεί ουσιαστικά σαν ειδική περίπτω-

ση της µεθόδου του Taylor, όπου χρησιµοποιούνται προσεγγίσεις 1ης τάξης.

Εναλλακτικά µπορεί κανείς να θεωρήσει ότι δεδοµένης της διαφορικής εξίσω-

σης

y′(x) = f(x, y(x))

µε αρχική συνθήκη y(x0) = y0, και δεδοµένης µιας ακολουθίας σηµείων xn =

x0+ nh, όπου το h είναι αρκετά µικρό, ότι η παράγωγος y′(x) προσεγγίζεται

από την πεπερασµένη “προς τα εµπρός” διαφορά

y′(xn) =y(xn+1)− y(xn)

h

Μέθοδος του Euler 121

ή σύµφωνα µε τον ορισµό της προηγούµενης παραγράφου

y′n =yn+1 − yn

h

Η διαφορική εξίσωση τότε γράφεταιyn+1 − yn

h= f(xn, yn)

ή ισοδύναµα

yn+1 = yn + hf(xn, yn) (10.6)

Η αναδροµική σχέση (10.6), προκύπτει επίσης άµεσα από την (10.4) για m =

1.

Μια παραλλαγή της µεθόδου του Euler που παρουσιάστηκε παραπάνω, προ-

κύπτει αν χρησιµοποιηθεί η “προς τα πίσω” διαφορά για την προσέγγιση της

παραγώγου δηλαδή

y′(xn) =y(xn)− y(xn−1)

h

οπότε προκύπτει µια ανάλογη αναδροµική σχέση. Οι δύο αυτές παραλλαγές

είναι γνωστές αντίστοιχα µε τις ονοµασίες “προς τα εµπρός” και “προς τα

πίσω” µέθοδοι του Euler.

Παράδειγµα 10.2 Να προσεγγιστεί η λύση της διαφορικής εξίσωσης

y′(x) = xy(x)

µε αρχική συνθήκη y(0) = 1, στο διάστηµα [0, 1] µε την “προς τα εµπρός”

µέθοδο του Taylor µε βήµα h = 0.1.

Από την (10.6) θα έχουµε

yn+1 = yn + hf(xn, yn)

= yn + hxnynδηλαδή αν θέσουµε xn = nh

yn+1 = yn(1 + nh2)

Τα αποτελέσµατα εµφανίζονται στον παρακάτω πίνακα :

xn 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.

yn 1 1 1.01 1.030 1.061 1.103 1.158 1.228 1.314 1.419 1.547

ex2n/2 1 1.005 1.02 1.046 1.083 1.133 1.197 1.278 1.377 1.499 1.649

Όπως είναι αναµενόµενο, η µέθοδος Euler εµφανίζει µικρότερη ακρίβεια σε

σύγκριση µε την µέθοδο Taylor 2ης τάξη που εφαρµόστηκε στο προηγούµενο

παράδειγµα.

122 Αριθµητική επίλυση διαφορικών εξισώσεων

Μέθοδος Runge - Kutta

Η µέθοδος των Runge - Kutta είναι ουσιαστικά µια οικογένεια αναδροµικών

µεθόδων, οι οποίες χαρακτηρίζονται από την τάξη τους. Παρακάτω παρουσιά-

ζουµε ενδεικτικά τους δύο πιο γνωστούς αντιπροσώπους της οικογένειας αυτής

και συγκεκριµένα τις µεθόδους Runge - Kutta 2ης και 4ης τάξης. Επειδή η

πλήρης ανάπτυξη των µεθοδολογιών αυτών απαιτεί µαθηµατικά εργαλεία που

δεν είναι γνωστά στους φοιτητές του τµήµατος αυτοµατισµού, θα σταθούµε

µόνο στην περιγραφή της εφαρµογής τους.

Μέθοδος Runge - Kutta 2ης τάξης

Η µέθοδος Runge - Kutta 2ης τάξης δίνει µια προσέγγιση της λύσης του

προβλήµατος

y′(x) = f(x, y(x)), y(x0) = y0

µέσω του αναδροµικού τύπου

yn+1 = yn + ak1 + bk2

όπου

k1 = hf(xn, yn)

k2 = hf(xn + ch, yn + dk1)

Οι σταθερές a, b, c, d προσδιορίζονται µε τη βοήθεια του αναπτύγµατος Taylor

της y(x) και είναι a = b = 12 και c = d = 1. Άρα η αναδροµική σχέση

γίνεται

yn+1 = yn +1

2(k1 + k2) (10.7)

όπου

k1 = hf(xn, yn)

k2 = hf(xn+1, yn + k1)

Παράδειγµα 10.3 Να προσεγγιστεί η λύση της διαφορικής εξίσωσης

y′(x) = xy(x)

µε αρχική συνθήκη y(0) = 1, στο διάστηµα [0, 1] µε την µέθοδο Runge - Kutta

2ης τάξης, µε βήµα h = 0.1.

Μέθοδος Runge - Kutta 123

Έχουµε

k1 = hxnyn = nh2yn

k2 = hxn+1(yn + nh2yn) = h2(n+ 1)(1 + nh2)ynΆρα η αναδροµική σχέση (10.7) γίνεται

yn+1 = yn +1

2[nh2yn + h2(n + 1)(1 + nh2)yn] =

= yn[1 +1

2h2(n + (n + 1)(1 + nh2))]

Τα αποτελέσµατα εµφανίζονται στον παρακάτω πίνακα

xn 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.

yn 1 1.005 1.02 1.047 1.084 1.135 1.199 1.281 1.381 1.505 1.656

ex2n/2 1 1.005 1.02 1.046 1.083 1.133 1.197 1.278 1.377 1.499 1.649

Μέθοδος Runge - Kutta 4ης τάξης

Αντίστοιχα µε τη µέθοδο 2ης τάξης, η µέθοδος Runge - Kutta 4ης τάξης,

χρησιµοποιεί την αναδροµική σχέση

yn+1 = yn +1

6(k1 + 2k2 + 2k3 + k4) (10.8)

µε

k1 = hf(xn, yn)

k2 = hf(xn +h

2, yn +

h

2k1)

k3 = hf(xn +h

2, yn +

h

2k2)

k4 = hf(xn+1, yn + hk3)

Η µέθοδος Runge - Kutta 4ης τάξης είναι η πιο συχνά χρησιµοποιούµενη σε

πραγµατικές εφαρµογές.