Διπλωματική Εργασία - EAPphysicslab.eap.gr/thesis/DROSOS...

183
1 ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Δ Δ ι ι π π λ λ ω ω μ μ α α τ τ ι ι κ κ ή ή Ε Ε ρ ρ γ γ α α σ σ ί ί α α Μεταπτυχιακή Ειδίκευση Καθηγητών Φυσικών Επιστημών Σ Σ τ τ α α τ τ ι ι σ σ τ τ ι ι κ κ έ έ ς ς Μ Μ έ έ θ θ ο ο δ δ ο ο ι ι Α Α ν ν ά ά λ λ υ υ σ σ η η ς ς Π Π ε ε ι ι ρ ρ α α μ μ α α τ τ ι ι κ κ ώ ώ ν ν Δ Δ ε ε δ δ ο ο μ μ έ έ ν ν ω ω ν ν Α Α θ θ α α ν ν ά ά σ σ ι ι ο ο ς ς Δ Δ ρ ρ ό ό σ σ ο ο ς ς Πάτρα 2008

Transcript of Διπλωματική Εργασία - EAPphysicslab.eap.gr/thesis/DROSOS...

1

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΔΔιιππλλωωμμααττιικκήή ΕΕρργγαασσίίαα Μεταπτυχιακή Ειδίκευση Καθηγητών Φυσικών Επιστημών

ΣΣττααττιισσττιικκέέςς ΜΜέέθθοοδδοοιι ΑΑννάάλλυυσσηηςς ΠΠεειιρρααμμααττιικκώώνν ΔΔεεδδοομμέέννωωνν

ΑΑθθααννάάσσιιοοςς ΔΔρρόόσσοοςς

Πάτρα 2008

2

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Σχολή Θετικών Επιστημών και Τεχνολογίας

Πρόγραμμα Σπουδών

Μεταπτυχιακή Ειδίκευση Καθηγητών Φυσικών Επιστημών

Σύμβουλος Καθηγητής : ΣΠΥΡΟΣ ΕΥΣΤ. ΤΖΑΜΑΡΙΑΣ

Διπλωματική Εργασία του

ΑΘΑΝΑΣΙΟΥ Β. ΔΡΟΣΟΥ

Στατιστικές Μέθοδοι Ανάλυσης Πειραματικών Δεδομένων

ΠΑΤΡΑ 2008

3

ΠΕΡΙΕΧΟΜΕΝΑ ΕΙΣΑΓΩΓΗ .................................................................................................................. 6 ΚΕΦΑΛΑΙΟ 1ον : ΠΙΘΑΝΟΤΗΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ ................................... 8 ΠΙΘΑΝΟΤΗΤΑΣ ......................................................................................................... 8

1.1 Η έννοια της πιθανότητας .......................................................................... 8 1.1.1 Κλασσικός Ορισμός της Πιθανότητας ( Από τον DE MOIVRE) ..... 8 1.1.2 Eμπειρικός ορισμός Πιθανότητας (Από τον Von Mises) .................. 9 1.1.3 Μαθηματικός Ορισμός της Πιθανότητας (Από τον Kolmogorov )10 1.1.4 Υποκειμενική η Μπευζιανή (Bayesian ) έννοια της Πιθανότητας (Από τον Bayes) ................................................................................................. 11

1.2 Tυχαίες Μεταβλητές ................................................................................. 19 1.3 Συνάρτηση πυκνότητας πιθανότητας....................................................... 21 1.4 Προσδοκώμενη τιμή - Μεταβλητότητα ................................................. 24 1.5 Γραμμικές συναρτήσεις τυχαίων μεταβλητών ......................................... 28 1.5 Συναρτήσεις τυχαίων μεταβλητών .......................................................... 31

ΚΕΦΑΛΑΙΟ 2ον : ΠΕΡΙΓΡΑΦΗ & ΤΑΞΙΝΟΜΗΣΗ ...................................... 34 ΔΕΔΟΜΕΝΩΝ ........................................................................................................... 34

2.1 Εισαγωγή ..................................................................................................... 34 2.2Συλλογή δεδομένων .......................................................................................... 35 2.3 Ταξινόμησης δεδομένων ............................................................................... 35

2.3.1 Παράσταση με την βοήθεια Πίνακα ............................................... 36 2.3.2Γραφική παράστασις ................................................................................. 38 2.3.3 Μορφές κατανομών δεδομένων ........................................................ 40

2.4 Χαρακτηριστικές τιμές δεδομένων .......................................................... 41 2.4.1 Χαρακτηριστικές τιμές θέσης ................................................................ 42 2.4.2 Χαρακτηριστικές τιμές διασποράς ....................................................... 44

2.5 Συνδιασπορά ............................................................................................... 48 2.6 Συσχέτιση .................................................................................................... 50 2.7 Ροπές μεγαλύτερης τάξης ................................................................... 51

ΚΕΦΑΛΑΙΟ 3 : BΑΣΙΚΕΣ ΣΥΝΑΡΤΗΣΕΙΣ ΠΥΚΝΟΤΗΤΑΣ .................. 56 ΠΙΘΑΝΟΤΗΤΑΣ ....................................................................................................... 56

3.1 Εισαγωγή .................................................................................................... 56 3.2 Διωνυμική Συνάρτηση Πιθανότητας ...................................................... 56 3.3 Πολυωνυμική Συνάρτηση Πιθανότητας ................................................. 60 3.5 Συνάρτηση Πιθανότητας Poisson ........................................................... 62 3.6 Κανονική Συνάρτηση Πιθανότητας ........................................................ 65 3.6 Ομοιόμορφη Συνάρτηση Πυκνότητας Πιθανότητας .............................. 68 3.7 Kατανομή Γ ................................................................................................... 69 3.8 Κατανομή 2Χ ................................................................................................ 70 3.9 Κατανομή STUDENT ................................................................................... 72 3.10 Ασυμπτωτική Συμεριφορά Κατανομών ................................................. 74

4ον ΚΕΦΑΛΑΙΟ : ΣΦΑΛΜΑΤΑ ....................................................................... 75 4.2 O Νόμος των Μεγάλων Αριθμών ............................................................. 75 4.3 Η έννοια του σφάλματος της μέτρησης .................................................. 77 4.4 Συστηματικά και τυχαία σφάλματα ......................................................... 78 4.5 Γιατί τα σφάλματα ακολουθούν συνήθως κανονική κατανομή. ............ 79

4

4.6 Βασικές αρχές της θεωρίας των σφαλμάτων ........................................... 82 4.7 Συμβατική και Bayesian ερμηνεία των μετρήσεων .................................. 83 4.8 Επαναλαμβανόμενες μετρήσεις ................................................................. 87 4.9 Απόρριψη αποτελεσμάτων ..................................................................... 91 4.10 Μέσο βεβαρημένο άθροισμα μετρήσεων .................................................... 91 4.11 Διάδοση Σφαλμάτων .................................................................................... 92 4.12 Συστηματικά σφάλαματα ............................................................................ 95

ΚΕΦΑΛΑΙΟ 5ο . ΣΥΝΑΡΤΗΣΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ ............. 98 ΤΩΝ ΠΕΙΡΑΜΑΤΙΚΩΝ ΜΕΤΡΗΣΕΩΝ ................................................................ 98

5.1 Εισαγωγή ......................................................................................................... 98 5.2 Διακριτική Ικανότητα των Μετρητικών Διατάξεων .............................. 99 5.3 Αποδοχή και Αποδοτικότητα της Μετρητικής διάταξης .................... 103 5.4 Ολοκλήρωση Monte Carlo ...................................................................... 105

5.4.1 Εισαγωγή ................................................................................................ 105 5.4.2 Τυχαίοι αριθμοί ................................................................................ 106 5.4.3 Ολολήρωση Monte Carlo ............................................................... 107

5.5 Προσομοίωση Φαινομένων με τη Μέθοδο Μonte Carlo ...................... 114 ΚΕΦΑΛΑΙΟ 6 : ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ ........................................... 122

6.1 Εισαγωγή .................................................................................................. 122 6.2 Ιδιότητες Εκτιμητών .............................................................................. 124

6.2.1 Συνέπεια ( Consistency) ........................................................................ 124 6.2.2 Προκατάληψη (Bias) .......................................................................... 126 6.2.3 Αποδοτικότητα ................................................................................. 127

6.3 Bασικοί Εκτιμητές .................................................................................. 128 6.3.1 Εκτίμηση Μέσης Τιμής ......................................................................... 128 6.3.2 Εκτίμηση της μεταβλητότητας ...................................................... 129 6.3.3 Eκτίμηση τυπικής απόκλισης σ ........................................................ 133

6.4 Συνάρτηση Πιθανοφάνειας .................................................................... 134 6.5 Μέγιστη Πιθανοφάνεια .......................................................................... 136

6.5.2 Ιδιότητες της Μεθόδου Μεγίστης Πιθανοφάνειας ...................... 141 6.6 Εκτεταμένη Μέθοδος Μέγιστης Πιθανοφάνειας ................................ 142 6.7 Μέθοδος των Ελαχίστων Τετραγώνων ................................................. 144

6.7.2 Εκτίμηση Παραμέτρων Γραμμικού Προτύπου ................................. 147 6.7.3 Εκτίμηση Παραμέτρων Ευθείας .................................................. 148

6.8 Μεθοδος των ροπών ................................................................................ 151 ΚΕΦΑΛΑΙΟ 7 : ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ .................................... 154

7.1 Διάστημα Εμπιστοσύνης στην Περιγραφική Στατιστική .................... 154 7.2 Διάστημα Εμπιστοσύνης στην Εκτίμηση ............................................. 156 7.3 Ορια Εμπιστοσύνης ................................................................................ 160 7.5 Διάστημα Εμπιστοσύνης Μέσης Τιμής ................................................... 161 7.4 Διάστημα Εμπιστοσύνης Παραμέτρου p Διωνυμικής Κατανομής ... 165 7.5 Διάστημα Εμπιστοσύνης Διασποράς κανονικής κατανομής ............. 167

ΠΑΡΑΡΤΗΜΑ Α .................................................................................................... 170 ΚΕΦΑΛΑΙΟ 1 ......................................................................................................... 170

1.1 Γεωμετρική ερμηνεία της δεσμευμένης πιθανότητας .............................. 170 1.2 Απόδειξη του νόμου του Bayes ................................................................... 171

ΚΕΦΑΛΑΙΟ 3 ......................................................................................................... 172 3.1 Eυρεση του τύπου της Συνάρτησης Πυκνότητας Πιθανότητας ................... 172 της κατανομής Poisson ......................................................................................... 172

ΚΕΦΑΛΑΙΟ 4 .......................................................................................................... 173

5

4.1 Ευρεση του τύπου διάδοσης σφαλμάτων για συνάρτηση............................ 173 με μία μεταβλητή .................................................................................................. 173 4.2 Ευρεση του τύπου διάδοσης σφαλμάτων για συνάρτηση.......................... 174 με δύο μεταβλητές ................................................................................................ 174 4.3 Ευρεση του τύπου διάδοσης σφαλμάτων για συνάρτηση.......................... 174 με Ν μεταβλητές ................................................................................................... 174 4.4 Ευρεση του πίνακα συνδιασποράς για δύο μεταβλητές .............................. 175 που έχουν τυχαία σφάλματα 1 2,σ σ και ένα κοινό συστηματικό ....................... 175 σφάλμα s .............................................................................................................. 175

ΚΕΦΑΛΑΙΟ 5 ......................................................................................................... 176 5.1 Aπόδειξη του τύπου ολοκλήρωσης Μonte Carlo .................................. 176 5.2 Β. Μέθοδος ( Επιτυχίας – Απώλειας ) ..................................................... 178

6

ΕΙΣΑΓΩΓΗ Αναμφίβολα πρωταρχική πηγή γνώσης στις Φυσικές Επιστήμες ,αποτελεί η παρατήρηση και το πείραμα. Η αλματώδης ανάπτυξη αυτών των επιστημών , στηρίχτηκε σε γενικές γραμμές στο παρακάτω μοντέλο: α. Πείραμα (Παρατήρηση) β. Γενίκευση αποτελεσμάτων και ανάπτυξη θεωριών γ. Εξήγηση φαινομένων και πρόβλεψη νέων (φαινομένων) που μπορούν να παρατηρηθούν πειραματικά Πόσο βέβαιοι είμαστε όμως ότι τα πειραματικά μας δεδομένα είναι αξιόπιστα ώστε να μπορούν να απορρίψουν η να ενισχύσουν μια θεωρία ; Όπως θα προσπαθήσουμε να δείξουμε στα επόμενα , ένα από τα σημαντικώτερα προβλήματα κατά την εκτέλεση ενός πειράματος είναι τα σφάλματα που υπεισέρχονται στις πειραματικές μετρήσεις .Τα προβλήματα αυτά συχνά έχουν να κάνουν με το τι συμβαίνει εάν επαναλάβουμε το ίδιο πείραμα πολλές φορές . Η γνώση τους και η απαλειφή τους είναι απαραίτητες προυποθέσεις για την αξιοπιστία και την επιτυχία του πειράματος . Πολλές φορές όμως παραβλέπουμε η υποβαθμίζουμε το γεγονός αυτό , έχοντας στο μυαλό μας τους θεμελιώδεις νόμους της κλασσικής φυσικής , οι οποίοι χαρακτηρίζονται από μαθηματική ακρίβεια και δεν επιδέχονται αβεβαιότητες και σφάλματα

Για παράδειγμα στον νόμο της βαρύτητας του Νεύτωνα 2

GMmFr

= ο εκθέτης

του παρανομαστή είναι ακριβώς ίσος με 2.000 και όχι π.χ 2.000 0.012± , όπως ενδεχόμενα να κατέληγαν οι πειραματικές μετρήσεις . Το γεγονός αυτό μπορεί να μας οδηγήσει στο συμπέρασμα ότι η Στατιστική δεν έχει θέση στις επιστήμες . Είναι γνωστό όμως ότι ο Νεύτωνας κατέληξε στον παραπάνω νόμο στηριζόμενος στις λεπτομερείς και αναλυτικές αστρονομικές παρατηρήσεις του Tycho Brahe. Σκοπός της Στατιστικής Ανάλυσης Πειραματικών Δεδομένων είναι η εύρεση της αληθούς τιμής ενός φυσικού μεγέθους με την μέγιστη δυνατή ακρίβεια , χρησιμοποιώντας τις πειραματικές μετρήσεις . Αν για παράδειγμα οι πειραματικές μετρήσεις για τον νόμο του Νεύτωνα κατέληγαν στο συμπέρασμα ότι η τιμή του εκθέτη είναι 2.000 0.012± , θα πρέπει να μπορούμε να δείξουμε ότι η τιμή αυτή είναι συμβατή με την θεωρητική πρόβλεψη , ότι η αληθής τιμή του εκθέτη είναι ίση με 2. Με τον όρο συμβατή εννοούμε ότι η πιθανότητα η αληθής τιμή του εκθέτη να είναι ίση με 2 , είναι πολύ μεγάλη π.χ 98%.

7

Εν αντιθέσει με την κλασσική φυσική που χαρακτηρίζεται από μαθηματική ακρίβεια, η σύγχρονη φυσική που μελετά τον μικρόκοσμο έχει από την φύση της στατιστικό χαρακτήρα. Η αρχή της απροσδιοριστίας μας δίνει μόνο την πιθανότητα η μέτρηση ενός φυσικού μεγέθους ( π.χ ταχύτητα ) να έχει μια ορισμένη τιμή. Στα πειράματα επομένως της σύγχρονης φυσικής , όπως π.χ της σωματιδιακής φυσικής τα σφάλματα έχουν διττή προέλευση : την φύση και την πειραματική διαδικασία . Αυτό κάνει πιο έντονο τον πιθανοκρατικό χαρακτήρα της μέτρησης ενός φυσικού μεγέθους και την αβεβαιότητα της αληθούς τιμής του. Η ανάλυση των πειραματικών δεδομένων δεν είναι εμπειρική . Στηρίζεται σε βασικές μαθηματικές αρχές και νόμους που περιγράφουν την συμπεριφορά μεγάλου πλήθους πειραματικών δεδομένων. Στο τεύχος αυτό παρουσιάζονται οι πιο βασικές έννοιες της θεωρίας αυτής .

8

ΚΕΦΑΛΑΙΟ 1ον : ΠΙΘΑΝΟΤΗΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΑΣ

1.1 Η έννοια της πιθανότητας Bασική έννοια στη θεωρία των πιθανοτήτων είναι το πείραμα , ο ορισμός του οποίου δεν είναι ξεκαθαρισμένος. Στην θεωρία των πιθανοτήτων μας ενδιαφέρουν τα πειράματα τα οποία μπορούν να επαναληφθούν όσες φορές θέλουμε κάτω από τις ίδιες πρακτικά συνθήκες . Η επανάληψη ενός πειράματος κάτω από τις ίδιες συνθήκες δεν οδηγεί στο ίδιο αποτέλεσμα , δηλαδή δεν μπορούμε με βεβαιότητα να προβλέψουμε το αποτελεσμά του ( αρχή αιτιότητας ) . Μικρές μεταβολές στα αίτια που διαφεύγουν από την αντιληψή μας ( και της μέτρησης ακόμα με τα πιο τέλεια όργανα ) μπορούν να μεταβάλλουν το αποτέλεσμα. Ένα τέτοιο πείραμα χαρακτηρίζεται σαν τυχαίο πείραμα. Το σύνολο των δυνατών αποτελεσμάτων ενός τυχαίου πειράματος το ονομάζουμε δειγματικό χώρο και το παριστάνουμε με το γράμμα Ω. Κάθε δυνατό αποτέλεσμα ενός πειράματος λέγεται απλό γεγονός η απλό ενδεχόμενο και η συλλογή απλών γεγονότων λέγεται γεγονός η ενδεχόμενο. Ο δειγματικός χώρος δηλαδή είναι το σύνολο όλων των απλών γεγονότων. Ο δειγματικός χώρος π.χ της ρίψεως ενός κύβου αποτελείται από τα δυνατά αποτελέσματα 1,2,3,4,5,6. Yπάρχουν οι παρακάτω μέθοδοι με τις οποίες εκτιμάμε (ουσιαστικά ορίζουμε αυθαίρετα ) την πιθανότητα ενός γεγονότος .

1.1.1 Κλασσικός Ορισμός της Πιθανότητας ( Από τον DE MOIVRE)

Εάν εκτελέσουμε ένα πείραμα Ν φορές και σημειώσουμε τον αριθμό xn που συνέβηκε ένα γεγονός Χ , yn τον αριθμό που συνέβηκε το γεγονός Υ κ.ο.κ όπου

...x yn n N+ + = και πάρουμε τα πηλίκα , yx nnN N

κ.ο.κ παρατηρούμε ότι τα

πηλίκα αυτά παρουσιάζουν μια ομαλότητα καθώς το Ν γίνεται πολύ μεγάλο.Εάν εκτελέσουμε δηλαδή τις Ν επαναλήψεις του πειράματος πολλές φορές τα πηλίκα

, ,...,yx nnN N

θα έχουν την ίδια τιμή την κάθε φορά.

9

Ολη μας η προσπάθεια είναι να ορίσουμε , για κάθε γεγονός Ε ενός πειράματος ,

έναν αριθμό ( ) Enp EN

= όταν το Ν είναι πολύ μεγάλο. Τον αριθμό ( )p E τον

ονομάζουμε πιθανότητα . Ο ορισμός αυτός ισχύει με την προυπόθεση ότι όλα τα γεγονότα είναι ισοπίθανα , δηλαδή δεν υπάρχει λόγος να υποθέσουμε ότι κάποιο γεγονός του δειγματικού χώρου είναι περισσότερο η λιγώτερο πιθανό να συμβεί έναντι των άλλων. Κατά την ρίψη π,χ ενός νομίσματος τα γεγονότα κορώνα , γράμματα είναι ισοπίθανα και η πιθανότητα να έχουμε κορώνα η γράμματα είναι 50%. 1.1.2 Eμπειρικός ορισμός Πιθανότητας (Από τον Von Mises) Η προυπόθεση του ισοπίθανου των γεγονότων του δειγματικού χώρου που απαιτεί ο κλασικός ορισμός της πιθανότητας που αναφέραμε προηγουμένως, περιορίζει σημαντικά το πεδίο εφαρμογών της πιθανοθεωρίας .Σε πολλά πειράματα δεν είναι ξεκάθαρο το ισοπίθανο των αποτελεσμάτων του. Ο Von Mises στην προσπαθειά του να αντιμετωπίσει το πρόβλημα του ορισμού της πιθανότητας σε οποιοδήποτε δειγματικό χώρο διατύπωσε τον παρακάτω ορισμό: OΡΙΣΜΟΣ: Eστω ότι ένα τυχαίο πείραμα η φαινόμενο μπορεί να επαναληφθεί κάτω από τις ίδιες ακριβώς συνθήκες απεριόριστο αριθμό φορών , και έστω ένα γεγονός Α.Υποθέτουμε ότι σε Ν επαναλήψεις του πειράματος αυτού , το γεγονός Α πραγματοποιείται An φορές .

Η σχετική συχνότητα του Α Af δίνεται από την σχέση : AAnfN

=

Αν υπάρχει το lim lim AA

nfN

= τότε αυτό ορίζει την πιθανότητα ( )p A , του

γεγονότος Α, δηλαδή

( ) lim lim AA

np A fN

= = (1.1)

Την ύπαρξη του ορίου αυτού με την μαθηματική έννοια ο Von Mises την παίρνει σαν αξίωμα. Πολλές είναι οι αντιρρήσεις που εκτοξεύθηκαν εναντίον της ερμηνείας της πιθανότητας ως συχνότητας . Πρώτον , ο πεπερασμένος αριθμός γεγονότων ( πειραμάτων ) που μπορούν να πραγματοποιηθούν μέσα στα όρια της ανθρώπινης εμπειρίας . Δεύτερον , η δυνατότητα εύρεσης της οριακής συχνότητας . Αυτό που φαίνεται ότι μπορούμε να κάνουμε είναι , από την παρατηρηση περιορισμένου τμήματος της ακολουθίας των γεγονότων να βγάζουμε συμπεράσματα για άπειρο αριθμό γεγονότων.

10

Τρίτον , δεν είναι βέβαιον ότι υφίσταται το όριο της σχετικής συχνότητας Για παράδειγμα κατά την ρίψη ενός νομίσματος είναι λογικώς δυνατό μια μακρά αλυσίδα από κορόνες να ακολουθηθεί από μια ακόμα μακρύτερη αλυσίδα από γράμματα και αυτή από ακόμα μια μακρύτερη αλυσίδα από κορόνες και ούτω κάθε εξής , έτσι ώστε η σχετική συχνότητα από κορόνες να κυμαίνεται σε ευρύτατα απομακρυσμένα όρια και να μην συγκλίνει. Παρά τις δυσκολίες που παρουσιάζει η παραπάνω προσσέγγιση της πιθανότητας χρησιμοποιείται ευρέως στις επιστήμες

1.1.3 Μαθηματικός Ορισμός της Πιθανότητας (Από τον Kolmogorov ) [13] H μεθοδος αυτή θεμελιώνεται σε τρία αξιώματα από τα οποία προκύπτουν τα πάντα . Με την χρήση των αξιωμάτων αυτών μπορούμε να υπολογίσουμε την πιθανότητα κάθε πολύπλοκου γεγονότος γνωρίζοντας όμως τις « a priori » πιθανότητες των συνιστουσών του Τα αξιώματα με τα οποία ο Kolmogorov θεμελίωσε την θεωρία του είναι : Aς υποτεθεί ότι Ω είναι το σύνολο όλων των δυνατών στοιχειωδών γεγονότων

iX , που είναι δυνατόν να συμβούν , καθώς επίσης και ότι μόνο ένα από αυτά μπορεί να συμβεί κάθε φορά. Η πιθανότητα να συμβεί το γεγονός iX , η ( )ip X , όρίζεται από τις παρακάτω ιδιότητες 1. ( ) 0ip X ≥ για κάθε iX ∈Ω 2. ( ) ( ) ( )i j i jp X ORX p X p X= +

3. ( ) 1ip XΩ

=∑

Το πρώτο αξίωμα επιβάλλει ότι η πιθανότητα να συμβεί ένα γεγονός είναι μεγαλύτερη η ίση του μηδενός. Αρνητικές πιθανότητες δεν υφίστανται Το δεύτερο αξίωμα δηλώνει ότι η πιθανότητα να συμβεί το γεγονός iX η το γεγονός jX ισούαι με το άθροισμα των πιθανοτήτων τους . Η ιδιότητα αυτή είναι συνέπεια της σχέσης αμοιβαίας απόκλισης των γεγονότων . Εάν συμβεί το γεγονός

iX αποκλείεται να συμβεί και το γεγονός jX . Το τρίτο αξίωμα εκφράζει ότι το σύνολο Ω καλύπτει όλα τα ενδεχόμενα αποτελέσματα του πειράματος και συνεπώς κάθε δυνατό αποτέλεσμα ανήκει στο σύνολο Ω. Από τα προηγούμενα αξιώματα προκύπτουν τα παρακάτω θεωρήματα :

11

Θεώρημα 1.1 : Εάν 1 2A A⊂ τότε 1 2( ) ( )p A p A≤ και 2 1 2 1( ) ( ) ( )p A A p A p A− = − Θεώρημα 1.2 : Για κάθε γεγονός Α ισχύει : 0 ( ) 1p A≤ ≤ δηλαδή κάθε πιθανότητα είναι μεταξύ 0 και 1 Θεώρημα 1.3 : ( ) 0p ∅ = Δηλαδή η πιθανότητα του αδύνατου γεγονότος είναι 0. Θεώρημα 1.4 Εάν Α και Β είναι δύο οποιοδήποτε γεγονότα τότε ( ) ( ) ( ) ( )p A B p A p B p A B∪ = + − ∩ Η ιδιότητα αυτή γενικεύεται για n γεγονότα Θεώρημα 1.5 : Εάν το Β είναι το συμπλήρωμα του Α τότε : ( ) 1 ( )p B P A= −

1.1.4 Υποκειμενική η Μπευζιανή (Bayesian ) έννοια της Πιθανότητας (Από τον Bayes)

Παρακάτω θα αναπτύξουμε την Βayesian έννοια της Πιθανότητας , η οποία προκάλεσε αρκετές έριδες μεταξύ των επιστημόνων , χωριζοντάς τους σε δύο σχολές :

- αυτούς που ακολουθούν τον τρόπο θεμελίωσης της Πιθανότητας ως το όριο της σχετικής συχνότητας . ( Συμβατικός ορισμός )

- αυτούς που ακολουθούν την Υποκειμενική η Bayesian έννοια της πιθανότητας Η προσέγγιση αυτή εφαρμόζεται κυρίως εκεί που δεν υπάρχει δυνατότητα πολλών επαναλήψεων των πειραμάτων . Πριν από αυτό όμως θα αναπτύξουμε ορισμένες έννοιες που σχετίζονται με αυτήν την θεώρηση.

1.1.4.1 Αμοιβαία αποκλειόμενα γεγονότα

Δύο γεγονότα , εάν δεν είναι δυνατόν να συμβούν ταυτόχρονα , ονομάζονται αμοιβαία αποκλειόμενα γεγονότα. Γενικά , εάν μεταξύ Κ γεγονότων δεν υπάρχουν ούτε δύο μη αμοιβαία αποκλειόμενα , τότε αυτά ονομάζονται αμοιβαία αποκλειόμενα. Στο παρακάτω σχήμα παριστάνονται γραφικά τα αμοιβαία αποκλειόμενα γεγονότα.

12

Σχήμα 1.1 Αμοιβαία αποκλειόμενα γεγονότα [ 1] Από τον ορισμό των αμοιβαίων αποκλειόμενων γεγονότων συνάγεται ότι η διατομή δύο η περισσοτέρων αμοιβαία αποκλειομένων γεγονότων είναι αδύνατο γεγονός , συμβολίζεται δε με ∅ , δηλαδή σαν κενό σύνολο. Δηλαδή εάν τα 1E και

2E είναι αμοιβαία αποκλειόμενα γεγονότα ,θα έχουμε : 1 2E E∩ =∅ όπου ∅ το κενό σύνολο , και 1 2( ) ( ) 0p E E p∩ = ∅ = (1.2) Η πιθανότητα του γεγονότος 1 2E E∪ δηλαδή η 1 2( )p E E∪ εκφράζει την πιθανότητα να συμβεί το γεγονός 1E η το 2E η να συμβούν και τα δύο. Επειδή όμως η πιθανότητα ενός γεγονότος ισούται με το άθροισμα των πιθανοτήτων των σημείων του δειγματικού χώρου , που αποτελούν το γεγονός και τα οποία στην συγκεκριμένη περίπτωση είναι σημεία που ανήκουν μόνο στο 1E , μόνο στο 2E και στο 1E , και

2E συνάγεται ότι : 1 2 1 2 1 2( ) ( ) ( ) ( )p E E p E p E p E E∪ = + − ∩ (1.3) Η πιθανότητα των κοινών σημείων των 1E και 2E αφαιρείται γιατί το άθροισμα

1 2( ) ( )p E p E+ περιλαμβάνει τις πιθανότητες των σημείων του 1E και όλων των σημείων του 2E και συνεπώς περιλαμβάνει τις πιθανότητες των κοινών σημείων των

1E και 2E εις διπλούν. Η σχέση αναφέρεται σαν αθροιστικός νόμος των πιθανοτήτων. Εάν τα γεγονότα 1E και 2E είναι αμοιβαία αποκλειόμενα , τότε 1 2( ) ( ) 0p E E p∩ = ∅ = και η γίνεται

13

1 2 1 2( ) ( ) ( )p E E p E p E∪ = + η σχέση αυτή γενικεύεται και για n γεγονότα ισχύει δηλαδή 1 2 1 2( ... ) ( ) ( ) ... ( )n np E E E p E p E p E∪ ∪ ∪ = + + + (1.4) Παράδειγμα 1.1 [ 6 ] Ποια η πιθανότητα κατά την ρίψιν ενός κύβου , να εμφανισθεί αριθμός 1,3,5 ή αριθμός διαιρούμενος διά του 3. Στο σχ. 1.2 φαίνονται ο δειγματικός χώρος της δοκιμής και τα σημεία που αποτελούν τα γεγονότα 1E (αριθμός 1,3,5) και 2E (αριθμός διαιρούμενος δια του 3)

Σχήμα 1.2 [ 1] Τα γεγονότα 1E και 2E , δηλαδή η εμφάνισης κατά την ρίψιν του κύβου αριθμού 1,3,5 ή αριθμού διαιρούμενου δια του 3 δεν είναι αμοιβαια αποκλειόμενα γεγονότα . Επειδή τα σημεία του δειγματικού χώρου είναι ισοπίθανα έχουμε :

1 23 2( ) , ( )6 6

p E p E= = και 1 21( )6

p E E∩ =

Επομένως από την σχέση παίρνουμε :

1 2 1 2 1 2( ) ( ) ( ) ( )p E E p E p E p E E∪ = + − ∩ = 3 2 1 26 6 6 3+ − =

1.1.4.2 Ανεξάρτητα γεγονότα

Στην θεωρία των πιθανοτήτων δύο γεγονότα λέγονται ανεξάρτητα , εάν η πιθανότητα να συμβούν ταυτόχρονα , 1 2( )p E E∩ , είναι ίση με το γινόμενο των πιθανοτήτων να συμβεί το καθένα χωριστά.. Δηλαδή όταν ισχύει η σχέση :

14

1 2 1 2( ) ( ) ( )p E E p E P E∩ = ⋅ (1.5) Η προηγούμενη σχέση ισχύει και στην περίπτωση κατά την οποίαν 2( ) 0p E = , οπότε όμως η 1 2( )p E E∩ δεν ορίζεται. Η παραπάνω σχέση γενικεύεται και για Ν γεγονότα : 1 2 1 2( ... ) ( ) ( ) ... ( )N Np E E E p E P E p E∩ ∩ ∩ = ⋅ ⋅ ⋅ (1.6) Δεν πρέπει να συγχέουμε τα «αμοιβαία αποκλειόμενα γεγονότα» με τα «ανεξάρτητα γεγονότα » .Η διαφορά τους είναι ότι τα μεν πρώτα δεν έχουν κανένα κοινό σημείο στον δειγματικό τους χώρο , στα δε δεύτερα ότι απαιτείται η ύπαρξη ενός τουλάχιστον κοινού σημείου για να είναι ανεξάρτητα Η ανεξαρτησία μεταξύ των γεγονότων 1E και 2E σημαίνει ότι δεν είναι δυνατόν να προκύψουν συμπεράσματα για το γεγονός 2E από το γεγονός 1E . Παράδειγμα 1.2 [ 6] Μια συσκευή λειτουργεί όταν λειτουργούν τρία εξαρτήματά της . Οι πιθανότητες λειτουργίας κάθε εξαρτήματος είναι : 1( ) 0,1p E = 2( ) 0,8p E = και 3( ) 0,9p E = αντίστοιχα. Ποια είναι η πιθανότητα να μην παρουσιαστεί βλάβη στην συσκευή ;. Η λειτουργία ενός εξαρτήματος υποτίθεται δεν επηρεάζεται από την λειτουργία ή βλάβη των άλλων εξαρτημάτων.Συνεπώς τα γεγονότα της λειτουργίας των εξαρτημάτων είναι ανεξάρτητα και η πιθανότητα να λειτουργήσει η συσκευή θα δίνεται από την σχέση : 1 2 3 1 2 3( ) ( ) ( ) ( ) 0,7 0,8 0,9 0,504p E E E p E P E p E∩ ∩ = ⋅ ⋅ = ⋅ ⋅ =

1.1.4.3 Υπό συνθήκη πιθανότητα Η πιθανότητα να παρουσιαστεί βλάβη σε μια συσκευή κατά την διάρκεια των 10 επόμενων ωρών λειτουργίας της δεν θα είναι η ίδια , εάν η συσκευή είναι καινούργια η εάν έχει ήδη λειτουργήσει επί 1000 ώρες . Το παράδειγμα αυτό φανερώνει ότι ένα γεγονός μπορεί να έχει πιθανότητα να συμβεί σ’ ένα υποσύνολο του δειγματικού χώρου , διαφορετική από αυτή που έχει στον συνολικό δειγματικό χώρο. Οι πιθανότητες που αναφέρονται σε γεγονότα τα οποία δημιουργούνται από σημεία τέτοιων υποσυνόλων ονομάζονται υπό συνθήκη πιθανότητες .

15

Θεωρούμε δύο γεγονότα Α και Β (σχ 1.3 ) με ( ) 0p B ≥ . Εστω ( / )p A B η πιθανότητα να συμβεί το A με την προυπόθεση ότι έχει συμβεί το B. Η πιθανότητα αυτή δίνεται από τον τύπο

( )( / )( )

p A Bp A BP B∩

= (1.7)

Σχήμα 1.3 Τα σύνολα στοιχειωδών γεγονότων Ω, Α και Β [ 2 ] H ( / )p A B ονομάζεται πιθανότητα υπό συνθήκη η δεσμευμένη πιθανότητα να συμβεί το Α με την προυπόθεση ότι έχει συμβεί το Β . Στο παράρτημα A παραθέτουμε την γεωμετρική απόδειξη της παραπάνω σχέσης . Παράδειγμα 1.3 Να βρεθεί η πιθανότητα να έρθει σε μια ρίψη ενός ζαριού, αποτέλεσμα μικρότερο του 4 εάν α) δεν δίνεται άλλη πληροφορία β) είναι γνωστό ότι η ρίψη έδωσε περιττό αριθμό. α) Εστω Α το γεγονός «μικρότερο του 4 » Επειδή το Α είναι ένωση των γεγονότων 1,2,3 , έχουμε :

1 1 1 1( ) (1) (2) (3)6 6 6 2

p A p p p= + + = + + =

όπου δεχτήκαμε ίσες πιθανότητες για όλα τα απλά γεγονότα .

16

β) Εστω Β το γεγονός περιττός αριθμός. Είναι : 3 1( )6 2

p B = = και

2 1( )6 2

p A B∩ = = . Αρα

1( ) 23( / ) 1( ) 3

2

p A Bp A BP B∩

= = = .

Παρατηρούμε ότι η επιπλέον πληροφορία ( ότι το αποτέλεσμα είναι περιττός )

αυξάνει την πιθανότητα από 12

σε 23

.

Όπως αναφέραμε δηλαδή και στην προηγούμενη ενότητα , η πιθανότητα επιλογής του δεύτερου γεγονότος από το σύνολο Α δεν εξαρτάται απο την επιλογή του πρώτου γεγονότος , δηλαδή από το εάν προηγουμένως είχε επιλεγεί γεγονός από το σύνολο Β.

1.1.4.4 Θεώρημα του Βayes Έστω τα 1 2, ,..., kA A A , είναι αμοιβαία αποκλειόμενα γεγονότα που η ενωσή τους σχηματίζει τον δειγματικό χώρο Ω των μετρήσεων ενός πειράματος και των οποίων οι πιθανότητες να συμβούν , 1 2( ), ( ),..., ( )Np A p A p A , είναι γνωστές. Εστω επίσης το γεγονός Β το οποίο πραγματοποιείται μόνον εφ΄όσον πραγματοποιηθεί ένα από τα γεγονότα iA και του οποίου γνωρίζουμε την υπο συνθήκη πιθανότητα

( / ), 1, 2...,ip B A i N= να συμβεί. . Η υπό συνθήκη πιθανότητα ( / ), 1, 2...,ip A B i N= κάθε ενός από τα γεγονότα

iA , αποδεικνύεται ότι δίνεται από την σχέση :

1

( ) ( / )( / ),( ) ( / )

i ii N

i ii

p A p B Ap A B ip A p B A

=

=

∑ (1.8)

H σχέση αυτή είναι το περίφημο θεώρημα του Bayes Η απόδειξη του θεωρήματος παρατίθεται στο παράρτημα A. Παράδειγμα 1.4 Στο παράδειγμα αυτό βλέπουμε πως μπορούμε να ελέγξουμε την αξιοπιστία μιάς επιστημονικής θεωρίας κάνοντας χρήση του θεωρήματος του Bayes Θέτουμε στον τύπο του Bayes :

17

A= Θεωρία , Β= Αποτελέσματα Πειράματων η παρατηρήσεων , οπότε μπορούμε να κάνουμε τις παρακάτω αντιστοιχίσεις : - ( ) ( )p A p ΄θεωρι α= . Eκφράζει την πίστη μας στην θεωρία χωρίς να έχουμε καμμιά πειραματική ένδειξη. Είναι φανερό ότι το ( ) ( )p A p ΄θεωρι α= , μπορούμε να το προσεγγίσουμε μόνο υποκειμενικά , δηλαδή με την διαισθησή μας , την εμπειρία μας κ.λ.π. - ( / ) ( / ) ( / )ip A B p A B p ΄ ΄θεωρι α πειραμα τα= = . Εκφράζει την πίστη μας στην θεωρία μετά τις πειραματικές επιβεβαίωσεις η διάψευσεις . - ( / ) ( / ) ( / )ip B A p B A p ΄ ΄πειρα ματα θεωρι α= = .Είναι η πιθανότητα να πάρουμε τα αναμενόμενα αποτελέσματα εφ’ οσον η θεωρία είναι σωστή - ( )p ΄πειρα ματα . Η πιθανότητα να έχουμε πειραματικές μετρήσεις ανεξάρτητα εάν η θεωρία μας είναι σωστή η λάθος . Οπότε ο τύπος του Bayes θα έχει την μορφή :

( / )( / ) ( )( )

p ΄ ΄p ΄ ΄ p ΄p ΄

πειρα ματα θεωρι αθεωρι α πειρα ματα θεωρι απειρα ματα

= ⋅

Η παραπάνω σχέση φαίνεται λογική .Βλέπουμε δηλαδή ότι εάν η θεωρία προβλέπει τα πειραματικά αποτελέσαματα δηλαδη ο όρος

( / ) ( / ) ( / )ip B A p B A p ΄ ΄πειρα ματα θεωρι α= = είναι μεγάλος τότε ο όρος . ( / ) ( / ) ( / )ip A B p A B p ΄ ΄θεωρι α πειραμα τα= = , δηλαδή η αξιοποιστία της θεωρίας

μετά τα πειραματικά αποτελέσματα γίνεται μεγαλύτερος από ότι πρίν ,δηλαδή από το

( ) ( )p A p ΄θεωρι α= (Γιατί . ( / ) 1( )

p ΄ ΄p ΄

πειρα ματα θεωρι απειρα ματα

≥ )

Εάν τα πειραματικά αποτελέσματα είναι ευλογοφανή ανεξάρτητα από τον αν η θεωρία είναι σωστή , οφείλονται δηλαδή σε άλλους λόγους , τότε ο όρος

( / ) 1( )

p ΄ ΄p ΄

πειρα ματα θεωρι απειρα ματα

και η αξιοπιστία της θεωρίας δεν μεγαλώνει..

Για να εφαρμόσουμε όμως το τύπο του Bayes θα πρέπει να γνωρίζουμε το

( )p Α , την πιθανότητα δηλαδή οι υποθέσή μας Α που έχουμε δεχθεί να είναι σωστή .Οι πιθανότητα αυτή όμως όπως είπαμε προηγουμένως ορίζεται υποκειμενικά χρησιμοποιώντας προηγούμενες γνώσεις και εμπειρίες . Η υποκειμενικός χαρακτήρας της γνώσης των ( )ip Α συγκεντρώνει τα πυρά των πολεμίων της Bayessian μεθόδου. Αν και η μέθοδος αυτή μπορεί να καταλήξει σε λανθασμένα αποτελέσματα , είναι πολύ χρήσιμη στις περιπτώσεις που δεν έχουμε την δυνατότητα να επαναλάβουμε το

18

πείραμα αρκετές φορές Επίσης σε αρκετές περιπτώσεις η κλασσική μέθοδος είναι δύσκολο να εφαρμοσθεί ,ενώ η χρήση της Bayesian μεθόδου είναι πολύ απλή. Όπως θα δούμε παρακάτω ο τρόπος που η συμβατική μέθοδος αντιμετωπίζει τέτοια προβλήματα είναι με την χρήση «διαστημάτων εμπιστοσύνης». Παράδειγμα 1.5 [ 6 ] Μια επιχείρηση παράγει ηλεκτρικούς λαμπτήρες σε τρία διαφορετικά εργοστάσια. Το πρώτο παράγει το 20% , το δεύτερο το 30% και το τρίτο το 50% της συνολικής παραγωγής .Η ποιότητα παραγωγής στα τρία εργοστάσια είναι διαφορετική , Συγκεκριμένα οι ελαττωματικοί λαμπτήρες στο πρώτο εργοστάσιο είναι 2% , στο δεύτερο 1% και στο τρίτο 3%. . Ζητάμε να μάθουμε ποια είναι η πιθανότητα ένας ελαττωματικός λαμπτήρας να προέρχεται από το πρώτο ,το δεύτερο ήτο τρίτο εργοστάσιο. Εστω Η το γεγονός του ελαττωματικού λαμπτήρα και 1E το γεγονός να προέρχεται από το πρώτο εργοστάσιο , 2E να προέρχεται από το δεύτερο και 3E να προέρχεται από το τρίτο. Οι αντίστοιχες πιθανότητες είναι 1( ) 0, 20p E = 2( ) 0,30p E = και 3( ) 0,50p E = Οι πιθανότητες ο ελαττωματικός λαμπτήρας να προέρχεται από το πρώτο το δεύτερο η το τρίτο εργοστάσιο είναι οι αντίστοιχες υπο συνθήκες πιθανότητες: 1( / ) 0,020p H E = , 2( / ) 0,020p H E = και 3( / ) 0,030p H E = Χρησιμοποιώντας την σχέση βρίσκουμε 1 1 1( ) ( ) ( / ) 0,004p E H p H p E H∩ = ⋅ = 2 2 2( ) ( ) ( / ) 0,004p E H p H p E H∩ = ⋅ = 3 3 3( ) ( ) ( / ) 0,015p E H p H p E H∩ = ⋅ = Αρα ( ) 0,023p H = Η πιθανότητα ένας λαμπτήρας να έχει παραχθεί στο πρώτο , δεύτερο και τρίτο εργοστάσιο , προτού αυτός επιλεγεί από το σύνολο και εξετασθεί , δηλαδή η a priori πιθανότητες είναι 0,20 - 0,30 και 0,50 αντίστοιχα. Οι πιθανότητες αυτές

19

διαφοροποιούνται όταν υπάρξει πληροφορία ότι ο επιλεγμένος λαμπτήρας είναι ελαττωματικός . Οι νέες πιθανότητες βρίσκονται από τις παρακάτω σχέσεις :

11

( ) 0,004( / ) 0,17( ) 0,023

p E Hp E Hp H∩

= = =

22

( ) 0,004( / ) 0,17( ) 0,023

p E Hp E Hp H∩

= = =

33

( ) 0,015( / ) 0,65( ) 0,023

p E Hp E Hp H∩

= = =

1.2 Tυχαίες Μεταβλητές [15]

Υποθέτουμε ότι στρίβουμε δύο νομίσματα των οποίων οι δύο όψεις είναι Α και Β .Στον παρακάτω πίνακα φαίνονται τα σημεία του δειγματικού χώρου αυτής της δοκιμής καθώς και οι πιθανότητες κάθε σημείου αυτού. Σημεία δειγματικου χώρου

Αριθμός όψεων

Πιθανότητα

Α Α

Α Β

Α Α

Β Α

Β Β

2 1 1 1 0

1/4

1/4

1/4

1/4

1/4

Πίνακας 1.1

Τις πληροφορίες του πίνακα 1.1 μπορούμε να τις συνοψίσουμε στον πίνακα 1.2

20

Αριθμός Α όψεων

0

1

2

Πιθανότητα

1/4

2/4

1/4

Πίνακας 1.2

Συμβολίζομεν τον αριθμό των Α όψεων με την μεταβλητή Χ , η οποία παίρνει την τιμή 1 0x = , όταν καμιά όψις Α δεν εμφανίζεται το οποίο ονομάζουμε γεγονός 1E .Την τιμή 2 1x = , όταν εμφανίζεται μία Α όψις σ’ αυτήν την δοκιμή και ονομάζουμε γεγονός 2E . Και τέλος την τιμή 3 2x = , όταν εμφανίζονται δύο όψεις Α και είναι το γεγονός 3E .Κάθε τιμή της μεταβλητής Χ έχει ορισμένη πιθανότητα να συμβεί. Μία μεταβλητή Χ όπως η προηγουμένη , η οποία παίρνει την τιμή 1x , όταν συμβαίνει το γεγονός 1E , την τιμή 2x όταν συμβαίνει το γεγονός

2E ……., την τιμή nx όταν συμβαίνει το γεγονός nx κ.οκ την ονομάζουμε τυχαία μεταβλητή . Οι μεταβλητές αυτές δεν έχουν καθορισμένη τιμή αλλά γνωρίζουμε μόνον την πιθανότητα να λάβουν κάποια τιμή . Τυχαίες μεταβλητές είναι και τα αποτελέσματα μετρήσεων πολλών φυσικών ποσοτήτων . Για παράδειγμα ο χρόνος ζωής ενός ασταθούς σωματιδίου η ενός ασταθούς πυρήνα δεν έχει μια μοναδική τιμή αλλά είναι μεταβλητός και το μόνο που μπορούμε να μάθουμε είναι η πιθανότητα να διασπαστεί το σωματίδιο σε χρόνο t. H πιθανότητα αυτή είναι ανάλογη της ποσότητας /te τ− όπου τ ο χρόνος ημιζωής . Ανεξάρτητα από την ακρίβεια των μετρητικών μας συσκευών , όταν επιχειρήσουμε να μετρήσουμε τον χρόνο ζωής ενός πλήθους πανομοιότυπων ασταθών πυρήνων , θα προσδιορίζουμε χρόνους ζωής t διαφορετικούς για καθέναν από αυτούς. Τον ίδιο εκθετικό νόμο τον συναντούμε σε πολλές περιπτώσεις , όπως για την πιθανότητα που έχει ένα εξάρτημα μηχανής να διαρκέσει χωρίς βλάβη για χρόνο μεγαλύτερο από t. Οι επαναλαμβανόμενες μετρήσεις της ίδιας φυσικής ποσότητας δεν καταλήγουν πάντα στο ίδιο αποτέλεσμα. Στις περισσότερες περιπτώσεις η πιθανότητα να βρούμε την τιμή Q ( η καλύτερα , μια τιμή μεταξύ Q και Q+dQ) ως ένα αποτέλεσμα μέτρησης ενός φυσικού μεγέθους με αληθή τιμή R εκφράζεται από την ακόλουθη σχέση

21

2

2( )

2( )R Q

P Q dQ e dQσ−

−∝

Εάν Χ μία τυχαία μεταβλητή , η οποία μπορεί να πάρει τις τιμές

1 2, ,..., nx x x με αντίστοιχες πιθανότητες 1 2( ), ( ),..., ( )np x p x p x , το σύνολο που έχει σαν στοιχεία τα διατεταγμένα ζεύγη [ ], ( ) : 1, 2,...,i ix p x i n= ονομάζεται συνάρτηση πιθανότητας της Χ.Συνήθως η συνάρτηση πιθανότητας γράφεται σαν συναρτησιακή σχέση μεταξύ του ( )ip x και του

ix 1.3 Συνάρτηση πυκνότητας πιθανότητας [ 13 ]

Για να αντιληφθούμε την την φυσική έννοια της πυκνότητας πιθανότητας εκτελούμε το παρακάτω πείραμα Σκοπός του πειράματος είναι ο καθορισμός της κατεύθυνσης ενός σωματίου το οποίο κινείται παράλληλα με τον άξονα Ζ προς το επίπεδο του σχ. Προς τούτο τοποθετούμε δύο σειρές ανιχνευτών x ( κάθετους στον οριζόντιο άξονα Χ ) και y ( κάθετους στον κατακόρυφο άξονα Υ.Το εύρος των ανιχνευτών είναι Δx και Δy αντίστοιχα. Κατά την διέλευση του σωματίου διαμέσου κάποιων από τους ανιχνευτές ( π.χ ix και iy ) οι ανιχνευτές διεγείρονται και παράγονται σήματα στην άκρη τους .Κατ’ αυτόν τον τρόπο για κάθε σωμάτιο που ανιχνεύεται προσδιορίζουμε δύο διακριτές μεταβλητές i και j που αντιστοιχούν στους ανιχνευτές ix και iy .

Σχήμα 1.4 Συστοιχία αμοιβαία ορθογώνιων ανιχνευτών [ 2 ] Εάν αφήσουμε Ν σωμάτια να διασχίσουν την μετρητική συσκεύη και υπολογίσουμε το πλήθος ijn των σωματίων που διέγειραν το ζεύγος των ανιχνευτών ( i,j) μπορούμε να υπολογίσουμε την πιθανότητα ijP να διέλθει ένα σωμάτιο διαμέσου των ανιχνευτών ix και iy .Πράγματι από τον ορισμό της πιθανότητας ισχύει :

22

lim ij ijij N

n nP

N N→∞= ≅ για μεγάλο Ν. (1.9)

Στο σχ. 1.5.a παρίσταται γραφικά , υπό μορφή ιστογράμματος η πιθανότητα διέγερσης κάθε ζεύγους ανιχνευτών ( i,j) , που υπολογίστηκε σε ανάλογο πείραμα βάσει της σχέσης 1.19

Σχήμα1.5Πιθανότητα διέγερσης του ζεύγους ανιχνευτών 1.5.b Πυκνότητα πιθανότητας διέλευσης σωματίου από την στοιχειώδη περιοχή dxdy γύρω από το σημείο (x,y) [ 2 ] Ουσιαστικά η ijP αναφέρεται στην πιθανότητα να περάσει ένα σωμάτιο μέσα από μια επιφάνεια διαστάσεων x yΔ ⋅Δ . Η πιθανότητα που έχει ένα σωμάτιο να

περάσει από την μοναδιαία επιφάνεια θα είναι : ijij

Px y

ρ =Δ ⋅Δ

και την ονομάζουμε

μέση πυκνότητα πιθανότητας . Εάν υποθέσουμε ότι κάθε σωμάτιο έχει την ίδια πιθανότητα να περάσει από κάθε σημείο της επιφάνειας x yΔ ⋅Δ , τότε η πιθανότητα να περάσει το σωμάτιο από ένα μικρό τμήμα d της επιφάνειας αυτής θα είναι : ij dρ ⋅ . Είναι φανερό ότι εάν έχουμε στην διαθεσή μας άπειρο αριθμό ανιχνευτών μηδενικού πάχους ( 0, 0x yΔ → Δ → ) και καλύψουμε όλη την επιφάνεια διέλευσης των σωματίων , θα μπορέσουμε να υπολογίσουμε το :

0 00 0

(( , )lim lim ( , )( ) ( )

xy

x xy y

N

nP x y N f x yx y x yΔ → Δ →

Δ → Δ →→∞

Δ Δ= =

Δ ⋅Δ Δ ⋅Δ (1.10)

23

όπου xyn ο αριθμός των σωματίων που πέρασαν από μια στοιχειώδη επιφάνεια x yΔ ⋅Δ που βρίσκεται στην θέση x,y , για κάθε σημείο ,x y

H συνάρτηση ( , )f x y που εκφράζει την πιθανότητα για κάθε σημείο ,x y , ονομάζεται συνάρτηση πυκνότητας πιθανότητας και για το παραδειγμά μας παρίσταται γραφικα΄στο σχ 1.5(b). Επειδή οι τυχαίες μεταβλητές ,x y είναι συνεχείς, η πιθανότητα να περάσει ένα σωματίδιο από ένα συγκεκριμένο σημείο ,x y , είναι 0. Μπορούμε να γνωρίζουμε μόνο την πιθανότητα το σωματίδιο να περάσει από την περιοχή ,x yΔ Δ . Από την παρατήρηση αυτή και την σχέση (1.20) προκύπτει ότι :

( , ) ( , )b d

a c

p x y f x y dxdyΔ Δ = ∫ ∫

όπου b a x− = Δ και d c y− = Δ Αν γνωρίζουμε ότι η συνάρτηση πυκνότητας πιθανότητας μιάς τυχαίας μεταβλητής Ζ είναι R(z) , τότε η πιθανότητα να λάβει η Ζ τιμή στο διάστημα μεταξύ z και z+dz είναι ( ) ( )P z R z dz= ⋅ (1.11) Στην περίπτωση που μελετάμε ένα πρόβλημα που χαρακτηρίζεται με περισσότερες από μία μεταβλητές ( π.χ η ταυτόχρονη μέτρηση πίεσης , θερμοκρασίας και του όγκου ενός αερίου ) ,συνήθως οι πυκνότητες πιθανότητες των τυχαίων μεταβλητών αλληλεξαρτώνται .Στην περίπτωση αυτή , η πιθανότητα οι τυχαίες μεταβλητές 1 2, ,..., NX X X να έχουν συγχρόνως τιμές στα διαστήματα

[ ]1 1 1,x x dx+ [ ]2 2 2,x x dx+ ,…, [ ],N N Nx x dx+ δίνεται από την σχέση : 1 2 1 2 1 2( , ,..., ) ( , ,..., ) ...N N NP x x x g x x x dx dx dx= όπου (1.12) 1 2( , ,..., )Ng x x x είναι η κοινή συνάρτηση πυκνότητας πιθανότητας των τυχαίων μεταβλητών. Το ολοκλήρωμα της συνάρτησης πυκνότητας πιθανότητας για όλες τις δυνατές τιμές των τυχαίων μεταβλητών εκφράζει την συνολική πιθανότητα και συνεπώς πρέπει να ισούται με την μονάδα.:

1 2 1 2... ( , ,..., ) ... 1N Ng x x x dx dx dx+∞ +∞

−∞ −∞

=∫ ∫ (1.13)

Στην περίπτωση που η τυχαία μεταβλητή παίρνει διακριτές τιμές η συνάρτηση πυκνότητας πιθανότητας χάνει την χρηστική της αξία .Στην περίπτωση αυτή μιλούμε για συνάρτηση πιθανότητας όπως την ορίσαμε στην προηγούμενη ενότητα.

24

Oρίζουμε ως αθροιστική συνάρτηση πιθανότητας της τυχαίας μεταβλητής Χ , με συνάρτηση πυκνότητας πιθανότητας f(x) , την συνάρτηση F(y) που εκφράζει την πιθανότητα η τυχαία μεταβλητή Χ να πάρει τιμή μικρότερη η ίση από την τιμή y :

( ) ( ) ( )y

F y f x dx P x y−∞

= = ≤∫ (1.14)

Aπο τον παραπάνω ορισμό έπεται ότι : ( ) 0F −∞ = και ( ) 1F ∞ = (1.15)

1.4 Προσδοκώμενη τιμή - Μεταβλητότητα

Είναι συχνό φαινόμενο στην πειραματική επιστήμη να παίρνουμε τα αποτελέσματα επαναλαμβανόμενων μετρήσεων ενός φυσικού μεγέθους και να προσπαθούμε να τα αξιολογήσουμε. Στην συντριπτική τους πλειοψηφία οι τιμές των μετρήσεων αυτών είναι διαφορετικές σε κάθε πείραμα. Αν για παράδειγμα μετρήσουμε την ορμή μιάς ομάδας ηλεκτρονίων που επιταχύνονται με τον ίδιο ακριβώς τρόπο από έναν επιταχυντή , βρίσκουμε διαφορετικές τιμές για την ορμή των ηλεκτρονίων. Το αποτέλεσμα της μέτρησης είναι τυχαία μεταβλητή και η συνάρτηση πυκνότητας πιθανότητας λέγεται διακριτική ικανότητα του οργάνου. Εάν η τυχαία μεταβλητή x είναι συνεχής με συνάρτηση πυκνότητας πιθανότητας g(x) για x∈Ω η αναμενόμενη τιμή αυτής ορίζεται από την σχέση :

( ) ( )E x x g x dxΩ

= ⋅∫ (1.16)

Το Ω δηλώνει όλο το πεδίο ορισμού της μεταβλητής x. Εάν η x είναι ασυνεχής τυχαία μεταβλητή που παίρνει τις τιμές 1 2, ,..., nx x x με

1, 2...,i n= η αναμενόμενη τιμή δίνεται από την σχέση :

1

( ) ( )n

i ii

E x x g x=

= ∑ (1.17)

Ενας εύκολος τρόπος για να καταλάβουμε την έννοια της αναμενόμενης τιμής είναι μέσα από τυχερά παιχνίδια όπως για παράδειγμα τα «φρουτάκια». Στα παιχνίδια αυτά υπάρχουν διάφορα δυνατά αποτελέσματα r ,το καθένα με πιθανότητα να συμβεί ( )P r , και παίρνεις σε κάθε επιτυχία ένα αντίστοιχο ποσό ( )f r Η αναμενόμενη τιμή f< > είναι το ποσό που προσδοκούμε κατά μέσο όρο να κερδίσουμε σ’ έναν μεγάλο αριθμό παιχνιδιών.

25

Εάν υποθέσουμε ότι η συνάρτηση ε(x) είναι συνάρτηση της τυχαίας μεταβλητής x με συνάρτηση πυκνότητας πιθανότητας f(x) η αναμενόμενη τιμή αυτής δίνεται από την σχέση :

( ) ( ) ( )E x x f x dxεΩ

= ⋅∫ (1.18)

Σύμφωνα με τα όσα είπαμε πιο πάνω η αναμενόμενη τιμή εκφράζει την μέση τιμή των τιμών της μέτρησης ενός φυσικού μεγέθους , η οποία επαναλαμβάνεται πολλές φορές . Για την αναμενόμενη τιμή ισχύουν τα παρακάτω θεωρήματα : Θεώρημα 1.6 : Εάν c μια σταθερά , τότε ( ) ( )E cX cE X= Θεώρημα 1.7 : Eάν X και Y είναι δυο τυχαίες μεταβλητές , τότε ( ) ( ) ( )E X Y E X E Y+ = + Θεώρημα 1.8 : Eάν X και Y είναι δύο ανεξάρτητες τυχαίες μεταβλητές , τότε ( ) ( ) ( )E XY E X E Y= Τα θεωρήματα αυτά γενικεύονται εύκολα για n μεταβλητές . Η μέση τιμή όμως δεν μας δίνει την εικόνα της διασποράς των τιμών της μεταβλητής .Η μέτρηση της διασπορά γίνεται κυρίως μέσω της μεταβλητότητας και της τυπικής απόκλισης Η αναμενόμενη τιμή της μεταβλητής [ ] 2( )x E x− ονομάζεται διασπορά (η τετραγωνική απόκλιση) και εκφράζεται από την σχέση :

[ ] [ ]2 2( ) ( ) ( ) ( )V x E x E x x E x f x dxΩ

⎡ ⎤= − = − ⋅⎣ ⎦ ∫ (1.19)

H τετραγωνική απόκλιση ( η διασπορά ) μιάς μονοτονικής συνάρτησης , ε(x) , της τυχαίας μεταβλητής x με συνάρτηση πυκνότητας πιθανότητας την f(x) δίνεται από την σχέση :

[ ] [ ] [ ]2 2( ) ( ( ) ) ( ( ) ) ( )V x E x E x x E x f x dxε ε εΩ

⎡ ⎤= − = − ⋅⎣ ⎦ ∫ (1.20)

Εάν η x είναι ασυνεχής τυχαία μεταβλητή που παίρνει τις τιμές 1 2, ,..., nx x x με 1, 2...,i n= η τετραγωνική απόκλιση δίνεται από την σχέση :

26

[ ] 2

1( ) ( ) ( )

N

i ii

V x x E x f x=

⎡ ⎤= − ⋅⎣ ⎦∑ (1.21)

Για την διασπορά ισχύουν τα παρακάτω θεωρήματα : Θεώρημα 1.9 : [ ]2 2( ) ( )V x E x E x⎡ ⎤= −⎣ ⎦ Θεώρηα 1.10 : Εάν c μια σταθερά , τότε [ ] [ ]2V cX c V X= Θεώρημα 1.11 : Eάν X και Y είναι δύο ανεξάρτητες τυχαίες μεταβλητές , τότε [ ] [ ] [ ]V X Y V X V Y+ = + και [ ] [ ] [ ]V X Y V X V Y− = + H έννοια της μέσης τιμής και της τετραγωνική απόκλισης μπορεί να γενικευτεί και σε περιπτώσεις περισσότερων της μιάς τυχαίων μεταβλητών . Εστω ότι η ( , )f x y είναι η κοινή συνάρτηση πυκνότητας πιθανότητας δύο τυχαίων μεταβλητών x και y . Θεωρούμε επίσης ότι η ( , )g x y είναι μια συνάρτηση των παραπάνω μεταβλητών. Οι σχέσεις για την μέση τιμή και την τετραγωνική απόκλιση θα είναι οι επόμενες :

[ ]( , ) ( , ) ( , )E g x y g x y f x y dxdy∞ ∞

−∞ −∞

= ⋅∫ ∫ (1.22)

[ ] [ ] [ ]2 2( , ) ( ( , ) ( , ) ) ( ( , ) ( , ) ( , )V g x y E g x y E g x y g x y E g x y f x y dxdy⎡ ⎤= − = − ⋅⎣ ⎦ ∫ ∫

(1.35)

( ) ( , )x E x x f x y dxdyμ∞ ∞

−∞ −∞

= = ⋅∫ ∫ (1.23)

( ) ( , )y E y y f x y dxdyμ∞ ∞

−∞ −∞

= = ⋅∫ ∫ (1.24)

27

2 2 2( ) ( ) ( ) ( , )x x xV x E x x f x y dxdyσ μ μ∞ ∞

−∞ −∞

⎡ ⎤= = − = − ⋅⎣ ⎦ ∫ ∫ (1.25)

2 2 2( ) ( ) ( ) ( , )y y yV y E y y f x y dxdyσ μ μ∞ ∞

−∞ −∞

⎡ ⎤= = − = − ⋅⎣ ⎦ ∫ ∫ (1.26)

Όταν οι μετρήσεις μας εξαρτώνται από περισσότερες από μία τυχαίες μεταβλητές για να είναι πλήρης η μελέτη τους θα πρέπει να γνωρίζουμε την Διασπορά (Covariance) και την Συσχέτιση (Correlation) μεταξύ των μεταβλητών. Ο ορισμός αυτών των εννοιών θα γίνει στο επόμενο κεφάλαιο. Παράδειγμα 1.6 Μπορούμε να αποκτήσουμε μία φυσικο-γεωμετρική εποπτεία των εννοιών προς μέσης τιμής και προς τετραγωνικής απόκλισης μέσα από την κατανομή μάζας των στερεών σωμάτων ως προς κάποιον άξονα συμμετρίας προς . Θεωρούμε μία ευθύγραμμη ράβδο αμελητέου πάχους προς οποίας η πυκνότητα κατανομής προς μάζας κατά μήκος του άξονα χ περιγράφεται από την συνάρτηση

( )xρ . Το κέντρο μάζας προς ράβδου δίνεται από την σχέση :

0 0 0

1 ( ) ( )L L L

csx xdm x x dx x x dx

M Mρ ρ= = =∫ ∫ ∫

Θεωρήσαμε ότι η διατομή προς ράβδου s είναι αμελητέα και η μάζα προς M ίση με την μονάδα . Προς φανερό ότι η παραπάνω σχέση εκφράζει την αναμενόμενη τιμή προς μεταβλητής ( συντεταγμένης ) x . Δηλαδή [ ]cx E x= Αν θυμηθούμε ότι το κέντρο μάζας είναι ένα σημείο στο οποίο μπορούμε να θεωρήσουμε ότι όλη η μάζα του σώματος είναι συγκεντρωμένη δηλαδή ένα αντοπροσωπευτικό σημείο του σώματος , παρόμοια μπορούμε να πούμε ότι η αναμενόμενη τιμή αντιπροσωπεύει προς προς δυνατές τιμές προς μεταβλητής x Η ροπή αδρανείας προς παραπάνω ράβδου ως προς άξονα που περνάει από το κέντρο μάζας είναι :

2 2

0 0

( ) ( ) ( ( )) ( )L L

c cI s x x x dx x E x x dxρ ρ= ⋅ − −∫ ∫ ( Γιατί [ ]cx E x= )

Η παραπάνω σχέση προς εκφράζει την διασπορά προς μεταβλητής (συντεταγμένης) x Δηλαδή [ ]cI V x= Τα παραπάνω συμπεράσμα είναι αναμενόμενο αν σκεφθούμε ότι η μεταβλητότητα ή η τυπική απόκλιση, εκφράζει την διασπορά των τιμών προς

28

μεταβλητής x γύρω από την μέση τιμή μ και η ροπή αδράνειας την διασπορά προς μάζας προς σώματος ως προς τον άξονα που διέρχεται από το κέντρο μάζας του . Ειδαμε λοιπόν ότι στην φυσική του στερεού σώματος η αναμενόμενη τιμή εκφράζει την συντεταγμένη του κέντρου μάζας ενώ η διασπορά την ροπή αδράνειας ως προς άξονα που περνά από το κέντρο μάζας του σώματος Παράδειγμα 1.7 Σ’ ένα παιχνίδι ένας παίκτης ρίχνει ένα ζάρι . Ο παίκτης κερδίζει 20 Ευρώ εάν έρθει 2 , 40 Ευρώ εάν έρθει 4 , χάνει 30 Ευρώ εάν έρθει 6 και ούτε κερδίζει ούτε χάνει αν έρθει άλλος αριθμός . Πόσα Ευρώ αναμένεται να κερδίσει ο παίκτης. σ’ ένα παιχνίδι. Εστω Χ η τυχαία μεταβλητή που παριστάνει το κέρδος του παίκτη σε μια ρίψη του ζαριού. Τα δυνατά αποτελέσματα είναι 1,2,…,6 με αντίστοιχα κέρδη 1 2 6, ,...,x x x και πιθανότητες 1 2 6( ), ( ),..., ( )f x f x f x Η συνάρτηση πιθανότητας φαίνεται στο σχ. Η αναμενόμενη τιμή είναι :

1 1 1 1 1 1( ) (0)( ) (20)( ) (0)( ) (40)( ) (0)( ) ( 30)( ) 56 6 6 6 6 6

E X = + + + + + − =

ix 0 20 0 40 0 -30

( )if x 1/6 1/6 1/6 1/6 1/6 1/6

Συνεπώς ο παίκτης αναμένεται να κερδίζει 5 Ευρώ ανα παιχνίδι. Θα πρέπει επομένως να πληρώνει 5 Ευρώ για την συμετοχή του στο παιχνίδι. 1.5 Γραμμικές συναρτήσεις τυχαίων μεταβλητών [ 13 ] Σκοπός κάθε πειραματικής έρευνας είναι εύρεση της συναρτησιακής εξάρτησης των μεταβλητών που επηρεάζουν το προβλημά μας . Για να ορίσουμε για παράδειγμα πλήρως την κατάσταση ενός ιδανικού αερίου θα πρέπει να βρούμε μια σχέση της μορφής ( , , , )P f V T S H= (1.27) η οποία μας δείχνει την σχέση των ανεξάρτητων μεταβλητών του όγκου V , της θερμοκρασίας Τ , της εντροπίας S , και της ενθαλπίας Η , με την εξαρτημένη μεταβλητή της πίεσης . Στην απλούστερη περίπτωση η σχέση αυτή είναι γραμμική. Εάν έχουμε Ν μεταβλητές 1 2, ,..., Nx x x με γραμμική συναρτησιακή εξάρτηση θα ισχύει :

29

1 21

( , ,..., )N

N i ii

y y x x x a x=

= =∑ (1.28)

Συνήθως οι Ν τυχαίες μεταβλητές 1 2, ,..., Nx x x έχουν κοινή συνάρτηση πυκνότητας πιθανότητας 1 2( , ,..., )Nf x x x με μέσες τιμές 1 2, ,...,μ μ μΝ , τετραγωνικές αποκλίσεις 1 2( ), ( ),..., ( )NV x V x V x και συνδιασπορές cov( , )i jx x που δίνονται από τους τύπους

[ ] 1 2 1 2... ( , ,..., ) ...i i N Nx x f x x x dx dx dxιμ+∞ +∞

−∞ −∞

= Ε = ∫ ∫ (1.29)

[ ] cov ,i i jV x x x⎡ ⎤= ⎣ ⎦ [ ]2 2 21 2 1 2... ( ) ( , ,..., ) ... ( )i N N i ix f x x x dx dx dx x E xιμ

+∞ +∞

−∞ −∞

⎡ ⎤− = Ε −⎣ ⎦∫ ∫

cov( , )i jx x = 1 2 1 2... ( )( ) ( , ,..., ) ...i j j N Nx x f x x x dx dx dxιμ μ+∞ +∞

−∞ −∞

− − =∫ ∫

= [ ]i j i jE x x E x E x⎡ ⎤ ⎡ ⎤⋅ − ⋅⎣ ⎦ ⎣ ⎦ (1.30) Συνεπώς η αναμενόμενη τιμή της τυχαίας ματαβλητής y είναι :

( ) [ ]1 21 1 1

, ,...,N N N

N i i i i ii i i

E y x x x E a x a E x a ιμ= = =

⎡ ⎤= = ⋅ =⎡ ⎤⎣ ⎦ ⎢ ⎥⎣ ⎦∑ ∑ ∑ (1.31)

H διασπορά της γραμμικής συνάρτησης 1 21

( , ,..., )N

N i ii

y y x x x a x=

= =∑

( )2

1 2 1 2 1 2, ,..., ( , ,..., ) ...N i i i i i i N Ni i i

V y x x x V a x E a x a x f x x x dx dx dx+∞

−∞

⎛ ⎞⎡ ⎤ ⎡ ⎤= = −⎡ ⎤ ⎜ ⎟⎣ ⎦ ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦⎝ ⎠

∑ ∑ ∑∫ και μετά από πράξεις καταλήγουμε στην σχέση

( ) [ ]21 2

,

, ,..., . 2 cov ,N i i i i i j i ji i i j

i j

V y x x x V a x a V x a a x x>

⎛ ⎞⎡ ⎤ ⎛ ⎞ ⎜ ⎟⎡ ⎤= = + ⋅ ⋅ ⋅⎡ ⎤ ⎜ ⎟⎣ ⎦ ⎢ ⎥ ⎣ ⎦⎜ ⎟⎣ ⎦ ⎝ ⎠ ⎜ ⎟

⎝ ⎠∑ ∑ ∑ (1.32)

ή ισοδύναμα γράφεται στην μορφή

( )1 21 1

, ,..., cov ,N N

N i i i j i ji i j

V y x x x V a x a a x x= =

⎡ ⎤ ⎡ ⎤= = ⋅ ⋅⎡ ⎤⎣ ⎦ ⎢ ⎥ ⎣ ⎦⎣ ⎦∑ ∑∑ (1.33)

30

Εάν οι τυχαίες μεταβλητές 1 2, ,..., Nx x x είναι αμοιβαία ανεξάρτητες , τότε η

διασπορά της γραμμικής συνάρτησης 1 21

( , ,..., )N

N i ii

y y x x x a x=

= =∑ ισούται με :

[ ]2.i i i ii i

V a x a V x⎡ ⎤ =⎢ ⎥⎣ ⎦∑ ∑ (1.34)

Παράδειγμα 1.8 [ 7 ] Θεωρήστε την περίπτωση όπου οι τυχαίες μεταβλητές ix είναι Ν αμοιβαία ανεξάρτητες δοκιμές (επαναλήψεις) του ίδιου πειράματος. Σ΄αυτήν την περίπτωση οι Ν τυχαίες μεταβλητές προέρχονται απο την ίδια συνάρτηση πυκνότητας πιθανότητας. Η κοινή συνάρτηση πυκνότητας πιθανότητας , . 1 2( , ,..., )Ng x x x . , θα είναι το γινόμενο : 1 2 1 2( , ,..., ) ( ) ( ) .... ( )N Ng x x x f x f x f x= ⋅ ⋅ ⋅ Η αναμενόμενη τιμή του αποτελέσματος κάθε δοκιμής θα ισούται με τη μέση τιμή της συνάρτησης πυκνότητας πιθανότητας:.

[ ] ( )E x x f x dxμ+∞

−∞

= = ⋅∫

γιατί

[ ] 1 2 1 2

1 2 1 2

1 1 1 1 1 1

.... ( , ,..., ) ...

... ( ) ( ).... ( ) ...

( ) ... ( )... ( ) ( )... ( ) ... ...

i i i N N

i N N

i i i i i N i i N

E x x g x x x dx dx dx

x f x f x f x dx dx dx

x f x dx f x f x f x f x dx dx dx dx

μ

μ

+∞ +∞

−∞ −∞

+∞ +∞

−∞ −∞

+∞ +∞

− + − +−∞ −∞

= = ⋅

= ⋅ ⋅ =

= ⋅ ⋅ =

∫ ∫

∫ ∫

∫ ∫

Όμοίως η διασπορά κάθε μέτρησης θα ισούται:

[ ]

[ ]

21 2 1 2

21 2 1 2

21 1 1 1 1 1

2

.... ( ) ( , ,..., ) ...

... ( ) ( ) ( ).... ( ) ...

( ) ( ) ... ( )... ( ) ( )... ( ) ... ...

i i N N

i N N

i i i i i N i i N

V x x g x x x dx dx dx

x f x f x f x dx dx dx

x f x dx f x f x f x f x dx dx dx dx

V x

μ

μ

μ

σ

+∞ +∞

−∞ −∞

+∞ +∞

−∞ −∞

+∞ +∞

− + − +−∞ −∞

= − ⋅

= − ⋅ ⋅ =

= − ⋅ ⋅ =

= =

∫ ∫

∫ ∫

∫ ∫

31

Στα επόμενα παριστούμε με το σύμβολο το μέσο όρο των Ν παρατηρήσεων ix ο οποίος είναι γραμμική συνάρτηση των Ν τυχαίων μεταβλητών ix Προφανώς ο μέσος όρος είναι και αυτός τυχαία μεταβλητή με αναμενόμενη μέση τιμή που δίνεται απο :

1

1 1N

ii

E x E x NN N

μ μ=

⎡ ⎤⎡ ⎤ = ⋅ = ⋅ ⋅ =⎣ ⎦ ⎢ ⎥⎣ ⎦∑

Δε χρειάζεται να γνωρίζουμε την ακριβή συναρτησιακή μορφή της πυκνότητας πιθανότητας που χαρακτηρίζει τον μέσο όρο ( για μεγάλο Ν είναι πολύ εύκολο να μαντέψουμε την συνάρτηση πυκνότητας πιθανότητας μέσου όρου, όπως θα δούμε στα επόμενα ) για να υπολογίσουμε τη διασπορά , V x⎡ ⎤⎣ ⎦ Πράγματι, εφαρμόζοντας τη σχέση (1.44) , καταλήγουμε ότι:

[ ]2 2

1 1 1 1

2

21 1

1 1 2 cov ,

2 cov ,

N N N N

i i i ji i i j i

N N

i ji j i

V x V x x xN N N

x xN

σ= = = + =

= + =

⎡ ⎤ ⎡ ⎤= ⋅ + ⋅ =⎢ ⎥ ⎣ ⎦⎣ ⎦

⎡ ⎤= + ⋅ ⎣ ⎦Ν

∑ ∑ ∑∑

∑∑

Εάν οι μετρησεις είναι ανεξάρτητες μεταξύ τους, όπως συμβαίνει στις περισσότερες των περιπτώσεων , τότε cov , 0i jx x⎡ ⎤ =⎣ ⎦ , και η προηγούμενη σχέση καταλήγει στην απλή έκφραση:

2

V x σ⎡ ⎤ =⎣ ⎦ Ν

Η διασπορά του μέσου όρου Ν ανεξάρτητων μετρήσεων του ίδιου φυσικού μεγέθους είναι Ν φορές μικρότερη απο τη διασπορά της μίας μέτρησης. Θα εκτιμήσουμε περισσότερο το αποτέλεσμα αυτό όταν θα συνδέσουμε την έννοια του μετρητικού σφάλματος με τη διασπορά των τυχαίων μεταβλητών , στο κεφάλαιο 4. 1.5 Συναρτήσεις τυχαίων μεταβλητών [ 13 ]

Οι σχέσεις που καταλήξαμε στην προηγούμενη ενότητα ισχύουν για γραμμικές συναρτήσεις . Παρακάτω δίνουμε χωρίς απόδειξη τους προσεγγιστικούς τύπους για την αναμενόμενη τιμή και την διασπορά οποιασδήποτε συνάρτησης Ν τυχαίων μεταβλητών.

32

Η αναμενόμενη τιμή της συνάρτησης των τυχαίων μεταβλητών 1 2, ,..., Nx x x ( )y f x= , δίνεται από την σχέση : 1 2( ) ( , ,..., )E f x f μ μ μΝ⎡ ⎤⎣ ⎦ (1.35) όπου 1 2, ,...,μ μ μΝ είναι οι αναμενόμενες τιμές των τυχαίων μεταβλητών. Η διασπορά της συνάρτησης των τυχαίων μεταβλητών 1 2, ,..., Nx x x ( )y f x= , δίνεται από την σχέση :

[ ] [ ]2

1 21 1 1

( ) ( ) ( )( , ,..., ) 2 cov ,

N N N

N i i ji j ji i xx

f x f x f xV f x x x V x x x

x x xι ξμμ= = + = ==

⎛ ⎞ ⎛ ⎞∂ ∂ ∂⎛ ⎞⎡ ⎤+ ⋅ ⋅ ⋅⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎣ ⎦⎜ ⎟⎜ ⎟∂ ∂ ∂⎝ ⎠ ⎝ ⎠⎝ ⎠

∑ ∑ ∑

(1.36)

Στις πρακτικές εφαρμογές συνήθως μας ενδιαφέρουν τυχαίες μεταβλητές που παίρνουν πραγματικές τιμές. Πολλές φορές όμως για να διευκολύνουμε τους υπολογισμούς ορίζουμε τυχαίες μεταβλητές που παίρνουν μιγαδικές τιμές . Αν για παράδειγμα X και Y είναι τυχαίες μεταβλητές με πραγματικές τιμές x και y , τότε η μεταβλητή iYΖ = Χ + παίρνει μιγαδικές τιμές , x iy+ . Η αναμενόμενη τιμή της μεταβλητής Ζ θ είναι ( ) ( ) ( )E z E x iE y= + (1.37) Εάν η μεταβλητή παίρνει τις τιμές 1 2, ,..., Nx x x , η χαρακτηριστική συνάρτηση

ορίζεται ως : 1

( ) ( ) k kitx itxx k

k

t f x e E eφ∞

=

⎡ ⎤= ⋅ = ⎣ ⎦∑ για t πραγματικό. (1.38)

Στην περίπτωση συνεχούς κατανομής με συνάρτηση πυκνότητας πιθανότητας

( )f x , χαρακτηριστική συνάρτηση ονομάζουμε τον μετασχηματισμό Fourier της f(x)

( ) ( )itx itxx t e f x dx E eφ

+∞

−∞

⎡ ⎤= ⋅ = ⎣ ⎦∫ για t πραγματικό. (1.39)

Προφανώς η χαρακτηριστική συνάρτηση είναι μιγαδική συνάρτηση. Εάν γνωρίζουμε την χαρακτηριστική συνάρτηση μιας τυχαίας μεταβλητής τότε η συνάρτηση πυκνότητας πιθανότητας της τυχαίας μεταβλητής βρίσκεται από την σχέση

1( ) ( )2

ixtxf x t e dtφ

π

+∞−

−∞

= ⋅∫ (1.40)

33

Μερικές από τις βασικές ιδιότητες της χαρακτηριστικής συνάρτησης είναι οι παρακάτω : α) Η χαρακτηριστικη συνάρτηση ( )x tφ υπάρχει για όλα τα t και επίσης ισχύει ότι ; (0) 1φ = και ( ) 1tφ < β) Εάν ( )x tφ είναι η χαρακτηιστική συνάρτηση της τυχαίας μεταβλητής x , τότε η χαρακτηριστική συνάρτηση της y ax b= + είναι ( ) ( )ibt

y xt e atφ φ= ⋅ (1.41) γ) Εάν X και Y είναι αμοιβαία ανεξάρτητες τυχαίες μεταβλητές με χαρακτηριστικές συναρτήσεις ( )x tφ και ( )y tφ η χαρακτηριστική συνάρτηση της μεταβλητής Z X Y= + είναι : ( ) ( ) ( )x y x yt t tφ φ φ+ = ⋅ (1.42) Παράδειγμα 1.9 [ 7 ] Εστω οι αμοιβαία ανεξάρτητες τυχαίες μεταβλητές 1 2, ,..., NX X X με κοινή συνάρτηση πυκνότητας πιθανότητας 1 2 1 2( , ,..., ) ( ) ( ) .... ( )N Nf x x x f x f x f x= ⋅ ⋅ ⋅ όπου 1 2( ), ( ),..., ( )Nf x f x f x είναι οι συναρτήσεις πυκνότητας πιθανότητας καθεμίας από τις τυχαίες μεταβλητές, Εστω 1 2( ), ( ),..., ( )t t tφ φ φΝ είναι οι αντίστοιχες χαρακτηριστικές συναρτήσεις .Εστω ακόμα η τυχαία μεταβλητή Ζ ώστε

1 2 ... NZ X X X= + + + Για να υπολογίσουμε την συνάρτηση πυκνότητας πιθανότητας της Ζ , ( )g z , πρέπει να κάνουμε τις παρακάτω ολοκληρώσεις

1 2 1 2 1 2( ) .... ( ... ) ( ) ( ).... ( ) ...N N Ng z z x x x f x f x f x dx dx dxδ= − − ⋅ ⋅∫ ∫ ∫

Μπορούμε να αποφύγουμε όμως την πολύπλοκη ολοκλήρωση με χρήση της χαρακτηριστικής συνάρτησης . Πράγματι για την περίπτωση των Ν μεταβλητών η γράφεται : 1 2( ) ( ) ( ) .... ( )t t t tφ φ φ φΝ= ⋅ ⋅ ⋅ Στην συνέχεια , η συνάρτηση πυκνότητας πιθανότητας υπολογίζεται ως ο αντίστροφος μετασχηματισμός Fourier της ( )tφ .

34

ΚΕΦΑΛΑΙΟ 2ον : ΠΕΡΙΓΡΑΦΗ & ΤΑΞΙΝΟΜΗΣΗ ΔΕΔΟΜΕΝΩΝ 2.1 Εισαγωγή Εάν υποθέσουμε ότι θέλουμε να μελετήσουμε ένα συγκεκριμένο χαρακτηριστικό ενός συνόλου ομοειδών ατόμων ή αντικειμένων , όπως για παράδειγμα το ύψος των φοιτητών ενός πανεπιστημίου ή τον χρόνο διάσπασης ενός ραδιενεργού υλικού , τότε είναι συνήθως αδύνατο ή οικονομικά ασύμφορο , να συλλεγούν αριθμητικά δεδομένα με μετρήσεις ή παρατηρήσεις του χαρακτηριστικού αυτού του συνόλου.Ένα τέτοιο σύνολο το ονομάζουμε πληθυσμό και ο αριθμός των στοιχείων του μπορεί να είναι πεπερασμένος ή άπειρος. Ο πληθυσμός π.χ των αυτοκινήτων που παράγει ετησίως ένα εργοστάσιο είναι πεπερασμένος , ενώ ο πληθυσμός των δυνατών ρίψεων ενός νομίσματος είναι θεωρητικώς άπειρος. Για τους παραπάνω λόγους , για την μελέτη ενός χαρακτηριστικού ένός πληθυσμού συνήθως χρησιμοποιείται ενα μέρος αυτού , το οποίο ονομάζουμε δείγμα και θεωρείται κάτω από ορισμένες προυποθέσεις αντιπροσωπευτικό του πληθυσμού Όπως θα δούμε στο κεφάλαιο της Εκτίμησης , γνωρίζοντας κάποια χαρακτηριστικά του δείγματος μπορούμε να τα γενικεύσουμε για όλον τον πληθυσμό. Για παράδειγμα εάν μετρήσουμε την πίεση ενός αερίου που περιέχεται σε ένα δοχείο σε δέκα διαφορετικά σημεία , θα είμαστε σε θέση να γνωρίζουμε με καθορισμένη ακρίβεια , την πίεση σε κάθε σημείο του δοχείου. Εάν ένα χαρακτηριστικό του δείγματος παίρνει τυχαίες τιμές , δηλαδή τιμές που δεν μπορούν να καθορισθούν από τον παρατηρητή , λέγεται στατιστικό μέγεθος και χαρακτηρίζεται σαν τυχαία μεταβλητή. Ένα στατιστικό μέγεθος μπορεί να παίρνει οποιαδήποτε αριθμητική τιμή σε μια συνεχή κλίμακα μετρήσεων ή να παίρνει μόνο διακεκριμένες τιμές , οι οποίες συνήθως είναι ακέραιοι αριθμοί. Τα παραπάνω μεγέθη λέγονται αντίστοιχα συνεχή η ασυνεχή στατιστικά μεγέθη. Παραδείγματα συνεχών μεγεθών είναι το μήκος , ο χρόνος διάσπασης ενός ασταθούς σωμστιδίου κ.λ.π , ασυνεχών μεγεθών δε , είναι ο ημερήσιος αριθμός ελλατωματικών εξαρτημάτων μιάς μηχανής , ο αριθμός των βροχερών ημερών εβδομαδιαίως κ.λ.π. Τά Στατιστικά μεγέθη θα τα συναντήσουμε είτε σαν αποτελέσματα πειραματικών μετρήσεων , είτε σαν δείγματα , είτε σαν γεγονότα . Οποια μορφή και αν έχουν όμως , βασικός σκοπός της Στατιστικής είναι να εξαγάγει από αυτά χρήσιμες πληροφορίες . Για να καταφέρουμε ώστε τα δεδομένα μας ( Στατιστικά μεγέθη) να σημαίνουν κάτι , θα πρέπει να τα ταξινομήσουμε και να τα παραστήσουμε γραφικά με τέτοιο τρόπο που θα μπορέσουμε να εξάγουμε από αυτά έναν ή δύο σημαντικούς αριθμούς , που θα περιγράφουν αυτά επαρκώς. Υπάρχουν διάφοροι τέτοιοι αριθμοί , καθώς και τρόποι παρουσίασης των δεδομένων σε γραφική μορφή.

35

Η Στατιστική που ασχολείται με την παρουσίαση και την περιγραφή των δεδομένων λέγεται Περιγραφική Στατιστική. 2.2Συλλογή δεδομένων Στην Στατιστική χρησιμοποιούνται δύο μέθοδοι συλλογής στατιστικών στοιχείων , η απογραφή και η δειγματοληψία. Η απογραφή χρησιμοποιείται όταν είναι αναγκαίο να μετρηθούν όλες οι μονάδες του πληθυσμού. Στην δειγματοληπτική μέθοδο , παίρνουμε ένα δείγμα από τον πληθυσμό και τα συμπεράσματα που εξάγουμε από αυτό τα γενικεύουμε σ’ ολόκληρο τον πληθυσμό. 2.3 Ταξινόμησης δεδομένων [ 15 ] Θα εξετάσουμε τον τρόπο ταξινόμησης των δεδομένων μέσω του επόμενου παραδείγματος. Στον πίνακα 2.1 έχουν καταχωρηθεί οι βαθμοί των προαγωγικών εξετάσεων εκατό φοιτητών. Οι βαθμοί δεν είναι ταξινομημένοι , γιατί προέρχονται από καταστάσεις στις οποίες οι φοιτητές ήταν καταχωρημένοι κατά αλφαβητικοί σειρά με το επωνυμό τους . Πίνακας 2.1 [10 ]

5,55 6,05 7,05 6,90 6,25 6,75 6,15 7,00 6,60 5,258,05 7,05 6,20 7,35 7,85 6,90 7,25 5,90 7,15 6,406,70 5,75 6,70 5,85 6,75 6,50 5,40 7,95 6,80 6,656,10 7,10 7,30 6,15 7,65 6,90 7,60 6,10 7,30 6,357,20 8,10 6,25 7,15 6,00 6,65 6,20 7,65 6,90 5,905,60 7,40 7,05 5,85 7,60 6,80 7,40 7,70 7,80 6,006,80 6,80 5,90 7,55 6,30 5,70 6,75 7,20 8,40 7,456,85 6,60 7,55 6,85 6,55 7,70 7,10 5,85 7,75 6,056,40 7,50 6,65 5,60 7,35 6,85 6,55 7,75 6,80 7,256,60 6,75 6,85 6,60 7,00 6,65 7,70 6,85 6,70 6,50

Αν υποθέσουμε ότι ζητάμε να βρούμε τον μικρότερο βαθμό του πίνακα , αυτός αναμφισβήτητα θα βρεθεί , μετά όμως από κάποια σχετική δυσκολία. Αν όμως ζητηθεί να διαπιστωθεί κατά πόσον η βαθμολογία είναι ικανοποιητική ή αν υπάρχουν σημαντικές αποκλίσεις στην αποδοσή τους , είναι δύσκολο να όχι αδύνατον να δώσουμε απάντηση. Συνεπώς ο παραπάνω πίνακας ελάχιστες πληροφορίες μας δίνει σχετικά με την βαθμολογία των εκατό φοιτητών. Και όσες μπορούν να προκύψουν εξάγονται με μεγάλη δυσκολία.

36

Στό παραπάνω παράδειγμα φαίνεται η αναγκαιότητα για μια πιο λεπτομερή επεξεργασία των δεδομένων , ώστε να μπορούμε να εξάγουμε από αυτά εύκολα και γρήγορα χρήσιμες πληροφορίες. Η ταξινόμηση και γενικά η οργάνωση των τιμών των δεδομένων μπορεί να γίνει με τους παρακάτω τρόπους . 2.3.1 Παράσταση με την βοήθεια Πίνακα

α. Αριθμός Κλάσεων Κατ’ αρχάς βρίσκουμε την περιοχή τιμών , δηλαδή την διαφορά της μικρότερης από την μεγαλύτερη τιμή και την χωρίζουμε σε κατάλληλο αριθμό τμημάτων που οναμάζουμε κλάσεις . Στο παραδειγμά μας ο μικρότερος βαθμός είναι 5,25 και ο μεγαλύτερος 8,40 , συνεπώς οι βαθμοί κατανέμονται σε μια περιοχή τιμών με πλάτος 3,15.Θεωρούμε ότι το πλάτος είναι 3,50 και διαιρούμε την περιοχή αυτή σε επτά κλάσεις. Οι κλάσεις στις οποίες διαιρείται η περιοχή τιμών ενός στατιστικού μεγέθους δεν έχουν κατ’ ανάγκη το ίδιο πλάτος. Σε ορισμένες περιπτώσεις μάλιστα ενδείκνυται η χρησιμοποίηση άνισων κλάσεων. Δεν υπάρχει κάποιος κανόνας για τον αριθμό των κλάσεων που θα χρησιμοποιήσουμε ,γενικά ισχύει ότι οσα περισσότερα είναι τα δεδομένα τόσες περισσότερες κλάσις πρέπει να σχηματίζομαι. Στην βιβλιογραφία αναφέρεται ο τύπος του Sturges που δίνει τον αριθμό των κλάσεων k συναρτήσει τους πλήθους τιμών ενός στατιστικού μεγέθους 1 3,3lnk N= + (2.1) όπου Ν το πλήθος των τιμών. Όταν επιλεγεί ο αριθμός των κλάσεων βρίσκουμε το πλάτος κάθε κλάσης .Στο παραδειγμά μας το πλάτος κάθε κλάσης είναι 0,50 β. Ορια Κλάσεων Στον πίνακα 2.2 φαίνονται οι επτά (7) κλάσεις που διαιρείται η περιοχή τιμών των βαθμών του πίνακα 1.1

37

Πίνακας 2.2 [ 10 ]

Βαθμός Αριθμός Φοιτητών

5,0 - 5,4

5,5 - 5,9

6,0 - 6,4

6,5 - 6,9

7,0 - 7,4

7,5 - 7,9

8,0 - 8,4

2

11

16

34

20

14

3 Σύνολο

100

Ο πίνακας μας δίνει την εντύπωση ότι το πλάτος της κλάσης είναι ίσο με 0,40.Αυτό όμως δεν είναι σωστό γιατί στον πίνακα ο συμβολισμός π.χ 5,0-5,4 δεν εκφράζει το πλάτος της κλάσης , αλλά αποτελεί απλώς συμβολισμό .Στην πραγματικότητα το πλάτος της κλάσης 5,5 – 5,9 είναι η περιοχή τιμών από 5,45 έως 5,95. Οι αριθμοί αυτοί εκφράζουν αντίστοιχα το κατώτερο και ανώτερο όριο της κλάσης .Τα όρια αυτά βρίσκονται εάν ο δεύτερος αριθμός συμβολισμού κλάσης προστεθεί στον πρώτο της επομένης και το άθροισμα διαιρεθεί διά δύο (2). Μετά την εκλογή του αριθμού των κλάσεων και τον καθορισμό των ορίων τους , βρίσκουμε τον αριθμό των τιμών που περιέχονται σε κάθε κλάση. Τον αριθμό αυτό τον ονομάζουμε συχνότητα της κλάσης .Η συχνότητα π.χ της κλάσης 6,0-6,4 του παραδείγματος των βαθμών είναι 16.Εάν συμβεί πολλές τιμές να συμπίπτουν με τα όρια της κλάσης , είναι σωστότερο να θεωρήσουμε ότι οι μισές από αυτές ανήκουν στην κατώτερη κλάση και οι υπόλοιπες στην ανώτερη κλάση. Στον πίνακα 2.2 δείχνουμε την κατανομή συχνότητας των βαθμών του πίνακα 2.1 Γενικά κατανομή συχνότητας ονομάζουμε το σύνολο των ζευγών των τιμών

1 1 2 2( , ), ( , ),..., ( , )x f x f x fν ν όπου 1 2, ,...,f f fν είναι οι συχνότητες εμφάνισης των τιμών 1 2, ,...,x x xν ενός στατικού μεγέθους .Εάν το στατικό μέγεθος είναι συνεχές τότε ως 1 2, ,...,x x xν θεωρούμε τα μέσα των κλάσεων. Παραμφερείς με την εννοια της συχνότητας είναι οι παρακάτω έννοιες . Σχετική συχνότητα μιάς κλάσεως ονομάζουμε τον λόγο της συχνότητας της κλάσης προς το άθροισμα των συχνοτήτων όλων των κλάσεων. Η σχετική συχνότητα π.χ της κλάσεως 5,0-5,4 του παραδείγματος των βαθμών είναι 0,02 η 2% . Το άθροισμα προφανώς των σχετικών συχνοτήτων όλων των κλάσεων είναι ίσο με την μονάδα.

38

Αθροιστική συχνότητα μέχρι του ανωτέρου ορίου μιάς κλάσης λέγεται το άθροισμα των συχνοτήτων όλων των κλάσεων μέχρι αυτού του ορίου. Σχετική αθροιστική συχνότητα μέχρι του ανωτέρου ορίου μιάς κλάσης λέγεται η αθροιστική συχνότητα μέχρι του ορίου αυτού διαιρεμένου δια του αριθμού συχνοτήτων όλων των κλάσεων . Στον πίνακα 2.3 φαίνεται η αθροιστική συχνότητα των βαθμών του πίνακα 1.1 Πίνακας 2.3 [ 10 ]

Βαθμοί Αριθμός Φοιτητών

4,95 5,45 5,95 6,45 6,95 7,45 7,95 8,45

0 2 13 29 63 83 97 100

2.3.2Γραφική παράστασις

α. Συνεχή μεγέθη Στην προηγούμενη παράγραφο περιγράψαμε με ποιο τρόπο μπορούμε να παρουσιάσουμε τα δεδομένα σε μορφή πίνακα. Εδώ θα εξετασθεί ο τρόπος που αυτά μπορούν να παρασταθούν γραφικά. Θεωρούμε ένα ορθογώνιο σύστημα αξόνων του οποίου στον οριζόντιο άξονα παίρνουμε τις τιμές του στατιστικού μεγέθους ( π.χ βαθμοί φοιτητών ) και στον κατακόρυφο τοποθετούνται οι συχνότητες των κλάσεων , σε κατάλληλη φυσικά κλίμακα. Στην συνέχεια για κάθε κλάση σχηματίζουμε ένα ορθογώνιο ως εξής : α) Την βάση του ορθογώνιου την παίρνουμε ίση με το πλάτος της κλάσης και την τοποθετούμε στον οριζόντιο άξονα έτσι ώστε το μέσον της να συμπίπτει με το μέσον της κλάσεως , και β) Το ύψος του ορθογώνιου επιλέγεται έτσι ώστε το εμβαδόν του ορθογώνιου να είναι ανάλογο προς την συχνότητα της κλάσης . Για να εκφράζει το εμβαδόν συχνότητα θα πρέπει να ισχύει :

ii i i

f fι

Ε = Π =Π

(2.2)

όπου , ,i i iE fΠ είναι το εμβαδόν του ορθογωνίου , το πλάτος της βασεώς του και η συχνότητα της κλάσεως i αντίστοιχα.Δηλαδή το ύψος του ορθογωνίου θα πρέπει να εκφράζεται από άποψη διαστάσεων σε συχνότητα ανά μονάδα μέτρησης του στατιστικού μεγέθους . Το νέο μέγεθος που προκύπτει λέγεται πυκνότητα συχνότητας

39

Στην περίπτωση που οι κλάσεις έχουν το ίδιο πλάτος τα ύψη των ορθογωνίων είναι ανάλογη με την συχνότητα των κλάσεων και συνήθως τα παίρνουμε αριθμητικά ίσα προς την συχνότητα των κλάσεων , όπως φαίνεται στο σχ 2.1 Το διάγραμμα που σχηματίζεται μ’ αυτόν τον τρόπο λέγεται ιστόγραμμα . Το σχ.2.1 δείχνει το ιστόγραμμα των βαθμών του πίνακα 2.2

Σχήμα 2.1 Ιστόγραμμα και πολύγωνο συχνότητας προαγωγικών βαθμών 100 φοιτητών. [ 1 ] Εάν συνδέσουμε τα μέσα των πλευρών των ορθογωνίων με ευθύγραμμα τμήματα , σχηματίζεται το πολύγωνο συχνότητας . Συνήθως το πολύγωνο συχνότητας προεκτείνεται μέχρι τα μέσα των κλάσεων των οποίων η συχνότητα είναι ίση με μηδέν.Κατ’ αυτόν τον τρόπο το άθροισμα της επιφανείας των ορθογωνίων ισούται προς την επιφάνεια που περικλείεται μεταξυ της πολυγωνικής γραμμής και του οριζόντιου άξονα , όταν τα πλάτη των κλάσεων είναι ίσα. Κατά τον ίδιο τρόπο σχηματίζεται το ιστόγραμμα και το πολύγωνο συχνότητας της σχετικής συχνότητας . Για να κατασκεύασουμε το αθροιστικό διάγραμμα , στα σημεία του οριζόντιου άξονα τα οποία αντιστοιχούν στα ανώτερα όρια των κλάσεων παίρνουμε τις τεταγμένες ίσες προς την αθροιστική συχνότητα μέχρι το συγκεκριμένο όριο.Στην συνέχεια ενώνουμε τα άκρα των τεταγμένων με ευθείες και έτσι το διάγραμμα δίνει με ικανοποιητική προσσέγγιση την αθροιστική συχνότητα για τις ενδιάμεσες τιμές των κλάσεων.Στο σχ. 2.2 φαίνεται το αθροιστικό διάγραμμα συχνοτήτων της αθροιτικής συχνότητας των βαθμών τν εκατό (100) φοιτητών .

40

Σχήμα 2.2 Διάγραμμα αθροιστικής συχνότητας προαγωγικών βαθμών 100 φοιτητών. [ 1 ] β. Ασυνεχή μεγέθη Επειδή τα ασυνεχή μεγέθη παίρνουν μόνο διακριτές τιμές δημιουργείται η εντύπωση ότι η γραφική παράσταση της κατανομής συχνότητας αυτών των τιμών δεν μπορεί να γίνει με ιστόγραμμα , αλλά μόνο με κάθετες γραμμές στα σημεία του οριζόντιου άξονα που αντιστοιχούν στα τιμή του στατιστικού μεγέθους και οι οποίες γραμμές έχουν μήκος ίσο με την συχνότητα του στατιστικολυ μεγέθους.Ομως αν θεωρήσουμε ότι οι διακεκριμμένες τιμες που παίρνει ένα ασυνεχές μέγεθος αντιστοιχούν στα μέσα των κλάσεων των τιμών του συνεχούς μεγέθους τότε μπορούμε να κατασκεύασουμε το ιστόγραμμα όπως και για τα συνεχή μεγέθη.

2.3.3 Μορφές κατανομών δεδομένων Η γραφική παράσταση τιμών των στατιστικών μεγεθών οδηγεί συνήθως στις παρακάτω μορφές κατανομών συχνότητας .

- Συμμετρική - Ασύμμετρη - Σχήματος U - Άλλες μορφές

Στην συνέχεια δίνουμε ορισμένα παραδείγματα των διαφόρων μορφών κατανομών

41

2.4 Χαρακτηριστικές τιμές δεδομένων Στην προηγούμενη ενότητα εξετάσαμε τον τρόπο που μπορούμε να ταξινομήσουμε τα δεδομένα , χρησιμοποιώντας πίνακα ή γραφική παράσταση. Παρ’ ότι το στάδιο αυτό επεξεργασίας των δεδομένων είναι χρήσιμο και αναγκαίο , ουσιαστικά μπορούμε να βγάλουμε μόνο υποκειμενικά συμπεράσματα για το νόημα των δεδομένων. Απαιτείται συνεπώς περαιτέρω επεξεργασία των τιμών ενός στατιστικού μεγέθους για να μπορέσουμε να εξάγουμε χρήσιμα συμπεράσματα γι’ αυτό. Η επεξεργασία αυτή αποβλέπει στον υπολογισμό ορισμένων χαρακτηριστικών τιμών των δεδομένων. (παράμετροι) Υπάρχουν κυρίως δύο ομάδες χαρακτηριστικών τιμών : α) αυτές που έχουν σχέση με την θέση που καταλαμβάνουν στον πίνακα κατάταξης δεδομένων και λέγονται χαρακτηριστικές τιμές θέσης και β) αυτές που έχουν σχέση με την διασπορά των δεδομένων ως προς κάποια κεντρική τιμή και λέγονται χαρακτηριστικές τιμές διασποράς Παρατήρηση Οι έννοιες που θα χρησιμοποιήσουμε για να περιγράψουμε αυτές τις τιμές , τις έχουμε συναντήσει ήδη στο πρώτο κεφάλαιο , όπου τις ορίσαμε μέσω της συνάρτησης πυκνότητας πιθανότητας ( )f x . Στο παρόν κεφάλαιο για τον ορισμό των εννοιών αυτών χρησιμοποιούμε την συχνότητα εμφάνισης των τιμών του στατιστικού μεγέθους , επειδή ο αριθμός των δεδομένων μας είναι περιορισμένος με αποτέλεσμα η συνάρτηση πυκνότητας πιθανότητας να είναι άγνωστη ,

Θα δούμε ότι υπάρχει ομοιότητα μεταξύ των σχέσεων που ορίζουν τις έννοιες στα δύο κεφάλαια , εάν αντικαταστήσουμε την συνάρτηση πυκνότητας πιθανότητας

( )f x με την σχετική συχνότητα ifN

. Στην πραγματικότητα όμως οι δύο έννοιες

είναι διαφορετικές και αυτό οφείλεται , στο ότι για μικρό αριθμό μετρήσεων μόνο κατά σύμπτωση θα συμβεί η πιθανότητα ( )f x με την οποία η μεταβλητή παίρνει

την τιμή ix να είναι ίση με την σχετική συχνότητα ifN

. Οι έννοιες του πρώτου

κεφαλαίου αναφέρονται σ’ ολον τον πληθυσμό ενώ του δευτέρου σε δείγματα του πληθυσμού. Είναι γεγονός όμως ότι όταν ο αριθμός των μετρήσεων ενός φυσικού μεγέθους είναι πολύ μεγάλος , η σχετική συχνότητα της μεταβλητής αυτής τείνει προς την πιθανότητα αυτής . Για άπειρο αριθμό μετρήσεων θα ισχύει

( )Nif f xN

→∞⎯⎯⎯→

42

2.4.1 Χαρακτηριστικές τιμές θέσης Οι χαρακτηριστικές τιμές θέσεως είναι οι παρακάτω

- Η μέση τιμή - Η μεσαία τιμή - Η συχνοτέρα τιμή - Η γεωμετρική μέση τιμή - Η αρμονική μέση τιμή

α. Μέση τιμή Εάν θέλουμε να περιγράψουμε τα δεδομένα με έναν μόνο αριθμό ο καλύτερος και ο περισσότερο αντιπρωσοπευτικός είναι : η Μέση Τιμή. Η μέση τιμή X των τιμών 1, , nX X… της μεταβλητής Χ , με την οποία συμβολίζουμε ένα στατιστικό μέγεθος , είναι ο αριθμητικός μέσος αυτών και δίνεται από την σχέση :

1 2 1...

N

iN i

XX X X

N N=+ + +

=∑

(2.3)

Εάν κάθε μία εκ των τιμών 1, , nX X… εμφανίζεται με συχνότητα 1 2, ,..., Nf f f αντίστοιχα , η μέση τιμή τους δίνεται από την σχέση :

1 1 2 2 1 1

1 2

1

......

N N

i i i iN N i i

NN

ii

f X f Xf X f X f X

f f f Nf

= =

=

+ + += =

+ + +

∑ ∑

∑ (2.4)

Παράδειγμα 2.1 Σε έλεγχο στην εθνική όδό διαπιστώθηκε ότι στα 100 αυτοκίνητα τα 72 είχαν 1 επιβάτη , τα 23 είχαν 2 , τα 2 είχαν 3 και τα 3 είχαν 4. Ο μέσος αριθμος επιβατών

ανά αυτοκίνητο είναι 72 1 23 2 2 3 3 4 1,36100

× + × + × + ×= επιβάτες ανα αυτοκίνητο

β) Μεσαία τιμή

43

Αν υποθέσουμε ότι οι Ν τιμές ενός στατιστικού μεγέθους κατατάσσονται κατά αύξουσα ή φθίνουσα σειρά , η μεσαία τιμή είναι αυτή που έχει ίσο αριθμό τιμών πάνω και κάτω. Δηλαδή οι μισές τιμές βρίσκονται πάνω από την μεσαία τιμή και οι μισές κάτω. Η μεσαία τιμή χρησιμοποιείται στις περιπτώσεις που η κατάταξη του στατιστικού μεγέθους είναι σπουδαιότερη από τη αριθμητική του τιμή. γ) Η Γεωμετρική μέση τιμή Η γεωμετρική μέση τιμή των τιμών 1, , nX X… ενός στατιστικού μεγέθους , ορίζεται ως η Ν-οστή ρίζα του γινομένου τους . Συνεπώς θα δίνεται από τον τύπο : 1 2. ... NG X X X= (2.5) Στην περίπτωση κατά την οποία έχουμε τις τιμές 1, , nX X… με συχνότητα εμφάνισης 1 2, ,..., Nf f f αντίστοιχα η παραπάνω σχέση γράφεται ως εξής : 1 2

1 2. ... Nff fNG X X X= (2.6)

όπου 1

N

ii

N f=

=∑

Παράδειγμα 2.2 [ 6 ] Εάν ο πληθυσμός μιάς πόλης το έτος 1980 ήταν 25.000 και κατά το 1990 ήταν 49.000, ζητείται να βρούμε τον πληθυσμό αυτής της πόλης το έτος 1985. Εάν χρησιμοποιήσουμε την μέση τιμή , βρίσκουμε ότι το έτος 1985 ο πληθυσμός είναι 37.000.Αυτό όμως σημαίνει ότι ο πληθυσμός κατά την πενταετία 1980-85 αυξάνονταν ομοιόμορφα κατά 2.400 άτομα ετησίως , πράγμα το οποίον δεν είναι σωστό , δεδομένου ότι ο πληθυσμός αυξάνει κατά σταθερό ποσοστό και όχι κατά σταθερό ποσό. Γι’ αυτό είναι σωστότερο να χρησιμοποιηθεί η γεωμετρική μέση τιμή , η οποία δίνει ότι ο πληθυσμός το έτος 1985 ήταν 35.000. δ) Αρμονική μέση τιμή Η αρμονική μέση τιμή Η των τιμών της μεταβλητής Χ ονομάζουμε τον αντίστροφο της μέσης τιμής των αντίστροφων τιμών. Δίνεται δε από την σχέση

44

1 2 1

1 1 1 1...N

N i i

N NH

x x x x=

= =+ + + ∑

(2.7)

Στην περίπτωση που έχουμε τις τιμές 1 2, ,..., Nx x x όπου η κάθε μία παρουσιάζεται με συχνότητα αντίστοιχα 1 2, ,..., Nf f f , η αρμονική μέση τιμή βρίσκεται απο την σχέση

1 2

11 2

...N

N i

iN i

N NH ff f fx x x x=

= =+ + + ∑

(2.8)

όπου 1

N

ii

N f=

=∑

Η έννοια της αρμονικότητας συνδέεται με τον Πυθαγόρα ο οποίος ανακάλυψε ότι Στο παράδειγμα που ακολουθεί φαίνεται η χρησιμότητα της αρμονικής τιμής Παράδειγμα 2.3 [ 6 ] Το τμήμα προμηθειών μιας εταιρείας αγόρασε 24 τεμάχια ενός υλικού με 45 ευρώ το καθένα. Μετά από κάποιο χρονικό διάστημα αγόρασε 36 τεμάχια του ίδιου υλικού με 30 ευρώ το τεμάχιο. Ζητάμε να βρούμε την μέση τιμή που αγοράσαμε το υλικό κατά τις δύο περιπτώσεις . Σε κάθε προμήθεια η εταορεία δαπάνησε συνολικά το ποσό των 1080 ευρώ. Ποια είναι η μέση πληρωθείσα τιμή ;. Η ζητούμενη τιμή δεν είναι η μέση αριθμητική τιμή των 37,5 ευρώ ,αλλά η αρμονική μέση τιμή την οποία βρίσκουμε όπως παρακάτω

1 1 1 1 24 36 361080 10802 2 1080 108024 36

HH

⎡ ⎤⎢ ⎥ ⎡ ⎤= = + ⇒ =⎢ ⎥ ⎢ ⎥⎣ ⎦⎢ ⎥+⎣ ⎦

2.4.2 Χαρακτηριστικές τιμές διασποράς

Η μέση τιμή περιγράφει όλα τα δεδομένα μας με έναν μόνο αριθμό , ο οποίος εκφράζει την κεντρική τάση των δεδομένων. Αν και αυτό είναι χρήσιμο , μπορεί να αποδειχθεί παραπλανητικό. Για να γίνει κατανοητό αυτό θεωρούμε τα δύο ιστογράμματα του σχ.2.3 τα οποία περιγράφουν τους βαθμούς που έλαβαν 80 φοιτητές από δύο βαθμολογητές

45

Σχήμα 2.3 Ιστόγραμμα που δείχνει τους βαθμούς που έλαβαν 80 φοιτητές από δύο βαθμολογητές [ 3 ] Παρατηρούμε ότι αν και τα δύο ιστογράμματα έχουν την ίδια μέση τιμή , ίση με 7, εν τούτοις είναι πολύ διαφορετικά μεταξύ τους. Στο πρώτο ιστόγραμμα η βαθμολογία των περισσοτέρων φοιτητών είναι κοντά στο 7 με μικρές αποκλίσεις , ενώ στο δεύτερο οι βαθμοί καταλαμβάνουν μία μεγάλη περιοχή τιμών .Βλέπουμε λοιπόν ότι η η μέση τιμή δεν δίνει πλήρη ποιοτική περιγραφή των δεδομένων και συνεπώς χρειαζόμαστε έναν αριθμό να περιγράφει την διασπορά των δεδομένων γύρω από την μέση τιμή. Οι χαρακτηριστικές τιμές διασποράς ενός στατιστικού μεγέθους που χρησιμοποιούνται είναι :

- το εύρος - η μέση απόλυτος απόκλισης - η μεταβλητότης - η τυπική απόκλισης

α) Το εύρος Εύρος των τιμών ενός στατιστικού μεγέθους ονομάζουμε την διαφορά της μεγαλύτερης από την μικρότερη τιμή του. Το εύρος μας δίνει την περιοχή μέσα στην οποία περιλαμβάνονται όλες οι τιμές του στατιστικού μεγέθους .Το εύρος π.χ των τιμών 2,3,3,5,5,5,8,10,12 είναι : W= 12-2=10. To εύρος δεν χρησιμοποιείται συχνά γατί δεν μας παρέχει καμιά πληροφορία σχετικά με την διασπορά των τιμών Επίσης μας οδηγεί σε μη αξιόπιστα συμπεράσματα εάν μία από τις ακραίες τιμές είναι ασυνήθης . β) Η μέση απόλυτη απόκλιση Μέση απόλυτη απόκλιση των τιμών ενός μεγέθους ονομάζουμε την μέση τιμή των απόλυτων αποκλίσεων των τιμών από την μέση τιμή τους Ετσι η μέση απόλυτη απόκλιση των των τιμών 1, , nX X… δίνεται από την σχέση :

46

1

N

iiX X

DN

=

−=∑

όπου X η μέση τιμή των . 1, , nX X… (2.9)

Εάν κάθε τιμή εκ των 1, , nX X… εμφανίζεται με συχνότητα 1 2, ,..., Nf f f , αντίστοιχα τότε η μέση τιμή απόλυτη απόκλιση δίνεται από την σχέση :

1

N

i iif X X

DN

=

−=∑

(2.10)

Η μέση απόλυτη απόκλιση δεν χρησιμοποιείται συχνά γιατί οδηγεί σε δύσκολες αριθμητικές παραστάσεις . Η μέση απόλυτη απόκλιση δεν είναι χρήσιμο μέγεθος γιατί το άθροισμα των θετικών και αρνητικών αποκλίσεων είναι μηδέν.

1 1 1 0

N N N

i ii i iX X X X

D X XN N N

= = =

−= = − = − =∑ ∑ ∑

(2.11)

Για τον λόγο αυτό η μέση απόλυτη απόκλιση δεν βρίσκεται ως προς την μέση τιμή αλλά ως προς άλλη χαρακτηριστική τιμή του στατιστικού μεγέθους. γ) Μέση τετραγωνική απόκλιση και μεταβλητότητα Ένα άλλο μέγεθος που θα μπορούσαμε να χρησιμοποιήσουμε για να εκφράσουμε την διασπορά θα ήταν η απόκλιση από την μέση τιμή , δηλαδή την

( )

11

N

iiX X

DN

=

−=∑

(2.12)

Το μέγεθος αυτό όμως δεν θα μας ήταν χρήσιμο γιατί το άθροισμα των θετικών και αρνητικών αποκλίσεων ως προς την μέση τιμή είναι μηδέν.

( )

1 1 11 0

N N N

i ii i iX X X X

D X XN N N

= = =

−= = − = − =∑ ∑ ∑

(2.13)

Μπορούμε να απαλείψουμε αυτό το ελλάτωμα της μέσης απόκλισης από την μέση τιμή υψώνοντας την παράσταση αυτή στο τετράγωνο .Ετσι προκύπτει ένα

47

καινούργιο μέγεθος το οποίο ονομάζουμε μεταβλητότητα V. Δηλαδή η μεταβλητότητα των τιμών 1, , nX X… ενός στατιστικού μεγέθους δίνεται από την

σχέση : 2

1

1 ( )n

ii

V X XN =

= −∑ (2.14)

Εάν κάθε τιμή εκ των 1, , nX X… εμφανίζεται με συχνότητα 1 2, ,..., Nf f f , αντίστοιχα τότε η μεταβλητότητα δίνεται από την σχέση

2

1

1 ( )n

i ii

V f X XN =

= −∑ (2.15)

Η παραπάνω σχέση μπορεί να μετασχηματισθεί όπως παρακάτω :

( )2 2 2 2 2

1 1 1 1 1

1 1 1( ) 2 ( 2 )n N N N N

i i i i ii i i i i

V X X X X X X X X X XN N N= = = = =

= − = − + = − +∑ ∑ ∑ ∑ ∑

2 2 2 2 2 2 2

1 1 1

1 2 1 2( ) ( ) ( )N N N

i ii i i

X X X X X X X X XN = = =

⎛ ⎞= − + = − + = −⎜ ⎟⎝ ⎠∑ ∑ ∑ (2.16)

Καταλήγουμε έτσι στην θεμελιώδη σχέση

2 2 2 2

1 1

1 1( ) ( )N N

i ii i

V X X X XN N= =

= − = −∑ ∑ (2.17)

δ) Τυπική Απόκλιση Η θετική τετραγωνική ρίζα της μεταβλητότητας ονομάζεται τυπική απόκλιση και δίνεται προφανώς από τις σχέσεις :

Vσ = =( )2

1

N

ii

X X

N=

−∑ η 2 2

1 1

1 1( )N N

i ii iX X

N Nσ

= =

= −∑ ∑ (2.18)

η 2 2Xσ = Χ − (2.19) Η τυπική απόκλιση είναι η κυριώτερη χαρακτηριστική τιμή μέτρησης της διασποράς των τιμών ενός στατιστικού μεγέθους .Οσο μικρότερη είναι αυτή τόσο μεγαλύτερη είναι η ομοιομορφία των τιμών του μεγέθους αυτού. Στην ακραία

48

περίπτωση που όλες οι τιμές του στατιστικού μεγέθους είναι ίσες η τυπική απόκλιση θα είναι μηδέν. Συνήθως στις φυσικές επιστήμες προτιμείται η χρήση της τυπικής απόκλισης , ενώ οι στατιστικοί προτιμούν την χρήση της μεταβλητότητας . Παράδειγμα 2.4 [ 8 ] Ένα εργοστάσιο παράγει ρουλεμάν των οποίων το βάρος είναι 30 gr και η τυπική απόκλιση σ = 0,1 gr.Τό τμήμα ποιοτικού ελέγχου του εργοστασίου ελέγχει κάθε πρωί την ποιότητα των ρουλεμάν μετρώντας το βάρος τους . Εάν το βάρος των ρουλεμάν βρίσκεται στην περιοχή 29,8gr – 30,2 gr , δηλαδή η τυπική τους απόκλιση είναι 2x0,1=2σ η παραγωγή βρίσκεται στο « επίπεδο προειδοποίησης » , ενώ όταν οι μετρήσεις του βάρους των ρουλεμάν δείχνουν τυπική απόκλιση 3σ και οι μετρήσεις είναι εκτός της περιοχής 29,7gr -30,3 gr η παραγωγή βρίσκεται στο «επίπεδο ενέργειας » και η γραμμή παραγωγής διακόπτεται γιατί τα προιόντα είναι εκτός προδιαγραφών . 2.5 Συνδιασπορά

Συχνά παρουσιάζονται περιπτώσεις κατά τις οποίες υπάρχει ανάγκη να μελετηθούν ταυτόχρονα περισσότερα από ένα χαρακτηριστικά ενός πληθυσμού . Για παράδειγμα εάν κάποιος καταγράφει την θέση και τον χρόνο ενός κινούμενου σωματιδίου , τα δεδομένα θα είναι ζεύγη μετρήσεων ( , )x t Παρόμοια εάν μετρήσουμε το βάρος , το ύψος , το IQ και την φυσική αντοχή σε μια τάξη φοιτητών τότε σε κάθε φοιτητή θα αντιστοιχεί ένα δεδομένο με τέσσερα ανεξάρτητες μετρήσεις Στις περιπτώσεις στις οποιές ένα φυσικό μέγεθος εξαρτάται από περισσότερες της μίας μεταβλητής ,αυτές δεν είναι πάντα ανεξάρτητες , αλλά συνδέονται βάσει κάποιου νόμου, που περιγράφει το φυσικό μέγεθος . Στις πειραματικές μετρήσεις στην Φυσική η αλληλεξάρτηση αυτή επιβάλλεται συνήθως από νόμους διατήρησης. Για παράδειγμα κατά την έκρηξη μιάς οβίδας απιλευθερώνεται συνολική εέργεια Ε που μοιράζεται σε τρία θραυσματα. Εάν ξέρουμε τις μάζες των θραυσμάτων μπορούμε να υπολογίσουμε την πιθανότητα το θραύσμα Α να έχει κινητική ενέργεια ίση με τα 3/4 της απελευθερωμένης ενέργειας .Ε. , όπως και το Β να έχει την ίδια ενέργεια. Η πιθανότητα όμως να εχουν τα Α και Β συγχρόνως κινητικές ενέργειες ισες με τα 3/4 της απελευθερωμένης ενέργειας είναι προφανώς ίση με μηδέν . Σ’ αυτές τις περιπτώσεις χρειάζεται να βρούμε τον βαθμό εξάρτησης μεταξύ των ποσοτήτων αυτών Ας υποθέσουμε ότι η καταγραφή των μετρήσεων ενός φαινομένου αποτελείται από ζεύγη των τιμών των μεταβλητών Χ και Υ δηλαδή ( )1 1 2 2 3 3, , ( , ), ( , )...( , )n nx y x y x y x y Φυσικά μπορούμε να βρούμε την μέση τιμή X και

Y των δύο μεταβλητών, καθώς και την μεταβλητότητα XV και YV όπως και την τυπική απόκλιση xσ και yσ Όμως θα πρέπει να αναζητήσουμε κάτι περισσότερο από αυτά . Θα πρέπει να κοιτάξουμε την σχέση των δύο μεταβλητών , εάν δηλαδή είναι

49

ανεξάρτητες η αν εξαρτάται η μία από την άλλη. Η πληροφορία αυτή περιγράφεται από την συνδιασπορά η οποία ορίζεται ως

1

1cov( , ) ( )( ) ( )( )N

i ii

x y x x y y x x y y xy xyN =

= − − = − − = −∑ (2.20)

Εάν οι τιμές της μεταβλητής y είναι εξαρτημένες από τις τιμές της μεταβλητής x και υποθέσουμε ότι αυτές είναι μεγαλύτερες της μέσης τιμής του x τότε το ίδιο θα συμβαίνει και με την y οπότε η συνδιασπορά τους θα είναι θετική .(Το ίδιο θα συμβεί εάν οι τιμές της x είναι μικρότερες της μέσης τιμής της x ) Oμοια εάν εξάρτηση του y από το x είναι τέτοια ώστε όταν το x μεγαλώνει το y μικραίνει η συνδιασπορά θα είναι αρνητική. Εάν οι μεταβλητές x και y είναι ανεξάρτητες τότε οι όροι του αθροίσματος της σχέσης θα είναι διαδοχικά θετικοί ή αρνητικοί οπότε θα αλληλοαναιρεθούν και το άθροισμα θα είναι μηδέν . Στην περίπτωση που έχουμε Ν μεταβλητές 1 2, ,..., Nx x x x= με κοινή συνάρτηση πυκνότητας πιθανότητας την 1 2( ) ( , ,..., )Nf x f x x x= οριζουμε την συνδιασπορά ως :

1 2 1 2

cov , ( ) ( )

( ) ( ) ( , ,..., ) ...

i j i i j j

i i j j N N

x x E x x

x x f x x x dx dx dx

μ μ

μ μ∞ ∞

−∞ −∞

⎡ ⎤ ⎡ ⎤= − ⋅ − =⎣ ⎦ ⎣ ⎦

− ⋅ − ⋅∫ ∫ (2.21)

όπου iμ και jμ είναι οι αναμενόμενες τιμές ( [ ]i iE xμ = και j jE xμ ⎡ ⎤= ⎣ ⎦ Στην περίπτωση αυτή εφ’ όσον οι μεταβλητές x και y έχουν κοινή συνάρτηση πυκνότητας πιθανότητας ( , )f x y και ή πυκνότητας πιθανότητας των x και y είναι

( )f x και ( )f y αντίστοιχα αποδεικνύεται ότι ισχύει : ( , ) ( ). ( )f x y f x f y= (2.22) Η παραπάνω σχέση γενικεύεται για Ν μεταβλητές δηλαδή 1 2 1 2( , ,..., ) ( ). ( ) ... ( )N Nf x x x f x f x f x= ⋅ ⋅ (2.23) και είναι η συνθήκη αμοιβαίας ανεξαρτησίας Ν μεταβλητών. Παράδειγμα 2.5 Παρακάτω δίνουμε παραδείγματα για την συνδιασπορά α) Η συνδιασπορά των μεταβλητών «ημέρα της εβδομάδας » και « βροχερή ημέρα της εβδομάδας » είναι ίση με μηδέν , γιατί η πιθανότητα βροχόπτωσης είναι ανεξάρτητη από την ημέρα της εβδομάδας . β) Η συνδιασπορά μεταξύ του ύψους και του βάρους σε έναν πληθυσμό ενηλίκων είναι θετική , γιατί όσο ψηλότεροι είναι άνθρωποι τόσο περισσότερο βάρος θα έχουν. γ) Η συνδιασπορά μεταξύ του βάρους και της φυσικής αντοχής πιθανότητα είναι αρνητική , γιατί το αυξημένο βάρος ενός ανθρώπου μειώνει την αντοχή του.

50

2.6 Συσχέτιση

Για να αποφύγουμε τις δυσκολίες λόγω των διαστάσεων των μεγεθών που εμφανίζονται στην συνδιασπορά , χρησιμοποιούμε τον συντελεστή συσχέτισης , ο οποίος ορίζεται ως

cov( , )

x y x y

x y xy x yρσ σ σ σ

−= = (2.24)

η τον αντίστοιχο πρός την (2.19) σχέση για Ν μεταβλητές

cov( , )i j

i j

x yρ

σ σ= (2.25)

όπου iσ και jσ είναι οι τυπικές αποκλίσεις ( [ ]i iV xσ = και j jV xσ ⎡ ⎤= ⎣ ⎦ )

Ο ρ είναι ένας αδιάστατος αριθμός μεταξύ -1 και +1. Εάν 0ρ = τα x και y είναι ανεξάρτητες μεταβλητές Εάν 0ρ > σημαίνει ότι εάν x x> τότε και y y> .Για 0ρ < και x x> θα ισχύει y y< . Εάν 1ρ = η -1 , τότε οι μεταβλητές x και y είναι πλήρως εξαρτημένες . Γνωρίζοντας την μία από αυτές προσδιορίζουμε και την άλλη. (Σχ.2.4)

Σχ. 2.4 Το διάγραμμα του σχ.2.5α μας δείχνει την συσχέτιση μεταξύ των βαθμών που έλαβαν οι φοιτητές στο μάθημα της κβαντικής φυσικής ( οριζόντιος άξονας ) και στην θερμοδυναμική (κάθετος άξονας ) Οι φοιτητές που έχουν καλό βαθμό στην κβαντική φυσική έχουν καλή απόδοση και στην θερμοδυναμική και ο βαθμός συσχέτισης είναι 0,7. Στο διάγραμμα του σχ.2.5β βλέπουμε την συσχέτιση μεταξύ των βαθμών που έλαβαν οι φοιτητές στο μάθημα της θερμοδυναμικής και τους βαθμούς του

51

εργαστηρίου .Παρατηρούμε ότι υπάρχει συσχέτιση μεταξύ των δύο , είναι όμως πιο ασθενής απ’ότι στο προηγούμενο παράδειγμα , μόλις 0,3.

Σχήμα 2.5α (πάνω) Βαθμοί στην κβαντική φυσική και στην θερμοδυναμική Σχήμα 2.5β (κάτω) Βαθμοί στο εργαστήριο και στην θερμοδυναμική [ 3 ] 2.7 Ροπές μεγαλύτερης τάξης

Η μέση τιμή και η διασπορά που ορίσαμε στις προηγούμενες παραγράφους δεν καθορίζουν με απόλυτη ακρίβεια την κατανομή των δεδομένων μας , εφ’ όσον είναι δυνατόν να υπάρξουν κατανομές με την ίδια μέση τιμή και την ίδια διασπορά ,αλλά με διαφορετικά ιστογράμματα. Τά χαρακτηριστικά των ιστογραμμάτων που δεν περιγράφονται με την βοήθεια της μέσης τιμής και της διασποράς είναι , η

52

ασυμμετρία και η αιχμηρότητα. Πληροφορίες για τα χαρακτηριστικά αυτά μας δίνει το μέγεθος της ροπής Έστω οι τιμές 1 2, ,..., Nx x x της μεταβλητής x που εμφανίζονται με συχνότητα 1 2, ,..., Nf f f . Η μέση τιμή των αποκλίσεων των τιμών 1 2, ,..., Nx x x από μια τιμή

0x , ονομάζεται ροπή πρώτης τάξης ως προς το 0x και δίνεται από την σχέση

1 01

1 ( )N

i iif x x

=

= −∑ (2.26)

Ομοια η μέση τιμή των τετραγώνων των αποκλίσεων των τιμών 1 2, ,..., Nx x x από το

0x ονομάζεται ροπή δεύτερης τάξης ως προς το 0x και δίνεται από την σχέση

22 0

1

1 ( )N

i ii

f x xN

μ=

= −∑ (2.27)

Γενικεύοντας η μέση τιμή της ν-οστής δύναμης των αποκλίσεων των τιμών 1 2, ,..., Nx x x που εμφανίζονται με συχνότητα 1 2, ,..., Nf f f , από την τιμή 0x ,

ονομάζεται ροπή ν-οστής τάξης ως προς την τιμή 0x και δίνεται από την σχέση

01

1 ( )N

i iif x x

νμ=

= −∑ (2.28)

Εάν οι τιμές 1 2, ,..., Nx x x έχουν συνάρτηση πυκνότητας πιθανότητα ( )f x και αναμενόμενη τιμή [ ]E x η σχέση γράφεται ( ( ))x E x ν

νμ ⎡ ⎤= Ε −⎣ ⎦ (2.29) Εάν [ ]0x x E x= = δηλαδή εάν η τιμή 0x είναι η μέση τιμή των

1 2, ,..., Nx x x τότε οι παραπάνω σχέσεις δίνουν αντίστοιχα τις ροπές 1ης , 2ης και ν-στής τάξης , ως προς την μέση τιμή. Οι ροπές αυτές ονομάζονται κεντρικές ροπές . Εάν [ ]0 0x E x= = οι αντίστοιχες ροπές ονομάζονται αλγεβρικές ροπές. Eάν συμβολίσουμε με νμ τις κεντρικές ροπές και με 'νμ τις αλγεβρικές , η μεταξύ τους σχέση δίνεται από τον τύπο :

1 0' ' ... ( 1) ' ... ( 1) '1

j j jjj

νν ν ν ν

ν νμ μ μ μ μ μ μ μ− −

⎛ ⎞ ⎛ ⎞= − + + − + + −⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠

Eπειδή 0' 1μ = και 1'μ μ= η παραπάνω σχέση μας δίνει :

53

22 2

33 3 2

2 44 4 3 2

'

' 3 ' 3

' 4 ' 6 ' 3

μ μ μ

μ μ μ μ μ

μ μ μ μ μ μ μ

= −

= − +

= − + −

Όπως είπαμε και πιο πάνω οι ροπές χρησιμοποιούνται για να εκφράσουν τα ποιοτικά χαρακτηριστικά των ιστογραμμάτων Για να βρούμε τον βαθμό ασυμμετρίας μια συνάρτησης χρησιμοποιούμε την τρίτης τάξης κεντρική ροπή . Συνήθως , προκειμένου να προκύξει αδιάστατος

αριθμός , διαιρούμε την τρίτη κεντρική ροπή με το [ ]3

3 2( )V xσ και ορίζουμε την ασυμμετρία ως : [ ] 3 3

1 ( ) /x E xγ σ⎡ ⎤= Ε −⎣ ⎦ (2.30) H τέταρτη κεντρική ροπή χρησιμοποιείται συνήθως για να ποσοτικοποιήσει την αιχμηρότητα (sharpness) του ιστογράμματος . Συνώθως ονομάζεται κύρτωση και ορίζεται ως : [ ] 4 4

2 ( ) / 3x E xγ σ⎡ ⎤= Ε − −⎣ ⎦ (2.31) Παράδειγμα 2.6 [ 9 ] Nα υπολογισθούν οι πρώτες τέσσερις κεντρικές και αλγεβρικές ροπές και στην συνέχεια οι συντελεστές α) ασυμμετρίας και β) αιχμηρότητας της συνάρτησης

2( ) 4 (9 ) / 81f x x x= − για 0 3x≤ ≤ α) Αλγεβρικές Ροπές Από την σχέση (2.27) προκύπτει :

3

2 21

0

4 8' ( ) (9 )81 5

x x dxμ μ= Ε Χ = − = =∫

3

2 3 22

0

4' ( ) (9 ) 381

x x dxμ = Ε Χ = − =∫

3

3 4 23

0

4 216' ( ) (9 )81 35

x x dxμ = Ε Χ = − =∫

54

3

3 5 23

0

4 27' ( ) (9 )81 2

x x dxμ = Ε Χ = − =∫

β) Κεντρικές Ροπές Από την σχέση έχουμε : 1 0μ =

2 22

8 113 ( )5 25

μ σ= − = =

3

3216 8 8 323(3) 235 5 5 875

μ ⎛ ⎞ ⎛ ⎞= − + = −⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

2 4

427 216 8 8 8 36934 6(3) 32 35 5 5 5 8750

μ ⎛ ⎞⎛ ⎞ ⎛ ⎞ ⎛ ⎞= − + − =⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠⎝ ⎠ ⎝ ⎠ ⎝ ⎠

γ) Ασυμμετρία

Συντελεστής ασυμμετρίας 31 3 0.1253μγ

σ= = −

δ) Αιχμηρότητα

Συντελεστής αιχμηρότητας 42 4 2,172μγ

σ= =

Όπως φαίνεται στο σχ. 2.6 που δείχνει την γραφική παράσταση της ( )f x παρατηρούμε ότι υπάρχει μια μικρή ασυμμετρία προς τα αριστερά και μικρή αιχμηρότητα

55

Σχ. 2.6 [ 4 ]

56

ΚΕΦΑΛΑΙΟ 3 : BΑΣΙΚΕΣ ΣΥΝΑΡΤΗΣΕΙΣ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

3.1 Εισαγωγή Στο πρώτο κεφάλαιο ορίσαμε την έννοια της τυχαίας μεταβλητής και της συνάρτησης πιθανότητας της μεταβλητής δηλαδή της πιθανότητας να πάρει αυτή μια ορισμένη τιμή. Ασχοληθήκαμε επίσης με την ανάπτυξη χαρακτηριστικών παραμέτρων όπως η αναμενόμενη τιμή και η τυπική απόκλιση που δείχνουν την συμπεριφορά της μεταβλητής . Οι έννοιες αυτές αναφέρονται στο σύνολο των δυνατών τιμών της τυχαίας μεταβλητής , δηλαδή σε όλον τον πληθυσμό , εν αντιθέσει με το δεύτερο κεφάλαιο που αναπτύξαμε τις ίδιες έννοιες οι οποίες αναφέρονταν όμως σε ένα συγκεκριμένο δείγμα που προέρχεται από κάποιον πληθυσμό. Εάν γνωρίζαμε τις κατανομές πιθανότητας όλων των τυχαίων μεταβλητών , τότε η ανάλυσης του δεύτερου κεφαλαίου θα ήταν περιττή Επειδή όμως σπανία γνωρίζουμε την κατανομή πιθανότητας μιάς προς μελέτη τυχαίας μεταβλητής , είμαστε υποχρεωμένοι να την βρούμε με την βοήθεια των τιμών του δείγματος .Αυτό σημαίνει ότι πρέπει να συμπεράνουμε την κατανομή των τιμών του πληθυσμού , από τον οποίο προέρχεται το δείγμα, με την βοήθεια των τιμών αυτού. Η παραπάνω διαδικασία μπορεί να πραγματοποιηθεί με την βοήθεια ορισμένων απλών συναρτήσεων πυκνότητας πιθανότητας, οι οποίες θεωρούμε ότι περιγράφουν ικανοποιητικά μια μεγάλη περιοχή φαινομένων . Το πρόβλημα συνεπώς ανάγεται στην εύρεση της κατάλληλης μορφής συνάρτησης πυκνότητας πιθανότητας που προσεγγίζει καλύτερα το φαινόμενο που εξετάζουμε και στην εκτίμηση των παραμέτρων αυτής με την βοήθεια τιμών από κάποιο δείγμα..Για παράδειγμα η εύρεση του χρόνου ζωής των ραδιενεργών πυρήνων μπορεί να γίνει υποθέτοντας (Στηριζόμενοι στην Φυσική θεωρία του φαινομένου) ότι η εκπομπή σωματιδίων από το ραδιενεργό υλικό γίνεται σύμφωνα με κάποια γνωστή συνάρτηση πυκνότητας πιθανότητας (Poisson) και εκτιμώντας την παράμετρο του χρόνου από τις τιμές ενός συγκεκριμένου δείγματος ραδιενεργών πυρήνων.

3.2 Διωνυμική Συνάρτηση Πιθανότητας Η διωνυμική κατανομή περιγράφει διαδικασίες , όπου έχουμε έναν ορισμένο αριθμό δοκιμών και κάθε δοκιμή έχει δύο δυνατά αποτελέσματα , τα οποία είναι αμοιβαία αποκλειόμενα. Το ένα από αυτά το ονομάζουμε «επιτυχία» και το άλλο «αποτυχία». Η πιθανότητα της επιτυχίας σε κάθε δοκιμή είναι σταθερή , έστω p και συνεπώς της αποτυχίας είναι (1 )p− Ο αριθμός των επιτυχιών σε μία σειρά Ν δοκιμών είναι μία τυχαία μεταβλητή έστω Χ η οποία παίρνει οποιαδήποτε τιμή μεταξύ 0 και Ν. Η διωνυμική κατανομή

57

μας δίνει την πιθανότητα να πάρει η τυχαία μεταβλητή Χ την τιμή r ( να έχουμε r επιτυχίες σε Ν δοκιμές ) Μια συνηθισμένη περίπτωση που έχει εφαρμογή η διωνυμική κατανομή είναι όταν σε μια παραγωγική διαδικασία , από ένα πλήθος προιόντων επιλέγονται τυχαία αλλά διαδοχικά ορισμένα από αυτά και εξετάζεται ποιο από αυτά είναι ελαττωματικό. Ας υποθέσουμε ότι ρίχνουμε στον αέρα ένα νόμισμα . Η πιθανότητα να πέσει

«κορόνα» είναι 12

p = , ενώ να πέσει «γράμματα» είναι 112

q p= − = . Αν τώρα

ρίξουμε στον αέρα δέκα (10) νομίσματα ποια είναι η πιθανότητα μόνο τα τρία από αυτά να έρθουν «κορόνα»;. Είναι φανερό ότι η τυχαία μεταβλητή Χ μπορεί να πάρει τις τιμές 0,1, 2,3, 4,5,6,7,8,9,10 με ορισμένη πιθανότητα για κάθε τιμή. Την πιθανότητα αυτή μας την δίνει ο τύπος της διωνυμικής κατανομής .

( ; , ) (1 )r N rNP r N p p p

r−⎛ ⎞

= ⋅ ⋅ −⎜ ⎟⎝ ⎠

(3.1)

H έκφραση Nr⎛ ⎞⎜ ⎟⎝ ⎠

είναι ίση με ( )

!! !N

r N r− και εκφράζει τον αριθμό των τρόπων

να διαλέξουμε r επιτυχίες από Ν δοκιμές όπου r και Ν είναι θετικοί ακέραιοι και p είναι πραγματικός αριθμός στο διάστημα 0 1p≤ ≤ Αν αντικαταστήσουμε στην 3.1 την τιμή της τυχαίας μεταβλητής Χ με 3r = βρίσκουμε :

3

10 3101 1 1(3;10, ) (1 )32 2 2

P −⎛ ⎞= ⋅ ⋅ − =⎜ ⎟⎝ ⎠

Ιδιότητες διωνυμικής συνάρτησης :

Aναμενόμενη τιμή : [ ]0

( ; , )r

E r r P r N p N p∞

=

= ⋅ = ⋅∑ (3.2)

Διασπορά : [ ] 2

0

( ) ( ) (1 )r

V r Np r P r N p p∞

=

= − ⋅ = ⋅ ⋅ −∑ (3.3)

Aσυμετρία : 11 2

(1 )p

n p pγ − ⋅=

⋅ ⋅ − (3.4)

58

Kύρτωση : 21 6 (1 )

(1 )p p

n p pγ − ⋅ ⋅ −

=⋅ ⋅ −

(3.5)

Χαρακτηριστική συνάρτηση : ( ) (1 )

nitt p e pφ ⎡ ⎤= ⋅ + −⎣ ⎦ (3.6) Η συνάρτηση αθροιστικής πιθανότητας της διωνυμικής κατανομής δηλαδή η πιθανότητα ο αριθμός των επιτυχιών να είναι μικρότερος η ίσος από κάποιο όριο r δίνεται από τον τύπο

0

( ) (1 ) , ( 0,1,..., )i r

i N i

i

NP X r p p r N

i

=−

=

⎛ ⎞≤ = ⋅ − =⎜ ⎟

⎝ ⎠∑ (3.7)

Στο σχ.3.1 φαίνονται μερικά παραδείγματα διωνυμικών συναρτήσεων.Παρατηρούμε ότι η κορυφή της καμπύλης βρίσκεται κοντά στην αναμενόμενη τιμή n.p , όπως περιμένουμε. Καθώς αυξάνεται ο αριθμός των δοκιμών η καμπύλη γίνεται πιο στενή γύρω από την αναμενόμενη τιμή.

59

Σχ. 3.1 Διωνυμικές κατανομές με διαφορετικά n και p [3 ]

60

Παράδειγμα 3.1 [ 7 ] Σε μια συστοιχία ανιχνευτών φορτισμένων σωματιδίων χρησιμοποιούμε τρείς ανιχνευτές . Η αποδοτικότητα του κάθε ανιχνευτή είναι 95% , αλλά χρειαζόμαστε αποκρίσεις και από τους τρείς ανιχνευτές συγχρόνως για να είμαστε βέβαιοι ότι ένα σωματίδιο πέρασε διαμέσου της ανιχνευτικής συστοιχίας . Ποια είναι η αποδοτικότητα του συστήματος ;. Eφαρμόζοντας την σχέση (3.1) βρίσκουμε ότι :

3 0 33(3) 0,95 (1 0,95) 0,95 0.857

3P ⎛ ⎞

= ⋅ ⋅ − = =⎜ ⎟⎝ ⎠

=85,7%

Αλλάζει η αποδοτικότητα του συστήματος εάν χρησιμοποιήσουμε τέσσερις η πέντε ανιχνευτές και ζητήσουμε οι τρείς από αυτούς να δίνουν θετική απόκριση; Προφανώς ισχύει : Για τέσσερις ανιχνευτές : (3;0,95,4) (4;0,95,4) 0,171 0,815 98,6%P P+ = + = Για πέντε ανιχνευτές : (3;0,95,5) (4;0,95,5) (5;0,95,5) 0,021 0,204 0,774 99,9%P P P+ + = + + = Παράδειγμα 3.2 Μια τράπουλα αποτελείται από χαρτια που αντιστοιχούν σε πέντε διαφορετικά σύμβολα . Εάν τραβήξουμε 6 χαρτιά από την τράπουλα ποια είναι η πιθανότητα να μαντέψουμε περισσότερα από τα μισά ; H πιθανότητα να μαντέψουμε ένα χαρτί είναι 20%p = . Επομένως η πιθανότητα να μαντέψουμε περισσότερα από τα μισά χαρτιά θα είναι : (4;0.2,6) (5;0.2,6) (6;0.2,6) 1.54% 0.154% 0.0064% 1.7%P P P+ + = + + =

3.3 Πολυωνυμική Συνάρτηση Πιθανότητας Είδαμε στην προηγούμενη ενότητα ότι η διωνυμική συνάρτηση πιθανότητας εκφράζει διαδικασίες στις οποίες τα δυνατά αποτελέσματα είναι μόνο δύο , όπως για παράδειγμα η ρίψη ενός κέρματος ( κορώνα , γράμματα) ή λειτουργία ενός μηχανήματος ( βλάβη , λειτουργία)

61

Η γενίκευση της διωνυμικής πιθανότητας για την περίπτωση πειράματος με περισσότερα από δύο δυνατά αποτελέσματα λέγεται πολυωνυμική συνάρτηση πιθανότητας και εκφράζεται από την παρακάτω σχέση :

1

1 21 2 1 2

11 2

!( , ,..., ) ...! !...

k

rkrr r i

k kik i

PNP r r r P P P Nr r r r=

= = ∏ (3.8)

1

1k

iip

=

=∑ και 1

k

iir N

=

=∑

Iδιότητες Πολυωνυμικής συνάρτησης πιθανότητας : [ ]i iE r N P= ⋅ (3.9) [ ] (1 )i i iV r N P P= ⋅ ⋅ − (3.10) cov ,i j i jr r N P P⎡ ⎤ = ⋅ ⋅⎣ ⎦ (3.11) Παράδειγμα 3.3 [ 7 ] Υποθέτουμε ότι για κατασκευαστικούς λόγους κατά την ρίψη ενός ζαριού η πιθανότητα να πάρουμε κάθε έναν από έξι αριθμούς 1, 2,3, 4,5,6 είναι διαφορετική. Ας καλέσουμε με ( 1, 2,...,6)ip i = την πιθανότητα μία ρίψη να καταλήξει σε καθένα από τα δυνατά αποτελέσματα. Ποιά είναι η πιθανότητα μετά από Ν ρίψεις τα αποτελέσματα να έχουν ως εξής : 1r φορές το ζάρι έφερε 1, 2r φορές το ζάρι έφερε 2 , 3r φορές το ζάρι έφερε 3, 4r φορές το ζάρι έφερε 4, 5r φορές το ζάρι έφερε 5, 6r φορές το ζάρι έφερε 6 ; Εφαρμόζουμε την σχέση (3.8) και βρίσκουμε :

61 2

6

1 2 6 1 2 611 2 6

!( , ,..., ) ...! !...

irrr r i

i i

PNP r r r P P P Nr r r r=

= = ∏ (3.12 )

Παράδειγμα 3.4 [ 9 ] Ένα κουτί περιέχει 5 κόκκινες , 4 άσπρες και 3 μπλέ σφαίρες . Διαλέγουμε μια σφαίρα στην τύχη , σημειώνουμε το χρώμα της και την ξαναβάζουμε στο κουτί. Εάν επαναλάβουμε το πείραμα αυτό 6 φορές , υπολογίστε την πιθανότητα να βγούν 3 κόκκινες σφαίρες , 2 άσπρες και 1 μπλέ.

62

P(κόκκινη σ’ ένα τράβηγμα ) = 512

, P(άσπρη σ’ ένα τράβηγμα ) = 412

,

P(μπλέ σ’ ένα τράβηγμα ) = 312

,

ΑραP(3κόκκινες ,2 άσπρες 1μπλέ ) = 3 2 11 2 3

6! 5 4 3 625( , , ) ( ) ( ) ( )3!2!1! 12 12 12 5184

P r r r = =

3.5 Συνάρτηση Πιθανότητας Poisson H διωνυμική κατανομή περιγράφει καταστάσεις στις οποίες σε n ανεξάρτητες δοκιμές είναι γνωστές τόσο οι επιτυχίες , να συμβεί δηλαδή ένα γεγονός , όσο και η αποτυχίες , δηλαδή να μην συμβεί. Υπάρχουν όμως περιπτώσεις στις οποίες ένα γεγονός δεν είναι αποτέλεσμα συγκεκριμένης δοκιμής , αλλά συμβαίνει τυχαία στον χώρο και τον χρόνο. Στις περιπτώσεις αυτές επίσης δεν έχει καμμιά έννοια η μη πραγματοποίηση του γεγονότος .Για παράδειγμα στην διάρκεια μιάς καταιγίδας μπορούμε να παρατηρήσουμε τον αριθμό των κεραυνών που έπεσαν σε μία ορισμένη χρονική στιγμή , όμως δεν έχει νόημα να ασχοληθούμε με τους κεραυνούς που δεν συνέβησαν. Επίσης όταν απο μιά ραδιενεργό πηγή ανιχνευτούν Ν διασπάσεις , δεν μπορούμε να γνωρίζουμε με βεβαιότητα τοσυνολικό πλήθος των ραδιενεργών πυρήνων , γιατί δεν υπάρχει τρόπος να ανιχνεύσουμε τους πυρήνες που δεν διασπάστηκαν. Περιπτώσεις σαν τις παραπάνω ακολουθούν την κατανομή Poisson με συνάρτηση πυκνότητας πιθανότητας που δίνεται από την σχέση

( ; )reP r

r

λ λλ− ⋅

= ( 3.13)

Ιδιότητες κατανομής Poisson H συνάρτηση Poisson έχει τις παρακάτω ιδιότητες : Aναμενόμενη τιμή : [ ]rμ λ= Ε = (3.14) Διασπορά : ( )V r λ= (3.15)

Καμπυλότητα : 11γμ

= (3.16)

63

Κύρτωση : 21γμ

= (3.17)

Χαρακτηριστική συνάρτηση : 1( )itet eμφ

⎡ ⎤−⎣ ⎦= (3.18) Παράδειγμα 3.5 [8 ] Ένα κλασσικό παράδειγμα εφαρμογής της κατανομής Poisson είναι η εκτίμηση των Πρώσσων στρατιωτών που σκοτώθηκαν στην διάρκεια του πολέμου από χτύπημα αλόγου.Σε δέκα διαφορετικές εκστρατείες τα τελευταία είκοσι χρόνια είχαμε 122 θανάτους , συνεπώς ο μέσος όρος θανάτων που συνέβησαν σε μια

εκστρατεία και σε ένα ορισμένο χρόνο , θα είναι : 122 0,61020 10x

= . H πιθανότητα να

είχαμε μηδέν (0) θανάτους σε μια εκστρατεία και σε ένα ορισμένο χρόνο , είναι :

0,61 00,61(0;0,61) 0,5434

0eP− ⋅

= =

Με τον ίδιο τρόπο μπορούμε να βρούμε τις πιθανότητες ώστε να έχουμε 1,2,3,4,…θανάτους σε μια εκστρατεία και ένα ορισμένο τρόπο. Στον παρακάτω πίνακα δίνουμε τα παρατηρούμενα στοιχεία και αυτά που υπολογίζουμε από την κατανομή Poisson . Παρατηρούμε ότι η αποκλίσεις είναι πολύ μικρές Αριθμός θανάτων σε μια εκστρατεία και ένα έτος

Πραγματικός αριθμός περιπτώσεων

Πρόβλεψη από κατανομή Poisson

0 109 0,5434x200=108,7 1 65 66,3 2 22 20,2 3 3 4,1 4 1 0,6

Στο σχ. 3.2 φαίνονται διάφορες κατανομές Poissson για διάφορες τιμές της αναμενόμενης τιμής λ.

64

Σχ.3.2 Κατανομές Poisson για διαφορετικά λ [ 8 ] Παρατηρούμε ότι για μικρές τιμές του λ (λ<1) η μεγαλύτερη πιθανότητα αντιστοιχεί στις μηδενικές «επιτυχίες » ( 0)r = . Καθώς αυξάνει η τιμή του λ και κατά συνέπεια ο αριθμός των συμβάντων r , ο αριθμός των επιτυχών συμβάντων συγκλίνει με την αναμενόμενη τιμή λ και η κατανομή τείνει να γίνει κανονική

65

Παράδειγμα 3.6 [9 ] Το ένα δέκατο των εργαλείων που κατασκευάζει μια βιομηχανία είναι ελαττωματικά. Ποια είναι η πιθανότητα να είναι σ’ ένα τυχαίο δείγμα 10 εργαλείων δύο ακριβώς εργαλεία ελαττωματικά . Προσεγγίζουμε την διωνυμική κατανομή με κατανομή Poisson.

( )!

xeP X xx

λλ −

= = και 2 1(1)( 2) 0.1839 0.182!eP X−

= = = =

3.6 Κανονική Συνάρτηση Πιθανότητας Η Gaussian η κανονική κατανομή είναι η περισσότερο γνωστή και χρήσιμη κατανομή . Πράγματι η κανονική κατανομή προσεγγίζει ικανοποιητικά , σαν μαθηματική σχέση , έναν αριθμό κατανομών που συναντάμε στην πράξη και των οποίων η χρήση είναι δύσκολη. Επίσης πολλές φορές παρατηρείται το φαινόμενο , στατιστικά στοιχεία ,τα οποία είναι τιμές κάποιας τυχαίας μεταβλητής με άγνωστη συνάρτηση πιθανότητας να παρουσιάζουν ιστόγραμμα όμοιο με αυτό της κανονικής κατανομής . Οποιαδήποτε τυχαία μεταβλητή Χ η οποία παίρνει τιμές x−∞ ≤ ≤ ∞ ,λέγεται κανονική τυχαία μεταβλητή , εάν υπάρχουν δύο σταθερές , έστω μ και σ με

μ−∞ ≤ ≤ ∞ και 0σ ≥ , τέτοιες ώστε η πιθανότητα η μεταβλητή Χ να λάβη τιμές μεταξύ των α και β να δίνεται από το εμβαδό που ορίζεται από το τμήμα αβ του άξονα χ και της κανονικής καμπύλης ή καμπύλης Gauss ή εξισωσή της είναι :

21

21( )2

x

y x eμ

σφσ π

−⎛ ⎞− ⎜ ⎟⎝ ⎠= = (3.19)

όπου 3,1416π = 2,7183e = Η καμπύλη της κανονικής κατανομής έχει το σχήμα καμπάνας και είναι συμμετρική γύρω από το σημείο x μ= και προσεγγίζει ασυμπτωτικά τον άξονα x. Το εύρος της καμπύλης εξαρτάται από την παράμετρο σ , είναι στενή όταν το σ

είναι μικρό και πλατιά όταν το σ είναι μεγάλο.Το μέγιστο της καμπύλης είναι 12π

και παρουσιάζεται στο σημείο x μ= ενώ για x μ σ= ± η ( )P x πέφτει στο 0,61 της μέγιστης τιμής της . Μεταβάλλοντας το μ η καμπύλη μετακινείτα στον άξονα x

66

χωρίς να μεταβληθεί το σχήμα της Επίσης αυξάνοντας η μειώνοντας το σ η καμπύλη μεταβάλλει το πλάτος της γύρω από το μ χωρίς να αλλάξει η μορφή της . Στο σχήμα 3.3 παριστάνεται γραφικά η παραπάνω συνάρτηση και φαίνονται τα χαρακτηριστικά της σημεία

Σχήμα 3.3 Καμπύλη κανονικής κατανομής

Εάν στην σχέση (3.19) εισάγουμε την μεταβλητή XZ μσ−

= παίρουμε την

σχέση

2

21( )2

z

P z eπ

−= (3.20)

η οποία ονομάζεται συνάρτηση πυκνότητας πιθανότητας της ανηγμένης κανονικής κατανομής Στο σχήμα 3.4 παριστάνεται γραφικά η παραπάνω συνάρτηση και φαίνονται τα εμβαδά της για 1, 2, 3z = ± ± ± .

67

Σχήμα 3.4 Γραφική παράσταση της ανηγμένης κανονικής κατανομής [ 1 ] Ιδιότητες κανονικής κατανομής Αναμενόμενη τιμή : [ ]E x μ= (3.21) Διασπορά : 2( )V x σ= (3.22) Καμπυλότητα : 1 0γ = (3.23) Κύρτωση : 2 0γ = (3.24)

Χαρακτηριστική συνάρτηση : 2 21

2( )it t

t eμ σ

φ− ⋅

= (3.25) Παρατηρούμε ότι οι παράμετροι μ και σ είναι αντίστοιχα η αναμενόμενη τιμή και η τυπική απόκλιση της κατανομής .

68

Μελέτες διαφόρων φαινομένων απέδειξαν ότι πολλές τυχαίες μεταβλητές όπως παραδείγματος χάριν , τα σφάλματα μετρήσεων , το μέγεθος φθοράς εξαρτημάτων μιάς μηχανής κ.λ.π μπορούν να θεωρηθούν ότι ακολουθούν κανονική κατανομή. Παράδειγμα 3.7 Σ’ ένα τεστ που δόθηκε σε 500 φοιτητές ο μέσος όρος ήταν 151 μονάδες και η τυπική απόκλιση 15 μονάδες . Αν οι βαθμοί έχουν κατανεμηθεί σύμφωνα με την κανονική κατανομή , να υπολογιστεί πόσοι μαθητές πήραν από 120 έως 155 μονάδες Βρίσκουμε την ανηγμένη παράμετρο z λαμβάνοντας υπ’οψιν ότι οι βαθμοί από 120 εως 155 προέρχονται στην πραγματικότητα από την περιοχή 119.5 εως 155.5 μονάδες . Αρα :

Στις 119.5 αντιστοιχεί : 119.5 151 2.1015

z −= = −

Στις 155.5 αντιστοιχεί : 155.5 151 0.3015

z −= =

Ποσοστό φοιτητών = ( εμβαδό από z= -2.10 έως z=0.30 )= ( εμβαδό από z= -2.10 έως z=0 )+ ( εμβαδό από z= 0 έως z=0.30 )= 0.4821 + 0.1179 = 0.6000. Συνεπώς 500 0.6000 300⋅ = φοιτητές πήραν από 120 έως 155 μονάδες .

3.6 Ομοιόμορφη Συνάρτηση Πυκνότητας Πιθανότητας Η συνάρτηση πυκνότητας πιθανότητας στην ομοιόμορφη κατανομή είναι σταθερή σε όλο το πεδίο τιμών της τυχαίας μεταβλητής και μηδέν έκτός αυτού. Εάν a και b είναι τα όρια της μεταβλητής ο συναρτησιακός τύπος της ομοιόμορφης συνάρτησης πυκνότητας πιθανότητας είναι :

1

( )0

f x b a⎧⎪= −⎨⎪⎩

για a x b≤ ≤ (3.26)

για a x≥ και x b≥ Ιδιότητες Ομοιόμορφης Συνάρτησης Πυκνότητας Πιθανότητας

Αναμενόμενη τιμή : [ ]2b aE x −

= (3.27)

69

Διασπορά : 2( )( )

12b aV x −

= (3.28)

Καμπυλότητα : 1 0γ = (3.29) Κύρτωση : 2 1.2γ = − (3.30)

Χαρακτηριστική συνάρτηση :

1sinh( ( )) 12( ) ( )( ) 2

it b at it b a

it b aφ

−= + ⋅ −

− (3.31)

3.7 Kατανομή Γ Μια τυχαία μεταβλητή Χ ακολουθεί την κατανομή γάμα με παράμετρο κ , εάν η συνάρτηση πυκνότητας πιθανότητας είναι :

1

( ) ( )0

xe xf x

κ

κ

− −⎧⎪= Γ⎨⎪⎩

0x ≥ (3.32)

όπου Γ(k) 1

0

xe x dxκ∞

− −∫ , είναι η συνάρτηση γάμα.

Οι χαρακτηριστικές ιδιότητες της συνάρτησης πυκνότητας πιθανότητας της κατανομής Γ είναι : Αναμενόμενη τιμή : [ ]E x κ= (3.33) Διασπορά : ( )V x κ= (3.34) Aξίζει να αναφέρουμε και το παρακάτω θεώρημα : Εάν η μεταβλητή Χ ακολουθεί κανονική κατανομή με μέση τιμή μ και

τυπική απόκλιση σ , η 21 ( )2X μσ− είναι μεταβλητή Γ με παράμετρο 1

2

Στο σχ. 3.5 παρουσιάζονται τυπικές μορφές της συνάρτησης πυκνότητας πιθανότητας Γ , η οποία είναι ασυμπτωτική ως προς τον άξονα των x και εξαρτάται από την τιμή του κ.

70

Σχήμα 3.5 Γ συνάρτηση πυκνότητας πιθανότητας [ 1 ] 3.8 Κατανομή 2Χ Εάν ορίσουμε την μεταβλητή 2Χ ως :

2 2 2 21 1 2 2

1 2

( ) ( ) ... ( )xx x ν ν

ν

μμ μσ σ σ

−− −Χ = + + + (3.35)

σύμφωνα με το θεώρημα που αναφέραμε παραπάνω συνάγεται ότι η μεταβλητή

212Χ ακολουθεί κατανομή Γ με παράμετρο 1

2ν .

Αποδεικνύεται ότι η μεταβλητή 2Χ κατανέμεται με μοναδικό τρόπο με συνάρτηση πυκνότητας πιθανότητας

21 1 ( 2)2 22 2

12

1 1( ) ( )1( ) 22

Xf e X

ν

νν

− −Χ = ⋅

Γ (3.36)

και ν βαθμούς ελευθερίας . Ιδιότητες συνάρτησης πιθανότητας 2 ( )X ν για ν λ= Ν − βαθμούς ελευθερίας

71

Αναμενόμενη τιμή : 2 2( ; )E X Q ν ν⎡ ⎤ =⎣ ⎦ (3.37) Διασπορά : 2 2( ; ) 2V X Q ν ν⎡ ⎤ = ⋅⎣ ⎦ (3.38)

Ασυμμετρία : 122γν

= ⋅ (3.39)

Κύρτωση : 212γν

= (3.40)

Χαρακτηριστική συνάρτηση : [ ] 2( ) 1 2t itν

φ −= − (3.41) Στο σχ. 3.6 παρουσιάζονται τυπικές μορφές της συνάρτησης πυκνότητας πιθανότητας 2X συναρτήσει του βαθμού ελευθερίας .

Σχήμα 3.6 Μορφές κατανομών Χ2 συναρτήσει του βαθμού ελευθερίας [1 ] Παράδειγμα 3.8 [ 9 ] Στο σχ 3.7 δίνεται η γραφική παράσταση κατανομής 2 (5)X με 5 βαθμούς ελευθερίας . Να υπολογιστούν οι τιμές 2

1X και 22X για τις οποίες α) το δεξιό

σκιασμένο εμβαδό ισούται με 0.05 β) το αριστερό σκιασμένο εμβαδό ισούται με 0.10

72

α) Εάν το δεξιό σκιασμένο εμβαδό ισούται με 0.05 , τότε το εμβαδό αριστερά του

22X ισούται με (1-0.05)=0.95 , δηλ. το 2

2X είναι το 95 το εκατοστιαίο σημείο 2

.95X Στον πίνακα του παραρτήματος Β κοιτάμε στην γραμμή που αντιστοιχεί σε

5ν = , στην διασταύρωση της γραμμής αυτής με την στήλη 2.95X βρίσκουμε 11.1

,που είναι η ζητούμενη τιμή του 2 (5)X β) Εάν το το αριστερό σκιασμένο τμήμα έχει εμβαδό 0.10 , 2

1X είναι το 10το εκατοστιαίο σημείο και ισούται με 1.61 .

Σχήμα 3.7 3.9 Κατανομή STUDENT Aλλη χρήσιμη κατανομή είναι η κατανομή του Student ( ψευδώνυμο του W.S.Gosset ) . H μεταβλητή t αυτής της κατανομής όρίζεται ως συνδιασμός της κανονικής κατανομής και της κατανομής 2X ως εξής : Eάν η τυχαία μεταβλητή X ακολουθεί κανονική κατανομή με μέση τιμή 0 και τυπική απόκλιση 1 και η μεταβλητή 2X ακολουθεί κατανομή 2X με ν βαθμούς ελευθερίας , τότε η μεταβλητή t ορίζεται από την σχέση :

2

XtXν

= με t−∞ ≤ ≤ ∞ (3.42)

Βρίσκεται ότι η συνάρτηση πυκνότητας πιθανότητας της t είναι :

73

12

2

1( )1 2( ) (1 ) ,( )2

tt tν

ν

φ ν νν π

+−

= ⋅ ⋅ + −∞ ≤ ≤ ∞⋅ Γ

(3.43)

H συνάρτηση αυτή λέγεται συνάρτηση πυκνότητας πιθανότητας της κατανομής του Student με ν βαθμούς ελευθερίας . Στο σχήμα 3.8 αντιπαραβάλλεται η κατανομή Student ως προς την κανονική κατανομή . Όταν οι βαθμοί ελευθερίας τείνουν στο άπειρο η κατανομή Student τείνει στην κανονική κατανομή.

Σχήμα 3.8 Σύγκριση κατανομής Student και κανονικής [1 ] Ιδιότητες συνάρτησης πιθανότητας Student για ν βαθμούς ελευθερίας Αναμενόμενη τιμή : 0μ = (3.44)

Διασπορά : [ ]2

V t νν

=−

(3.45)

74

Παράδειγμα 3.9 [ 6 ] Να υπολογιστούν οι τιμές του t για τις οποιες το δεξιά εμβαδό της κατανομής t του Student είναι 0.05 για ν ίσο με α) 16 , β) 27 , γ) 200. Από την στήλη 95.t του πίνακα του παραρτήματος Β παίρνουμε τις τιμές α) 1.75 για ν=16 β) 1.70 για ν=27 γ) 1.645 για ν=200 . Η τελευταία τιμή , που δίνεται στην γραμμή για ν = ∞ , έχει προκύψει από την αντίστοιχη κανονική κατανομή που αποτελεί καλή προσέγγιση για τόσο μεγάλο ν. 3.1 Ασυμπτωτική Συμεριφορά Κατανομών

Στο σχήμα 3.2 που παραθέσαμε για την κατανομή Poisson φαίνεται καθαρά ότι όταν το λ ( αναμενόμενη τιμή συμβάντων ) είναι μεγάλο η κατανομή Poison τείνει στην κανονική κατανομή με μ λ= και σ λ= . Το πόσο μεγάλο πρέπει να είναι το λ εξαρτάται από την ακρίβεια που επιθυμούμε . Για τιμές 10 λ≤ μπορούμε να θεωρήσουμε ότι η κατανομή Poisson συμπίπτει με Gaussian όπως φαίνεται και στο σχ. 3.2 Στο ίδιο συμπέρασμα μπορούμε να καταλήξουμε και για την διωνυμική κατανομή όπως φαίνεται στο σχ. 3.1, η οποία τείνει σε κανονική με npμ = και

(1 )np pσ = − Το γενικό συμπέρασμα που καταλήγουμε είναι ότι πολλές από τις γνωστές κατανομές , όπως η διωνυμική ,Poisson , 2X , Student , κ.α τείνουν ασυμπτωτικά προς την κανονική συνάρτηση όταν το πλήθος των παατηρουμένων συμβάντων τείνει στο άπειρο. Όπως θα δούμε στο επόμενο κεφάλαιο η πρόταση αυτή είναι απόρροια του θεωρήματος του κεντρικού ορίου που θα αναπτύξουμε στο επόμενο κεφάλαιο

75

4ον ΚΕΦΑΛΑΙΟ : ΣΦΑΛΜΑΤΑ

4.1 Εισαγωγή Στο προηγούμενο κεφάλαιο αναφέραμε βασικές συναρτήσεις πυκνότητας πιθανότητας που περιγράφουν μια ευρεία περιοχή φαινομένων και διαδικασιών που συναντάμε στην φύση αλλά και σε πολλές πρακτικές δραστηριότητες. Βασικός μας στόχος είναι να χρησιμοποιήσουμε αυτά τα εργαλεία στην επεξεργασία μετρήσεων και στην εξαγωγή συμπερασμάτων Αν υποθέσουμε ότι σε κάποιο πείραμα μετράμε την πίεση ενός αερίου που περιέχεται σε ένα δοχείο που παραμένει αμετάβλητη , θα διαπιστώσουμε ότι κάθε μέτρηση δίνει διαφορετική τιμή. Η πίεση δηλαδή είναι τυχαία μεταβλητή. Αν μπορούσαμε να εκτελέσουμε άπειρες μετρήσεις θα μπορούσαμε να βρούμε την συνάρτηση πυκνότητας πιθανότητας της τυχαίας μεταβλητής της πίεσης . Ετσι θα μπορούσαμε να υπολογίσουμε την μέση τιμή , την διασπορά και συνδιασπορά. Αντιλαμβανόμαστε λοιπόν ότι οι επαναλαμβανόμενες μετρήσεις μιας φυσικής ποσότητας κατανέμονται γύρω από την πραγματική τιμή ( της φυσικής ποσότητας ),σύμφωνα με μία συνάρτηση πυκνότητας πιθανότητας και μόνο κατά τύχη μία από αυτές τις μετρήσεις θα συμπίπτει με την πραγματική. Στόχος αυτού του κεφαλαίου είναι η παρουσίαση της θεωρίας των σφαλμάτων που έχει σαν σκοπό να μας βοηθήσει να προσεγγίσουμε την πραγματική τιμή μιάς φυσικής ποσότητας με όσο το δυνατόν μεγαλύτερη ακρίβεια , εκτελώντας το μικρότερο αριθμό μετρήσεων. Πώς όμως εξαρτάται η ακρίβεια της εκτίμησης από τον αριθμό των παρατηρήσεων ;

4.2 O Νόμος των Μεγάλων Αριθμών Τα προβλήματα των μετρήσεων , όπως αναφέραμε και πρίν έχουν να κάνουν με το τι συμβαίνει εάν επαναλάβουμε την ίδια μέτρηση ξανά και ξανά. Οι μαθηματικοί νόμοι που διέπουν τις επαναλαμβανόμενες μετρήσεις λέγονται οριακοί νόμοι , γιατί περιγράφουν τι γίνεται στο όριο , όταν το πείραμα εκτελείται όλο και περισσότερες φορές . Ο πρώτος από αυτούς τους νόμους ,λέγεται Νόμος των Μεγάλων Αριθμών. Για να περιγράψουμε τον νόμο αυτόν , υποθέτουμε ότι ρίχνουμε ένα νόμισμα πολλές φορές . Αν το νόμισμα είναι «τίμιο» , θα περιμέναμε η αναλογία των «κεφαλιών » που εμφανίζονται να είναι περίπου το 1/2 του συνόλου των ρίψεων , καθώς οι ρίψεις γίνονται όλο και περισσότερες . Αυτό προβλέπει ο Νόμος των Μεγάλων Αριθμών , ο οποίος μας λέει ότι αν επαναλάβουμε το πείραμα όλο και περισσότερες φορές , η αναλογία των κεφαλιών θα τείνει ακριβώς στην τιμή 1/2 .

76

Σχήμα 4.1 [ 11 ] Τα παραπάνω σχήματα δείχνουν τι ακριβώς συμβαίνει , όταν κάθε φορά έχουν εκτελεστεί 4 ακολουθίες ρίψεως νομίσματος , και έχουν υπολογιστεί οι αναλογίες με τις οποίες εμφανίζεται το κεφάλι. Κάθε εικόνα ανφέρεται σε συγκεκριμένο αριθμό ρίψεων. Από εικόνα σε εικόνα , ο αριθμός αυτός γίνεται όλο και μεγαλύτερος . Παρατηρούμε ότι η σύγκλιση είναι αργή και όταν ακόμα οι ρίψεις γίνουν 1000 , τα αποτελέσματα ακόμη ξεχωρίζουν . Στην γενικώτερη περίπτωση θεωρούμε ότι 1 2, ,..., NX X X είναι ένα σύνολο αμοιβαία ανεξάρτητων τυχαίων μεταβλητών με αναμενόμενη τιμή ίση με μ (κοινή για όλες τις μεταβλητές ) και διασπορές ίσες με 2

iσ με 1, 2,...,i N= Ο μέσος όρος των τυχαίων μεταβλητών ορίστηκε ως :

1

1 N

ii

x xN =

= ∑ (4.1)

Oι δύο εκφράσεις του Νόμου των Μεγάλων Αριθμών είναι : AΣΘΕΝΗΣ ΝΟΜΟΣ Ο ασθενής νόμος διατείνεται ότι αν

22

1

1lim 0N

iN iNσ

→∞=

⎡ ⎤ =⎢ ⎥⎣ ⎦∑ (4.2)

77

τότε ο μέσος όρος x συγκλίνει στην αναμενόμενη τιμή μ , των τυχαίων μταβλητών :

1

1limN

ii

xN

μΝ→∞

=

⎛ ⎞ =⎜ ⎟⎝ ⎠∑ (4.3)

ΙΣΧΥΡΟΣ ΝΟΜΟΣ Ο ισχυρός νόμος διατείνεται ότι αν

2

1lim ( )

Ni

N i΄

iσ πεπερασμε νο

→∞=

⎡ ⎤=⎢ ⎥

⎣ ⎦∑ (4.4)

τότε ο μέσος όρος x συγκλίνει στην αναμενόμενη τιμή μ , των τυχαίων μταβλητών :

1

1limN

ii

xN

μΝ→∞

=

⎛ ⎞ =⎜ ⎟⎝ ⎠∑ (4.5)

Αντιλαμβανόμαστε ότι όταν οι μεταβλητές 1 2, ,..., NX X X είναι τα αποτελέσματα , ( 1, 2,3,..., )ix i N= του ίδιου πειράματος μέτρησης της φυσικής ποσότητας Χ θα ισχύει 2 2

iσ σ= και προφανώς εξασφαλίζεται η συνθήκη . Επομένως η αναμενόμενη τιμή υπολογίζεται ως το όριο , όταν N →∞ , του μέσου όρου των αποτελεσμάτων των επαναλαμβανόμενων μετρήσεων , ix .

4.3 Η έννοια του σφάλματος της μέτρησης Σε κάθε πειραματική διαδικασία επιδιώκουμε να πάρουμε μετρήσεις των διαφόρων φυσικών μεγεθών που εμπλέκονται στο πείραμα και εν συνεχεία να τις αναλύσουμε για να καταλήξουμε σε συμπεράσματα. Τι είναι όμως μέτρηση ; ,Είναι η σύγκριση κάποιου μεγέθους με ένα άλλο «πρότυπο » που διαθέτει η συσκευή που χρησιμοποιούμε στο πείραμά μας . Όταν μετράμε την ένταση του ρεύματος την συγκρίνουμε με γνωστές εντάσεις που μας βοήθησαν να βαθμολογήσουμε το αμπερόμετρο. Θα πρέπει λοιπόν το « πρότυπό »μας να είναι σωστό και να ανταποκρίνεται στις απαιτήσεις της μέτρησης. Όμως όσο ιδανικά και να πραγματοποιηθεί ένα πείραμα οι μετρήσεις που κάνουμε δεν είναι ποτέ τέλειες και ακριβείς , πάντα χαρακτηρίζονται από σφάλμα. Το σφάλμα μιας μέτρησης εκφράζει την αναπόφευκτη έλλειψη ακρίβειας που υπάρχει στην μέτρηση ενός μεγέθους που οφείλεται στις τυχόν ατέλειες των οργάνων μέτρησης αλλά και καί στις μεθόδους μέτρησης

78

Μπορούμε να αυξήσουμε την ακρίβεια της μέτρησης απεριόριστα ; . Αποδείχνεται πώς όχι . Αιτία είναι η ίδια η ουσία της ύλης και ο στατιστικός χαρακτήρας των σωματιδίων του μικρόκοσμου. Αυτό επιβάλλεται από την αρχή απροσδιοριστίας του Heisenberg που έχει την έκφραση :

2hp xπ

Δ ⋅Δ ≥ (4.6)

όπου pΔ το σφάλμα στον προσδιορισμό της ορμής και xΔ το σφάλμα στον προσδιορισμό της θέσης του σωματιδίου και 276.626176 10 .h erg s−= − η σταθερά του Plank. Oπως φαίνεται από αυτή την σχέση είναι αδύνατο να προσδιορίσουμε π.χ το x με ακρίβεια ( 0xΔ → ) γιατί τότε το p δεν είναι δυνατόν να προσδιοριστεί ( pΔ →∞ )

4.4 Συστηματικά και τυχαία σφάλματα

Αν υποθέσουμε ότι με ένα χρονόμετρο μετρούμε πολλές φορές τον χρόνο που κάνει να διανύσει ένα κινητό μια απόσταση, θα παρατηρήσουμε ότι σχεδόν όλες οι μετρήσεις μας θα είναι διαφορετικές. Αυτό οφείλεται στο γεγονός ότι οι συνθήκες διεξαγωγής του πειράματος είναι διαφορετικές κάθε φορά. Για παράδειγμα πάντα θα υπάρχουν μετακινήσεις του αέρα , σκόνη που δημιουργεί πρόσθετες αντιστάσεις , η έναρξη και το σταμάτημα του χρονομέτρου να μην γίνονται με μεγάλη ακρίβεια κ.λ.π. Επίσης μπορεί να υπάρχουν προβλήματα από παράγοντες που δεν γνωρίζουμε .Για παράδειγμα το χρονόμετρο ίσως να μην λειτουργεί σωστά . Ισως να έχουμε διαρκή αύξηση της θερμοκρασίας του περιβάλλοντος , η οποία αν και ανεπαίσθητη επιδρά στο αποτέλεσμα που βρίσκουμε. Τα διαφορετικά αποτελέσματα που παίρνουμε κατά την μέτρηση του ίδιου μεγέθους μας δείχνουν τα σφάλματα. Η πρώτη παράγραφος αναφέρεται στα τυχαία σφάλματα και η δεύτερη στα συστηματικά . Τα τυχαία σφάλματα εκφράζουν την διακύμανση των μετρήσεων από το ένα πείραμα στο άλλο και οδηγούν στην κατανομή των αποτελεσμάτων γύρω από μία μέση τιμή. Μπορεί να οφείλονται στην έλλειψη ευαίσθετης απόκρισης του οργάνου η του παρατηρητή ,στον εξωτερικό «θόρυβο» η σε στατιστικές διαδικασίες όπως είναι η ρίψη ενός ζαριού. Τα τυχαία σφάλματα είναι αναπόφευκτα. (σχ 4.2.α) Τα συστηματικά σφάλματα τείνουν να μετατοπίσουν όλες τις μετρήσεις με συστηματικό τρόπο έτσι ώστε η μέση τιμή να είναι μετατοπισμένη προς μία διευθυνση. Μπορεί να οφείλονται στην κακή βαθμονόμηση των οργάνων , στην λανθασμένη χρήση τους η στην παράβλεψη ορισμενων φαινομένων η σε εξωτερικά αίτια που μπορεί να αλλάξουν τα αποτελέσματα του πειράματος Τα συστηματικά σφάλματα μένουν πάντα σταθερά κατά την διάρκεια του πειράματος (σχ.4.2β)

79

Σχήμα 4.2α Τυχαία σφάλματα Σχήμα 4.2β Συστηματικά σφάλματα [ 12] Είναι φανερό από τα παραπάνω ότι τα τυχαία σφάλματα είναι αναπόφευκτα , οφείλονται σε αντικειμενικές αιτίες και δεν επιδρούν στα αποτελέσματα των μετρήσεων μας παρά μόνο στην ακρίβειά τους , Τα συστηματικά σφάλματα αντιθέτως οφείλονται σε κακή λειτουργία και ρύθμιση των οργάνων μας και κάνουν τα αποτελέσματά μας λαθεμένα

4.5 Γιατί τα σφάλματα ακολουθούν συνήθως κανονική κατανομή. Όταν παίρνουμε επαναλαμβανόμενες μετρήσεις κάποιου φυσικού μεγέθους π.χ της περιόδου ενός εκκρεμούς , τα σφάλματα , που συνοδεύουν τις μετρήσεις ακολουθούν κανονική κατανομή με αναμενόμενη τιμή μ και τυπική απόκλιση σ . Δηλαδή εάν πούμε ότι η περίοδος ενός εκκρεμούς είναι 12,3 0,1sec± , αυτό σημαίνει ότι η μετρησή μας έχει πιθανότητα 68% να βρίσκεται στο διάστημα 12, 2,...,12, 4 , 95% πιθανότητα να βρίσκεται στο διάστημα 12.1,...,12.5 και

99,7% πιθανότητα να βρίσκεται στο διάστημα 12.0,...,12.6 . Γιατί όμως τα σφάλματα ακολουθούν κανονική κατανομή.; Tα σφάλματα των μετρήσεων δεν οφείλονται σε έναν μόνο λόγο όπως για παράδειγμα στην ανικανότητά μας , στην αδυναμία μας να διαβάσουμε σωστά την μέτρηση ,στο ότι το χέρι μας είναι τρεμάμενο κ.λ.π. , άλλα σε συνδυασμό όλων αυτών των παραγόντων. Εάν π.χ μετρήσουμε το μήκος μιας ράβδου με έναν κανόνα το αποτέλεσμα της μέτρησης θα είναι αλλοιωμένο από : α) την οπτική παράλλαξη , β) την βαθμονόμηση του κανόνα , γ) την στρογγυλοποίηση στο διάβασμα της τιμής ,δ) το τρέμουλο των χεριών μας κ.λ.π. Ακόμη και τα σύγχρονα ψηφιακά όργανα εμφανίζουν σφάλματα στις μετρήσεις τα οποία οφείλονται κυρίως στην κατασκευή των ηλεκτρονικών εξαρτημάτων.

80

Η συμπεριφορά των μεταβλητών όπως τα σφάλματα , οι οποίες προκύπτουν ως άθροισμα πολλών άλλων μεταβλητών , περιγράφεται από τον δεύτερο οριακό νόμο που λέγεται : Kεντρικό Οριακό Θεώρημα « Το άθροισμα S , Ν ανεξάρτητων τυχαίων μεταβλητών ix με 1,2,3,...,i N= , οι οποίες επιλέγονται από δείγματα με μέση τιμή , 1, 2,3,...,i i Nμ = και διασπορά

, 1, 2,3,...,iV i N= , είναι τυχαία μεταβλητή η οποία έχει τις παρακάτω ιδιότητες :

α) Aναμενόμενη τιμή [ ]1 1

N N

i ii i

E S E X μ= =

⎡ ⎤= =⎢ ⎥⎣ ⎦∑ ∑ (4.7)

β) Διασπορά 1

N

ii

V V=

=∑ (4.8)

γ) ακολουθεί κανονική κατανομή για N →∞

δ) Συνάρτηση Πυκνότητας Πιθανότητας 2

2( )

21( ) ( ; , )2

S

f S e N Sμσ μ σ

πσ

−−

⋅= ⋅ =

(4.9)

όπου 1

N

ii

μ μ=

=∑ και 2 2

1

N

ii

σ σ=

=∑

Για αυτόν τον λόγο η κανονική κατανομή είναι τόσο σημαντική. Όταν μια ποσότητα είναι αποτέλεσμα της αθροιστικής δράσης πολλών ανεξάρτητων μεταβλητών , ανεξάρτητα από τις κατανομές που αυτές προέρχονται , η ποσότητα θα ακολουθεί έστω προσεγγιστικά την κανονική κατανομή. Με αυτόν τον τρόπο συμπεριφέρονται τα σφάλματα των μετρήσεων , όπως και πολλές άλλες ποσότητες. Για παράδειγμα το ύψος των ανθρώπων ,όπως και άλλα ανατομικά χαρακτηριστικά του ανθρώπινου είδους ακολουθούν κανονική κατανομή, επειδή είναι αποτέλεσμα πολλών γενετικών και περιβαλλοντικών παραγόντων. Από την άλλη μεριά το βάρος του ανθρώπου δεν ακολουθεί την κανονική κατανομή γιατί εξαρτάται μόνο από την ποσότητα της τροφής που καταναλώνουμε. Παράδειγμα 4.1 [ 8 ] Στο σχήμα 4.3 παριστάνεται υπό μορφή ιστογραμμάτων το κεντρικό οριακό θεώρημα . Το σχ. 4.3a δείχνει 5000 αριθμούς που επιλέγονται τυχαία από μια ομοιόμορφη κατανομή μεταξύ 0 και 1 με μέση τιμή 1/2 και μεταβλητότητα 1/12.

81

Το σχ.4.3 δείχνει το άθροισμα ζευγών τυχαίων αριθμών που επιλέχθηκαν από δύο ομοιόμοφες κατανομές σαν την ανωτέρω ,ήτοι 1 2x xΧ = + Η κατανομή που προκύπτει είναι τριγωνική στο 1X = . Το σχ.4.3b δείχνει το άθροισμα 1 2 3X x x x= + + τυχαίων αριθμών από τρείς ομοιόμορφες κατανομές . Το μέγιστο εδώ παρουσιάζεται στο 1.5X = Το σχ.4.3c δείχνει το άθροισμα 1 2 12...X x x x= + + + τυχαίων αριθμών που λαμβάνονται από 12 ομοιόμορφες κατανομές . Η τελευταία κατανομή είναι

Gaussian 6.0μ = και 2 112 112

σ = × =

Από τα παραπάνω συμπεραίνουμε ότι μπορούμε να χρησιμοποιήσουμε το άθροισμα Ν τυχαίων μεταβλητών , που παίρνουν τιμές ισοππίθανα , από ομοιόμορφη κατανομή για να παράγουμε τυχαίους αριθμούς σύμφωνα με κανονική κατανομή.

Σχήμα 4.3

82

4.6 Βασικές αρχές της θεωρίας των σφαλμάτων [13 ] Είδαμε στην προηγούμενη ενότητα ότι οι μετρήσεις ακολουθούν συνήθως έστω και κατά προσέγγιση την κανονική κατανομή με αναμενόμενη τιμή μ και διασπορά 2V σ= . Ονομάζουμε την τετραγωνική ρίζα της διασποράς διακριτική ικανότητα της μετρητικής συσκευής . Το πρόβλημα της μέτρησης τίθεται ως εξής : Έστω κάποια μετρητική συσκευή με διακρτική ικανότητα 2V σ σ= = και έστω x ένα και μοναδικό αποτέλεσμα της μέτρησης της φυσικής ποσότητας Χ. Ποια είναι η σχέση του αποτελέσματος της μέτρησης με την πραγματική τιμή της φυσικής ποσότητας Rx . Επειδή η συνάρτηση πυκνότητας πιθανότητας της μέτρησης όπως ειπώθηκε πιο πάνω είναι κανονική , η πιθανότητα το αποτέλεσμα της μέτρησης να είναι μεταξύ x και dx , δεδομένου ότι η αληθής τιμή της φυσικής ποσότητας είναι Rx ,θα δίνεται απο την παρακάτω σχέση δεσμευμένης πιθανότητας :

2

2( )

2( / ) ( )2

Rx x

RRP x x e dxσ

π σ

−−

= ⋅⋅

(4.10)

( / ) 1RP x x dxβ

α

=∫ (4.11)

όπου R είναι παράγοντας κανονικοποίησης , ώστε η συνολική πιθανότητα στο διάστημα [ ],α β των επιτρεπτών τιμών να ισούται με ένα Πριν κάνουμε οποιαδήποτε μέτρηση , όλοι οι αριθμοί στο διάστημα [ ],α β έχουν την ίδια πιθανότητα για να είναι η πραγματική τιμή Rx .Επομένως η πιθανότητα 0 ( )RP x να είναι η αληθής τιμή του φυσικού μεγέθους ένας αριθμός μεταξύ Rx και R Rx dx+ , θα είναι :

[ ]

[ ]0 ( ) , ,0, ,

R

R R

R

dxP x x

xβ α α β

α β

⎧⎪ −= ∈⎨⎪ ∉⎩

(4.12)

83

Eπίσης το αποτέλεσμα της μέτρησης έχει την ίδια πιθανότητα να πάρει οποιαδήποτε τιμή στο διάστημα [ ],α β . Δηλαδή :

[ ]

[ ]0 ( ) , ,0, ,

dxM x x

xβ α α β

α β

⎧⎪ −= ∈⎨⎪ ∉⎩

(4.13)

Συνδυάζοντας τις σχέσεις (4.10) , (4.12) , (4.13) και εφαρμόζοντας το θεώρημα του Bayes καταλήγουμε στην έκφραση :

2

2( )

2

0

0

2( / ) ( )( / )( )

Rx xR

R RR

dxR e dxb aP x x P xP x x dxM x

b a

σ

π σ

− −⎛ ⎞⎜ ⎟ ⋅⎜ ⎟ −⋅⋅ ⎝ ⎠= =

( / )RP x x⇒ = 2

2( )

2

2

Rx x

RN e dxσ

π σ

− −

=⋅

για [ ],Rx α β∈

(4.14) ( / ) 0RP x x = για [ ],Rx α β∉ Η σχέση (4.14) μας δίνει την πιθανότητα να περιέχεται η πραγματική τιμή της φυσικής ποσότητας στην στοιχειώδη περιοχή [ ],x x dx+ λαμβάνοντας υπ’οψιν την τιμή μιάς και μόνο μέτρησης x . Συνεπώς σύμφωνα με αυτή την προσέγγιση , εκτελώντας μία μέτρηση ενός φυσικού μεγέθους μπορούμε χρησιμοποιώντας το θεώρημα του Bayes να βρούμε την πιθανότητα η πραγματική τιμή να βρίσκεται στην στοιχειώδη περιοχή [ ],x x dx+ , ενώ η πραγματική τιμή παραμένει άγνωστη. Η απόκλιση του αποτελέσματος της μέτρησης από την πραγματική τιμή ορίζεται σαν σφάλμα μέτρησης και εκφράζεται από την διακριτική ικανότητα σ του οργάνου μέτρησης .Ομως στις περισσότερες περιπτώσεις δεν γνωρίζουμε την πραγματική τιμή. Στην περίπτωση αυτή όπως θα δούμε στα επομενα κεφάλαια είμαστε υποχρεωμένοι να προχωρήσουμε στην εκτίμηση της « αληθούς τιμής » ενός φυσικού μεγέθους και το σφάλμα εκφράζεται από την τετραγωνική ρίζα της διασποράς του αποτελέσματος της εκτίμησης , η οποία πέρα από τα μετρητικά σφάλματα εξαρτάται και από την μεθοδολογία ανάλυσης .

4.7 Συμβατική και Bayesian ερμηνεία των μετρήσεων

84

Στο πρώτο κεφάλαιο αναφέραμε ότι υπάρχουν δύο κυρίως προσεγγίσεις στην έννοια της πιθανότητας , η συμβατική και η υποκειμενική η Bayessian . Η συμβατική στατιστική προσέγγιση βασίζεται στην άποψη ότι η πιθανότητα ενός γεγονότος εκφράζεται ως το όριο της σχετικής συχνότητας όταν οι επαναλήψεις του γεγονότος αυτού τείνουν στο άπειρο , δηλαδή

( ) lim lim AA N

np A fN→∞

= = (4.15)

Η ερμηνεία της πιθανότητας ως συχνότητας θεωρεί την πιθανότητα σαν φυσικό μέγεθος που εκφράζει αντικειμενικά χαρακηριστικά του πραγματικού κόσμου. Η ερμηνεία αυτή της πιθανότητας χρησιμοποιείται από την κβαντική και στατιστική φυσική. Όμως υπάρχουν αρκετοί μαθηματικοί και φιλόσοφοι που θεωρούν ότι οι πιθανότητες έχουν και ένα υποκειμενικό στοιχείο. Αυτό φαίνεται να είναι συνδεμένο με τον βαθμό πεποίθησης στον οποίο κάποιο άτομο πιστεύει στην μια η άλλη πρόταση. Για να είναι όμως αποδεκτή η υποκειμενική πιθανότητα ενός ατόμου θα πρέπει αυτή να μην παραβιάζει τον λογισμό των πιθανοτήτων . Για παράδειγμα εάν ισχυρισθούμε ότι η πιθανότητα να πάρουμε τον αριθμό έξι όταν ρίχνουμε ένα ζάρι είναι 1/2 η πεποίθηση αυτή παραβιάζει τον λογισμό των πιθανοτήτων και δεν είναι αποδεκτή. Η ιδέα αυτή της προσωπικής ερμηνείας της πιθανότητας συνδέεται άμεσα με τον κανόνα του Bayes εάν στην θέση των a priori πιθανοτήτων χρησιμοποιήσουμε τις προσωπικές πιθανότητες . Εάν διαθέτουμε δηλαδή κάποιες προσωπικές πιθανότητες για μια θεωρία , χρησιμοποιώντας τον κανόνα του Bayes μπορουμε να βρούμε την πιθανότητα ισχύος της θεωρίας έχοντας συλλέξει περιορισμένο αριθμό παρατηρήσεων . Ας δούμε τώρα πώς οι δύο παραπάνω σχολές ερμηνεύουν την διαδικασία της μέτρησης για την εύρεση της αληθούς τιμης ενός φυσικού μεγέθους . Α. Bayesian Μεθοδολογία Η μέθοδος αυτή έχει σαν αφετηρία τα παρακάτω δεδομένα :

1. Eίναι γνωστή η συνάρτηση πυκνότητας πιθανότητας των μετρήσεων ( π.χ Gaussian) στο διάστημα [ ],α β

2. Η μέση τιμή της συνάρτησης πυκνότητας πιθανότητας των μετρήσεων είναι ίση με την αληθή τιμή της φυσικής ποσότητας

3. Γνωρίζουμε την διασπορά της συνάρτησης πυκνότητας πιθανότητας Και στηρίζεται στις εξής υποθέσεις :

85

α) Κάθε σημείο του διαστήματος [ ],α β έχει την ίδια πιθανότητα 0 ( )RP x να εμπεριέχει ην αληθή τιμή της υπό μέτρηση φυσικής ποσότητας . Η υπόθεση αυτή όπως αναλύσαμε και πιο πάνω είναι υποκειμενική και εκφράζει τον βαθμό πεποιθησής μας ότι η πιθανότητα να έναι η αληθής τιμή του φυσικού μεγέθους

μεταξύ Rx και R Rx dx+ είναι Rdxβ α−

( a priori γνώση) ,χωρίς να έχουμε

πραγματοποιήσει καμμιά μέτρηση. β) Κάθε στοιχειώδης περιοχή του διαστήματος [ ],α β έχει την ίδια πιθανότητα να

εμπεριέχει το αποτέλεσμα της μέτρησης : 0 ( ) dxM xβ α

=−

Εάν τώρα πάρουμε το αποτέλεσμα μιάς μέτρησης έστω mx ,κάνοντας χρήση των παραπάνω δεδομένων και υποθέσεων το θεώρημα του Bayes μας λέει ότι η πιθανότητα η τιμή mx να είναι ίση με την αληθή τιμή Rx είναι :

( / )R mP x x = 2

2( )

2

2

R mx x

RN e dxσ

π σ

− −

⋅ για [ ],Rx α β∈ (4.16)

Το αδύνατο σημείο αυτής της θεωρίας είναι η αυθαίρετη και υποκειμενική εκλογή των a priori πιθανοτήτων 0 ( )RP x , που μπορούν να μας οδηγήσουν σε λανθασμένα συμπεράσματα. Η μετάλλαξη της συνάρτησης πυκνότητας πιθανότητας της 0 ( )RP x από ομοιόμορφη ( όταν δεν έχουμε πραγματοποιήσει καμμιά μέτρηση ) σε Gaussian ( έχοντας κάνει μια μέτρηση ) δεν είναι αυτονόητη , αντίθετα μπορεί να αποδειχθεί αντιεπιστημονική και εσφαλμένη. Συμβατική Μέθοδος Η συμβατική μέθοδος απορρίπτει την Bayesiasn προσέγγιση , σύμφωνα με την οποία , έχοντας μια μόνο μέτρηση της μεταβλητής Χ μπορούμε να βρούμε την πιθανότητα η αληθής τιμή Rx να περιέχεται στο διάστημα [ ],x x dx+ Η αληθής τιμή παραμένει πάντα άγνωστη . Μπορούμε όμως να κατασκεύασουμε διαστήματα εμπιστοσύνης που περιέχεται η αληθής τιμή Rx με κάποια πιθανότητα ίση με λ Επι παραδείγματι έάν mx είναι το αποτέλεσμα μιάς μέτρησης της Χ η οποία έχει συνάρτηση πυκνότητας πιθανότητας την :

2

2( )

2( / ) ( )2

Rx x

RRP x x e dxσ

π σ

−−

= ⋅⋅

(4.17)

86

το διάστημα εμπιστοσύνης [ ],m mx xσ σ− + θα έχει πιθανότητα ίση με :

2

2( )2( )

2

yR e dyβ

σ

α

λπ σ

−= ⋅

⋅∫ (4.18)

να περιέχει την την αληθή τιμή ( Ry x x= − ) Η ερμηνεία που η συμβατική μέθοδος δίνει στο διάστημα εμπιστοσύνης είναι η εξής : Eάν από την μέτρηση του φυσικού μεγέθους Χ πάρουμε τις μετρήσεις

1 2, ,..., Nx x x , που ακολουθούν κατανομή με συνάρτηση πυκνότητας πιθανότητας την 2

2( )

2( / ) ( )2

Rx x

RRP x x e dxσ

π σ

−−

= ⋅⋅

και κατασκευάσουμε τα αντίστοιχα διαστήματα

εμπιστοσύνης [ ]1 1,x xσ σ− + , [ ]2 2,x xσ σ− + ,…..,[ ],N Nx xσ σ− + , η αναλογία αυτών που θα περιέχουν την αληθή τιμή του Rx του Χ θα είναι λ . Οι περισσότεροι επιστήμονες θεωρούν ότι η συμβατική προσσέγγιση είναι περισσότερο αξιόπιστη σε σχέση με την Bayesian που θεωρείται ανορθόδοξη και αιρετική. Πολλές φορές όμως για την ερμηνεία των αποτελεσμάτων ενός πειράματος χρησιμοποιούμε την Bayesian μεθοδολογία . Παράδειγμα 4.2 Ας υποθέσουμε ότι η μετράμε την μάζα του ηλεκτρονίου και βρίσκουμε την τιμή 2520 10 /KeV c± . Αυτό σημαίνει ότι μετρήσαμε την μάζα του ηλεκτρονίου με συσκευή διακριτικής ικανότητας 210 /KeV c και πήραμε το παραπάνω αποτέλεσμα . Η ερμηνεία του αποτελέσματος αυτού έχει ως εξής Α. Bayesian ερμηνεία Η ερμηνεία του επιστήμονα που ακολουθεί την Bayesian μεθοδολογία θα είναι η ακόλουθη : «Κάναμε μία μέτρηση της μάζας του ηλεκτρονίου με συσκευή διακριτικής ικανότητας 210 /KeV cσ = και πήραμε την τιμή

2520 /em KeV c= .Επειδή οι μετρήσεις μας ακολουθούν κανονική συνάρτηση πυκνότητας πιθανότητας με 210 /KeV cσ = , η πιθανότητα η τιμή

87

2520 /em KeV c= να είναι ίση με την αληθή τιμή της μάζας του ηλεκτρονίου είναι

68% »( Δίνεται από την σχέση 2

2( )2( )

2

yR e dyβ

σ

α

λπ σ

−= ⋅

⋅∫ )

Β. Συμβατική ερμηνεία Η συμβατική ερμηνεία απορρίπτει τον ισχυρισμό ότι η μάζα του ηλεκτρονίου συνδέεται με κάποια πιθανότητα . Το ηλεκτρόνιο έχει μια καθορισμένη μάζα Rm . Η πιθανότητα να έχει αυτή την μάζα είναι 1 , και η πιθανότητα να έχει άλλη μάζα είναι 0. Το προβλημά μας είναι ότι η αληθής τιμή της μάζας του ηλεκτρονίου Rm είναι άγνωστη. Μπορούμε όμως να δηλώσουμε ότι η αληθής τιμή περιέχεται στο διάστημα τιμών [ ] [ ]520 10,520 10 510,530− + = με εμπιστοσύνη 68% . Αυτό σημαίνει ότι εάν επαναλάβουμε την μέτρηση πολλές φορές και σχηματίσουμε τα αντίστοιχα διαστήματα [ ]10, 10m mx x− + το 68% αυτών θα περιέχουν την αληθή τιμή του ηλεκτρονίου.

4.8 Επαναλαμβανόμενες μετρήσεις Ας υποθέσουμε ότι μετράμε την ίδια ποσότητα λ φορές παίρνοντας τις τιμές

1 2, ,...,x x xλ των οποίων η αναμενόμενη τιμή είναι 1μ και η απόκλιση 1σ Κατόπιν επαναλαμβάνουμε την παραπάνω διαδικασία Ν φορές και βρίσκουμε κάθε φορά την αναμενόμενη τιμή 2 3, ,...,μ μ μΝ και την απόκλιση 2 3, ,...,σ σ σΝ Εάν υποθέσουμε ότι

1 2 ...μ μ μ μΝ= = = = και 1 2 ...σ σ σ σΝ= = = = και εφαρμόσουμε το κεντρικό οριακό θεώρημα θα πάρουμε :

1

ιι

μ μΝ

=

Χ = = Ν ⋅∑ (4.19)

1x μ μ= Ε ⎡ Χ ⎤ = Ν ⋅ =⎣ ⎦ Ν (4.20)

2 2

22 2 2

1 1

1 1( )N N

ii i

V x VN N ι

σ σσ= =

Ν ⋅= = = =

Ν Ν∑ ∑ (4.21)

Οι παραπάνω σχέσεις μας λένε το εξής : Η αναμενόμεη τιμή κάθε « παρτίδας » μετρήσεων του ίδου μεγέθους συμπεριφέρεται ως τυχαία μεταβλητή με αναμενόμενη τιμή που δίνεται από την σχέση (4.16) και διασπορά από την σχέση (4.17). Καταλήγουμε λοιπόν στο συμπέρασμα ότι πιο κοντά στην « πραγματική » τιμή του μεγέθους είναι η μέση τιμή που υπολογίζεται από την σχέση (4.16) . Όμως εφ’ όσον η μέση τιμή χαρακτηρίζεται από την διασπορά που δίνεται από την σχέση (4.17) δεν μπορούμε να θεωρήσουμε ότι το αποτελεσμά μας συμπίπτει με την «

88

πραγματική » τιμή .Πρέπει λοιπόν να προσδιορίσουμε το σφάλμα δηλαδή την περιοχή τιμών του x μέσα στην οποία βρίσκεται η πραγματική τιμή. Δηλαδή x x xδ= ± (4.22)

Όταν ο αριθμός των μετρήσεων τείνει στο άπειρο ,η διασπορά των μετρήσεων τείνει στο μηδέν και η μέση τιμή δεν είναι πλέον τυχαία μεταβλητή αλλά πραγματικός αριθμός και ίση με την « αληθή » τιμή. Τις περισσότερες φορές όμως είναι πρακτικά αδύνατο να έχουμε στην διαθεσή μας άπειρο αριθμό μετρήσεων. Αντίθετα οι μετρήσεις μας είναι λιγοστές , και συνεπώς αγνοούμε την μέση τιμή x μ= (επειδή είναι τυχαία μεταβλητή ). Επίσης δεν

μπορούμε να βρούμε την διασπορά των μετρήσεων 2σ , γιατί εξ’ορισμού η διασπορά είναι :

2 2

1

1lim( ( ) )N

iN i

V xN

σ μ→∞

=

= = −∑ (4.23)

Στην περίπτωση αυτή όπως θα δούμε στο Κεφάλαιο 6 η Στατιστική μας προσφέρει τα εργαλεία για να εκτιμήσουμε τις παραμέτρους της αναμενόμενης τιμής από την σχέση (4.10) και της διασποράς από την σχέση

2 2

1

1 ( )1 ix

ι

σ μΝ

=

⎛ ⎞= ⋅ −⎜ ⎟Ν −⎝ ⎠∑ (4.24)

Παράδειγμα 4.3 [ 7 ] Ας υποθέσουμε ότι χρησιμοποιώντας μια μετρητική συσκευή παίρνουμε 2000000 μετρήσεις ενός φυσικού μεγέθους Χ του οποίου η αληθής τιμή είναι 10. Από τα αποτελέσματα αυτά μπορούμε να υπολογίσουμε από τις σχέσεις (4.10) και (4.14) η αναμενόμενη τιμή και η διασπορά των μετρήσεων , οι οποίες βρέθηκαν ίσες με 10.00 και 0.63 αντίστοιχα. Βλέπουμε λοιπόν ότι η εκτίμηση της αναμενόμενης τιμής του αποτελέσματος της μέτρησης προσεγγίζει με ικανοποιητική ακρίβεια την αληθή τιμή της μέτρησης. Για λόγους οικονομίας όμως εκτελούμε μόνο είκοσι (20) μετρήσεις και παίρνουμε τα αποτελέσματα : 9.894216,9.895958,9.917391,9.053773,9.564336,9.944962,8.613512,9.892406, 10.12885,10.08975,10.09461,9.642553,9.57625,9.323130,11.34587 9.143096,10.30736,9.235592,10.34878,7.992024,9.700222

89

Υπολογίζουμε και βρίσκουμε τον μέσο όρο των μετρήσεων ίσο με 9.7 και εκτιμούμε την διασπορά των μετρήσεων από την σχέση (4.14) ίση με 0.675 . Συνεπώς η τετραγωνική ρίζα της διασποράς του μέσου όρου δηλαδή το σφάλμα της

μέτρησης θα είναι 0.675 0.1520

=

Συμπεραίνουμε λοιπόν ότι η αληθής τιμή του φυσικού μεγέθους καθώς και η ακρίβεια προσδιορισμού του είναι : 9.7 0.15x = ± H ερμηνεία της Μπεύζιανής σχολής για την παραπάνω μέτρηση είναι η εξής : H αληθής τιμή του φυσικού μεγέθους Χ έχει χαρακτήρα τυχαίας μεταβλητής με κανονική συνάρτηση πυκνότητας πιθανότητας . Κάνοντας είκοσι (20) μετρήσεις του φυσικού μεγέθους Χ αυτό που μπορούμε να γνωρίζουμε για την αληθή τιμή του Χ είναι η πιθανότητα αυτή να βρίσκεται στο διάστημα 9.7 0.15± και η οποία ισούται με

2

2( 9.7)2 (0.15)1( )

2 0.15

Rx

RP x eπ

− −

⋅= ⋅⋅

που παρίσταται στο σχ . 4.4

η διαφορετικά την πιθανότητα η πραγματική τιμή να είναι Rx ( π.χ

8, 9, 10R R Rx x x= = = κ.οκ)

Σχήμα 4.4 Η Bayesian συνάρτηση πυκνότητας πιθανότητας που εκφράζει την Γνώση που αποκόμισαν οι πειραματιστές από τον μέσο όρο των 20 μετρήσεων αναφορικά με την αληθή τιμή της ποσότητας Χ [ 2 ] Η συμβατική στατιστική προσέγγιση για να ερμηνεύσει αυτό το γεγονός χρησιμοποιεί την έννοια του διαστήματος εμπιστοσύνης που θα αναλύσουμε σε επόμενο κεφάλαιο

90

Εχουμε δηλαδή την δυνατότητα να ορίσουμε ένα διάστημα εμπιστοσύνης

[ ]9.7 ,9.7σ σ− + με εμπιστοσύνη λ όπου 2

22 (0.15)12 0.15

y

σ

λπ

−+⋅

= ⋅⋅ ∫

Για παράδειγμα το διάστημα εμπιστοσύνης [ ]9.7 0.15,9.7 0.15− + έχει βαθμό

εμπιστοσύνης 2

20.15

2 (0.15)

0.15

1 68.3%2 0.15

y

eλπ

−+⋅

= ⋅ =⋅ ∫ ενώ το διάστημα

[ ]9.7 0.30,9.7 0.30− + έχει βαθμό εμπιστοσύνης

2

20.30

2 (0.15)

0.30

1 95.45%2 0.15

y

eλπ

−+⋅

= ⋅ =⋅ ∫

Παράδειγμα 4.4 [ 8 ] Σε ένα πείραμα καταμέτρησης κοσμικών ακτίνων που προσπίπτουν σε έναν ανιχνευτή ανα ώρα , έγιναν εννέα μετρήσεις και τα αποτελέσματα καταγράφονται στον παρακάτω πίνακα :

i ix 2( )i mx x−

1 80 400

2 95 25

3 100 0

4 110 100

5 90 100

6 115 225

7 85 225

8 120 400

9 105 25

Σ 900 1500

Η μέση τιμή και η τυπική απόκλιση των μετρήσεων είναι :

900 1009

x = = 2 1500 1888xσ = = η 14xσ = . Αρα η πιθανότητα να υπάρχει

μία μέτρηση στο διάστημα 100 14± είναι 68% . Η τυπική απόκλιση όμως της

μέσης τιμής είναι 14 4.69= Εάν κάποιος κάνει άλλες εννέα μετρήσεις του x , ο νεα

μέση τιμή θα έχει 68% πιθανότητα να βρίσκεται στο διάστημα 100 4.6± .

91

4.9 Απόρριψη αποτελεσμάτων Μερικές φορές όταν μετρούμε επανειλημμένα μια ποσότητα , κάποιο από τα αποτελέσματα μας μπορεί να διαφέρει από τα άλλα. Αν συμβεί αυτό θα πρέπει να αποφασίσουμε αν είναι συνέπεια λαθών στην διαδικασία της μέτρησης , οπότε θα πρέπει να αγνοηθεί , η προκύπτει νομοτελειακά και θα πρέπει να εξεταστεί μαζί με τα άλλα. Θα πρέπει να υπογραμμίσουμε εδώ ότι επειδή όπως είδαμε τα σφάλματα ακολουθούν κανονική κατανομή δεν είναι παράδοξο κάποια μέτρηση να βρίσκεται στα άκρα της κατανομής . Αν λοιπόν πεισθούμε ότι η πειραματική διαδικασία είναι ορθή θα πρέπει να πάρουμε την τελική απόφαση η οποία όμως δεν πρέπει να είναι αυθαίρετη, γιατί θα επιδράσει σημαντικά στο αποτελεσμά μας

4.10 Μέσο βεβαρημένο άθροισμα μετρήσεων Σε πολλές περιπτώσεις μετρούμε το ίδιο μέγεθος με διαφορετική μεθοδολογία και καταλήγουμε σε διαφορετικό αποτέλεσμα με διαφορετικό σφάλμα. Αν υποθέσουμε ότι όλες οι μέθοδοι έχουν δώσει «σωστό » αποτέλεσμα για να καταλήξουμε σε κάποιο συμπέρασμα για την τιμή του μετρούμενου μεγέθους , θα πρέπει να συνδυάσουμε τα παραπάνω αποτελέσματα ετσι ώστε οι « καλές » μετρήσεις ( μικρό σ ) να έχουν μεγαλύτερη βαρύτητα από ότι οι «κακές »( μεγάλο σ). Για παράδειγμα υποθέτουμε ότι η τάση στα άκρα μιάς αντίστασης όπως μετρείται με βολτόμετρο διακριτικής ικανότητας 0.02V είναι 3.11V και όπως μετρείται από άλλο καλύτερο βολτόμετρο διακριτικής ικανότητας 0.01V είναι 3.13V Πώς μπορούν να συνδιασθούν αυτές οι μετρήσεις ; Eάν πάρουμε τέσσερις (4) μετρήσεις ακρίβειας 0.02V τότε το σφάλμα του μέσου όρου των μετρήσεων , όπως έχουμε πεί , θα είναι 0.02 0.01

4V= .Συνεπώς η ακρίβεια μιας μέτρησης του «καλού » βολτομέτρου

ισοδυναμεί με την ακρίβεια τεσσάρων μετρήσεων του «κακού». Μια μέτρηση ακρίβειας 0.01V δηλαδή είναι ισοδύναμη με τέσσερις μετρήσεις ακρίβειας 0.02V και συνεπώς η βαρυτητά της θα είναι τέσσερα. Επομένως καταλήγουμε στον παρακάτω τύπο

1 43.11 3.13 3.1265 5

V V= × + × =

Γενικεύοντας τα παραπάνω αποτελέσματα , στο επόμενο κεφάλαιο θα δείξουμε ότι εάν μία φυσική σταθερά μετριέται σε Ν διαφορετικά πειράματα που το καθένα

92

έχει διαφορετική διασπορά 2ισ η εκτίμηση της αληθούς τιμής του της φυσικής

σταθεράς είναι :

2

1

21

1

Ni

i

x

ι

ι ι

σμ

σ

=

=∑

∑ (4.25)

και η ακρίβεια της εκτίμησης εκφράζεται από την διασπορά της τυχαίας μεταβλητής μ ως :

21

1( )1( )

V

ι ι

μ

σ

Ν

=

=

∑ (4.26)

4.11 Διάδοση Σφαλμάτων [ 13 ] Πολλές φορές στις πειραματικές μετρήσεις , η άμεση μέτρηση κάποιων μεγεθών μα χρησιμεύει για τον έμμεσο υπολογισμό κάποιων άλλων με την χρήση γνωστών τύπων. Ετσι για παράδειγμα μετρώντας το ρεύμα I που διαρρέει έναν αγωγό και την τάση U στα άκρα του μπορούμε από τον τύπο του Ohm να

υπολογίσουμε την αντίσταση URI

= .

Είναι φανερό ότι τα σφάλματα κατά την μέτρηση του U και του I θα έχουν επίδραση και στην R . Στην περίπτωση αυτή λέμε ότι τα σφάλματα συνδυάζονται και διαδίδονται επηρεάζοντας τη τιμή του τελικού μεγέθους. To σφάλμα της εξαρτημένης μεταβλητής που «μεταφέρεται» από την ανεξάρτητη η τις ανεξάρτητες μεταβλητές δίνεται από τους παρακάτω τύπους : - Συνάρτηση μιάς μεταβλητής Ας υποθέσουμε την περίπτωση που το μέγεθος φ είναι συνάρτηση του x . Δηλαδή ( )f xφ = . Εάν xσ είναι το σφάλμα του μεγέθους x ,τότε το σφάλμα του μεγέθους φ , fσ δίνεται από τον τύπο :

2( ) ( ) ( ) f xdf dfV f V xdx dx

σ σ≈ ⇒ ≈ ⋅ (4.27)

. O παραπάνω τύπος ισχύει για μικρά σφάλματα , που σημαίνει ότι η πρώτη παράγωγος ελάχιστα μεταβάλλεται για μικρή μεταβολή του σ . Πρέπει να υπολογίσουμε την τιμή της παραγώγου για την πραγματική τιμή του x .Εάν αυτή δεν είναι γνωστή χρησιμοποιούμε την τιμή μέτρησης του x . Στην ειδική περίπτωση που η ( )f x είναι γραμμική συνάρτηση του x , δηλαδή :

93

f ax b= + (4.28) είχαμε δείξει (σχέση 1.45 ) ότι : 2( ) ( ) f xV f V x aα σ σ= ⇒ = (4.29) Παράδειγμα 4.5 [ 8 ] Εάν η ταχύτητα ενός κινητού είναι 200 10 /u m s= ± , πόσο είναι το διάστημα που θα διανύσει σε 6sec ;.

Aπο τον τύπο su s u tt

= ⇒ = ⋅

Εφαρμόζοντας τον τύπο (4.19) βρίσκουμε το σφάλμα της μετατόπισης s .

( ) 6 10 / 60s u u uds d u t t m s mdu du

σ σ σ σ⋅= ⋅ = = ⋅ = ⋅ = . Συνεπώς το διάστημα s

θα είναι : 200 6 60 1200 60ss u t mσ= ⋅ ± = ⋅ ± = ± - Συνάρτηση δύο μεταβλητών Υποθέτουμε τώρα ότι έχουμε το μέγεθος φ εξαρτάται από δύο μεταβλητές ,δηλαδή ( , )f x yφ = τότε

2 2( ) ( ) ( ) ( ) ( )df dfV f V x V ydx dy

≈ + και (4.30)

2 2 2 2 2( ) ( )f x ydf dfdx dy

σ σ σ= + (4.31)

- Συνάρτηση Ν μεταβλητών Οι παραπάνω τύποι γενικεύονται για Ν μεταβλητές σύμφωνα με την σχέση :

94

[ ]1 2

( ) ( ) .....( ) ( )x x xN

f f fV f Vx x xμ μ μ= = =

⎛ ⎞∂ ∂ ∂= ⎜ ⎟∂ ∂ ∂⎝ ⎠

1

2

( )

( )

.............

( )

x

x

x

fxfx

fx

μ

μ

μ

=

=

=

∂⎛ ⎞⎜ ⎟∂⎜ ⎟⎜ ⎟∂⎜ ⎟∂⎜ ⎟⎜ ⎟⎜ ⎟∂⎜ ⎟⎜ ⎟∂⎝ ⎠

( ') 'Tf V f= ⋅ ⋅ (4.32)

όπου

1

2

...

N

xx

x

x

⎛ ⎞⎜ ⎟⎜ ⎟=⎜ ⎟⎜ ⎟⎜ ⎟⎝ ⎠

είναι το διάνυσμα των Ν μετρήσεων και

1

'2

( )

( )

.............

( )

x

x

x

fxf

f x

fx

μ

μ

μ

=

=

=

∂⎛ ⎞⎜ ⎟∂⎜ ⎟⎜ ⎟∂⎜ ⎟= ∂⎜ ⎟⎜ ⎟⎜ ⎟∂⎜ ⎟⎜ ⎟∂⎝ ⎠

Παράδειγμα 4.6 [ 7 ] Μετρώντας την διαφορά δυναμικου 1V στα άκρα μιάς αντίστασης RR σ± , με ένα βολτόμετρο διακριτικής ικανότητας

1Vσ , μπορούμε να υπολογίσουμε την ένταση

του ηλεκτρικού ρεύματος που διαρρέει την αντίσταση . Ποιο είναι το σφάλμα στη μέτρηση του ρεύματος ;

Σύμφωνα με τον νόμο του Ohm ισχύει : VIR

= .Eπειδή τα V και R είναι

ανεξάρτητα μεταξύ τους , χρησιμοποιώντας την σχέση (4.32) καταλήγουμε :

1

1 1

2 2

2 22 2 2 21

2 4V

I V R R

V VVR R

V R R Rσ

σ σ σ σ

⎛ ⎞ ⎛ ⎞∂ ∂⎜ ⎟ ⎜ ⎟= ⋅ + ⋅ = +⎜ ⎟ ⎜ ⎟∂ ∂⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

= 1

2

21I

σΙ = 1

2

21

V

+2

2R

95

4.12 Συστηματικά σφάλαματα Εάν ένα μετρητικό όργανο έχει διακριτική ικανότητα ας πούμε 1% , τότε οι μετρήσεις μας θα είναι μερικές φορές υψηλές , μερικές φορές χαμηλές και γενικά θα είναι ακανόνιστες .Οπως είπαμε όμως μπορούμε να ελαχιστοποιήσουμε το σφάλμα επαναλαμβάνοντας πολλές φορές την ίδια μέτρηση και υπολογίζοντας τον μέσο όρο των μετρήσεων. Στην περίπτωση όμως που οι μετρήσεις μας αποκλίνουν συστηματικά από την αληθή τιμή κατά xΔ έχουμε να αντιμετωπίσουμε δύο κινδύνους . Πρώτον δεν μπορούμε να ελαττώσουμε την συστηματική απόκλιση με την επανάληψη της μέτρησης . Θα πρέπει να βρούμε κάποιον άλλον ανεξάρτητο τρόπο να προσδιορίσουμε το μέγεθος xΔ και να διορθώσουμε την μέτρησή μας. Δεύτερον το συστηματικό σφάλμα επηρεάζει ολες τις μετρήσεις . Αν δεν το γνωρίζουμε δεν έχουμε κανένα τρόπο να αντιληφθούμε την υπαρξή του από τα δεδομένα μας γιατί αυτά φαίνονται θεωρητικά συνεπή. Εάν για παράδειγμα μετρήσουμε την ένταση του ρεύματος που διαρρέει μια αντίσταση σε διαφορετικές τάσεις , με ένα αμπερόμετρο που έχει συστηματικό σφάλμα , οι μετρήσεις μας θα ικανοποιούν πράγματι τον νόμο του Ohm και η γραφική παράσταση τους θα είναι ευθεία , όμως η κλίση της θα είναι λάθος. Για τον λόγο αυτό οι πειραματικοί επιστήμονες φοβούνται τα συστηματικά λάθη. Ένα πείραμα με μεγάλο συστηματικό σφάλμα είναι εσωτερικά συνεπές με καλή προσαρμογή των αποτελεσμάτων , όμως οι μετρήσεις είναι όλες λανθασμένες Παρ’ όλα αυτά όμως εάν γνωρίζουμε την υπαρξή του μπορούμε με συγκεκριμένες στατιστικές μεθόδους να τα χειριστούμε. Ας υποθέσουμε ότι η μέτρηση της φυσικής ποσότητας Χ ,x , πάσχει επιπλέον του στατιστικού και από συστηματικό σφάλμα. Μπορούμε να θεωρήσουμε ότι η μετρησή μας αποτελείται από δύο μέρη . Ένα τυχαίο Rx με σφάλμα σ και ένα συστηματικό sx με σφάλμα s . Θα έχουμε δηλαδή ότι R Sx x x= + . Συνεπώς η συνολική

διασπορά των μετρήσεων θα ισούται με :

[ ] ( )2 2

2 2 2 2

( )

( ) ( ) 2 ( ) ( ) 2

S R s R s R

s R s R s R S R

s R

V x V x x E x x E x x

E x x x x E x E x E x E x

V x V x

⎡ ⎤⎡ ⎤ ⎡ ⎤= + = + − + =⎣ ⎦ ⎣ ⎦⎢ ⎥⎣ ⎦⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤+ + − − − ⋅⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦⎡ ⎤ ⎡ ⎤+⎣ ⎦ ⎣ ⎦

(4.33)

Συνεπώς τα δύο είδη σφαλμάτων μπορούν να προστεθούν σε τετραγωνική μορφή 2 2 2

tot sσ σ= + (4.34) Ιδιαίτερο ενδιαφέρον έχουν οι παρακάτω περιπτώσεις :

96

- Δύο μεταβλητές με κοινό συστηματικό σφάλμα [ 13 ] Ας υποθέσουμε ότι έχουμε δύο μετρήσεις 1x και 2x , οι οποίες έχουν ένα κοινό συστηματικό σφάλμα ( )s και τυχαία σφάλματα 1σ και 2σ αντίστοιχα. Στην περίπτωση αυτή ισχύει 1 1 1

R Sx x x= + και 2 2 2R Sx x x= + επομένως

[ ] 2 2

1 1V x sσ= + και [ ] 2 22 2V x sσ= +

Η συνδιασπορά των δύο μεταβλητών 1x και 2x είναι : [ ]1 2cov ,x x 2

1 2cov , ( )S Sx x V s s⎡ ⎤= = =⎣ ⎦ Συνεπώς ο πίνακας συνδιασποράς εκφράζεται ως :

[ ] [ ][ ] [ ]

1 1 1 2

2 1 2 2

cov , cov ,cov , cov ,

x x x xx x x x

⎛ ⎞⎜ ⎟⎝ ⎠

2 2 2

12 2 2

2

s ss s

σσ

⎛ ⎞+= ⎜ ⎟

+⎝ ⎠ (4.35)

Στην περίπτωση που εξετάσαμε τα συστηματικά σφάλματα ήταν σταθερά και ανεξάρτητα από την μέτρηση . Όμως στην γενική περίπτωση το σφάλμα εμφανίζεται σαν αναλογία η σαν ποσοστό ,οπότε παύει να είναι σταθερό και εξαρτάται από το αποτέλεσμα της μέτρησης . Εστω λοιπόν οι τυχαίες μεταβλητές 1x και 2x , με τυχαία σφάλματα 1σ και 2σ και συστηματικά σφάλματα 1 1s xε= ⋅ και 2 2s xε= ⋅ Αντίστοιχα. Προφανώς θα ισχύει ότι : 1 1 1

R Sx x x= + , 2 2 2R Sx x x= + και

[ ] 2 2

1 1 1V x xσ ε= + ⋅ και [ ] 2 22 2 2V x xσ ε= + ⋅ και

[ ] 2

1 2 1 2 1 2cov , cov ,s sx x x x x xε⎡ ⎤= = ⋅ ⋅⎣ ⎦

- Τρείς μεταβλητές με κοινό συστηματικό σφάλμα Ας υποθέσουμε ότι έχουμε τρείς μεταβλητές 1x , 2x και 3x , οι οποίες επιπλέον των συστηματικών σφαλμάτων 1σ , 2σ και 3σ ,έχουν ένα κοινό συστηματικό σφάλμα ( )s και ένα άλλο συστηματικό σφάλμα Τ για τις μεταβλητές 1x και 2x μόνο. Στην περίπτωση αυτή ο πίνακας συνδιασποράς θα είναι :

97

[ ] [ ] [ ][ ] [ ] [ ][ ] [ ] [ ]

2 2 2 2 2 211 12 13 1

2 2 2 2 2 221 22 23 2

2 2 2 231 32 33 3

cov cov covcov cov covcov cov cov

x x x s T s T sx x x s T s T sx x x s s s

σσ

σ

⎛ ⎞⎛ ⎞ + + +⎜ ⎟⎜ ⎟ = + + +⎜ ⎟⎜ ⎟

⎜ ⎟ ⎜ ⎟+⎝ ⎠ ⎝ ⎠

(4.36)

Τα πραπάνω αποτελέσματα μπορούν να γενικευτούν για περισσότερες μεταβλητές . Παράδειγμα 4.7 [ 7 ] Ειδαμε στο παράδειγμα 4.6 ότι το σφάλμα στην μέτρηση του ρεύματος 1I που διαρρέει μιάν αντίσταση μεγέθους RR σ± και υπολογίζεται με την μέτρηση της διαφοράς δυναμικού 1V στα άκρα της αντίστασης η οποία μετράται με βολτόμετρο με διακριτική ικανότητα

1Vσ προκύπτει από την σχέση :

1

2

21I

σΙ = 1

2

21

V

+2

2R

Εάν με την ίδια συνδεσμολογία μετρήσουμε το σφάλμα στην ένταση του ρεύματος 2I που διαρρέει την ίδια αντίσταση και έχει διαφορά δυναμικού

22 VV σ± , αυτό θα δίνεται από την σχέση :

2

2

22I

σΙ = 2

2

22

V

+2

2R

Προφανώς το σφάλμα της αντίστασης είναι το ίδιο και στις δύο περιπτώσεις και μπορούμε να πούμε ότι είναι συστηματικό σφάλμα το οποίο ονομάζουμε Rσ Οι μετρήσεις των δύο ρευμάτων συνεπώς θα έχουν μη μηδενική συνδιασπορά επειδή χρησιμοποιήθηκε η ίδια αντίσταση . Η συδιασπορά ισούται με (σχέση 4.36) :

[ ] 2 21 2 1 21 2 2cov , R R

I I I II IR R R

σ σ∂ ∂= ⋅ ⋅ = ⋅∂ ∂

98

ΚΕΦΑΛΑΙΟ 5ο . ΣΥΝΑΡΤΗΣΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ ΤΩΝ ΠΕΙΡΑΜΑΤΙΚΩΝ ΜΕΤΡΗΣΕΩΝ 5.1 Εισαγωγή Στα προηγούμενα κεφάλαια ασχοληθήκαμε με την έννοια της πιθανότητα και εισάγαμε τις έννοιες της τυχαίας μεταβλητής και της συνάρτησης πυκνότητας πιθανότητας . Επίσης εξετάσαμε μερικές ιδανικές συναρτήσεις πυκνότητας πιθανότητας που θεωρούμε ότι προσομοιάζουν σε αρκετά φυσικά φαινόμενα. Εάν γνωρίζουμε την συνάρτηση πυκνότητας πιθανότητας για μια φυσική διαδικασία που μελετάμε , μπορούμε να υπολογίσουμε την πιθανότητα να πάρουμε μια συγκεκριμένη πειραματική μέτρηση. Πρέπει εδώ να διευκρινήσουμε το εξής : Eνα φυσικό φαινόμενο γίνεται αντιληπτό και κατανοητό όταν μπορούμε να το μετρήσουμε . Όμως η «αληθής» τιμή της φυσικής ποσότητας έχει τον χαρακτήρα τυχαίας μεταβλητής για δύο λόγους : α) Η φύση , ιδιαίτερα στον μικρόκοσμο συμπεριφέρεται πιθανοκρατικά.. Επί παραδείγματι , η κινητική ενέργεια του ηλεκτρονίου κατά την β-διάσπαση του πυρήνα Υ σε πυρήνα Χ σύμφωνα με την αντίδραση eY X e v−→ + + (5.1) συμπεριφέρεται σαν τυχαίος αριθμός . Πράγματι , τα θυγατρικά ηλεκτρόνια των διασπάσεων πανομοιότυπων πυρήνων Υ έχουν διαφορετικές ενέργειες , με συνάρτηση πυκνότητας πιθανότητας όπως στο σχ. 5.1

Σχήμα 5.1 Γραφική παράσταση συνάρτησης πυκνότητας της κινητικής Ενέργειας των ηλεκτρονίων κατά την β-διάσπαση. Τα σημεία αντιστοιχούν στις πειραματικές μετρήσεις [2 ] Στα περισσότερα φαινόμενα του μικρόκοσμου , ακόμα και όταν εμπλέκονται ιδανικές μετρητικές συσκευές , η επανάληψη του ίδιου πειράματος καταλήγει σε

99

διαφορετικές τιμές των μετρούμενων φυσικών μεγεθών . Στην περίπτωση αυτή , η συνάρτηση πυκνότητας πιθανότητας της μέτρησης x του φυσικού μεγέθους Χ ταυτίζεται με τη συνάρτηση πυκνότητας πιθανότητας της «πραγματικής τιμής » του μεγέθους Rx . ( ) ( )Rf x f x= (5.2) Βέβαια στην Κλασική Φυσική επειδή τα μεγέθη της διατηρούνται σταθερά η συνάρτηση πυκνότητας πιθανότητας θα είναι : ( ) ( )Rf x x xδ= − (5.3) όπου ( )xδ είναι η συνάρτηση δ του Dirac και Rx είναι η αληθής τιμή της μεταβλητής Χ. β) Οι συσκευές που χρησιμοποιούνται στα πειράματα πάσχουν από « μετρητικές ατέλειες » οι οποίες έχουν ως συνέπεια τα αποτελέσματα της μέτρησης ενός φυσικού μεγέθους να ακολουθούν κάποια συνάρτηση πυκνότητας πιθανότητας, η οποία συνήθως είναι η κανονική . Ετσι η τελική συνάρτηση πυκνότητας πιθανότητας του φυσικού μεγέθους προκύπτει σαν συνισταμένη των δύο παραγόντων που αναλύσαμε προηγουμένως και εκφράζεται με κάποια από τις «ιδανικές » συναρτήσεις πυκνότητας πιθανότητας που παρουσιάσαμε στο κεφ. 3. Όμως υπάρχουν ορισμένες αποκλίσεις από την παραπάνω θεώρηση όταν μελετάμε πραγματικά φαινόμενα όπου υπεισέρχονται πολλοί εξωτερικοί παράγοντες που επηρεάζουν τα αποτελέσματα των μετρήσεων , με αποτέλεσμα η συνάρτηση πυκνότητας πιθανότητας να είναι περισσότερο πολύπλοκη από αυτήν που περιγράφει η σχέση (5.2) :

- Πολλά φυσικά φαινόμενα δεν ακολουθούν τις θεωρητικές συναρτήσεις κατανομής πιθανότητας που εξετάσαμε . Για πολλά από αυτά τα φαινόμενα είναι δύσκολο να τις υπολογίσουμε η δεν έχουν βρεθεί ακόμη

- Το πεδίο τιμών των τυχαίων μεταβλητών της συνάρτησης πυκνότητας πιθανότητας δεν είναι πάντα το [ ],−∞ +∞ όπως υποθέσαμε αλλά περιορίζε- λόγω φυσικών νόμων π.χ Διατήρηση της ενέργειας , η λόγω της πειραματικής συσκευής π.χ ένα Τηλεσκόπιο επεξεργάζεται μια περιοχή συχνοτήτων .

5.2 Διακριτική Ικανότητα των Μετρητικών Διατάξεων [ 13 ] Ας επανέλθουμε τώρα στο παράδειγμα της ραδιενεργού διάσπασης της παραγράφου (5.1) Όπως είδαμε προηγουμένως η ενέργεια των ηλεκτρονίων είναι τυχαία μεταβλητή με συνάρτηση πυκνότητας πιθανότητας έστω ( )Rf E η οποία μπορεί να υπολογιστεί αναλυτικά στο πλαίσιο του θεωρητικού μοντέλου που περιγράφει τις ασθενείς αλληλεπιδράσεις . Όμως η μέτρηση της ενέργειας γίνεται

100

με κάποια πειραματική διάταξη ( αποτελούμενη συνήθως από κρυσταλλικό σπινθηριστή , φωτοπολλαπλασιαστή και ηλεκτρονικούς καταμετρητές ) που έχει ορισμένη διακριτική ικανότητα.. Αυτό έχει σαν αποτέλεσμα να μην μετράμε την αληθή τιμή της ενέργειας RE του ηλεκτρονίου αλλά το m RE δΕ = ± , όπου το δ ακολουθεί την συνάρτηση πυκνότητας πιθανότητας που χαρακτηρίζει την πειραματική διάταξη , ( )f δ . Δηλαδή για ορισμένη τιμή της ενέργειας RE , το αποτέλεσμα της μέτρησης συμπεριφέρεται σαν τυχαία μεταβλητή. Η πιθανότητα να βρεθεί το αποτέλεσμα μιάς μέτρησης στο διάστημα τιμών [ ],m m mE E dE+ , δεδομένου ότι η πραγματική ενέργεια του ηλεκτρονίου είναι RE , Θα είναι : ( )( / ) ;m R m R mP E E g E E dE= (5.4) H δεσμευμένη συνάρτηση πυκνότητας πιθανότητας ονομάζεται συνάρτηση διακριτικής ικανότητας της μετρητικής διάταξης . Η συνάρτηση ( ; )m Rg E E εξαρτάται αποκλειστικά από την μετρητική διάταξη και είναι ανεξάρτητη του μηχανισμού παραγωγής των ηλεκτρονίων. Για την κανονικοποίηση της ( ; )m Rg E E ισχύει ότι :

( ; ) 1m R mg E E dE+∞

−∞

=∫ RE∀

H σχέση (5.4) μπορεί να γραφεί ισοδύναμα : ( )( / ) ( ) ; ( )m R R m R R R mP E E P E g E E f E dE dE⋅ = ⋅ ⋅ ⋅ (5.5) πολ/ζοντας τα δύο μέλη της με την πιθανότητα ( ) ( )R R RP E f E dE= ⋅ δηλαδή την πιθανότητα η αληθής τιμή να βρίσκεται στο διάστημα [ ],R R RE E dE+ Η σχέση (5.5) μας δίνει την πιθανότητα να βρίσκεται το αποτέλεσμα της μέτρησης στο διάστημα τιμών [ ],m m mE E dE+ , δεδομένου ότι η αληθής τιμή της ενέργειας

περιέχεται στο διάστημα τιμών [ ],R R RE E dE+ . Η πιθανότητα να είναι το αποτέλεσμα της μέτρησης ίσο με mE , ανεξάρτητα της αληθούς τιμής της ενέργειας του ηλεκτρονίου , θα δίνεται από το ολοκλήρωμα της σχέσης (5.5) ως ακολούθως :

( ) ( ; ) ( ) ( )m m R R R m m mP E g E E f E dE dE q E dE+∞

−∞

⎡ ⎤= ⋅ ⋅ = ⋅⎢ ⎥⎣ ⎦∫ (5.6)

όπου ( ) ( ; ) ( )m m R R Rq E g E E f E dE+∞

−∞

= ⋅ ⋅∫ (5.7)

101

είναι συνάρτηση πυκνότητας πιθανότητας του αποτελέσματος της μέτρησης . Η σχέση (5.6) μας λέει ότι εάν η πραγματική τιμή της ενέργειας του ηλεκτρονίου είναι RE , εμείς θα μετρήσουμε την τιμή mE με πιθανότητα

( ; )m Rg E E Στην σχέση (5.7) επιβεβαιώνουμε αυτό που αναφέραμε πιο πάνω , δηλαδή ότι η τελική συνάρτηση πυκνότητας πιθανότητας του μετρούμενου φυσικού μεγέθους εμπεριέχει σαν συνιστώσες τόσο την συνάρτηση διακριτικής ικανότητας του οργάνου

( ; )m Rg E E , όσο και την συνάρτηση πυκνότητας πιθανότητας του φυσικού φαινομένου ( )Rf E Η συνάρτηση της διακριτικής ικανότητας ( ; )m Rg E E θεωρήσαμε ότι εξαρτάται από την πραγματική τιμή RE της μετρούμενης ποσότητας . Η εξάρτηση αυτή μπορεί να είναι σχετικά απλή . Για παράδειγμα , η διακριτική ικανότητα μπορεί να είναι συνάρτηση της διαφοράς EΔ μεταξύ της αληθούς τιμής και του αποτελέσματος της μέτρησης , όπως φαίνεται στην παρακάτω σχέση. :

2

2( )

21( ; ) ( )2

m RE E

m Rg E E g E e σ

σ π

−−

⋅= Δ = ⋅ =⋅ ⋅

. 2

2( )21

2

E

e σ

σ π

Δ−

⋅⋅⋅ ⋅

(5.8)

όπου το σ εκφράζει μια χαρακτηριστική σταθερά της μετρητικής συσκευής . Στις περισσότερες των περιπτώσεων , για λόγους που επιβάλλονται από τις φυσικές διεργασίες της μέτρησης , η παράμετρος σ εξαρτάται από την αληθή ενέργεια του ηλεκτρονίου , επί παραδείγματι με σχέσεις της μορφής :

( )RR

aE

σ σ β≡ Ε = + (5.9)

Eίναι προφανές ότι στην περίπτωση αυτή η συνάρτηση διακριτικής ικανότητας εξαρτάται άμεσα από την αληθή τιμή της ενέργειας του προσπίπτοντος ηλεκτρονίου. Παρατηρούμε ότι τα όρια ολοκλήρωσης των σχέσεων (5.6) , (5.7) εκτείνονται από το μείον άπειρο εως το σύν άπειρο. Πολλά φυσικά μεγέθη όμως , όπως η ενέργεια που εξετάσαμε δεν μπορεί να πάρει αρνητικές τιμές , ούτε να υπερβεί μια μέγιστη τιμή που επιβάλλεται από την αρχή διατήρησης της ενέργειας .Σε τέτοιες περιπτώσεις θα πρέπει να περιοριστούμε σε φυσικά αποδεκτές τιμές περιοχές τιμών τροποποιώντας την κανονικοποίηση των συναρτήσεων πιθανότητας . Υποθέτουμε ότι η φυσική ποσότητα Χ έχει πεδίο ορισμού το διάστημα [ ],a b Η πυκνότητα της Χ συνήθως είναι μία από τις ιδανικές κατανομές πιθανότητας όπως π.χ η κανονική . Οι κατανομές αυτές συνήθως κανονικοποιούνται ως :

102

( ) 1f x dx+∞

−∞

=∫ (5.10)

Προκειμένου να χρησιμοποιήσουμε την ( )f x για να εκφράσουμε την συνάρτηση πυκνότητας πιθανότητας της φυσικής ποσότητας Χ , ( )g x , θα πρέπει να προβούμε στην ακόλουθη τροποποίηση :

( )( )( )

b

a

f xg xf x dx

=

∫ (5.11)

H συνάρτηση ( )g x είναι κανονικοποιημένη στο διάστημα [ ],a b

( ) 1b

a

g x dx⎛ ⎞

=⎜ ⎟⎝ ⎠∫ , αλλά στις περισσότερες περιπτώσεις έχει περισσότερο πολύπλοκο

τύπο από την ( )f x Σε ορισμένες περιπτώσεις ο περιορισμός του πεδίου ορισμού της συνάρτησης είναι καλοδεχούμενος . Όπως συμβαίνει για παράδειγμα στην συνάρτηση πυκνότητας πιθανότητας Cauchy :

2

1 1( )1

f xxπ

= ⋅+

(5.12)

H συνάρτηση αυτή βρίσκει πολλές εφαρμογές στην περιγραφή καταστάσεων συντονισμού , έχει σαν μειονέκτημα όμως ότι δεν μπορούμε να ορίσουμε την αναμενόμενη τιμή , την διασπορά κ.λ.π της μεταβλητής x γιατί όπως φαίνεται στο σχ. αυτές απειρίζονται . Όταν όμως περιορίσουμε το πεδίο ορισμού της τυχαίας μεταβλητής επί παραδείγματι στην περιοχή [ ],A A− , η προκύπτουσα συνάρτηση πυκνότητας πιθανότητας ;

2

1( ) 1( )

2 arctan( )( )

b

a

f x xg xA

f x dx

+= =⋅

∫ (5.13)

έχει πεπερασμένη αναμενόμενη τιμή :

( ) ( ) 0A

A

E x x g x dx+

= ⋅ ⋅ =∫ (5.14)

και διασπορά :

103

2( ) ( ) 1arctan

A

A

AV x x g x dxA

+

= ⋅ ⋅ = −∫ (5.15)

5.3 Αποδοχή και Αποδοτικότητα της Μετρητικής διάταξης [ 13 ] Στην προηγούμενη ενότητα αναλύσαμε το γεγονός ότι το αποτέλεσμα της μέτρησης ενός φυσικού μεγέθους Χ εξαρτάται από την συνάρτηση πυκνότητας πιθανότητας της φυσικής μεταβλητής , λόγω της πιθανοκρατίας στον μικρόκοσμο ,και από την συνάρτηση πυκνότητας πιθανότητας της μετρητικής διάταξης , λόγω των σφαλμάτων από τα οποία αυτή πάσχει. Σιωπηρά υποθέσαμε ότι η μετρητική συσκευή δέχεται και επεξεργάζεται το 100% του σήματος που εκπέμπεται από την πηγή. Πρακτικά όμως αυτό είναι ανέφικτο . Κάθε μετρητική διάταξη έχει πεπερασμένες διαστάσεις με αποτέλεσμα να αποκόπτεται ένα ποσοστό του σήματος που εκπέμπει η πηγή. Επιπλέον , άλλα φαινόμενα που συμβαίνουν κατά την διάρκεια της μέτρησης επηρεάζουν την λειτουργία των οργάνων και συνεισφέρουν στον νεκρό χρόνο της διάταξης. Οι παράγοντες αυτοί έχουν σαν αποτέλεσμα την μείωση της αποδοτικότητας τη διάταξης και στην αλλοίωση της πραγματικής συνάρτησης πυκνότητας πιθανότητας του υπό μέτρηση φυσικού μεγέθους . Για παράδειγμα , θέλουμε να μετρήσουμε την φασματική κατανομή της ηλεκτρομαγνητικής ακτινοβολίας κάποιας φωτεινής πηγής που εκπέμπει στην περιοχή μηκών κύματος [ ],a bλ∈ . Η πιθανότητα ένα εκπεμπόμενο φωτόνιο από

την πηγή να έχει μήκος κύματος στην περιοχή τιμών [ ], dλ λ λ+ εκφράζεται από την συνάρτηση πυκνότητας πιθανότητας ( )f λ . Από τις συλλεγόμενες μετρήσεις , προσδιορίζουμε την φασματική κατανομή ως :

0

'

'( ) lim'i

infNδλ

λ→

Ν →∞

= (5.16)

όπου 'in είναι ο αριθμός των φωτονίων που καταμετρήθηκαν από την μετρητική συσκευή με μήκη κύματος στην περιοχή τιμών [ ],i iλ λ λ+ Δ και 'Ν είναι ο συνολικός αριθμός των καταμετρουμένων φωτονίων ανεξαρτήτως μήκους κύματος . Είναι σαφές ότι ένας αριθμός φωτονίων που εκπέμπει η πηγή δεν φτάνουν καθόλου στην μετρητική διάταξη λόγω της απορροφησής τους από τον αέρα , τα υλικά της συσκευής κ.λ.π Επισης ένα μικρό ποσοστό των φωτονίων που φθάνουν στην μετρητική διάταξη παράγουν ανιχνεύσιμα ηλεκτρόνια μέσω των οποίων ανιχνεύονται τα φωτόνια .

104

Συνεπώς η ( )f λ που βρίσκουμε με την σχέση εκφράζει την πυκνότητα πιθανότητα των μετρήσεων και όχι την πραγματική φασματική κατανομή της πηγής . Για να βρούμε την συνάρτηση πυκνότητας πιθανότητας της πηγής θα πρέπει να προσδιορίσουμε την συνάρτηση πυκνότητας πιθανότητας ανίχνευσης κάθε φωτονίου ( συνάρτηση αποδοτικότητας της μετρητικής συσκευής ). Θα θεωρήσουμε χάριν απλότητας ότι η συνάρτηση πυκνότητας πιθανότητας ανίχνευσης του φωτονίου, ( , )ε λ θ εξαρτάται απο το μήκος κύματος του και την γωνία που σχηματίζει η διεύθυνση του φωτονίου με κάποιον άξονα συμμετρίας της πειραματικής διάταξης . Αν ( , )g λ θ είναι η συνάρτηση πυκνότητας πιθανότητας εκπομπής των φωτονίων από την πηγή , η συνάρτηση πυκνότητας πιθανότητας ( )f λ θα είναι :

2

02

0

( , ) ( , )( )

( , ) ( , )b

a

g df

g d d

π

π

λ θ ε λ θ θλ

λ θ ε λ θ θ λ

⋅ ⋅=

⋅ ⋅ ⋅

∫ ∫ (5.17)

Στην απλούστερη περίπτωση που η αποδοτικότητα της συσκευής εξαρτάται μόνο από το μήκος κύματος ( , ) ( )ε λ θ ε λ→ η γίνεται :

22

002 2

0 0

( ) ( , )( , ) ( , )( ) ( )( )

( , ) ( , ) ( ) ( )( ) ( , )b bb

a aa

g dg dGf

g d d G dg d d

ππ

π π

ε λ λ θ θλ θ ε λ θ θε λ λλ

λ θ ε λ θ θ λ ε λ λ λε λ λ θ θ λ

⎡ ⎤⋅ ⋅⋅ ⋅ ⎢ ⎥

⋅⎣ ⎦= = =⎡ ⎤

⋅ ⋅ ⋅ ⋅ ⋅⋅ ⋅ ⋅⎢ ⎥⎣ ⎦

∫∫

∫ ∫ ∫∫ ∫

(5.18)

όπου 2

0

( ) ( , )G g dπ

λ λ θ θ= ∫

Γενικεύοντας το αποτελέσματα του παραδείγματος , έστω ότι οι φυσικές ποσότητες 1 2, , ,..., kt x x x χαρακτηρίζουν τα αποτελέσματα μιάς φυσικής διεργασίας που μελετάμε πειραματικά . Εστω η κοινή συνάρτηση πυκνότητας πιθανότητας των αληθών τιμών των φυσικών ποσοτήτων 1 2( , , ,..., )kg t x x x . Εστω επίσης η συνάρτηση 1 2( , , ,..., )kt x x xε που εκφράζει την αποδοτικότητα της μετρητικής διάταξης να ανιχνεύσει την φυσική διεργασία και να μετρήσει την μεταβλητή t . Η συνάρτηση πυκνότητας πιθανότητας του αποτελέσματος της μέτρησης της μεταβλητής t , εκφράζεται από την ακόλουθη σχέση :

105

1 2

1 2

1 2 1 2 1 2

1 2 1 2 1 2

... ( , , ,..., ) ( , , ,..., ) ...( )

... ( , , ,..., ) ( , , ,..., ) ...k

k k k

k k kt

g t x x x t x x x dx dx dxf t

g t x x x t x x x dx dx dx dt

κ

ε

ε

Ω Ω Ω

Ω Ω Ω Ω

⋅ ⋅ ⋅

=⎡ ⎤

⋅ ⋅⎢ ⎥⎢ ⎥⎣ ⎦

∫ ∫ ∫

∫ ∫ ∫ ∫ (5.19)

όπου 1 2, ,...,t κΩ Ω Ω Ω είναι τα πεδία ορισμού των μεταβλητών 1 2, , ,..., kt x x x . Εάν λάβουμε υπ’ όψιν μας και την διακριτική ικανότητα της συσκευής μέτρησης με συνάρτηση πυκνότητας πιθανότητας 1 2( ; , , ,..., )m R R R R

kR t t x x x , η συνάρτηση πυκνότητας πιθανότητας των αποτελεσμάτων της μέτρησης θα δίνεται από την ακόλουθη σχέση :

5.4 Ολοκλήρωση Monte Carlo 5.4.1 Εισαγωγή Ο υπολογισμός ολοκληρωμάτων της μορφής (5.20) είναι δύσκολο αν όχι αδύνατο να γίνει με τις συνηθισμένες αναλυτικές η αριθμητικές μεθόδους επίλυσης ολοκληρωμάτων. Η δυσκολία έγκειται στην συνήθως πολύπλοκη μορφή της υπό ολοκλήρωση συνάρτησης και στο γεγονός ότι τις περισσότερες φορές οι συναρτήσεις της διακριτικής ικανότητας και αποδοτικότητας είναι σύνθετες . Ένας τρόπος επίλυσης τέτοιων ολοκληρωμάτων είναι με την τεχνική Monte Carlo. H μέθοδος Monte Carlo απαιτεί την πραγματοποίηση των ακόλουθων βημάτων :

1. Eκλογή της συνάρτησης πυκνότητας πιθανότητας που περιγράφει το πρόβλημά μας

2. Παραγωγή τυχαίων αριθμών από το πεδίο ορισμού της συνάρτησης πυκνότητας πιθανότητας

3. Εκτίμηση της τιμής του ολοκληρώματος Βλέπουμε λοιπόν ότι η μέθοδος Monte Carlo είναι στατιστική μέθοδος και η ακριβειά της εξαρτάται εκτός των άλλων παραγόντων από την επιλογή των τυχαίων αριθμών. Η εξάρτηση της τιμής του ολοκληρώματος ,που πρέπει να είναι ένας ορισμένος αριθμός , από την επιλογή των τυχαίων αριθμών , δημιουργεί κατ αρχάς αμφιβολίες για την αξιοπιστία ης μεθόδου, οι οποίες όμως θα παραμεριστούν όταν διαπιστώσουμε παρακάτω την μεγάλη της ακρίβεια. Πρίν αναπτύξουμε την την μέθοδο Monte Carlo θα πρέπει να ορίσουμε την έννοια των τυχαίων αριθμών.

106

5.4.2 Τυχαίοι αριθμοί

Μπορούμε να κατατάξουμε τους τυχαίους αριθμούς σε δύο κατηγορίες :

- Πραγματικοί τυχαίοι αριθμοί - Ψευδοτυχαίοι αριθμοί

5.4.2.1 Πραγματικά τυχαίοι αριθμοί. Οι αριθμοί αυτοί βασίζονται σε διάφορες φυσικές διαδικασίες όπως :

- O χρόνος που μεσολαβεί στην άφιξη δύο κοσμικών ακτίνων. - Ο αριθμός των διασπάσεων ενός ραδιενεργού υλικού σε ορισμένο χρόνο - Η ρίψη ενός ζαριού.

Αναφέρομαι ένα παράδειγμα που θα μπορούσαμε να παράγουμε τυχαίουα αριθμούς χρησιμοποιώντας την περίπτωση την ραδιενεργού διάσπασης. Με την χρήση ενός ανιχνευτή καταγράφουμε τον αριθμό των διασπάσεων που συμβαίνουν σε ορισμένο χρόνο. Επαναλαμβάνουμε το πείραμα αυτό πολλές φορές . Εάν ο αριθμός των διασπάσεων είναι περιττός καταγράφουμε 1, ενώ εάν είναι άρτιος καταγράφουμε 0. Εάν μετατρέψουμε τώρα του δυαδικούς σχηματισμούς που θα πάρουμε στο δεκαδικό σύστημα , θα έχουμε παράγει μια ομάδα τυχαίων αριθμών. Ατυχώς , με την διαδικασία αυτή δεν προκύπτει ομοιόμορφη κατανομή , εάν η πιθανότητα να έχουμε περιττό αριθμό δεν είναι ισοδύναμη με την πιθανότητα να έχουμε άρτιο.Γι’ αυτό παίρνουμε ζεύγη αριθμών. Εάν και οι δύο αριθμοί του ζεύγους είναι όμοιοι τους απορρίπτουμε , εάν είναι διαφορετικοί κρατάμε τον δεύτερο. Η πιθανότητα δηλαδή να καταλήξουμε στον αριθμό 1 , είναι ίση με την πιθανότητα ο πρώτος αριθμός να είναι 0 και ο δεύτερος 1.Υποθέτοντας ότι οι μετρήσεις μας είναι ανεξάρτητες κάθε μέτρηση έχει την ίδια πιθανότητα και συνεπώς οι αριθμοί που παίρνουμε θα είναι τυχαίοι. Η διαδικασία αυτή βέβαια είναι χρονοβόρα. Για να πάρουμε 24 ζεύγη μετρήσεων θα χρειαστούμε 96 μετρήσεις εάν υπολογίσουμε και τις μετρήσεις που απορρίπτουμε . Για τον λόγο αυτό καταφεύγουμε στην παραγωγή ψευδοτυχαίων αριθμών με Η/Υ

5.4.2.2 Ψευδοτυχαίοι αριθμοί Ο ι αριθμοί αυτοί δεν είναι στην πραγματικότητα τυχαίοι ,αλλά παράγονται με αυστηρά μαθηματικό τρόπο ξεκινώντας από κάποια αρχή.Παραγοντάς τους όμως με κάποια λογική διαδικασία δεν μπορεί να είναι τυχαίοι. Θα μπορούσε όμως οι αριθμοί αυτοί να είναι στατιστικώς τυχαίοι. Αυτό σημαίνει ότι μπορούμε να τους ελεγξουμε στατιστικά αν απομακρύνονται σημαντικά από την τυχαιότητα και επομένως στην

107

περίπτωση που δεν απομακρύνονται , μπορούμε για κάθε πρακτικό σκοπό να θεωρούμε ότι συμπεριφέρονται σαν τυχαίοι αριθμοί , δηλαδή κατανέμονται ομοιόμορφα και είναι στατιστικώς ανεξάρτητοι. Υπάρχουν αρκετά προγράμματα παραγωγής ψευδοτυχαίων αριθμών με Η/Υ τα οποία όμως δεν θα αναφέρουμε εδώ.

5.4.3 Ολολήρωση Monte Carlo Υπάρχουν δύο μέθοδοι ολοκλήρωσης Monte Carlo , η απλής μέθοδος και η μέθοδος επιτυχίας –απώλειας 5.4.3.1 A. Mέθοδος (απλή ) Εστω ότι επιθυμούμε να υπολογίσουμε το ολοκλήρωμα :

( )b

a

I g u du= ∫ (5.20)

για κάποια συνάρτηση g της τυχαίας μεταβλητής u . Υποθέτουμε ακόμα ότι η μεταβλητή u παίρνει τιμές σύμφωνα με την ομοιόμορφη συνάρτηση πυκνότητας

πιθανότητας 1( )f ub a

=−

για a u b≤ ≤

Για να υπολογίσουμε λοιπόν το ολοκλήρωμα της (5.21) ακολουθούμε τα παρακάτω βήματα. : Bήμα 1: επιλέγουμε ισοπίθανα Ν πραγματικούς αριθμούς στο διάστημ

( 1,2,3,..., )iu i N= Bήμα 2 : υπολογίζουμε τις αντίστοιχες τιμές της συνάρτησης ( )ig u και

Bήμα 3 :εφαρμόζουμε την σχέση 1

( )N

ii

b aI g u IN =

−= ⋅ =∑

Επειδή για τον υπολογισμό του ολοκληρώματος I ,χρησιμοποιήσαμε τυχαίους αριθμούς είναι ευνόητο ότι το I θα είναι τυχαία μεταβλητή η οποία σύμφωνα με το κεντρικό οριακό θεώρημα ακολουθεί κανονική κατανομή

2

( )21( )

2

I I

I

g I e σ

π σΙ

− −

= ⋅⋅

(5.21)

με αναμενόμενη τιμή ( )( )I E g b a= − και διασπορά η οποία για μεγάλο αριθμό Ν προσεγγίζεται από την σχέση :

108

2σΙ= ( )22 21( ) ( ( )) ( )b a g u g u

N⎡ ⎤− ⋅ ⋅ −⎣ ⎦

(5.22)

Προφανώς όσο μεγαλύτερο είναι το Ν (ο αριθμός των τυχαίων αριθμών ) τόσο καλύτερη είναι η εκτίμηση του ολοκληρώματος Παράδειγμα 5.1 Ας υποθέσουμε ότι θέλουμε να εκτιμήσουμε το ολοκλήρωμα

2

1 1( )

0 0

x yI e dxdy+= ∫ ∫

Ακολουθώντας τον παραπάνω αλγόριθμο φτιάχνουμε το ακόλουθο πρόγραμμα

[ ][ ]

[ ] [ ] [ ]

2, ( ) ;

; 10000; 0

, , ;

Pr int /

g x y Exp x y

seedRandom n s

Do s s q Random Random n

s n

∧⎡ ⎤= +⎣ ⎦= =

⎡ ⎤⎡ ⎤= + ⎣ ⎦⎣ ⎦

Το αποτέλεσμα που προκύπτει είναι 4.89727 Eίναι ενδιαφέρον να αναφέρουμε ότι ο Αριθμητικός υπολογισμός του ολοκληρώματος δίνει : 4.89916

5.4.3.2 Β. Μέθοδος ( Επιτυχίας – Απώλειας ) Μια άλλη μέθοδος υπολογισμού του ολοκληρώματος είναι με την μέθοδο Επιτυχίας – Απώλειας Monte Carlo . Στην μέθοδο αυτή χρειαζόμαστε δύο τυχαίους αριθμούς για κάθε υπολογισμό της ( )g u . Οι αριθμοί αυτοί ορίζουν ένα σημείο στο ορθογώνιο παραλληλόγραμμο που ορίζεται από το μέγιστο maxg και ελάχιστο ming της συνάρτησης ( )g u και τα όρια της ολοκλήρωσης a και b . (Σχ. 5.2 ) [ ],iu R a b= .Τυχαίοι αριθμοί σύμφωνα με ομοιόμορφη συνάρτηση

πυκνότητας πιθανότητας στο διάστημα [ ],a b

109

[ ],iz R κ λ= .Τυχαίοι αριθμοί σύμφωνα με ομοιόμορφη συνάρτηση

πυκνότητας πιθανότητας στο διάστημα [ ],κ λ όπου mingκ ≤ και maxgλ ≥

Σχήμα 5.2 Μέθοδος αποτυχίας απώλειας [ 2 ] Ορίζουμε σαν επιτυχία εάν ( )i iz g u≤ Και ορίζουμε σαν αποτυχία όταν : ( )i iz g u≥ . Eάν μετά από Ν δοκιμές δηλαδή Ν επιλογές ζευγών ,i iu z είχαμε n επιτυχίες και ( )N n− απώλειες η εκτίμηση του ολοκληρώματος θα εκφράζεται από την σχέση :

( ) ( ) ( )nI b a b aN

λ κ κ= ⋅ − ⋅ − + ⋅ − (5.23)

H ποσότητα I είναι τυχαία μεταβλητή με αναμενόμενη τιμή ( ) ( ) ( ) ( )E I p b a b a Iλ κ κ= ⋅ − ⋅ − + ⋅ − = (5.24) και διασπορά :

1 ( ( ) ) (( ) )V I I b a b a Iκ λ⎡ ⎤ = ⋅ − − ⋅ ⋅ − ⋅ −⎣ ⎦ Ν (5.25)

110

Από την (5.35) και το σχ. συμπεραίνουμε ότι η διασπορά της τυχαίας μεταβλητής I ελαχιστοποιείται με τρείς τρόπους : - Mεγάλο αριθμό δοκιμών Ν

- Ο παράγοντας κ να πάρει την μέγιστη τιμή δηλαδή mingκ = - Ο παράγοντας λ να πάρει την ελάχιστη τιμή δηλαδή maxgλ =

Ο ταν mingκ ≤ η maxgλ ≥ τότε γίνεται σπατάλη τυχαίων αριθμών , δηλαδή επιλέγουμε ζεύγη τυχαίων αριθμών τα οποία στην συνέχεια θα απορριφθούν , χωρίς να συνεισφέρουν στην ακρίβεια της εκτίμησης . Εάν δεν γνωρίζουμε το μέγιστο και ελάχιστο της υπο ολοκλήρωση συνάρτησης , τα εκτιμούμε με κάποια ασφάλεια Για να έχει πρακτική σημασία η (5.25) θα πρέπει να γνωρίζουμε εκ των προτέρων την τιμή του ολοκληρώματος I . Επειδή αυτό συνήθως δεν συμβαίνει στην σχέση (5.35) αντικαθιστούμε I I→ , οπότε παίρνουμε :

1 ( ( ) ) (( ) )V I I b a b a Iκ λ⎡ ⎤ = ⋅ − − ⋅ ⋅ − ⋅ − =⎣ ⎦ Ν

2 22 (1 ) ( ) ( )n n b a

N Nλ κ⋅ − ⋅ − ⋅ −

επομένως η τιμή του ολοκληρώματος θα είναι :

( )I I V I= ± = ( ) ( ) ( )n b a b aN

λ κ κ= ⋅ − ⋅ − + ⋅ − ±

[ ]1 (1 ) ( ) ( )nn b aN N

λ κ⋅ ⋅ − ⋅ − ⋅ − (5.26)

Μπορούμε να προσεγγίσουμε γεωμετρικά την παραπάνω μέθοδο ως εξής ¨ Για να υπολογίσουμε το εμβαδό ( δηλαδή το ολοκλήρωμα ) που καλύπτει μια συνάρτηση σχεδιάζουμε μια περιοχή που περικλείει το ζητούμενο εμβαδό. Στην περιοχή αυτή ρίχνουμε Ν τυχαία σημεία που προέρχοντα από ομοιόμορφη κατανομή. Από τα σημεία αυτά υπάρχουν n που πέφτουν στην περιοχή του οποίου το εμβαδό

θέλουμε να υπολογίσουμε. Ο λόγος του πλήθους σημείων , nN

, δίνει το ποσοστό από

το εμβαδό του παραληλογράμμου που αντιστοιχεί στο ολοκλήρωμα (5.26) (σχ. )

111

Η παραπάνω μέθοδος Monte Carlο εύκολα γενικεύεται σε εκτιμήσεις πολλαπλών ολοκληρωμάτων επιλέγοντας τυχαία σημεία στο χώρο ολοκλήρωσης ( )i ix x→ , και έναν αριθμό μεταξύ ελάχιστης και μέγιστης τιμής της υπο

ολοκλήρωση συνάρτησης στον χώρο ολοκλήρωσης ( )i iz z→ , και εφαρμόζουμε τα κριτήρια χαρακτηρισμού του αποτελέσματος της δοκιμής ως «επιτυχία » η «απώλεια ». Η εκτίμηση του ολοκληρώματος εκφράζεται με την σχέση (5.36) αντικαθιστώντας τον όρο ( )b a− με τον «όγκο » της περιοχής ολοκλήρωσης . Στα προηγούμενα θεωρήσαμε οι τυχαίοι αριθμοί προέρχονται από ομοιόμορφη κατανομή στο διάστημα [ ]0,1 . Σε αρκετά όμως προβλήματα που επιλύουμε με την μέθοδο Monte Carlo χρησιμοποιούμε την παραγωγή τυχαίων αριθμών και από άλλες κατανομές π.χ κανονική , Poisson , διωνυμική κ.λ.π. Για τον λόγο αυτό έχουν αναπτυχθεί διάφορες μέθοδοι παραγωγής τυχαίων αριθμών , που θα εξετάσουμε πιο κάτω ,όπως η μέθοδος της απόρριψης , βεβαρημένου αθροίσματος ,αντιστροφής κ.λ.π Παράδειγμα 5.2 Υπολογισμός του π Ας δούμε με ποιόν τρόπο μπορούμε να χρησιμοποιήσουμε την μέθοδο αυτή για τον υπολογισμό του π. Σχεδιάζουμε ένα τεταρτοκύκλιο με ακτίνα την μονάδα . Για τον υπολογισμό του π αρκεί να υπολογίσουμε το εμβαδό του τεταρτοκυκλίου :

21 1 44 4

E r E Eπ π π= ⇒ = ⇒ =

H ρίψη τυχαίων σημείων στην περιοχή του τετραγώνου μας δίνει το σκιασμένο εμβαδόν που ισούται με :

.n nE E EN Nτετρ= ⇒ =

όπου αυξάνουμε το Ν κατά ένα κάθε φορά που η απόσταση του τυχαίου σημείου ( , )x y από την αρχή των αξόνων είναι μικρότερη της ακτίνας του τεταρτοκυκλίου 2 2 1d x y= + ≤

112

Σχ. 5.3 Υπολογισμός του π Παράδειγμα 5.3 [7 ] Πρόβλημα της βελόνας του Buffon (1777). Mιά βελόνα μήκους d ρίχνεται τυχαία στο επίπεδο που είναι χωρισμένο με παράλληλες γραμμές σε απόσταση d η μία από την άλλη (σχ. 5.4 ). Ποια είναι η πιθανότητα ότι η βελόνα θα διασταυρώσει μία από τις ευθείες του επιπέδου ; Η λύση του προβλήματος βα σίζεται στην μέθοδο «επιτυχίας –απώλειας » με Monte Carlo , που αναπτύξαμε προηγουμένως. Σχήμα 5.4 Το μέσον της βελόνας απέχει κατά χ από την πλησιέστερη Παράλληλο και η διευθυνσή της σχηματίζει γωνία θ με τις Ευθείες παράλληλες γραμμές 2

x

h

113

Eπειδή η θέση και ο προσανατολισμός κατά την στιγμή της ρίψης της βελόνας είναι τυχαία , θα πρέπει η απόσταση του κέντρου της βελόνας από την πλησιέστερη γραμμή , x , και η γωνία που σχηματίζει η βελόνα με την κάθετο προς τις παράλληλες γραμμές ,θ , να κατανέμονται με ίσες πιθανότητες στα διαστήματα

0,2d⎡ ⎤

⎢ ⎥⎣ ⎦ και 0,

2π⎡ ⎤

⎢ ⎥⎣ ⎦ αντίστοιχα. Επομένως οι δύο τυχαίες μεταβλητές x και θ θα

προέρχονται από ομοιόμορφη συνάρτηση πυκνότητας πιθανότητας που είναι :

1 2( )0

2

g x d d= =

− 1 2( )

02

w θ π π= =

− (5.27)

Για κάποια συγκεκριμένη γωνία 0θ θ= η πιθανότητα η βελόνα να διασταυρώσει μία ευθεία , ( το γεγονός αυτό ονομάζουμε «επιτυχία» ) είναι :

0cos( / ) cosh df ΄

d dθεπιτυχι α θ θ θ⋅

= = = = (5.28)

όπου h είναι η προβολή της βελόνας προς την κάθετο των παράλληλων γραμμών του επιπέδου. Η πιθανότητα επιτυχίας για κάθε τιμή της γωνίας θ , θα προκύπτει με ολοκλήρωση της (5.38) δηλαδή :

2 2

0 0

2 2( / ) ( ) cosP f ΄ w d d

π π

επιτυχι α θ θ θ θ θπ π

= ⋅ ⋅ = ⋅ ⋅ =∫ ∫ . (5.29)

Bασιζόμενοι στο αποτέλεσμα αυτό διάφοροι ερευνητές προσπάθηασαν να μετρήσουν την τιμή του π , ως εξής : Eάν ρίξουμε την βελόνα Ν φορές και μετρήσουμε τις επιτυχίες n , τότε η

σχετική συχνότητα είναι nN

και σύμφωνα με τον ορισμό της πιθανότητας θα ισχύει

:

2 2n NpN n

ππ

⋅≈ = ⇒ = (5.30)

O παρακάτω πίνακας συνοψίζει τις προσπάθειες διαφόρων ερευνητών για τον προσδιορισμό του π με το πείραμα του .uffonΒ

114

Πειραματιστής

Μήκος Βελόνας

Ρίψεις

Επιτυχίες

Υπολογισμός του π

Wolf 1850 Smith 1855 De Morgan 1860 Fox 1884 Lazerini 1901 Reina 1925 Gridgeman 1960

0,8 0,6 1,0 0,75 0,83

0,5419 0,7857

5000 3204 600 1030 3408 2520

2

2532 1218.5 382.5 489 1808 859 1

3,1596 3,1553 3,137 3,1595

3,1415929 3,1795 3,143

5.5 Προσομοίωση Φαινομένων με τη Μέθοδο Μonte Carlo [ 13 ] Tις τελευταίες δεκαετίες έχει παρουσιαστεί και αναπτυχθεί μια νέα «πειραματική » μέθοδος μελέτης στοχαστικών φαινομένων η οποία βασίζεται στην υπολογιστική ισχύ που προσφέρουν οι σύγχρονοι Η/Υ. Εάν θέλουμε για παράδειγμα να υπολογίσουμε την πιθανότητα ενός γεγονότος Α κατάγράφουμε το πλήθος πραγματοποιήσεων αυτού και υπολογίζουμε την πιθανότητα σαν το όριο της σχετικής συχνότητας του Α. Οσο περισσότερες καταγραφές έχουμε τόσο ακριβέστερη είναι η ευρεση της πιθανότητας Συνήθως όμως η παρακολούθηση πολλών πραγματοποιήσεων ενός γεγονότος είναι χρονοβόρα και πολυέξοδη. Αντί όμως να παρακολουθούμε το φαινόμενο στην φυσική του εξέλιξη , μπορούμε να «αναπαραστήσουμε » το φαινόμενο μέσα σε μία κατάλληλη «εικονική πραγματικότητα » του υπολογιστή. Από την στιγμή τώρα που αναπαρίσταται σχετικά ικανοποιητικά το φαινόμενο από τον υπολογιστή , μπορούμε να το πραγματοποιήσουμε χιλιάδες η εκατομμύρια φορές και να καταγράψουμε τα χαρακτηριστικά του . Αυτή είναι η βασική ιδέα της μεθόδου που είναι γνωστή σαν «προσομοίωση ». Πολλές φορές μια προσομοίωση , όπως για παράδειγμα η προσομοίωση πυρηνικών εκρήξεων όταν οι διεθνείς νόμοι θα απαγορεύουν τις πυρηνικές δοκιμές η την προσομοίωση της διάσπασης ραδιενεργών αποβλήτων που έχουν εν γένει μεγάλους χρόνους υποδιπλασιασμού , είναι μονόδρομος για τους επιστήμονες . Οι προσομοιώσεις φυσικών συστημάτων έχουν γίνει επομένως μια νέα μορφή πειραματικής έρευνας . Με την μέθοδο Monte Carlo που ανπτύξαμε στην προηγούμενη ενότητα εκτός από προβλήματα ολοκλήρωσης μπορούμε να αντιμετωπίσουμε και προβλήματα προσομοίωσης , όπως περιγράφεται στο ακόλουθο παράδειγμα . Ας υποθέσουμε ότι ενδιαφερόμαστε για την εξέλιξη του φαινομένου της σκέδασης (σκέδαση Rutherford). Kάθε φορά που ένας πυρήνας He διέρχεται μέσα από ένα φύλλο χρυσού , οι πειραματικές συσκευές καταγράφουν ένα πλήθος από φυσικές ποσότητες 1 2, ,..., nx x x x= όπως π.χ τα συνημίτονα κατεύθυνσης του

115

σκεδαζόμενου πυρήνα.. ( Το διάνυσμα x παριστάνει ένα γεγονός , δηλαδή μια διεξαγωγή του φαινομένου ). Εάν επαναλάβουμε το πείραμα Ν φορές θα πάρουμε Ν διανύσματα , 1 2

, ,..., 1, 2,3,...,ni i i ix x x x i N= = .

Το ατομικό μοντέλο του Rutherford προβλέπει την συνάρτηση πυκνότητας πιθανότητας 1 2( ) ( , ,..., )ng y g y y y= των συνημιτόνων κατευθυνσης των σκεδαζομένων σωματίων a , όταν είναι γνωστή η αρχική κατάσταση της προσπίπτουσας δέσμης των σωματίων a . Επομένως εάν γνωρίζουμε την συνάρτηση αποδοχής –αποδοτικότητας ( )yε και την συνάρτηση διακριτικής ικανότητας ( , )R x y της μετρητικής διάταξης , μπορούμε να βρούμε με χρήση της σχέσης (5.20) την συνάρτηση πυκνότητας πιθανότητας των μετρήσεων :

( ) ( ) ( , )

( )( ) ( )

g y y R x y d yf x

g y y d y

ε

ε

Ω

Ω

⋅ ⋅=

⋅ ⋅

∫ (5.31)

Eχοντας ένα μεγάλο πλήθος πειραματικών μετρήσεων , μπορούμε , όπως είπαμε πρίν , να προσδιορίσουμε την πιθανότητα εμφάνισης iP , των αποτελεσμάτων της μέτρησης , ix των φυσικών ποσοτήτων , και επομένως και την συνάρτηση

πυκνότητας πιθανότητας των μετρήσεων ( ),i iP x . Συγκρίνοντας την ( ),i iP x με την

πρόβλεψη της θεωρητικής υπόθεσης ( )f x που δίνεται από την σχέση (5.41) , μπορούμε να καταλήξουμε σε έλεγχο της ορθότητας του θεωρητικού μοντέλου η στον προσδιορισμό παραμέτρων της συνάρτησης ( )g y που αφορούν βασικές φυσικές σταθερές . Η μέθοδος Monte Carlo εκτός από την χρήσης της στον υπολογισμό πολύπλοκων ολοκληρωμάτων για τον ποσδιορισμό των συναρτήσεων ( )g y , ( , )R x y και ( )yε , είναι χρήσιμη στο να «παράγουμε » διανύσματα μετρήσεων x , σύμφωνα με την συνάρτηση πυκνότητας πιθανότητας ( )f x . Πράγματι επειδή οι μετρήσεις μας ακολουθούν την συνάρτηση πυκνότητας πιθανότητας ( )f x , οι τιμές αυτές θα ήταν δυνατόν να είχαν «παραχθεί » σαν τυχαίοι αριθμοί για τον υπολογισμό του

ολοκηρώματος ( )f x dx∫ . Η παραγωγή τιμών που ακολουθούν μια συγκεκριμένη

κατανομή ( )f x λέγεται προσομοίωση Monte Carlo .Βλέπουμε λοιπόν ότι η προσομοίωση είναι ισοδύναμη με την ολοκλήρωση. Η προσομοίωση Monte Carlo είναι μια πολύπλοκη διαδικασία γι’ αυτό αναλύεται σε διαδοχικά βήματα. Σε κάθε βήμα , κάθε δυνατή έκβαση (αποτέλεσμα ) επιλέγεται

116

από ένα σύστημα πιθανών συμβάντων σύμφωνα με κάποια συνάρτηση πυκνότητας πιθανότητας που χαρακτηρίζει τις φυσικές διεργασίες σ’ αυτό το βήμα. Το αποτέλεσμα αυτής της διαδικασίας είναι η παραγωγή ψευδοτυχαίων αριθμών σύμφωνα με την συνάρτηση πυκνότητας πιθανότητας ( )f x . Οι αριθμοί αυτοί όμως όπως έχουμε δεί προέρχονται από ομοιόμορφη συνάρτηση πυκνότητας πιθανότητας .Θα πρέπει συνεπώς να μεταμορφόσουμε τους τυχαίους αριθμούς που προέρχονται από ομοιόμορφη συνάρτηση ,σε τυχαίους αριθμούς άλλης συνάρτησης πυκνότητας πιθανότητας . Υπάρχουν τρείς μέθοδοι να γίνει αυτό. - Μέθοδος απόρριψης

- Μέθοδος βεβαρημένου αθροίσματος

- Μέθοδος Αντίστροφου Μετασχηματισμού. α. Μέθοδος απόρριψης Η μέθοδος αυτή είναι ανάλογη με την μέθοδο «Επιτυχίας – απώλειας » που αναπτύξαμε στην ολοκλήρωση Monte-Carlo. Oπως και εκεί , δημιουργούμε ζεύγη τυχαιων αριθμών ,i ix y προερχόμενα από ομοιόμορφη συνάρτηση πυκνότητας πιθανότητας , σύμφωνα με την συνθήκη :

Σχήμα 5.5 Μέθοδος απόρριψης [ 2 ]

117

[ ],ix R a b= (5.32) [ ]max0,iy R f= (5.33) όπου maxf είναι το μέγιστο της ( )f x στο διάστημα [ ],a b (σχ. 5.4 ) Τα σημεία iy για τα οποία ισχύει ( )i if x y≤ απορρίπτονται. Ο αλγόριθμος απόρριψης είναι ο εξής : Βήμα 1. : Παράγουμε έναν τυχαίο αριθμό ix στο διάστημα [ ],a b Βήμα 2 : Παράγουμε έναν τυχαίο αριθμό iy στο διάστημα [ ]max0, f Bήμα 3 : Eάν ( )i if x y≥ , κρατάμε το ζεύγος ( ),i ix y . Εάν ( )i if x y≤ το απορρίπτουμε και επιστρέφουμε στο βήμα 1. Το ολοκλήρωμα στο υποδιάστημα [ ],c d του [ ],a b θα είναι :

max( ) ( )d

c x d

c

nf x dx b a fn≤ ≤= −∫ (5.34)

H δυσκολία αυτής της μεθόδου είναι ότι στηρίζεται στην γνώση του maxf . Εάν αυτό δεν είναι γνωστό , επιλέγουμε μια τιμή λ η οποία θα είναι σίγουρα μεγαλύτερη της maxf , δηλαδή maxfλ ≥ , έτσι όμως η παραπάνω μέθοδος είναι μη αποδοτική . Η μέθοδος γίνεται πιο αποδοτική εάν επιλέξουμε διαφορετικές τιμές του maxf από διαφορετικές περιοχές του [ ],a b . Παράδειγμα 5.4 Θέλουμε να παράγουμε τυχαίου αριθμούς σύμφωνα με την συνάρτησηση πυκνότητας πιθανότητας 2( ) 1f x x= + στην περιοχή [ ]1,1− Εχουμε max 2, 1, 1f a b= = − = . Επομένως επιλέγουμε τυχαίου αριθμούς στα διαστήματα ix στο διάστημα [ ] [ ], 1,1a b R= −

και iy στο διάστημα [ ] [ ]max0, 0, 2f R= εάν 21i iy x≥ + το ζεύγος ( ),i ix y απορρίπτεται

118

β. Μεθοδος βεβαρημένου αθροίσματος Εστω ότι θέλουμε να υπολογίσουμε το την τιμή του ολοκληρώματος :

( , )b x

a a

I g x y dy dx⎡ ⎤

= ⎢ ⎥⎣ ⎦∫ ∫ (5.35)

όπου η επιφάνεια ολοκλήρωσης είναι το γραμμοσκιασμένο τμήμα του σχ. 5.6

Σχήμα 5.6 Επιλογή σημείων με διαφορετικό βάρος [ 2 ] Αρχικά τα σημεία επιλέγονται ομοιόμορφα σε κάθε περοχή του ορθογωνίου ΑΒΓΔ με συνέπεια η πυκνότητα κατανομής των n επιλεγμένων σημείων στην περιοχή ΚΛΜΝ να είναι :

( )n

x b aρ =

Δ ⋅ − (5.36)

Mετά την συμπίεση των σημείων στην στοιχειώδη περιοχή ολοκλήρωσης , επιφάνειας ( )ix x aΔ ⋅ − η πυκνότητα σημείων θα είναι :

'( )i

nx x a

ρ =Δ ⋅ −

(5.37)

119

Προκειμένου να εξασφαλίσουμε την ίδια πυκνότητα σημείων για κάθε στοιχειώδη περιοχή ολοκλήρωσης , θα βαρύνουμε τη συμμετοχή κάθε επιλεγέντος ζεύγους ,i ix y στο άθροισμα με τον λόγο πυκνοτήτων ως :

( )( )( )

( )

ii

i

nx ax b aw n b a

x x a

−Δ ⋅ −= =−

Δ ⋅ −

(5.38)

και η τιμή του ολοκληρώματος θα είναι :

2

1 1

( ) ( , ) ( , ) ( )N N

ii i i i i

i i

x ab a b aI g x y g x y x aN b a N= =

−− −= ⋅ ⋅ = ⋅ ⋅ −

−∑ ∑ (5.39)

γ. Μέθοδος αντίστροφου μετασχηματισμού. Εστω ( )f x η συνάρτηση πυκνότητας πιθανότητας ενός φαινομένου. Η ολοκλήρωση της ( )f x με την μέθοδο Monte Carlo όπως δείξαμε γίνεται με την επιλογή τυχαίων αριθμών από ομοιόμορφη συνάρτηση πυκνότητας πιθανότητας . Στην μέθοδο αυτή χρησιμοποιούμε την αθροιστική συνάρτηση πυκνότητας πιθανότητας , αντί της ( )f x . ( )f x dx dF= (5.40) και

( ) ( )x

a

F x f x dx= ∫ (5.41)

Σχήμα 5.7 Μέθοδος αντίστροφου μετασχηματισμού

120

Επομένως μπορούμε να παράγουμε τυχαίες τιμές από την ομοιόμορφη συνάρτηση πυκνότητας πιθανότητας ( )F x στο διάστημα [ ]( ) 0, ( ) 1F a F b= = και ( ) 1F b = ,

εάν το διάστημα της τυχαίας μεταβλητής x είναι το [ ],a b . Επιλέγουμε λοιπόν , ομοιόμορφα τιμές για την μεταβλητή ( )u F x= από το διάστημα τιμών [ ]0,1 : [ ]0,1iu R= (5.42) και στην συνέχεια υπολογίζουμε την αντίστοιχη τιμή της x με αντίστροφο μετασχηματισμό : 1( )i ix F u−= (5.43) Oι τιμές της μεταβλητής x που παράγονται σύμφωνα με τις σχέσεις (5.52) και (5.53) έχουν σαν συνάρτηση πυκνότητας πιθανότηας την ( )f x . Πράγματι εάν υποθέσουμε ότι η συνάρτηση πυκνότητας πιθανότητας της μεταβλητής x είναι

( )g x , τότε από τον μετασχηματισμό των μεταβλητών u x→ προκύπτει :

( ) ( ) ug x Q ux∂

= ⋅∂

(5.44)

είναι όμως ( ) 1Q u = , αφού η ( )Q u είναι ομοιόμορφη σνάρτηση πυκνότητας πιθανότητας και 1( ) ( )i ix F u u F x−= ⇒ = .Οπότε :

( )( ) ( ) ( )u F xg x Q u f xx x∂ ∂

= ⋅ = =∂ ∂

Το βασικό μειονέκτημα αυτής της μεθόδου είναι οι υπολογιστικές δυσκολίες που αφορούν στην ολοκλήρωση για τον προσδιορισμό της αθροιστικής συνάρτησης πιθανότητας και τον αντίστροφο μετασχηματισμό (5.53) . Όταν οι υπολογισμοί αυτοί είναι εφικτοί η μέθοδος αυτή είναι η πλέον αποδοτική στην παραγωγή τιμών για τυχαίες μεταβλητές. Παράδειγμα 5.5 Επιλύουμε το παράδειγμα 5.4 σύμφωνα με την μέθοδο του αντίστροφου μετασχηματιμού.

121

Εχουμε 3 3

2

1 1

4( ) (1 )3 3 3

xx x xF x x dx x x− −

= + = + = + +∫ .

Οπότε : ( 1) 0F − = και 8(1)3

F =

Ο αλγόριθμος είναι : Bήμα 1 : Επιλέγουμε έναν τυχαίο αριθμό της μεταβλητής u στο διάστημα [ ]0,1 Βήμα 2 : Bρίσκουμε την αντίστοιχη τιμή της μεταβλητής x από την σχέση :

3

1 12 23 3

8 4( )3 3 3

(4 2 1 4(1 2 ) ) (4 2 1 4(1 2 ) )

xu F x x

x u u u u

= = + + ⇒

= − + + − + − − + −

Kατ’ αυτόν τον τρόπο μπορούμε να παράγουμε οσοδήποτε τυχαίους αριθμούς της μεταβλητής x . Είναι εμφανής όμως η δυσκολία των υπολογισμών για να παράγουμε τυχαίους αριθμούς με αυτήν την μέθοδο.

122

ΚΕΦΑΛΑΙΟ 6 : ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ

6.1 Εισαγωγή Το βασικό πρόβλημα που προσπαθεί να επιλύσει η επιστήμη της Στατιστικής , είναι η εύρεση πληροφοριών για έναν πληθυσμό ( π.χ το ύψος των νέων ηλικίας 18- 20 ετών ,στην Ελλάδα ) , μελετώντας ένα δείγμα αυτού ( π.χ το ύψος των νεων 18-20 ετών σε είκοσι σχολεία της Ελλάδας ). Η παραπάνω διαδικασία περιλαμβάνει δύο είδη προβλημάτων :

- Εκτίμηση των παραμέτρων μιάς γνωστής κατανομής ( π.χ Διωνυμικής ) - Ελεγχος των στατιστικών υποθέσεων , σε σχέση με τις παραμέτρους μιάς

κατανομής , καθώς και το είδος αυτής .

Στο κεφάλαιο αυτό θα αασχοληθούμε με την εκτίμηση των παραμέτρων μιας γνωστής κατανομής , με την χρήση των τιμών ενός δείγματος .

Στην καθημερινή ζωή βέβαια χρησιμοποιούμε τον όρο εκτίμηση όταν δεν ζητούμε ακριβή αποτελέσματα για μια διαδικασία . Στην Στατιστική όμως η εκτίμηση είναι μια ακριβής διαδικασία που οδηγεί στην εύρεση της αληθούς τιμής ενός μεγέθους . Δεν έχει καμμιά σχέση με την προσσέγγιση. Το πρόβλημα τίθεται ως εξής : Υποθέτουμε ότι εχουμε αποκτήσει ορισμένο αριθμό πειραματικών μετρήσεων για την μελέτη ενός φυσικου΄φαινομένου , π.χ τον χρόνο διάσπασης t των πυρήνων ενός ραδιενεργού υλικού. Οι θεωρητικές γνώσεις μας για το φαινόμενο αυτό μας οδηγούν στο συμπέρασμα ότι εξελίσεται ακολουθώντας την κατανομή

Poisson , ( ; )reP r

r

λ λλ ⋅= . H κατανομή αυτή εξαρτάται από την παράμετρο

λ . Σκοπός μας είναι με βάση τις πειραματικές μετρήσεις πού διαθέτουμε να βρούμε την τιμή της παραμέτρου λ , περιγράφοντας έτσι πλήρως το φαινόμενο των ραδιενεργών διασπάσεων. Συνεπώς : Eκτίμηση είναι η διαδικασία προσδιορισμού της τιμής μίας η περισσοτέρων παραμέτρων χρησιμοποιώντας έναν περιορισμένο αριθμό Ν , παρατηρήσεων (μετρήσεων ). Το αποτέλεσμα της εκτίμησης παραμέτρου ( εκτίμηση σημείου ) συμπεριφέρεται σαν τυχαία μεταβλητή . Εάν δηλαδή επαναλάβουμε την εκτίμηση της τιμής της ίδιας παραμέτρου , χρησιμποιώντας ένα άλλο σύνολο παρατηρήσεων με τις ίδιες ακριβώς συνθήκες , θα καταλήξουμε σε διαφορετική τιμή.

123

Επομένως εάν θ είναι η εκτίμηση μιάς παραμέτρου και θ η αληθής τιμή της ,και η εκτίμηση θ θα παίρνει τιμές από κάποια κατανομή μπορούμε να γράψουμε θ θ σ θ σ θ θ σ= ± ⇒ − ≤ ≤ + ( όπου σ η τυπική απόκλιση της κατανομής ) Δηλαδή λόγω του στατιστικού χαρακτήρα της εκτίμησης , πολλές φορές ενδιαφερόμαστε για τον προσδιορισμό μιας περιοχής τιμών (εκτίμηση περιοχής ) η οποία είναι πολύ πιθανόν να περιέχει την πραγματική τιμή της παραμέτρου. Για να εκτιμηθεί μια άγνωστη παράμετρος από ένα πλήθος παρατηρήσεων που ακολουθούν γνωστή κατανομή , χρησιμοποιείται μια κατάλληλη συνάρτηση των παρατηρήσεων την οποία ονομάζουμε εκτιμητή . Ο εκτιμητής είναι στατιστική συνάρτηση και η τιμή της που προκύπτει από τις διαθέσιμες μετρήσεις μας , είναι η εκτίμηση της παραμέτρου.

Ας υποθέσουμε ότι θέλουμε να βρούμε το μέσο ύψος των φοιτητών ενός πανεπιστημίου χρησιμοποιώντας ένα αντιπροσωπευτικό δείγμα N φοιτητών . Θα μπορούσαμε να χρησιμοποιήσουμε μία από τις παρακάτω διαδικασίες :

1. Προσθέτουμε όλα τα ύψη και διαιρούμε με το Ν. 2. Προσθέτουμε τα 10 πρώτα ύψη και διαιρούμε με το 10 . Αγνοούμε τα

υπόλοιπα. 3. Προσθέτουμε όλα τα ύψη και διαιρούμε με το 1Ν − . 4. Απορρίπτουμε όλες τις μετρήσεις και απαντάμε 1.80 μέτρα. 5. Πολλαπλασιάζουμε όλα τα ύψη και βρίσκουμε την Ν-οστή ρίζα τους . 6. Προσθέτουμε τα μεγαλύτερα ύψη με τα μικρότερα και διαιρούμε με το 2.

Ολες οι παραπάνω προτάσεις είναι εκτιμητές , σύμφωνα με τον ορισμό του εκτιμητή που δώσαμε πιο πάνω. Μερικοί δε εξ’ αυτών φαίνονται περισσότερο κατάλληλοι από ότι οι άλλοι. Το ερώτημα είναι ποιόν πρέπει να χρησιμοποιήσουμε ; . Eνας εκτιμητής δεν χαρακτηρίζεται σαν «σωστός » , «λάθος » η «κατάλληλος » και «ακατάλληλος » , αλλά μπορούμε να τον χαρακτηρίσουμε μόνο σαν «καλο» η «κακό». Για να είναι ένας εκτιμητής «καλός»» θα πρέπει να έχει τις παρακάτω ιδιότητες :

- Συνέπεια ( Consistency) - Eλλειψη Προκατάληψης (Unbiasedness) - Aποδοτικότητα (Efficiency)

τις οποίες αναλύουμε στην επόμενη ενότητα

124

Ιδιότητες Εκτιμητών

6.2.1 Συνέπεια ( Consistency)

Εάν είναι θ η ποσότητα που θέλουμε να μετρήσουμε τότε θα χρησιμοποιούμε το σύμβολο για να δηλώσουμε τον εκτιμητή , έτσι ο θ είναι ο εκτιμητής του θ . Όταν ο εκτιμητής θ εφαρμοσθεί σε Ν μετρήσεις δεδομένων θα πάρουμε την εκτίμηση της παραμέτρου θ . Η τιμή όμως αυτή θα διαφέρει από την αληθή τιμή της θ γιατί όπως είπαμε πιο πάνω η εκτίμηση είναι τυχαία μεταβλητή. Από τον νόμο των μεγάλων αριθμών γνωρίζουμε ότι η απόκλιση αυτή γίνεται όλο και πιο μικρή , όσο ο αριθμός των παρατηρησεών μας αυξάνεται και το Ν τείνει στο άπειρο.Επομένως ένα στοιχείο της ποιότητας του εκτιμητή θα πρέπει να είναι το μέγεθος της απόκλισης της εκτιμούμενης τιμής της παραμέτρου από την αληθή τιμή της ,για μεγάλο αριθμό μετρήσεων . Ο εκτιμητής που εκπληρεί την παραπάνω προυπόθεση λέγεται συνεπής . Επομένως ένας εκτιμητής λέγεται ότι είναι συνεπής ( Consistent) εάν η εκτίμηση της παραμέτρου nθ ,συγκλίνει προς την πραγματική της τιμή 0θ , καθώς ο αριθμός των παρατηρήσεων n αυξάνει. Ο παραπάνω ορισμός ορίζεται μαθηματικά χρησιμοποιώντας την έννοια της πιθανότητας . Εστω nθ είναι η εκτίμηση της παραμέτρου θ , η οποία βασίζεται σε n παρατηρήσεις 1 2, ,..., nx x x : 1 2( , ,..., )n nx x xθ = Θ (6.1) όπου η στατιστική συνάρτηση 1 2( , ,..., )nx x xΘ είναι ο εκτιμητής . Για οποιοδήποτε αριθμό 0ε ≥ η έκφραση : 0( nP θ θ ε− ≥ (6.2)

εκφράζει την πιθανότητα ώστε η απόλυτη τιμή της απόκλισης της εκτίμησης της μεταβλητής από την πραγματική τιμή 0θ , να είναι μεγαλύτερη από το ε . Εάν για οποιοδήποτε πραγματικό αριθμό 0λ ≥ , υπάρχει ένας αριθμός παρατηρήσεων , Ν , τέτοιος ώστε : 0( ( )nP θ θ ε λ− ≥ ≤ για n N≥ (6.3)

ο εκτιμητής θ είναι συνεπής .

125

Το σχ. 6.1 περιγράφει την μεταβολή της πιθανότητας 0( nP θ θ ε− ≥ σε ένα

υποθετικό παράδειγμα εκτίμησης κάποιας παραμέτρου θ συναρτήσει του αριθμού των παρατηρήσεων n . Παρατηρούμε ότι σε ένα τμήμα της καμπύλης παρ’όλο που ο αριθμός παρατηρήσεων 2 1n n≥ η 0( nP θ θ ε− ≥ αυξάνεται. Παρ’ όλα αυτά

το παράδειγμα αναφέρεται σε συνεπή εκτίμηση , διότι παρά τις τοπικές διακυμάνσεις η σχέση (6.3) χαρακτηρίζει την ασυμπτωτική συμπεριφορά της εκτίμησης .

Σχήμα 6.1 Ιδιότητα της συνέπειας για πεπερασμένο αριθμό μετρήσεων [ 2 ]

Παράδειγμα 6.1 Θα προσπαθήσουμε να βρούμε ποιοι από τους εκτιμητές που αναφέραμε στο παράδειγμα του ύψους των φοιτητών είναι συνεπής Η πρόταση 1 μας λέει ότι το μέσο ύψος των φοιτητών είναι ίσο με τον μέσο όρο του ύψους των Ν φοιτητών . Δηλαδή :

1 2 ... Nx x x xN

μ + + += =

Πράγματι κάνοντας χρήση του νόμου των μεγάλων αριθμών μπορούμε να δείξουμε ότι ισχύει η σχέση (6.3) για κάθε ε και λ , όταν το Ν→∞ . Δηλαδή το μ είναι συνεπής εκτιμητής Επίσης η πρόταση 3 οδηγεί σε συνεπή εκτιμητή γιατί όταν 1N N→∞⇒ − →∞ Και η πρόταση 6 αποτελεί συνεπή εκτιμητή Προφανώς η συνέπεια δεν μας δίνει κάποιο κριτήριο για το ποιος από τους 1,3,6 εκτιμητές είναι ο πλέον «καλός». Και αυτό γιατί και οι τρείς εκτιμητές είναι εξ’ ίσου «καλοί » σε άπειρο αριθμό παρατηρήσεων , διαφοροποιούνται όμως όταν έχουμε πεπερασμένο αριθμό παρατηρήσεων Ν. Το κριτήριο αυτό θα το εισάγουμε με την επόμενη ιδιότητα την : προκατάληψη (Bias)

126

6.2.2 Προκατάληψη (Bias) Oρίζουμε ως προκατάληψη nb , του εκτιμητή της παραμέτρου θ , την

απόκλιση της αναμενόμενης τιμής της εκτίμησης θ , η οποία βασίζεται σε n παρατηρήσεις , από την πραγματική τιμή , 0θ . Δηλαδή :

0 0 0 1 2 1 2( ) ... ( ) ( , ,..., ; ) ...n N nb f x x x dx dx dxθ θ θ θ θ θ θ θΩ Ω Ω

⎡ ⎤ ⎡ ⎤= Ε − = Ε − = − ⋅⎣ ⎦ ⎣ ⎦ ∫ ∫ ∫

0 1 2 1 2 0( ) ( , ,..., ; ) ... ( ) ( ; )N nf x x x dx dx dx f x d xθ θ θ θ θ θ= − ⋅ = − ⋅∫ ∫ (6.4)

H συνάρτηση ( ; )f x θ , η οποία εκφράζει την κοινή συνάρτηση πυκνότητας πιθανότητας των n μετρήσεων , εξαρτάται από την παράμετρο θ . Επομένως , ένας εκτιμητής δεν είναι προκατειλημμένος εάν , για κάθε πλήθος μετρήσεων n , ισχύει : ( ) 0nb θ = η 0θ θ⎡ ⎤Ε =⎣ ⎦ (6.5)

Όπως αναφέραμε η τιμή ενός εκτιμητή είναι τυχαία μεταβλητή . Την συνάρτηση πυκνότητας πιθανότητας της τυχαίας μεταβλητής θΝ , ονομάζουμε δειγματική συνάρτηση πυκνότητας πιθανότητας . Από αυτά που αναφέραμε πιο πάνω ,η μέση τιμή της δειγματικής συνάρτησης , ενός συνεπούς εκτιμητή , για άπειρο αριθμό παρατηρήσεων θα συμπίπτει με την πραγματική τιμή της παραμέτρου. Όμως η μέση τιμή της δειγματικής συνάρτησης ενό εκτιμητή χωρίς προκατάληψη , για κάθε αριθμό παρατηρήσεων Ν , συμπίπτει με την πραγματική τιμή της υπό εκτίμηση παραμέτρου. Στο σχ 6.2 παρίσταται γραφικά η σχέση μεταξύ της μέσης τιμής της δειγματικής κατανομής και της πραγματικής τιμής της παραμέτρου , για τις περιπτώσεις συνεπούς και μη προκατειλημμένου εκτιμητή.

127

Σχήμα 6.2 Γραφική παράσταση της ιδιότητας της συνέπειας (α) και της Απουσίας προκατάληψης .(β) [ 2 ] Παράδειγμα 6.2 Σε συνέχεια του παραδείγματος 6.1 , η αναμενόμενη τιμή της πρότασης 1 είναι :

1 2 ...... N x x x N xx x x xN N N

μ μ+ + + ⋅+ + +

= = = = = .

Eπομένως η πρόταση 1. είναι μη προκατειλλημένη. Για την πρόταση 3. έχουμε :

1

μ μ μΝ= ⋅ ≠Ν −

. Δηλαδή η 3 είναι προκατελλειμένη Επομένως θα

προτιμήσουμε την 1 από την 3

6.2.3 Αποδοτικότητα Στη προηγούμενη ενότητα επισημάναμε ότι το αποτέλεσμα τα εκτίμησης παραμέτρου συμπεριφέρεται σαν τυχαία μεταβλητή και είδαμε ότι η μέση τιμή της δειγματικής συνάρτησης ενός συνεπούς και μη προκατειλλημένου εκτιμητή ισούται με την αληθή τιμή της παραμέτρου. Το εύρος της δειγματικής κατανομής εκφράζει την ακρίβεια της εκτίμησης .Για παράδειγμα , η εκτίμηση της τιμής κάποιας φυσικής σταθεράς από τα δεδομένα κατάλληλου πειράματος καταλήγει σε διαφορετικό αποτέλεσμα κάθε φορά πού επαναλαμβάνουμε το πείραμα. Η ακρίβεια της εκτίμησης είναι βέλτιστη όταν τα αποτελέσματα κατανέμονται γύρω από την πραγματική τιμή της φυσικής σταθεράς με αμελητέο εύρος . Δηλαδή η διασπορά του αποτελέσματος της εκτίμησης εκφράζει την αποδοτικότητα του εκτιμητή.

128

Παράδειγμα 6.3 [ 7 ] Εστω ότι η μεταβλητή x εκφράζει το αποτέλεσμα της μέτρησης της περιόδου ενό εκκρεμούς. Υποθέτουμε ότι κατά την μετρητική διαδικασία πληρούνται όλες οι προυποθέσεις του θεωρήματος του κεντρικού ορίου. Η τυχαία μεταβλητή x χαρακτηρίζεται από κανονική συνάρτηση πυκνότητας πιθανότητας με μέση τιμή μ , ίση με την πραγματική τιμή της περιόδου και τεραγωνική απόκλιση [ ] 2V x σ= που εκφράζει την διακριτική ικανότητα του οργάνου. Εστω από τις Ν μετρήσεις που παίρνουμε εκτιμούμαι την αληθή τιμή της περιόδου

από τον μέσο όρο των μετρήσεων 1

1 N

ii

x xN =

= ∑ Ο εκτιμητής αυτός όπως θα δούμε

πιο κάτω είναι συνεπής και μη προκατειλλημένος . Η ακρίβεια της εκτίμησης υπολογίζεται ως :

[ ] [ ]2

2 21 1

1 1 1N N

ii i

V x V x V x N V xN N N

σ= =

⎡ ⎤⎡ ⎤ = = ⋅ = ⋅ ⋅ =⎣ ⎦ ⎢ ⎥ Ν⎣ ⎦∑ ∑

Παρατηρούμε ότι η ακρίβεια της εκτίμησης εξαρτάται από την διασπορά της συνάρτησης πυκνότητας πιθανότητας που χαρακτηρίζει τις μετρήσεις και το πλήθος των πειραματικών δεδομένων . 6.3 Bασικοί Εκτιμητές

Στην προηγούμενη ενότητα περιγράψαμε τις βασικές ιδιότητες των εκτιμητών. Εδώ θα περγράψουμε μερικούς βασικούς εκτιμητές και θα δούμε πώς εφαρμόζονται στην πράξη οι προηγούμενες ιδέες. 6.3.1 Εκτίμηση Μέσης Τιμής Η μέση τιμή μ ,της τυχαίας μεταβλητής x με συνάρτηση πυκνότητας πιθανότητας ( )f x , εκτιμάται ως ο μέσος όρος n τιμών της μεταβλητής . Θα δούμε εάν ο παραπάνω εκτιμητής έχει τις ιδιότητες του καλού εκτιμητή α) Συνέπεια Σύμφωνα με το θεώρημα του κεντρικού ορίου έάν υπολογίσουμε άπειρες φορές τον μέσο όρο των n τιμών μιας μεταβλητής x που ακολουθεί την συνάρτηση πυκνότητας πιθανότητας ( )f x που έχει μέση τιμή μ και απόκλιση ( )V x , με διαφορετικές κάθε φορά τιμές της x , τότε ο μέσος όρος είναι τυχαία μεταβλητή και ακολουθεί την κανονική κατανομή

129

2

2( )

21( )2

x

g x eμ

σ

π σ

−−

⋅= ⋅⋅

(6.6)

με μέση τιμή 1

1 n

ii

x xn

μ=

= = ⋅∑ (6.7) και τυπική απόκλιση ( )V xn

σ = (6.8)

Επομένως αν n→∞ τότε λόγω της (6.8) 0σ → και λόγω της (6.6)

( )g x →∞ ( ) ( ( ) ) 0P x P xμ μ ε⇒ = →∞⇒ − ≥ = . Δηλαδή ισχύει η σχέση (6.3) για κάθε ε και λ . Συνεπώς ο εκτιμητής μας είναι συνεπής. β) Προκατάληψη

1 1

1 1( ) ( ) ( ( )n n

i ii i

nx E x E xn n n

μ μ= =

⋅Ε = = ⋅ = =∑ ∑ (6.9)

Eπομένως σύμφωνα με την (6.5) ισχύει :

0 ( ) 0x x b xμ μ⎡ ⎤ ⎡ ⎤Ε = ⇒ Ε − = ⇒ =⎣ ⎦ ⎣ ⎦ (6.10)

Επομένως ο παραπάνω εκτιμητής είναι και μη προκατελλειμένος γ) Ακρίβεια Η ακρίβεια της εκτίμησης υπολογίζεται ως :

[ ] [ ]2 21 1

1 1 1 ( )n n

ii i

V xV x V x V x n V xn n n n= =

⎡ ⎤⎡ ⎤ = = ⋅ = ⋅ ⋅ =⎣ ⎦ ⎢ ⎥⎣ ⎦∑ ∑ (6.11)

H ακρίβεια της εκτίμησης δηλαδή η αποδοτικότητα εξαρτάται από από την διασπορά της συνάρτησης πυκνότητας πιθανότητας ( )f x και το n . Επομένως για τον εκτιμητή αυτόν δεν μπορούμε να πούμε εάν είναι αποδοτικός η όχι, εξαρτάται από το είδος και το εύρος της κατανομής που ακολουθούν οι μετρήσεις μας καθώς και το πλήθος των μετρήσεών μας Εάν π.χ οι μετρήσεις μας ακολουθούν κανονική κατανομή και το n→∞ τότε ο εκτιμητής μας θα είναι αποδοτικός.

6.3.2 Εκτίμηση της μεταβλητότητας

130

Εστω ότι έχουμε Ν μετρήσεις ενός μεγέθους 1 2, ( , ,..., )Nx x x x με συνάρτηση πυκνότητα πιθανότητας ( )g x a.) Θεωρούμε πρώτα την περίπτωση όπου η μέση τιμή της μεταβλητής είναι γνωστή (ίση με μ , παρ’ όλο που τις περισσότερες περιπτώσεις η μ είναι άγνωστη).Θα προσπαθήσουμε να βρούμε έναν εκτιμητή για την μεταβλητότητα [ ]V x

Ενας «λογικός εκτιμητής» θα ήταν ο :

[ ] 21 ( )iV x xN

μ= −∑ (6.12)

Εξετάζουμε τις ιδιότητες αυτού του εκτιμητή : α). Συνέπεια

Δείξαμε στην σχέση ότι το άθροισμα 2

1( )iS x

ι

μΝ

=

= −∑ είναι τυχαία μεταβλητή

με αναμενόμενη τιμή [ ] 2

1 1

( )N

ii

E S E x ιι

μ μ μΝ

= =

⎡ ⎤= − = =⎢ ⎥⎣ ⎦∑ ∑ και διασπορά :

[ ] 2 2

1 1

( )i

N N

i xi i

V S V x μμ σ σ−= =

⎡ ⎤= − = =⎢ ⎥⎣ ⎦∑ ∑ (6.13)

η οποία όταν το Ν τείνει στο άπειρο κατανέμεται σύμφωνα με την κανονική κατανομή

2

2( )

21( )2

S

f S eμ

σ

π σ

−−

= ⋅ (6.14) . Επομένως και η

[ ] 21 ( )iV x xN

μ= −∑ θα είναι τυχαία μεταβλητή που θα κατανέμεται σύμφωμα

με την κανονική κατανομή :

[ ]2

2( )

21 1 1( ) ( ) ( )2

SSf V x f f S eN N N

μ

σ

π σ

−−

= = = ⋅ ⋅ (6.15)

Η διασπορά της εκτίμησης είναι :

2 2

1

1 1( ) ( ) ( )N N

i ii i

V V x V x V xN N

μ μ=

⎡ ⎤⎡ ⎤ = ⋅ − = − =⎢ ⎥⎣ ⎦ ⎣ ⎦∑ ∑

2σΝ

λόγω της (6.13)

Για Ν→∞ , 2

( ) 0V V x σ⎡ ⎤ = =⎣ ⎦ Ν : (6.16)

131

Συνεπώς η (6.15) λόγω της (6.16) γράφεται : [ ]( )f V x →∞ [ ] [ ] [ ]( ( ) ) ( ( ) ) 0P V x V x P V x V x ε⇒ = →∞⇒ − ≥ = . Δηλαδή ισχύει

η σχέση (6.3) για κάθε ε και λ . Συνεπώς ο εκτιμητής μας είναι συνεπής. β . Προκατάληψη

Η αναμενόμενη τιμή του εκτιμητή ( )V x είναι :

[ ] [ ] [ ]2

1 1

1 1( ) ( )N

ii

E V x E x V x V xN ι

μΝ

= =

⎡ ⎤= − = =⎣ ⎦ Ν∑ ∑ (6.17)

Eπομένως σύμφωνα με την (6.17) ισχύει : [ ] [ ] [ ] [ ] [ ]( ) ( ) 0 ( ) 0V x V x V x V x b V xΕ = ⇒ Ε − = ⇒ = (6.18) Aρα ο εκτιμητής ( )V x είναι μη προκατειλλημένος γ). Αποδοτικότητα Επειδή όπως είδαμε ο εκτιμητής ( )V x ακολουθεί κανονική κατανομή και η διασπορά του μηδενίζεται όταν N →∞ θα είναι αποδοτικός για μεγάλο πλήθος μετρήσεων b) Θα εξετάσουμε τώρα την περίπτωση κατά την οποία η μέση τιμή της μεταβλητής είναι άγνωστη. Μια λογική διόρθωση είναι να αντιματαστήσουμε

στην (6.12) το μ με τον μέσο όρο του x , δηλαδή : xμ = όπου 1

1 N

ii

x xN =

= ∑

Αρα θα έχουμε :

[ ] 22 2

1 1

1 1( ) ( )N N

i ii i

V x x x x xN N= =

= − = −∑ ∑ (6.19)

α) Προκατάληψη O εκτιμητής αυτός όμως είναι πρακατειλλημένος , γιατί :

[ ] 2 22 2

1

1 N

i ii

E V x x E x E x E xN =

⎡ ⎤⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎡ ⎤ ⎡ ⎤= ⋅ − = − =⎣ ⎦ ⎣ ⎦⎣ ⎦ ⎣ ⎦ ⎣ ⎦⎣ ⎦∑

132

( ) [ ]22 2 2( ) ( )iE x E x E x E x V x V x⎡ ⎤ ⎡ ⎤⎡ ⎤= − − − ⎡ ⎤ = − ⎡ ⎤⎣ ⎦ ⎣ ⎦⎣ ⎦ ⎣ ⎦ ⎣ ⎦ =

[ ] [ ] [ ] [ ]1V x NV x V x V xN N

−− = ⋅ ≠ (6.20)

Συνεπώς στην περίπτωση που η αναμενόμενη τιμή δεν είναι γνωστή και εκτιμάται ως :

[ ]1

1 N

ii

E x x xN =

= = ∑ η στατιστική συνάρτηση

[ ] 2

1

1 ( )N

ii

V x x xN =

= −∑

είναι προκατελλειμένος εκτιμητής Εχοντας προσδιορίσει την προκατάληψη της [ ]V x μπορούμε να την

διορθώσουμε . Πολλαπλασιάζοντας με 1

NN −

μπορούμε να εξαλείψουμε την

προκατάληψη . Πράγματι για τον εκτιμητή :

[ ] 2

1

1 ( )1

N

ii

NV x x xN N =

= ⋅ − =− ∑ 2

1

1 ( )1

N

iix x

N =

−− ∑ έχουμε :

[ ] 2 22 2

1

11 1

N

i ii

NE V x x E x E x E xN N=

⎡ ⎤⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎡ ⎤ ⎡ ⎤= ⋅ − = − =⎣ ⎦ ⎣ ⎦⎣ ⎦ ⎣ ⎦ ⎣ ⎦⎣ ⎦− −∑

( ) [ ]22 2 2( ( ) ( ) ) ( )1 1i

N NE x E x E x E x V x V xN N

⎡ ⎤ ⎡ ⎤⎡ ⎤= − − − ⎡ ⎤ = − ⎡ ⎤⎣ ⎦ ⎣ ⎦⎣ ⎦ ⎣ ⎦ ⎣ ⎦− − =

[ ] [ ] [ ] [ ]1( )1 1

V xN N NV x V x V xN N N N

−− = ⋅ ⋅ =

− − (6.21)

γ) Αποδοτικότητα Tώρα θα πρέπει να υπολογίσουμε την διασπορά αυτού του εκτιμητή .

( ) ( ) ( )2 222 2

2 21 11 1

Ni i

i

x x x xV V x V V

ι

σ σσ σ

Ν

= =

⎡ ⎤ ⎡ ⎤− −⎛ ⎞⎡ ⎤ ⎢ ⎥ ⎢ ⎥= ⋅ = ⋅⎜ ⎟⎣ ⎦ Ν − Ν −⎢ ⎥ ⎢ ⎥⎝ ⎠⎣ ⎦ ⎣ ⎦∑ ∑ (6.22)

133

Η τυχαία μεταβλητή 2

22

1

( )Ni

i

x xχ

σ=

⎡ ⎤−= ⎢ ⎥⎣ ⎦∑ όταν κάθε μέτρηση ix ακολουθεί

κανονική συνάρτηση πυκνότητας πιθανότητας με διασπορά 2σ , χαρακτηρίζεται από την λεγόμενη 2 ( 1)χ Ν − συνάρτηση πυκνότητας πιθανότητας , για 1Ν − βαθμούς ελευθερίας . Η διασπορά της 2V χ⎡ ⎤⎣ ⎦ ισούται με : 2 ( 1) 2 ( 1)V χ⎡ ⎤Ν − = ⋅ Ν −⎣ ⎦ και η (6.22) καταλήγει σε :

42( )1

V V x σ⎛ ⎞⋅⎡ ⎤ = ⎜ ⎟⎣ ⎦ Ν −⎝ ⎠ (6.23)

Παρατηρούμε ότι η ακρίβεια της εκτίμησης άρα και η αποδοτικότητα του εκτιμητή εξαρτάται από την διασπορά των μετρήσεων 6.3.3 Eκτίμηση τυπικής απόκλισης σ O προφανής τρόπος να εκτιμήσουμε το σ είναι να το θεωρήσουμε σαν την τεραγωνική ρίζα της εκτίμησης της μεταβλητότητας , δηλαδή :

( )V xσ = η διαφορετικά 2 2σ σ=

Ας δούμε τις ιδιότητες αυτού του εκτιμητή . α) Συνέπεια Όπως και στην εκτίμηση της μεταβλητότητας ο νόμος των μεγάλων αριθμών και το κεντρικό οριακό θεώρημα εξασφαλίζουν ότι ο παραπάνω εκτιμητής είναι συνεπής β) Προκατάληψη Ότι ο εκτιμητής

[ ] 2

1

1 ( )N

ii

V x x xN =

= −∑

είναι μη προκατειλημμένος δεν σημαίνει ότι και ο εκτιμητής

1

2 2

1

1( ) ( ( ) )N

ii

V x x xN

σ=

= = −∑

θα είναι μη προκατειλημμένος εκτιμητής του σ . Όμως αυτό δεν μας προβληματίζει γιατί στους υπολογισμούς των σφαλμάτων η τυπική απόκλιση εμφανίζεται ως 2σ .

134

γ) Αποδοτικότητα Η απόκλιση του σ μπορεί να βρεθεί από την σχέση :

4

22 22 22 2

21( )( ) ( ) 4 ( ) ( )

4 4 2( 1)d VV V V Vd

σσ σ σσ σ σ σ σσ σ σ

⎛ ⎞⎜ ⎟Ν −⎛ ⎞ ⎝ ⎠= = ⇒ = = =⎜ ⎟ Ν −⎝ ⎠

το οποίο μπορεί να γραφεί σαν :

2( 1)σσσ =Ν −

(6.24)

H σχέση αυτή υπολογίζει την απόκλιση της εκτίμησης του σ σαν συνάρτηση του σ . Για να υπολογίσουμε δηλαδή το ( )V σ πρέπει να γνωρίζουμε το σ . Ομως εάν γνωρίζουμε το σ γιατί να προσπαθήσουμε να το εκτιμήσουμε ;. Για δύο λόγους : Πρώτον , όταν σχεδιάζουμε ένα πείραμα χωρίς να υπάρχουν οποιαδήποτε δεδομένα , και θέλουμε να βρούμε πόσες μετρήσεις θα πρέπει να πάρουμε για να προσεγγίσουμε με κάποια ακρίβεια την αληθή τιμή του μεγέθους που μετράμε . Για παράδειγμα θέλουμε να μετρήσουμε το σ . Κάνουμε μια λογική υπόθεση ότι π.χ

6σ = , οπότε σύμφωνα με την σχέση (6.24) μπορούμε να πούμε ότι κάνοντας 40 μετρήσεις μπορούμε να μετρήσουμε το σ με ακρίβεια 0.7 . Στην δεύτερη περίπτωση έχουμε τα πειραματικά δεδομένα από τα οποία υπολογίζουμε το σ και εν συνεχεία από την σχέση (6.24) το σφάλμα ως προς την αληθή τιμή του σ . Αν για παράδειγμα κάνοντας 40 μετρήσεις υπολογίσουμε

6,0σ = , θα μπορούμε να πούμε ότι το σφάλμα είναι 6,0 0,7±

6.4 Συνάρτηση Πιθανοφάνειας [ 13 ] Oπως αναφέραμε και στην εισαγωγή αυτού του κεφαλαίου σκοπός της διαδικασίας της εκτίμησης, είναι να προσεγγίσουμε με όσο το δυνατόν μεγαλύτερη ακρίβεια την αληθή τιμή μιάς παραμέτρου των τιμών ενός φυσικού μεγέθους , από περιορισμένο αριθμό μετρήσεων. Επειδή όμως οι περισσότερες φυσικές διαδικασίες ακολουθούν κάποια από τις γνωστές απλές κατανομές (κανονική , διωνυμική κ.λ.π) το παραπάνω πρόβλημα ανάγεται στην εκτίμηση των παραμέτρων της κατανομής . Εστω λοιπόν ότι οι μετρήσεις μας ix ακολουθούν κάποια κατανομή με συνάρτηση πυκνότητας πιθανότητας ( ; )P x θ Το θ είναι η παράμετρος της

135

συνάρτησης που απαιτείται για την συναρτησιακή έκφραση της πυκνότητας πιθανότητας ( π.χ στην κανονική κατανομή έχουμε δύο παραμέτρους την μ και σ ) Όπως αναφέραμε και πιο πάνω ο εκτιμητής του θ δηλαδή ο θ είναι συνάρτηση των μετρήσεων των ix . Επομένως εάν έχουμε p μετρήσεις που ακολουθούν την

( ; )f x θ , και σχηματίσουμε την συνάρτηση 1 2( , ,..., )px x xθ , τότε κατά μέσο όρο ( για

Ν επαναλήψεις των p μετρήσεων ) η τιμή της θ θα είναι θ

Για παράδειγμα σε ένα πείραμα ( π.χ σκέδαση Compton φωτονίου ) μετρούμε συγχρόνως p φυσικές ποσότητες ( τη γωνία cφ , μεταξύ των διευθύνσεων του προσπίπτοντος και σκεδαζομένου φωτονίου : 2p = ) 1 2, ,..., px x x . Επαναλαμβάνοντας το πείραμα Ν φορές , συλλέγουμε τα ακόλουθα πειραματικά δεδομένα : 1 11 12 1, ,..., px x x x= 2 21 22 2, ,..., px x x x= (6.25) ……………………. ……………………. 1 2, ,...,N N N Npx x x x= Γνωρίζοντας ότι οι μετρήσεις μας ακολουθούν την συνάρτηση πυκνότητας πιθανότητας ( ; )f x θ και για δεδομένη τιμή του θ θ= μπορούμε να βρούμε την

πιθανότητα οι μετρήσεις μας να λάβουν τις τιμές 1 2, ,..., Nx x x σε Ν επαναλήψεις της ίδιας πειραματικής διαδικασίας δεδομένου ότι η παράμετρος η οι παράμετροι έχουν την τιμή θ θ= . Η συνάρτηση ( ) ( )1 2; , ,..., ;NL x L x x xθ θ= που προκύπτει με τον

παραπάνω τρόπο είναι συνάρτηση μόνο του θ επειδή οι μεταβλητές ix έχουν συγκεκριμένες τιμές ( αυτές που καταγράφησαν από την πειραματική διαδικασία). Η ( ) ( )1 2; , ,..., ;NL x L x x xθ θ= ονομάζεται συνάρτηση πιθανοφάνειας (likelihood

function ) Eπειδή οι παρατηρήσεις 1 2, ,..., Nx x x είναι αμοιβαία ανεξάρτητες η συνάρτηση

πιθανοφάνειας ( ) ( )1 2; , ,..., ;NL x L x x xθ θ= θα είναι ίση με το γινόμενο των

πιθανοτήτων κάθε μέτρηση να έχει λάβει την τιμή ix για την δεδομένη τιμή της παραμέτρου θ . Δηλαδή :

( ) ( ) ( )1 21

; , ,..., ; ;N iL x L x x x f xι

θ θ θΝ

=

= =∏ (6.26)

136

Μπορούμε όμως να δώσουμε στην Πιθανοφάνεια ένα ευρύτερο περιεχόμενο από αυτό που αναφέραμε πιο πάνω. Μπορούμε να πούμε δηλαδή ότι η Πιθανοφάνεια εκφράζει την πιθανότητα ένας πειραματιστής να συλλέξει τις μετρήσεις

1 2, ,..., Nx x x , όταν η τιμή η οι τιμές των παραμέτρων είναι 1 2, ,..., κθ θ θ .

6.5 Μέγιστη Πιθανοφάνεια [ 13 ] Η αρχή της μέγιστης πιθανοφάνειας είναι μια από τις μεθόδους για την κατασκευή συνεπών εκτιμητών. Εστω 1 2, ,..., Nx x x είναι οι μετρήσεις ενός πειράματος που ακολουθούν κάποια κατανομή με συνάρτηση πυκνότητας πιθανότητας ( ; )f x θ η οποία εξαρτάται από την παράμετρο θ . Η συνάρτηση πιθανοφάνειας των μετρήσεω αυτών είναι :

( ) ( ) ( )1 21

; , ,..., ; ;N iL x L x x x f xι

θ θ θΝ

=

= =∏ (6.27)

Η εκτιμητής θ της παραμέτρου θ για την οποία η συνάρτηση πιθανοφάνειας

( ; )L x θ παίρνει την μέγιστη τιμή της , έχει σημαντικές ιδιότητες και λέγεται εκτιμητής μεγίστης πιθανοφάνειας . Αυτό σημαίνει ότι η μέθοδος μεγίστης πιθανοφάνειας θεωρεί ότι η καλύτερη εκτίμηση της παραμέτρου θ είναι αυτή που μεγιστοποιεί την πιθανότητα να έχουμε πάρει τις μετρήσεις 1 2, ,..., Nx x x . Επομένως το μέγιστο της ( ; )L x θ συμβαίνει για θ θ= και βρίσκεται (κατά τα γνωστά από την θεωρία των συναρτήσεων )από την εξίσωση :

( ; ) 0L x θθ

∂=

όταν (6.28)

0

2

2( ) 0Lθ θθ =

∂≤

Επειδή η συνάρτηση ln ( ; )L x θ έχει μέγιστο για την τιμή του θ , για την οποία έχει και η ( ; )L x θ , για διευκόλυνση της μαθηματικής επεξεργασίας χρησιμοποιούμε την ln ( ; )L x θ αντί της ( ; )L x θ .

137

Παράδειγμα 6.4 [ 7 ] Θεωρούμε την περίπτωση που μετράμε το φυσικό μέγεθος X σε Ν διαφορετικά πειράματα.. Η αληθής τιμή του X είναι μ και υποθέτουμε ότι η συνάρτηση πυκνότητας πιθανότητας κάθε πειράματος ( 1, 2,3,..., )ix i N= είναι κανονική με μέση τιμή μ και τυπική απόκλιση iσ , που διαφέρει από πείραμα σε πείραμα . Ζητάμε να βρούμε την εκτίμηση του μ . Η συνάρτηση πιθανοφάνειας των μετρήσεων είναι :

2

2( )

2

1

2

21

12

( )1ln ln(2 ) ln2 2

i

i

xN

i i

Ni

ii i

L e

xL

μσ

π σ

μπ σσ

−−

=

=

= ⋅⋅ ⋅

⎡ ⎤−= − ⋅ − −⎢ ⎥⋅⎣ ⎦

η οποία μεγισοποιείται για :

21

( ) 0i

Ni

i i

xLμ μ

μμ σ=

=

−∂= =

∂ ∑

και

2

1

21

1

Ni

i iN

i i

xσμ

σ

=

=

=∑

που εκφράζει το βεβερημένο άθροισμα των μετρήσεων , όπου κάθε μέτρηση συμμετέχει με το αντίστροφο της διασποράς της . Αποδεικνύεται ότι η εκτίμηση της μ είναι ελεύθερη πρκατάληψης . Πράγματι :

[ ] [ ]

[ ]2 2 2

1 1 1

2 2 21 1 1

1 1 1

N N Nii

i i ii i iN N N

i i ii i i

E xx

E E

μσ σ σμ μ

σ σ σ

= = =

= = =

= = = =∑ ∑ ∑

∑ ∑ ∑

δηλαδή ίση με την αληθή τιμή

138

Παράδειγμα 6.5 [7 ] Εκτελούμε ένα πείραμα για να υπολογίσουμε τον χρόνο ζωής t , βραχύβιων φυσικών καταστάσεων ( π.χ χρόνο διάσπασης ραδιενεργών πυρήνων ) . Τα πειραματικά μας όργανα είναι «ιδανικά» , χωρίς πειραματικά σφάλματα και με 100% αποδοχή και αποδοτικότητα . Σε κάθε πείραμα παράγονται N καταστάσεις και μετριέται ο χρόνος που με μεσολαβεί μέχρι την διάσπαση καθεμίας από αυτές. :

1 2( , ,..., ).Nt t t t= To πείραμα επαναλαμβάνεται n φορές . Η συνάρτηση πυκνότηας πιθανότητας αυτών των καταστάσεων , είτε πρόκειται για ραδιενεργούς πυρήνες η βραχύβια σωματίδια η έμβια συστήματα , εκφράζεται από την εκθετική συνάρτηση.

1( ; ) , 0t

f t e tλλλ

−= ⋅ ≥

Η παράμετρος λ εκφράζει τον μέσο χρόνο ζωής των φυσικών καταστάσεων : ( )E t λ= . Eστω ότι στο παραδειγμά μας η αληθής τιμή του μέσου χρόνου ζωής είναι

0λ ισούται με 2 , σε κάποιες αυθαίρετες μονάδες χρόνου. Εκτιμάμαι την τιμή της παραμέτρου λ από τα δεδομένα του κάθε πιράματος με την μέθοδο της μέγιτης πιθανοφάνειας . Στο πείραμα υπ’ αριθμόν j , βρίσκουμε :

1

1( ; )jtN

j

i

L t e λλλ

=

= ⋅∏

0

12

0 0

ln ( ; )

Nj

j iit

L t

λ λ

λλ λ λ

=

=

⎛ ⎞∂ Ν= +⎜ ⎟∂⎝ ⎠

1

ln ( ; ) 10 , 1, 2,3,...,j

j Nj ji

i

L t t j nNλ λ

λ λλ ==

⎛ ⎞∂= ⇒ = ⋅ =⎜ ⎟∂⎝ ⎠

Στο σχήμα 6.3 παρίστανται με την μορφή ιστογράμματος οι τιμές των

μεταβλητών 0

ln ( ; )jL t

λ λ

λλ

=

⎛ ⎞∂⎜ ⎟∂⎝ ⎠

και λ , όπως προκύπτουν από τα δεδομένα

10000n = (προσομοιώσεις ) πειραμάτων , όπου σε κάθε πείραμα συλλέγονται 9N = μετρήσεις .

139

Η αναμενόμενη τιμή και η διασπορά των μεταβλητών 0

ln ( ; )L t

λ λ

λλ =

∂⎛ ⎞⎜ ⎟∂⎝ ⎠

και λ

υπολογίστηκαν προσγγιστικά από τις μετρήσεις και βρέθηκαν ίσες με :

[ ]

0

0 01

1

ln ( ; ) ln ( ; 1 ln ( ; )( ) 0

1 ( ) 2

j in

i

N

ii

L t L t L tn

n

λ λλ λ λ λ

λ λ λλ λ λ

λ λ λ

=== =

=

⎛ ⎞ ⎛ ⎞∂ ∂ ∂Ε = =⎜ ⎟ ⎜ ⎟∂ ∂ ∂⎝ ⎠ ⎝ ⎠

⎡ ⎤Ε = =⎣ ⎦

[ ]0

0

2 2

1

ln ( ; ) 1 ln ( ; ) ln ( ; )( ) (1.5)1

j jN

i

L t L t L tVn λ λ

λ λ

λ λ λλ λ λ =

==

⎛ ⎞ ⎛ ⎞∂ ∂ ∂− =⎜ ⎟ ⎜ ⎟∂ − ∂ ∂⎝ ⎠ ⎝ ⎠

( ) ( )2 2

1

1 0.6671

n

ii

Vn

λ λ λ=

⎡ ⎤ − =⎣ ⎦ − ∑

Σχ. 6.3 [ 2 ]

140

Aντίστοιχα στο σχήμα 6.4 παρίστανται με την μορφή ιστογράμματος οι τιμές

των μεταβλητών 0

ln ( ; )jL t

λ λ

λλ

=

⎛ ⎞∂⎜ ⎟∂⎝ ⎠

και λ , όπως προκύπτουν από τα δεδομένα

10000n = (προσομοιώσεις ) πειραμάτων , όπου σε κάθε πείραμα συλλέγονται 10000N = μετρήσεις .

Η αναμενόμενη τιμή και η διασπορά των μεταβλητών 0

ln ( ; )L t

λ λ

λλ =

∂⎛ ⎞⎜ ⎟∂⎝ ⎠

και λ

υπολογίστηκαν προσγγιστικά από τις μετρήσεις και βρέθηκαν ίσες με :

[ ]

0

0 01

1

ln ( ; ) ln ( ; 1 ln ( ; )( ) 0

1 ( ) 2

j in

i

N

ii

L t L t L tn

n

λ λλ λ λ λ

λ λ λλ λ λ

λ λ λ

=== =

=

⎛ ⎞ ⎛ ⎞∂ ∂ ∂Ε = =⎜ ⎟ ⎜ ⎟∂ ∂ ∂⎝ ⎠ ⎝ ⎠

⎡ ⎤Ε = =⎣ ⎦

[ ]0

0

2 2

1

ln ( ; ) 1 ln ( ; ) ln ( ; )( ) (50)1

j jN

i

L t L t L tVn λ λ

λ λ

λ λ λλ λ λ =

==

⎛ ⎞ ⎛ ⎞∂ ∂ ∂− =⎜ ⎟ ⎜ ⎟∂ − ∂ ∂⎝ ⎠ ⎝ ⎠

Σχ.6.4 [2 ]

141

Από την σύγκριση των σχημάτων 6.3 και 6.4 βλέπουμε ότι η συνάρτηση

πυκνότητας πιθανότητας που περιγράφει τις μεταβλητές 0

ln ( ; )jL t

λ λ

λλ

=

⎛ ⎞∂⎜ ⎟∂⎝ ⎠

και

λ ,εξαρτάται από το πλήθος , Ν , των μετρήσεων και μάλιστα όσο μεγαλύτερο είναι το N , τείνει προς την κανονική κατανομή.

6.5.2 Ιδιότητες της Μεθόδου Μεγίστης Πιθανοφάνειας Οι εκτιμητές που υπολογίζονται με την Μέθοδο της Μέγιστης Πιθανοφάνειας είναι συνήθως συνεπείς . Όμως δεν μπορούμε να πούμε το ίδιο για την προκατάληψη. Για πεπερασμένο πλήθος μετρήσεων υπάρχει μόνο μία περίπτωση όπου ο εκτιμητής της μεγίστης πιθανοφάνειας έχει ιδανικές ιδιότητες . Αυτή είναι η περίπτωση που η συνάρτηση πυκνότητας πιθανότητας μπορεί να γραφεί σε εκθετική μορφή. [ ]( ; ) exp ( ) ( ) ( ) ( )f x a x a x cθ θ β θ= ⋅ + + (6.29) Στην περίπτωση αυτή η στατιστική συνάρτηση

1

( ) ( )N

ii

t x a x=

= ∑ είναι μη προκατειλημμένος εκτιμητής της

ποσότητας 0

0

0

( )

( )( )

dad

rdcd

θ θ

θ θ

θθ

θθθ

=

=

⎛ ⎞⎜ ⎟⎝ ⎠

= −⎛ ⎞⎜ ⎟⎝ ⎠

, όχι κατ’ ανάγκη της αληθούς τιμής της

παραμέτρου θ , 0θ .Μόνον όταν ( )r θ θ= ο εκτιμητής

1 21

1( ) ( , ,..., ) ( )N

N ii

t x t x x x xN

θ α=

= = = ⋅∑ είναι αποδοτικός και χωρίς προκατάληψη .

Όταν έχουμε μεγάλο πλήθος μετρήσεων δηλαδή Ν→∞ αποδεικνείεται ότι η εκτίμηση της μέγιστης πιθανοφάνειας είναι συνεπής και μη προκατειλημμένος . Στην περίπτωση αυτή η ποσότητα :

0

ln ( ; )L xrθ θ

θθ =

∂⎛ ⎞= ⎜ ⎟∂⎝ ⎠ (6.30)

ακολουθεί κανονική συνάρτηση πυκνότητας πιθανότητας με μέση τιμή ίση με μηδέν

και διασπορά : 2

2

ln( ; ) ln ( ; )x L xV θ θθ θ

⎡ ⎤∂ ∂⎡ ⎤ = −Ε ⎢ ⎥⎢ ⎥∂ ∂⎣ ⎦ ⎣ ⎦ (6.31)

H απόκλιση της εκτίμησης από την πραγματική τιμή είναι ανάλογη της πρώτης παραγώγου του λογαρίθμου της πιθανοφάνειας , δηλαδή :

142

0

0

0 2

2

ln ( ; )

ln ( ; )

L x

L xθ θ

θ θ

θθ

θ θθ

θ

=

=

∂⎛ ⎞⎜ ⎟∂⎝ ⎠

− =⎛ ⎞∂⎜ ⎟∂⎝ ⎠

(6.32)

Kατά συνέπεια η εκτίμηση της παραμέτρου θ ακολουθεί κανονική συνάρτηση πυκότητας πιθανότητας με μέση τιμή την αληθή τιμή , 0θ και διασπορά :

0

2

2

1ln( ; )( )

Vx

θ θ

θθ

θ =

⎡ ⎤ =⎣ ⎦ ∂∂

(6.33)

Όταν το N →∞ η διασπορά V θ⎡ ⎤

⎣ ⎦ παιρνει την ελάχιστη τιμή της και συνεπώς

η εκτίμηση μεγίστης πιθανοφάνειας φτάνει στην μέγιστη δυνατή ακρίβεια. Στην περίπτωση αυτή που ονομάζεται και «ασυμπτωτικό όριο » ο εκτιμητής της μέγιστης πιθανοφάνειας είναι ο ακριβέστερος όλων των άλλων μεθόδων εκτίμησης. Όπως όμως είδαμε πιο πάνω θα πρέπει να είμαστε προσεκτικοί στην περίπτωση που έχουμε μικρό αριθμό μετρήσεων , γιατί τότε η μέθοδος της μέγιστης πιθανοφάνειας μπορεί να μας οδηγήσει σε προκατειλημμένους εκτιμητές .

6.6 Εκτεταμένη Μέθοδος Μέγιστης Πιθανοφάνειας [13] Υπάρχουν αρκετές πειραματικές διαδικασίες , όπου ο αριθμός των μετρήσεων που κάνουμε είναι άγνωστος . Σ’ αυτά τα πειράματα ο αριθμός των μετρήσεων που κάνουμε για κάποιο ορισμένο χρονικό διάστημα είναι τυχαίος . Για παράδειγμα η μέτρηση των αυτοκινήτων σε μια διάβαση η όταν μετράμε την ενέργεια μια ακτινοβολίας όπου δεν γνωρίζουμε εκ των προτέρων πόσα φωτόνια θα καταμετρήσουν οι ανιχνευτές μας . Η συνάρτηση πιθανοφάνειας που περιγράφει αυτά τα πειράματα, εξαρτάται αποκλειστικά από την συναρτησιακή μορφή της συνάρτησης πυκνότητας πιθανότητας των τυχαίων μεταβλητών που χαρακτηρίζουν το πρόβλημα . Δεν μεταφέρει καμμιά πληροφορία σχετικά με τον αριθμό των γεγονότων που αναμένεται να συλλέξει κανείς στο συγκεκριμένο πείραμα , έστω και αν το αναμενόμενο πλήθος γεγονότων εξαρτάται από τις υπό εκτίμησης παραμέτρους . Για να συμπεριλάβουμε στην εκτίμηση των παραμέτρων και την πληροφορία που εμπεριέχει ο συνολικός αριθμός των δεδομένων , πολλαπλασιάζουμε την

143

συνάρτηση πιθανοφάνειας με την πιθανότητα ανίχνευσης Ν γεγονότων , η οποία εκφράζεται από Poissonian συνάρτηση πιθανότητας . :

( ) ( )

1 1

( )( ; ) ( , ) ( ; ) ( , )

N N

i E ii

eL x f x L x f x

N

ν θ

ι

ν θθ θ θ θ

−Ν

= =

⋅= → = ⋅∏ ∏

και 1 2 1 20

( ; ) ... 1 ( ; ) ...N E NN

L x dx dx dx L x dx dx dxθ θ∞

=

= → =∑∫ ∫

( )1 2

1( ; ) ... 1E Ne L x dx dx dxν θ θ

∞−

Ν=

= + =∑∫ (6.34)

όπου το διάνυσμα 1 2( , ,..., )TNx x x x= εμπεριέχει τις Ν μετρήσεις και ( )ν θ είναι η αναμενόμενη τιμή του πλήθους των μετρήσεων , η οποία συνήθως είναι συνάρτηση της παραμέτρου θ . Η σττιστική συνάρτηση ( ; )EL x θ που ορίστηκε στην σχέση (6.34) ονομάζεται εκτεταμένη (extended) συνάρτηση πιθανοφάνειας . Η εκτεταμένη πιθανοφάνεια έχει τις ίδιες ιδιότητες με την μέγιστη πιθανοφάνεια δηλαδή : H ποσότητα :

0

ln ( ; )L xrθ θ

θθΕ

=

∂⎛ ⎞= ⎜ ⎟∂⎝ ⎠ (6.35)

ακολουθεί κανονική συνάρτηση πυκνότητας πιθανότητας με μέση τιμή ίση με μηδέν

και διασπορά : 2

2

ln ( ; ) ln ( ; )E EL x L xV θ θθ θ

⎡ ⎤∂ ∂⎡ ⎤ = −Ε ⎢ ⎥⎢ ⎥∂ ∂⎣ ⎦ ⎣ ⎦ (6.36)

H απόκλιση της εκτίμησης από την πραγματική τιμή είναι ανάλογη της πρώτης παραγώγου του λογαρίθμου της πιθανοφάνειας , δηλαδή :

0

0

0 2

2

ln ( ; )

ln ( ; )

E

EE

L x

L xθ θ

θ θ

θθ

θ θθ

θ

=

=

∂⎛ ⎞⎜ ⎟∂⎝ ⎠

− =⎛ ⎞∂⎜ ⎟∂⎝ ⎠

(6.37)

Kατά συνέπεια η εκτίμηση της παραμέτρου Eθ ακολουθεί κανονική συνάρτηση πυκότητας πιθανότητας με μέση τιμή την αληθή τιμή , 0θ και διασπορά :

144

0

2

2

1ln ( ; )( )

EE

VL x

θ θ

θθ

θ =

⎡ ⎤ =⎣ ⎦ ∂∂

(6.38)

6.7 Μέθοδος των Ελαχίστων Τετραγώνων

H αρχή των ελαχίστων τετραγώνων σαν μέθοδος εκτίμησης προέρχεται από την αρχή της μέγιστης πιθανοφάνειας . Την μέθοδο αυτή μπορούμε να την χρησιμοποιήσουμε στα ακόλουθα είδη προβλημάτων 1ον : Εκτίμηση των παραμέτρων της συνάρτησης πυκνότητας πιθανότητας που ακολουθούν οι μετρήσεις μας , όταν έχουμε μετρήσεις μιας η περισσοτέρων ανεξαρτήτων τυχαίων μεταβλητών 1 2, ,..., Nx x x x . 2ον : Εκτίμηση των παραμέτρων της σχέσης στατιστική εξάρτησης , όταν έχουμε μετρήσεις δύο στατιστικώς εξαρτημένων μεταβλητών x και y . Στην περίπτωση αυτή η μέθοδος των ελαχίστων τετραγώνων χρησιμοποιείται για την εκτίμηση των αγνώστων παραμέτρων κυρίως όταν έχουμε δύο μεταβλητές x και y και διαθέτουμε : α) Τιμές της μεταβλητής x β) Τιμές της μεταβλητής y με ακρίβεια yσ γ) Την συναρτησιακή εξάρτηση της y από την x , ( ; )y f x a= .Η σχέση αυτή περιέχει την άγνωστη παράμετρο a την οποία πρέπει να εκτιμήσουμε . Παρακάτω εξετάζουμε τις δύο αυτές περιπτώσεις 1ον: Υποθέτουμε ότι έχουμε Ν ανεξάρτητες μετρήσεις της ποσότητας 1 2, , ,..., Nx x x x που ακολουθούν κανονική συνάρτηση πυκνότητας πιθανότητας με

αναμενόμενη τιμή ( )iE x μ= και τυπική απόκλιση iσ . ( )1, 2,...,i N= . Για την εκτίμηση της μ χρησιμοποιούμε την σχέση :

( )

( )

( ) ( )

2

22

1

2

21

1;2

ln ; ln(2 ) ln2 2

i

i

xN

i i

Ni

ii i

L x e

xL x

μσμ

π σ

μμ π σ

σ

−−

=

=

= ⋅ ⇒⋅

⎛ ⎞−Ν= − ⋅ + − −⎜ ⎟

⎜ ⎟⋅⎝ ⎠

∑ (6.39)

Από την (6.39) προκύπτει ότι η μεγιστοποίηση της πιθανοφάνειας ( );L y μ αντιστοιχεί στην ελαχιστοποίηση της ποσότητας :

145

2

22

1

( )Ni

i i

xQ μσ=

⎛ ⎞−= ⎜ ⎟

⎝ ⎠∑ (6.40)

Η (6.40) ελαχιστοποιείται όταν :

( ) 221

21

21

( ) 2 01

Ni

Ni iiN

i

i i

xxQ

μ μι μ μ

σμμ

μ σσ

=

== =

=

⎛ ⎞⎜ ⎟−⎛ ⎞∂ ⎝ ⎠= − ⋅ = ⇒ =⎜ ⎟∂ ⎛ ⎞⎝ ⎠⎜ ⎟⎝ ⎠

∑∑

∑ (6.41)

Kαταλήξαμε δηλαδή στην ίδια ακριβώς εκτίμηση με την μέθοδο της μέγιστης πιθανοφάνειας . Η διασπορά της (6.41) είναι :

( ) ( )2 1

21 1

1N N

ii ii i

V V yxμμ

σ

= =

⎛ ⎞ ⎛ ⎞∂= ⋅ =⎜ ⎟ ⎜ ⎟⎜ ⎟∂ ⎝ ⎠⎝ ⎠∑ ∑ (6.42)

2ον : Eξαρτημένες Μεταβλητές Το πρόβλημα που εξετάσαμε προηγουμένως αναφέρονταν σε μία η περισσότερες ανεξάρτητες τυχαίες μεταβλητές . Σε αρκετές περιπτώσεις όμως οι μεταβλητές δεν είναι ανεξάρτητες , και πρέπει να βρούμε την μεταξύ τους σχέση. Δύο ανεξάρτητες μεταβλητές μπορεί να εξαρτώνται με δύο τρόπους : α) Να είναι συναρτησιακά εξαρτημένες δηλαδή να υπάρχει μονοσήμαντη

αντιστοιχία μεταξύ τους , όπως π.χ στον Νόμο του Ohm VIR

= . Εάν παραβλέψουμε

τα σφάλματα μετρήσεων και μετρήσουμε την τάση V και την ένταση I , κρατώντας σταθερή την αντίσταση R τα σημεία ( ),I V θα βρίσκονται πάνω σε ευθέια γραμμή. β) Οι μεταβλητές όμως δεν είναι όμως πάντα συναρτησιακά εξαρτημένες , δηλαδή μία ορισμένη τιμή της μιάς μεταβλητής δεν αντιστοιχεί πάντοτε στην ίδια τιμή της άλλης μεταβλητής . Για παράδειγμα η σχέση μεταξύ του βάρους και του ύψους των ανδρών ενός πληθυσμού. Εάν σχεδιάσουμε τα ζεύγη τιμών ( ),y x =(ύψος ,βάρος ) θα πάρουμε το διάγραμμα του σχ. 6.5

146

Σχήμα 6.5 Μετρήσεις ύψους και βάρους ενηλίκων ανδρών [ 1 ] Από το διάγραμμα αυτό προκύπτει ότι για μια ορισμένη τιμή του ύψους αντιστοιχεί μια κατανομή των τιμών βάρους . Επομένως δεν υπάρχει μονοσήμαντος αντιστοιχία μεταξύ των τιμών ύψους και βάρους , μπορούμε όμως να πούμε ότι σε μια καθορισμένη τιμή του ύψους x , αντιστοιχεί μια τελείως καθορισμένη μέση τιμή του βάρους y . Η γραμμή που ενώνει τα σημεία της μεταβλητής x με τα αντίστοιχα των μέσων τιμών της y , λέγεται γραμμή παλινδρόμησης και εκφράζεται από την εξίσωση. ( ) ( ; )y x h x θ= Η γραμμή αυτή μπορεί να είναι ευθεία η καμπύλη , οπότε η εξίσωση θα είναι γραμμική η μη γραμμική. Υποθέτουμε ότι διαθέτουμε ένα πλήθος μετρήσεων μιας ποσότητας Y οι τιμές της οποίας προκύπτουν από την τιμή κάποιας άλλης ποσότητας X . Υπάρχει δηλαδή στατιστική εξάρτηση μεταξύ τους . Διαθέτουμε συνεπώς Ν ζεύγη μετρήσεων , 1, 2,...,i iy x i N= των ποσοτήτων ( )Y X και X αντίστοιχα. Υποθέτουμε επίσης ότι οι τιμές ix δεν πάσχουν από κανένα μετρητικό σφάλμα αντιστοιχούν δηλαδή στις αληθείς τιμές τους , ενώ το αναμενόμενο σφάλμα των μετρήσεων iy είναι iσ με 1, 2,...,i N= . Η συνάρτηση πυκνότητας πιθανότητας των μετρήσεων iy δεν είναι κατ’ ανάγκη κανονική. Σκοπός μας είναι να βρούμε την σχέση εξάρτησης της ποσότητας Y από την ποσότητα X δηλαδή την γραμμή παλινδρόμησης που εκφράζεται από την σχέση : ( ) ( ; )y x h x θ= (6.43) Για να επιτύχομε τον σκοπό μας θα πρέπει πρώτον να γνωρίζουμε την μορφή της συνάρτησης ( ; )h x θ στηριζόμενοι σε φυσικές θεωρίες , εμπειρία , διαίσθηση κ.λ.π ,

147

και δεύτερον να προσδιορίσουμε τις k παραμέτρους ( )1 2, ,..., Tkθ θ θ θ= με την

μέθοδο των ελαχίστων τετραγώνων Προσπαθούμε δηλαδή να επιτύχουμε την πιο καλη προσαρμογή της γραμμής παλινδρόμησης στις πειραματικές μας μετρήσεις , όπως φαίνεται στο σχ. 6.6

Σχήμα 6.6 Γραφική παράσταση του προτύπου (6.43) Οι καμπύλες παριστούν Την συνάρτηση πυκνότητας πιθανότητας των μετρήσεων yi 6.7.2 Εκτίμηση Παραμέτρων Γραμμικού Προτύπου [ 13 ] Στην ανάλυση πειραματικών δεδομένων ,βασικός σκοπός είναι η εύρεση της σχέσης (6.43) χρησιμοποιώντας τις διαθέσιμες μετρήσεις μας . Η εύρεση αυτής της σχέσης αποσκοπεί στον προδιορισμό φυσικών σταθερών η στην εμπειρική περιγραφή των δεδομένων π.χ για να βαθμονομηθεί η απόκριση ενός οργάνου. Για παράδειγμα για να βρεθεί η καμπύλη βαθμονόμησης ενός θερμοζεύγους μετράμε την διαφορά δυναμικού ( )V Y V→ στα άκρα του όταν εκτίθεται σε γνωστή

θερμοκρασία ( )T X T→ . Εχοντας διαθέσιμα τα N ζεύγη μετρήσεων

( ) ( ) ( ) , , ,i i i i i it y x tν ν→ και τα αντίστοιχα σφάλματα στις μετρήσεις της διαφοράς δυναμικού , προσδιορίζουμε την σχέση ( ) ( ; )y x h x θ= και επομένως γνωρίζουμε την απόκριση του θερμοζεύγους ( )tν σα συνάρτηση της θερμοκρασίας . Θα εξετάσουμε την περίπτωση που η σχέση (6.43) είναι γραμμική και εκφράζεται από την ακόλουθη σχέση :

1 1 2 21

( ) ( ) ( ) ... ( ) ( )k

k k i ii

y x h x h x h x h xθ θ θ θ=

= ⋅ + ⋅ + + ⋅ = ⋅∑ (6.44)

Προκειμένου να εκτιμήσουμε τις τιμές των παραμέτρων για τις οποίες το πρότυπο προσαρμογής περιγράφει επαρκώς τις μετρήσεις χρησιμοποιούμε την ποσότητα Q , όπου :

148

[ ] 2

1

Ni i

i

y E yQ

ισ=

⎛ ⎞−= =⎜ ⎟

⎝ ⎠∑

22

21 1 1

( ( )) 1 ( )N N k

i ii j j

i i ji

y y x y h xι

θσ σ= = =

⎛ ⎞⎛ ⎞−= − ⋅⎜ ⎟⎜ ⎟

⎝ ⎠ ⎝ ⎠∑ ∑ ∑ (6.45)

H εκτίμηση των παραμέτρων επιτυγχάνεται με την μεγιστοποίηση της τιμή της ποσότητας 2Q , η οποία καταλήγει στην λύση του ακόλουθου συστήματος k

εξισώσεων με k αγνώστους : 1 2, ,..., kθ θ θ :

( )1 1

2

21 1

12 ( ) ( ) 0N k

j l l j i ij li j

Q y h x h xθ θ

θθ σ= ==

⎛ ⎞∂ ⎛ ⎞= ⋅ ⋅ − ⋅ ⋅ − =⎜ ⎟ ⎜ ⎟∂ ⎝ ⎠⎝ ⎠

∑ ∑ για 1, 2,3,...,i k= (6.46)

Οι σχέσεις (6.46) ανάγονται στο ακόλουθο σύστημα εξισώσεων :

2 21 1 1

( )( ) ( )

N k Ni j j

l l j i jj l jj j

h x yh x h xθ

σ σ= = =

⎛ ⎞ ⎛ ⎞⋅ ⋅ = ⋅⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠∑ ∑ ∑ για 1, 2,3,...,i k= (6.47)

που καλείται σύστημα κανονικών εξισώσεων

6.7.3 Εκτίμηση Παραμέτρων Ευθείας [13 ] Οι παραπάνω εξισώσεις μπορούν να εφαρμοσθούν για την προσαρμογή ευθείας στα πειραματικά δεδομένα. Εστω ότι έχουμε Ν ζεύγη αμοιβαία ανεξάρτητων μετρήσεων , , 1,2,3,...,i ix y i N= των ποσοτήτων ( )Y X και X , στις οποίες θέλουμε να προσαρμόσουμε το γραμμικό πρότυπο y a b x= + ⋅ (6.48) Στην σχέση (6.47) μπορούμε να θέσουμε : 2k = , 1θ α= , 2 bθ = , 1( ) 1h x = , 2 ( )h x x= (6.49) To βεβαρημένο άθροισμα τετραγώνων θα είναι :

2

2

1

Ni i

i

y a b xQισ=

⎛ ⎞− − ⋅= ⎜ ⎟

⎝ ⎠∑ (6.50)

Eπομένως οι ετιμητές των παραμέτρων θα είναι :

2

21

21

101

Ni i

Ni i

i

y b xQ aa

ι

σσ

=

=

− ⋅∂= ⇒ = ⋅

∂ ∑∑

(6.51)

149

2

2 21

21

10N

i i iN

ii i

i

y x a xQ bxbι

σσ

=

=

⋅ − ⋅∂= ⇒ = ⋅

∂ ∑∑

(6.52)

Αντικαθιστώντας το a από την (6.51) στην (6.52) προκύπτει :

2 2

2 2 2 21 1 1 1

22

2 2 21 1 1

1

1

N N N Ni i i i

i i i ii i i

N N Ni i

i i ii i i

x y x y

bx x

ισ σ σ σ

σ σ σ

= = = =

= = =

⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⋅⋅ − ⋅⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠=⎛ ⎞ ⎛ ⎞ ⎛ ⎞

⋅ −⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ⎝ ⎠

∑ ∑ ∑ ∑

∑ ∑ ∑ και (6.53)

21

21

11

Ni i

Ni i

i

y b xa

ι

σσ

=

=

− ⋅= ⋅∑∑

(6.54)

Στο ίδιο αποτέλεσμα θα καταλήξουμε εάν επιλύσουμε την (6.47) βάσει των συνθηκών της (6.49) Παράδειγμα 6.6 [ 6 ] Προκειμένου να μελετηθεί η μεταβολή της ειδικής θερμότητας ενός υλικού συναρτήσει της θερμοκρασίας , πήραμε τις παρακάτω μετρήσεις : Θερμοκρασία : OC 40 50 60 70 80 90

Ειδική Θερμότητα : 1,651,69

1,681,70

1,721,72

1,751,77

1,761,77

1,761,79

Θεωρούμε ότι η τυπική απόκλιση είναι ίδια για όλες τις μετρήσεις , δηλαδή

ισ σ= , οπότε το σ απαλοίφεται από τις εξισώσεις (6.53) και (6.54) , Εάν ix είναι η θερμοκρασία και iy η ειδική θερμότητα με αντικατάσταση των παραπάνω τιμών στις (6.53) και (6.54) βρίσκουμε : 0,0022b = και 1,587a = Επομένως η γραμμή παλινδρομήσεως εκφράζεται από την εξίσωση : 1,587 0,0022y a b x y x= + ⋅ ⇒ = + ⋅

150

Για 60ox C= π.χ παίρνουμε 1,719y = ειδική θερμότητα Επειδή όμως στις μετρήσεις μας για 60ox C= είχαμε 1,72y = η απόκλισης είναι 1,720 1,719 0,001− = Παράδειγμα 6.7 [ 9 ] Να σχεδιαστεί η ευθεία που προσεγγίζει τα δεδομένα του πινακα και να βρεθεί μια εξίσωση γι’ αυτή την ευθεία .

x 1 3 4 6 8 9 11 14 y 1 2 4 4 5 7 8 9

Σ’ ένα ορθογώνιο σύστημα συντεταγμένων παίρνουμε τα σημεία (1,1) , (3,2) , (4,4) , (6,4) , (8,5) , (9,7) , (11,8) , (14,9) σχ. Φέρνουμε αυθαίρετα μια ευθεία που να περνάει περίπου από τα σημεία αυτά ( διακεκομένη ευθεία )

Mεταφέρουμε τα δεδομένα στον παρακάτω πίνακα για να εκτιμήσουμε τις παραμέτρους της εξίσωσης

151

x y 2x x.y 2y 1 1 1 1 1 3 2 9 6 4 4 4 16 16 16 6 4 36 24 16 8 5 64 40 25 9 7 81 63 49 11 8 121 88 64 14 9 196 126 81

56x =∑ 40y =∑ 2 524x =∑ . 364x y =∑ 2 256y =∑

Aρα

2

2 2 2

2 2 2

( )( ) ( )( ) 40 524 56 364 6 0.545( ) 8 524 56 11

. ( ).( ) 8 364 56 40 7 0.636( ) 8 524 56 11

y x x xya

N x x

N x y x yb

N x x

− × − ×= = = =

− × −

− × − ×= = = =

− × −

∑ ∑ ∑ ∑∑ ∑

∑ ∑ ∑∑ ∑

Αρα η εξίσωση της ευθείας είναι 0.545 0.636y a bx x= + = +

6.8 Μεθοδος των ροπών [ 13 ] Η μέθοδος των ροπών είναι μαζι με τις προηγούμενες μια άλλη μέθοδος κατασκευής συνεπών εκτιμητών Εστω ότι διαθέτουμε Ν μετρήσεις 1 2 3, , ,..., Nx x x x .με συνάρτηση πυκνότητας πιθανότητας ( ; )f x θ . Επίσης ( )a x είναι μια συνάρτηση των μετρήσεων τέτοια ώστε η τετραγωνική της διασπορά να είναι πεπερασμένη. Σύμφωνα με τον νόμο των μεγάλων αριθμών ο μέσος όρος των τιμών αυτής της συνάρτησης συγκλίνει προς την αναμενόμενη τιμή της μεταβλητής [ ]( )xαΕ όταν το N →∞ . Δηλαδή :

[ ]1)

1( ( ) ( ) ( ; )

x

N

i Ni

N a x E a x a x f x dxθ−→∞

= Ω

⋅ ⎯⎯⎯→ = ⋅∑ ∫

Eάν η αναμενόμενη τιμή [ ]( )E a x μπορεί να εκφραστεί σαν συνάρτηση του θ ,

δηλαδή : ( ) ( ; ) ( )x

a x f x dx hθ θΩ

⋅ =∫ η πραγματική τιμή της παραμέτρου εκτιμάται

ως :

152

1 1

1 1

lim ( ) ( )N N

i iN i i

h a x h a xθ − −

→∞= =

⎛ ⎞ ⎛ ⎞= =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

∑ ∑ (6.55)

όπου το όρισμα 1

( )N

ii

a x=

⎛ ⎞⎜ ⎟⎝ ⎠∑ της αντιστρόφου της συνάρτησης ( )h θ υπολογίζεται

χρησιμοποιώντας τα πειραματικά δεδομένα 1 2 3, , ,..., Nx x x x . H σχέση (6.55) μπορεί να μας δώσει περισσότερες από μία τιμες της θ . Στην περίπτωση αυτή μόνο μία από αυτές θα οδηγεί σε συνεπή εκτιμητή. Επίσης η εκτίμηση της (6.55) οδηγεί σε συνεπή εκτιμητή λόγω του νόμου των μεγάλων αριθμών που επικαλεστήκαμε στην αρχή , όμως δεν οδηγεί πάντα σε μη προκατειλλημένους εκτιμητές . Εάν στην (6.55) θέσουμε ( )a x x= , η εκτίμηση της παραμέτρου θ ορίζεται ως :

1 1

1

1 N

ii

h x h xθ − −

=

⎛ ⎞= = ⎡ ⎤⎜ ⎟ ⎣ ⎦Ν⎝ ⎠∑ (6.56)

Eάν υπάρχουν k άγνωστοι παράμετροι 1 2, ,..., kθ θ θ , χρησιμοποιούμε k

συναρτήσεις ( ) jx με 1, 2,3,...,j k= . Στην περίπτωση αυτή έχουμε :

( ) ( ) ( ; ) ( )x

j j jE x x f x dx Mθ θΩ

⎡ ⎤ = ⋅ =⎣ ⎦ ∫ (6.57)

από τον ορισμό των ροπών . Από την (6.57) συμπεραίνουμε ότι :

1 21

1( , ,..., ) ( ) , 1, 2,3,...,Nj j j

ki

M M x j kN

θ θ θ=

= = ⋅ =∑ (6.58)

Λύνοντας το σύστημα των k εξισώσεων της σχέσης (6.58) μπορούμε να υπολογίσουμε τις k παραμέτρους του θ . Παράδειγμα 6.8

153

Ζητείται να βρεθεί μία εκτίμησης της παραμέτρου θ , της συναρτήσης πυκνότητας πιθανότητας ( ; ) ( 1)f x xθθ θ= + ⋅ , όπου 0θ ≥ και 0 1x≤ ≤ , από τις παρακάτων μετρήσεις : Μεταβλητή x : 0.2 0.4 0.5 0.7 0.8 0.8 0.9 0.9− − − − − − − Η ροπή πρώτης τάξης της τυχαίας μεταβλητής x , με συνάρτηση πυκνότητας πιθανότητας την ( ; ) ( 1)f x xθθ θ= + ⋅ είναι :

( )11

0

112

M x x dxθ θθθ+

= + ⋅ ⋅ ⋅ =+∫ (6.59)

H ροπή πρώτης τάξης από τών τιμών των μετρήσεων είναι :

1

1 1 1 0,2 1 0,4 1 0,5 1 0,7 2 0,8 2 0,9 5,2 0,658 8

N

i iif x

MN

=

⋅⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅

= = = =∑

(6.60)

Εξισώνοντας τις (6.59) και (6.60) βρίσκουμε :

1 0,65 0,862

θ θθ+

= ⇒ =+

154

ΚΕΦΑΛΑΙΟ 7 : ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Η έννοια των διαστημάτων εμπιστοσύνης είναι χρήσιμη τόσο στην περιγραφική στατιστική , για να περιγράψουμε την πιθανότητα με την οποία ένα μέγεθος παίρνει τιμές από κάποιο διάστημα τιμών , όσο και στην εκτίμηση παραμέτρων όπου προσδιορίζουμε την πιθανότητα η αληθής τιμή της παραμέτρου να περιέχεται σε κάποιο διάστημα τιμών.

7.1 Διάστημα Εμπιστοσύνης στην Περιγραφική Στατιστική Ας υποθέσουμε ότι το βάρος τών πακέτων ζάχαρης που παράγει μια βιομηχανία ακολουθούν κανονική κατανομή με μέση τιμή 520 γρ και τυπική απόκλιση 10 γρ. Από το διαγραμμα της κανονικης κατανομής ( η από πίνακες ) διαπιστώνουμε ότι το 68% των πακέτων θα έχουν βάρος μεταξύ 510 και 530 γραμμαρίων . Επομένως λέγοντας στον καταναλωτή ότι το βάρος των πακέτων είναι μεταξύ 510 και 530 γραμμαρίων , εννοούμε ότι από τα εκατό πακέτα που παράγουμε μόνο τα 68 θα έχουν βάρος 510 εως 530 γραμμάρια Στην περίπτωση αυτή η «εμπιστοσύνη» μας είναι 68%. Στην κανονική κατανομή μπορούμε να θεωρήσουμε διάφορα διαστήματα εμπιστοσύνης , 68% η 1σ , 95,4% η( 2σ ), 90% (1,64 )η σ , 95% (1,96 )η σ , 99% (2.58 )η σ . Στις υπόλοιπες κατανομές η αντιστοίχηση μεταξύ της τυπικής απόκλισης σ και του ποσοστού είναι διαφορετική. Επειδή υπάρχουν αρκετά διαστήματα με διαφορετικά όρια που αντιστοιχούν σε 68%(1 )σ η 90%(1,64 )σ κ.λ.π θα πρέπει να πρσδιορίσουμε τα όρια των διαστημάτων .

155

Σχήμα 7.1 Διάστημα εμπιστοσύνης 90% για κανονική κατανομή [3 ] Η σχέση που πρέπει να ικανοποιούν τα όρια a και b είναι :

( ) ( ; )b

a

p a x b f x dx Cθ≤ ≤ = =∫ (7.1)

όπου ( ; )f x θ η συνάρτηση πυκνότητας πιθανότητας της κατανομής και C ο βαθμός εμπιστοσύνης , δηλαδή 68%(1 )σ η 90%(1,64 )σ κ.λ.π Eπιπρόσθετα ανάλογα με το είδος του διαστήματος θα πρέπει να ισχύουν και τα εξής :

1. Για συμμετρικά διαστήματα ισχύει : b aμ μ− = − (7.1.α) όπου μ η μέση τιμή της κατανομής

2. Για πολύ στενά διαστήματα ισχύει : mina b imum+ = (7.1.β)

3. Για κεντρικά διαστήματα ισχύει : 1( ; ) ( ; )2

a

b

Cf x dx f x dxθ θ∞

−∞

−= =∫ ∫ (7.1.γ)

Τα κεντρικά διαστήματα είναι τα πιο ευρέως χρησιμοποιούμενα . Με τις παραπάνω προυπθέσεις μπορούμε να ορίσουμε τα όρια a και b .

156

7.2 Διάστημα Εμπιστοσύνης στην Εκτίμηση Στο 6ο κεφάλαιο αναπτύχθηκαν μέθοδοι εκτίμησης μιας άγνωστης παραμέτρου δια μιας μόνο τιμής (εκτίμηση σημείου ) του εκτιμητή θ , χρησιμοποιώντας τις τιμές ενός δείγματος . Δεδομένου όμως το αποτέλεσμα της εκτίμησης είναι τυχαία μεταβλητή , η σημειακή εκτίμησης πρέπει να χρησιμοποιείται όταν υπάρχει μεγάλη πιθανότητα η απλοκλιση 0θ θ− να είναι πολύ μικρή για τον σκοπό που κάνουμε την εκτίμηση.

Αυτό ισχύει ακόμα και αν ο εκτιμητής θ έχει όλες τις ιδιότητες ενός καλού εκτιμητή.Στην αντίθετη περίπτωση ενδιαφερόμαστε για τον προσδιορισμό μιας περιοχής τιμών ( εκτίμηση περιοχής ) η οποία είναι πολύ πιθανό να περιέχει την πραγματική τιμή της παραμέτρου. Εάν υποθέσουμε ότι η πιθανότητα να περιέχεται η απόκλιση 0θ θ− μεταξύ των ορίων ,a b είναι β μπορούμε να γράψουμε : 0 0( ) ( )p a b p a bθ θ β θ θ θ β≤ − ≤ = ⇒ + ≤ ≤ + = (7.2) To διάστημα ,a bθ θ⎡ ⎤+ +⎣ ⎦ ονομάζεται διάστημα εμπιστοσύνης και εκφράζει την

%β εμπιστοσύνη μας να περιέχεται η αληθής τιμή 0θ στο διάστημα αυτό. Τα a θ+

και b θ+ είναι αντίστοιχα το ανώτερο και κατώτερο όριο . Από την (7.2) συμπεραίνουμε ότι τα όρια a θ+ και b θ+ είναι τυχαίες μεταβλητές , εφ’όσον εξαρτώνται από την θ που είναι τυχαία μεταβλητή. Στην προηγούμενη παράγραφο (7.1) είδαμε ότι εάν μια μεταβλητή x ακολουθεί κανονική κατανομή ( η άλλη γνωστή κατανομή ) με μέση τιμή μ και τυπική απόκλιση σ είναι εύκολο να ορίσουμε διαστήματα εμπιστοσύνης [ ],x xσ σ− + με

εμπιστοσύνη 68% η [ ]2 , 2x xσ σ− + με εμπιστοσύνη 95% κ.λ.π να περιέχεται η μ στα παραπάνω διαστήματα. Υποθέτουμε ότι ακολουθώντας την μεθοδολογία του κεφαλαίου 6 , βρίσκουμε την εκτίμηση θ , της παραμέτρου θ , η οποία έχει κανονική κατανομή με διασπορά

2 ( )Vθ

σ θ= . Σύμφωνα μεταλεγόμενα της 7.1 μπορούμε να γράψουμε : 0θ θ

θ σ θ θ σ− ≤ ≤ + όπου 0θ είναι η αληθής τιμή της παραμέτρου θ . Εάν ερμηνεύσουμε την σχέση αυτή σύμφωνα με την παράγραφο 7.1 , ότι δηλαδή η πιθανότητα η αληθής τιμή να βρίσκεται στο διάστημα ,

θ θθ σ θ σ⎡ ⎤− +⎣ ⎦ είναι

68% ,στη ουσία χρησιμοποιούμε την Bayesian προσσέγιση ορισμού ης αληθούς τιμής (Βλέπε κεφάλαιο 4. ). Η προσσέγιση αυτή όπως δείχνεται στο επόμενο παράδειγμα

157

είναι λανθασμένη . Αυτό συμβαίνει γιατί τα όρια του διαστήματος ,θ θ

θ σ θ σ⎡ ⎤− +⎣ ⎦

είναι τυχαίες μεταβλητές . Στο παρακάτω παράδειγμα φαίνεται πως η μέθοδος έυρεσης των ορίων , της παραγράφου 7.1 ,όταν η αληθής τιμή της παραμέτρου δεν είναι γνωστή μπορεί να μας οδηγήσει σε λανθασμένα και παράλογα αποτελέσματα Το βάρος ενός αδειου δίσκου βρίκεται ότι είναι : 25.30 0.14gr± Τοποθετούμε μια ποσότητα ζάχαρης στο δίσκο και το νέο μικτό βάρος του είναι : 25.50 0.14gr± . Συμπεραίνουμε επομένως ότι το βάρος της ζάχαρης που τοποθετήσαμε στον δίσκο είναι : 0.20 0.20gr± .Σύμφωνα με την ενότητα 7.1 μπορούμε να καθορίσουμε ένα διάστημα εμπιστοσύνης για το βάρος της ζάχαρης , με εμπιστοσύνη 68% , και όρια [ ]0,0.40 .Αυτό σημαίνει ότι το 100% 68% 32%− = των δειγμάτων της ζάχαρης είναι

εκτός αυτών των ορίων και μάλιστα το 32% 16%2

= θα έχουμε δείγματα ζάχαρης

με αρνητική μάζα ( μικρότερη από το κατώτερο όριο ) Το πρόβλημα που προσπαθούμε να αντιμετωπίσουμε τίθεται ως εξής : Aπο ένα περιορισμένο αριθμό μετρήσεων 1 2, ,..., Nx x x που ακολουθούν κατανομή με συνάρτηση πυκνότητας πιθανότητας ( ; )f x θ , όπου θ είναι άγνωστη παράμετρος , να προσδιορίσουμε τα όρια του διαστήματος εμπιστοσύνης που περιέχει την αληθή τιμή της παραμέτρου θ , με εμπιστοσύνη ίση με β . Εστω επίσης ότι

( )t t xθ= = είναι η εκτίμηση της παραμέτρου θ από τα πειραματικά δεδομένα. . Θεωρούμε ότι η συνάρτηση πυκνότητας πιθανότητας του αποτελέσματος της εκτίμησης εκφράζεται από την συνάρτηση ( ; )g t θ Εάν η αληθής τιμή της παραμέτρου θ ήταν γνωστή , εστω ίση με 0θ , θα μπορούσαμε να ορίσουμε διάστημα εμπιστοσύνης με πιθανότητα β από την σχέση (7.1.γ) για κεντρικό διάστημα :

1

2

1 2( )

1( ; ) ( ; )2

t

t

p t t t

g t dt g t dt

β

βθ θ+∞

−∞

≤ ≤ =

−= =∫ ∫

(7.3)

Oταν η αληθής τιμή της παραμέτρου θ δεν είναι γνωστή μπορούμε να προσδιορίσουμε διαστήματα εμπιστοσύνης για κάθε δυνατή τιμή που μπορεί να πάρει η παράμετρος [ ] [ ]1 2 1 2, ( ), ( )t t t tθ θ θ→ από την σχέση (7.3) , δηλαδή

158

1

2

1 2( )

( )

( ( ) ( ))

1( ; ) ( ; )2

t

t

p t t t

g t dt g t dtθ

θ

θ θ β

βθ θ+∞

−∞

≤ ≤ =

−= =∫ ∫

(7.4)

Eτσι σε κάθε τιμή της θ βρίσκουμε από την (7.3) το άνω και κάτω όριο 1 2,t t αντίστοιχα του διαστήματος εμπιστοσύνης [ ]1 2,t t Επομένως τα 1t και 2t είναι συνάρτηση του θ και η γραφική τους παράσταση φαίνεται στο σχ. 7.3 (σελ432 τζαμαριας )

Σχήμα 7.2 Γραφική παράσταση ορισμού διαστήματος εμπιστοσύνης με την βοήθεια ζωνών εμπιστοσύνης [ 2 ] Εάν γνωρίζουμε την αληθή τιμή 0θ της παραμέτρου θ εύκολα βρίσκουμε από την γραφική παράσταση του σχ.7.3 τις τιμές 1 0( )t θ και 2 0( )t θ που ορίζουν τα όρια εμπιστοσύνης για το αποτέλεσμα της εκτίμησης t , με επίπεδο εμπιστοσύνης β . Εστω τώρα ότι έχουμε τις μετρήσεις 1 2, ,..., Nx x x από τις οποίες βρίσκουμε μια

εκτίμηση της παραμέτρου θ ίση με t . Η πιθανότητα να βρεθεί το αποτέλεσμα της εκτίμησης στο διάστημα [ ]1 0 2 0( ), ( )t tθ θ είναι ίση με β . Το σημείο που η κατακόρυφος στο t συναντά την 1( )t θ μας δίνει την τιμή της

παραμέτρου θ , 1( )tθ για την οποία η εκτίμηση t είναι ίση με 1t . Ομοια το σημείο

που η κατακόρυφος στο t συναντά την 2 ( )t θ μας δίνει την τιμή της παραμέτρου θ ,

2 ( )tθ για την οποία η εκτίμηση t είναι ίση με 2t . Από το σχ 7.2 αντιλαμβάνεται κανείς ότι

159

- Εάν το αποτέλεσμα της εκτίμησης t βρισκεται στο διάστημα [ ]1 0 2 0( ), ( )t tθ θ

τότε η περιοχή τιμών 2 1( ), ( )t tθ θ⎡ ⎤⎣ ⎦ της παραμέτρου θ εμπεριέχει την αληθή τιμή

της παραμέτρου , 0θ .

- Εάν το αποτέλεσμα της εκτίμησης t δεν βρισκεται στο διάστημα

[ ]1 0 2 0( ), ( )t tθ θ τότε η περιοχή τιμών 2 1( ), ( )t tθ θ⎡ ⎤⎣ ⎦ της παραμέτρου θ δεν

εμπεριέχει την αληθή τιμή της παραμέτρου , 0θ .

Επειδή η εκτίμηση t είναι τυχαία μεταβλητή , ένα ποσοστό ίσο με β των τιμών

της τυχαίας μεταβλητής t θα ανήκει στο διάστημα [ ]1 0 2 0( ), ( )t tθ θ . Επομένως , η πιθανότητα να εμπεριέχεται η αληθής τιμή της παραμέτρου , 0θ , στο διάστημα

τιμών 2 1( ), ( )t tθ θ⎡ ⎤⎣ ⎦ από μία οποαδήποτε τιμή της εκτίμησης t , θα είναι ίση με

β .

Δηλαδή το διάστημα τιμών 2 1( ), ( )t tθ θ⎡ ⎤⎣ ⎦ αποτελεί διάστημα επιστοσύνης για την

αληθή τιμή της παραμέτρου με περιεχόμενο πιθανότητας ίσο με β .

2 0 1( ( ) ( ))p t tθ θ θ β≤ ≤ = (7.5)

Επομένως η δήλωση για το διάστημα εμπιστοσύνης της εκτίμησης της παραμέτρου t μετατρέπεται σε δήλωση για το διάστημα εμπιστοσύνης της αληθούς τιμής της παραμέτρου θ Ο ορισμός του διαστήματος εμπιστοσύνης για την αληθή τιμή μιας παραμέτρου θ ,αποτελεί μια εναλλακτική προσέγγιση (συμβατική μέθοδος ), όπως θα δούμε και πιο κάτω , στην Bayesian μεθοδολογία. Η μέθοδος αυτή προσάπτει μια πιθανότητα β να βρίσκεται η αληθής τιμή 0θ σε ένα στοιχειώδες διάστημα t dt+ , έχοντας μια

τιμή της εκτίμησης t της παραμέτρου θ . Σύμφωνα με την Bayesian μεθοδολογία λοιπόν η σχέση (7.5) ερμηνεύεται ως εξής : « Εάν έχουμε προσδιορίσει μια τιμή του εκτιμητή της παραμέτρου θ , την t , μπορούμε να υπολογίσουμε την πιθανότητα β η αληθής τιμή της θ , η 0θ ,

να βρίσκεται στο στο διάστημα 2 1( ), ( )t tθ θ⎡ ⎤⎣ ⎦ »

Αντίθετα η συμβατική μεθοδολογία θεωρεί εσφαλμένη και υποκειμενική την ιδέα ότι μπορούμε να υπολογίσουμε την πιθανότητα (γνώσης ) της αληθούς τιμής

0θ έχοντας μόνο μία τιμή του εκτιμητή t , της παραμέτρου θ . Η αληθής τιμή παραμένει πάντοτε άγνωστη. Μπορούμε όμως να ορίσουμε διάστημα εμπιστοσύνης

160

2 1( ), ( )t tθ θ⎡ ⎤⎣ ⎦ με περιεχόμενο πιθανότητας ίσο με β .

Σύμφωνα με την συμβατική μεθοδολογία λοιπόν η σχέση (7.5) ερμηνεύεται ως εξής : «Για έναν μεγάλο αριθμό εκτιμώμενων διαστημάτων εμπιστοσύνης , η αναλογία αυτών που θα περιλαμβάνουν την 0θ θα είναι β » Επομένως ο τρόπος που κατασκευάζουμε το διάγραμμα του σχ.7.3 δεν μας επιτρέπει να συμπεράνουμε ότι για μια ορισμένη τιμή της εκτίμησης t η αληθής τιμή της παραμέτρου θ έχει πιθανότητα β να βρίσκεται στο διάστημα 2 1( ), ( )t tθ θ⎡ ⎤

⎣ ⎦ .

Αντίστροφα σημαίνει ότι εάν η αληθής τιμή 0θ βρίσκεται στο διάστημα

2 1( ), ( )t tθ θ⎡ ⎤⎣ ⎦ , η πιθανότητα η εκτίμηση t να βρίσκεται στο διάστημα [ ]1 0 2 0( ), ( )t tθ θ

είναι ίση με β .

7.3 Ορια Εμπιστοσύνης [13] Όπως είπαμε υπάρχουν άπειροι τρόποι να οριστεί ένα διάστημα εμπιστοσύνης . Συνήθως επιλέγονται συμμετρικά όρια , αλλά υπάρχουν περιπτώσεις όπου είναι προτιμητέα τα μη κεντρικά όρια .Για παράδειγμα όταν αναζητάμε πειραματική απόδειξη για την ύπαρξη εξωτικών φυσικών καταστάσεων , ενδιαφερόμαστε να καθορίσουμε από τα πειραματικά δεδομένα « πάνω όρια » για τον ρυθμό παραγωγής τους .Εάν ο ρυθμός παραγωγής σύμφωνα με την φυσική θεωρία που προβλέπει την ύπαρξη της εξωτικής κατάστασης , είναι ανάλογος της παραμέτρου θ , ενδιαφέρει το όριο 1θ στην τιμή της παραμέτρου , ώστε : 1( )p θ θ β≤ = (7.6) Εάν θέλουμε για παράδειγμα να εντοπίσουμε τους υψηλής νοημοσύνης ανθρώπους σ’ έναν πληθυσμό θα πρέπει να βρούμε αυτούς που έχουν δείκτη ευφυίας πάνω από το ανώτερο όριο. Σε άλλες περιπτώσεις εχει αξία να βρεθεί μόνο το κάτω όριο μιάς φυσικής παραμέτρου : 2( )p θ θ β≥ = (7.7) Για παράδειγμα τα νετρίνα έχουν μικρή μάζα . Αν σε ένα πείραμα , όπως π.χ β διάσπασης του τριτίου , που παράγονται νετρίνα μαζί με άλλα στοιχειώδη σωματίδια , θέλουμε να προσδιορίσουμε τα νετρίνα θα πρέπει να βρούμε τις μάζες των σωματιδίων που είναι κάτω από το κατώτερο όριο της μάζας .

161

Παρακάτω θα δείξουμε πως ορίζονται τα όρια εμπστοσύνης , όταν είναι γνωστά η κατανομή του εκτιμητή θ , το περιεχόμενο πιθανότητας β και ο αριθμός των μετρήσεων N . 7.5 Διάστημα Εμπιστοσύνης Μέσης Τιμής α. Περίπτωση πολλων μετρήσεων α1. Διασπορά γνωστή Θεωρούμε την περίπτωση που οι τυχαίες μεταβλητές ix είναι N αμοιβαία ανεξάρτητες δοκιμές του ίδιου πειράματος. Ειχαμε δεί στο κεφ. ότι ο μέσος όρος των N παρατηρήσεων x είναι τυχαία μεταβλητή που ακολουθεί κανονική

κατανομή , με αναμενόμενη τιμή E x μ= και διασπορά 2

V x σ⎡ ⎤ =⎣ ⎦ Ν

όπου 2σ η

διασπορά της κάθε μέτρησης .

Δηλαδή η x κατανέμεται ως 2

( ; , )N xNσμ . Επομένως η μεταβλητή

x

z

N

μσ−

= (7.8)

θα κατανέμεται ως ( ;0,1)N z

Εάν θεωρήσουμε δύο τιμές 112

β ≤ και 212

β ≤ με 1 2β β β+ = έχουμε :

1 2 2 11 1( ) ( )

xp z z p x z x z

N NN

β β β β

μ σ σβ μ βσ − −

−≤ ≤ = ⇒ − ≤ ≤ − = (7.9) (σ

162

Σχήμα 7.3 [1]

Εάν θεωρήσουμε κεντρικό διάστημα δηλαδή 1 212

β β= = και 1 112 2

z zβ β−= − η

σχέση (7.12) γίνεται :

1 11 12 2

( )p x z x zN Nβ β

σ σμ β− −

− ≤ ≤ − = (7.10)

Eάν εκλέξουμε τον βαθμό εμπιστοσύνης β στην σχέση (7.13) , έστω π.χ

95%β = από τους πίνακες κανονικής κατανομής βρίσκουμε ότι : 1 0,9751

2

1,96z zβ−= = (7.11)

και επομένως το 95% όρια εμπιστοσύνης της μ είναι :

1,96xNσ

± (7.12)

Εάν θεωρήσουμε την x τυχαία μεταβητή όπως πράγματι και είναι τότε ησχέση

(7.13) σημαίνει ότι η αναμενόμενη τιμή μ της τυχαίας μεταβλητής x περιέχεται

στο διάστημα 112

x zNβ

σ−

± (7.16) με πιθανότητα β .

Στην πράξη όμως κάνουμε περιορισμένο αριθμό μετρήσεων και γνωρίζουμε συνήθως μόνο μία τιμή της x . Επομένως τα όρια εμπιστοσύνης που προσδιορίζονται από την σχέση (7.16) θα περιέχουν η δεν θα περιέχουν την μ , οπότε οι πιθανότητες είναι : 0 η 1. Στην περίπτωση αυτή η ερμηνεία της σχέσεως (7.13) είναι η εξής : «Εάν υπολογίσουμε πολλούς μέσους όρους μετρήσεων x , και για καθένα από αυτά προσδιορίσουμε το διάστημα εμπιστοσύνης από την σχέση (7.16) , τα %β αυτών θα περιέχουν την μ »

163

Παράδειγμα 7.1 [ 6 ] Να βρεθούν τα 95% όρια εμπιστοσύνης 10N = μετρήσεων ενός πειράματος , των οποίων ο μέσος όρος είναι 25,62x = και η διασπορά τους 2 1,6σ =

Εχουμε 0,95β = , 1 0,97512

1,96z zβ−= = και 1,6 0,4

10Nσ

= = . Αρα

112

1,96 0,4 0,78zNβ

σ−

= × =

επομένως το 95% διάστημα εμπιστοσύνης είναι :

[ ]1 11 12 2

x z x zN Nβ β

σ σμ− −

− ≤ ≤ − =

[ ] [ ]25.62 0.78, 25.62 0.78 24.84, 26.40− + = Oπως εξηγήσαμε και παραπάνω η έκφραση (24.84 26.40)p μ≤ ≤ δεν είναι πλέον σωστή γιατί τα όρια εμπιστοσύνης δεν είναι πλέον τυχαίες μεταβλητές , αλλά έχουν συγκεκριμένες τιμές Η πιθανότητα να περιέχεται η μ στο παραπάνω διάστημα είναι 1 η 0 , αναλόγως αν περιέχεται η όχι η μέση τιμή μ . α2. Διασπορά άγνωστη Πολλές φορές στην πράξη , η διασπορά ( )V x και επομένως η τυπική απόκλιση σ των μετρήσεων που θέλουμε να εκτιμήσουμε την αναμενόμενη τιμή μ , είναι άγνωστη. Στην περίπτωση αυτή , αυτό που μπορούμε να κάνουμε , είναι να χρησιμοποιήσουμε έναν κατάλληλο εκτιμητή για την ( )V x . Στι κεφ 6. είχαμε δεί ένας αμερόληπτος εκτιμητής για την ( )V x δίνεται αποτ ην σχέση :

[ ] 2

1

1 ( )1

N

ii

V x x xN =

= ⋅ −− ∑ (7.13)

Στην περίπτωση αυτή τα όρια εμπιστοσύνης της μ βρίσκονται από την σχέση

(7.13) εάν αντικατασταθεί το σ με με ( )V x σύμφωνα με την σχέση (7.17) Αυτό γιατί η μεταβλητή

164

( )

xz

V xN

μ−= (7.14)

ακολουθεί κανονική κατανομή ( ;0,1)N z β. Περίπτωση λίγων μετρήσεων β1 . Διασπορά γνωστή

Στην περίπτωση αυτή η μεταβλητή x

z

N

μσ−

= ακολουθεί πάλι κατανομή

( ;0,1)N z και το διάτημα εμπιστοσύνης της μ δίνεται από την σχέση (7.13) β2. Διασπορά άγνωστη

Στην πράξη η διασπορά δεν είναι γνωστή οπότε η μεταβλητή x

z

N

μσ−

= λόγω

του μικρού αριθμού των μετρήσεων δεν ακολουθεί κανονική κατανομή και δεν πρέπει να χρησιμοποιείται η σχέση (7.13) για την εκτίμηση διαστημάτων

εμπιστοσύνης της μ . Η μεταβλητή x

z

N

μσ−

= ακολουθεί την κατανομή Student

με 1N − βαθμούς ελευθερίας . Επομένως από τους πίνακες της κατανομής Student μπορούμε να βρούμε την πιθανότητα :

1 1, 1 , 12 2

( )( )N N

xp t t t

V xN

β β

μβ

− −

−− ≤ = ≤ = (7.15)

και να υπολογίσουμε τα όρια εμπιστοσύνης από τις σχέσεις :

1 , 12

( )N

V xx t

Nβ −± (7.16)

165

Eάν υπολογίσουμε επομένως για N μετρήσεις τον x και την ( )V x , το %β διάστημα εμπιστοσύνης της αναμενόμενης τιμής μ των μετρήσεων θα δίνεται από την σχέση :

[ ]1 1, 1 , 12 2

( ) ( )a N N

V x V xp x t x t

N Nβμ β

− −− ≤ ≤ − = (7.17)

7.4 Διάστημα Εμπιστοσύνης Παραμέτρου p Διωνυμικής Κατανομής Πολλές φορές χρειάζεται να βρεθούν τα όρια εντός των οποίων βρίσκεται η παράμετρος p της διωνυμικής κατανομής , η οποία όπως έχουμε δεί έχει συνάρτηση πυκνότητας πιθανότητας

( ; , ) (1 )r N rNP r N p p p

r−⎛ ⎞

= ⋅ ⋅ −⎜ ⎟⎝ ⎠

(7.18)

Όπως δείξαμε στο παράδειγμα ο εκτιμητής της p είναι : xpN

= όπου x είναι η

μεταβλητή που έχει μια χαρακτηριστική ιδιότητα και N ο συνολικός αριθμός των δοκιμών Εάν λάβουμε υπ’όψιν το κεντρικό οριακό θεώρημα , με την προυπόθεση ότι το N είναι μεγάλο , μπορούμε να πούμε ότι η τυχαία μεταβλητή p προσεγγίζει την

κανονική κατανομή με ppμ = και 2 (1 )

p

p pN

σ −= . Επομένως και η μεταβλητή :

( )

(1 ) (1 ) (1 )

x Px Np p pNzNp p p P p p

N N

−− −= = =

− − − (7.23) κατανέμεται ως

( ;0,1)N z Χρησιμοποιώντας την σχέση (7.13) βρίσκουμε το %β διάστημα εμπιστοσύνης της p από την σχέση :

[ ]1 11 12 2

(1 ) (1 )p p p pp p z p p z

N Nβ ββ

− −

− −− ≤ ≤ − = (7.19)

166

Τα όρια εμπιστοσύνης της p , όπως προκύπτει από την παραπάνω σχέση εξαρτώνται από την άγνωστο παράμετρο p . Για να ξεπεράσουμε την δυσκολία

αυτή αντικαθιστούμε την p με την p με την αιτιολογία ότι έαν το p είναι

μεγαλύτερο του p , τότε η τιμή 1 p− είναι μικρότερη της 1 p− και αντίστροφα , με

αποτέλεσμα η αντικατάσταση του p με την p μεταβάλλει πολύ λίγο το γινόμενο (1 )p p− .

Παράδειγμα 7.2 [ 6 ] Μια θερμική κατεργασία βρέθηκε αποτελεσματική 16 φορές από τις 25 εφαρμογές . Να βρεθεί το 99% διάστημα εμπιστοσύνης της πιθανότητας ότι μια κατεργασία είναι αποτελεσματική. Η άγνωστη παράμετρος είναι η πιθανότητα p σε μία ορισμένη δοκιμή. Το μέγεθος του δείγματος είναι 25 και η εκτιμήτρια της p είναι :

16 0,6425

p = =

Tα όρια εμπιστοσύνης είναι :

0,64(1 0,64)0,64 2,58 0,64 0, 2525−

± = ±

και το διάστημα εμπιστπσύνης : [ ]0,39 0,89p≤ ≤ Παράδειγμα 7.3 [ 9 ] Από 100 τυχαίους ψηφοφόρους που ρωτήθηκαν σε μια περοιχή , οι 55 είπαν ότι θα ψηφίσουν έναν ορισμένο υποψήφιο. Να υπολογισθούν τα α) 95% β) 99% και γ) 99.73% διαστήμαα εμπιστοσύνης για την αναλογία ψήφων που θα πάρει ο υποψήφιος αυτός κατά τις εκλογές σ’ όλη την περιοχή α) Τα 95% όρια εμπιστοσύνης για την αναλογία του p του πληθυσμού είναι :

167

(1 ) 0.55 0.451.96 0.55 1.96 0.55 0.10100

p ppN− ×

± = ± = ±

όπου σαν εκτίμηση του p χρησιμοποιήσαμε την δειγματική αναλογία 0.55 β) Τα 99% όρια εμπιστοσύνης για την P είναι

0.55 0.450.55 2.58 0.55 0.13100×

± = ±

γ) β) Τα 99.73% όρια εμπιστοσύνης για την P είναι

0.55 0.450.55 3 0.55 0.15100×

± = ±

7.5 Διάστημα Εμπιστοσύνης Διασποράς κανονικής κατανομής Ε στω ότι η μεταβλητή X ακολουθεί κανονική κατανομή με άγνωστη αναμενόμενη τιμή μ και άγνωστη διασπορά ( )V x . Αποδυκνείεται ότι η

μεταβλητή ( 1) ( )( )

N V xV x− ακολουθεί κατανομή 2X με 1N − βαθμούς ελυθερίας .

Δηλαδή

21

( 1) ( )( )N

N V xXV x−−

= (7.20)

Η κατανομή 2X είναι ασύμμετρος για αυτό λέμε π.χ ότι τα 95% όρια εμπιστοσύνης αντισοιχούν σε δύο τιμές 2

0,025X και 20,975X , όπως φαίνεται και στο

σχ.7.5 (σελ200ψωινου) τέτοιο ώστε το 95% της επιφάνειας της κατανομής να περιέχεται μεταξύ αυτών. Οι τιμές 2

0,025X και 20,975X βρίσκονται από πίνακες

(πίνακας ) για βαθμούς ελευθερίας 1 εως 100.

168

Σχήμα 7.5 Ορια εμπιστοσύνης της Χ2n- [1] Από τα παραπάνω προκύπτει ότι εάν :

2 2 20,025 1 0,975

2 20,975 0,025

( ) 0,95

( ( ) 1) ( )( 1) ( )( ( ) ) 0,95

Np X X X

V x V xN V xP V xX X

−≤ ≤ = ⇒

−−≤ ≤ =

(7.21)

Τα όρια της τυπικής απόκλισης σ θα είναι οι ρίζες των ορίων της σχέσης (7.26) Παράδειγμα 7.4 [ 6 ] Προκειμένου να ελεγχθή το σημείο τήξης του σιδήρου , που προμηθεύεται μια χαλυβουργία πήραμε τις παρακάτω μετρήσεις από ένα τυχαίο δείγμα : 1493 , 1519 ,1518 , 1512 , 1514 , 1489 , 1508 , 1508 , και 1494 Εάν οι θερμοκρασίες τήξεως ακολουθούν κανονική κατανομή να εκτιμηθεί το 95% διάστημα εμπιστοσύνης της διασποράς της θερμοκρασίας τήξεως. Από τις μετρήσεις ρίσκουμε την εκτίμηση της ( )V x . Είναι

10

2

122702503i

ix

=

=∑ , 10N = και 1506,70x =

Επομένως 222702503 10 1506,70( ) 117,12

9V x − ⋅

= =

169

Οι βαθμοί ελευθερίας είναι 1 9N − = επομένως από τον πίνακα (πινακα Χ2) προκύπτει ότι : 2

0,025 2,70X = και 20,975 19,02X =

Επομένως τα 95% όρια εμπιστοσύνης είναι :

2

0,975

( 1) ( ) 9 117,12 55, 4219,02

N V xX− ⋅

= = και

20,025

( 1) ( ) 9 117,12 390, 402,70

N V xX− ⋅

= =

Συνεπώς αν και η αληθής τιμή της ( )V x είναι άγνωστη , γνωρίζουμε ότι το 95% των δειγμάτων θα εχουν διασπορά μεταξύ 55,42 και 390,40

170

ΠΑΡΑΡΤΗΜΑ Α ΚΕΦΑΛΑΙΟ 1 [13] 1.1 Γεωμετρική ερμηνεία της δεσμευμένης πιθανότητας Μπορούμε να καταλάβουμε καλύτερα την έννοια της δεσμευμένης πιθανότητα κάνοντας χρήση της γεωμετρικής πιθανότητας .

Σχήμα 1.1 Τα σύνολα στοιχειωδώ γεγονότων Ω , Α και Β [2] Αν ο δειγματικός χώρος Ω είναι μια περιοχή του επιπέδου ( κάθε γεγονός αντιστοιχεί σε ένα σημείο του επιπέδου ) και περιοχές με ίσα εμβαδά έχουν ίσες πιθανότητες , τότε η πιθανότητα μιάς περιοχής εμβαδού Α που περιέχεται στο Ω , είναι :

[ ][ ]

( )E ΄

p A΄

μβαδονμβαδον

Α=Ε Ω

(1.1)

Aναφερόμενοι στο σχ.1.1 μπορούμε να γράψουμε :

[ ][ ]

( )E ΄

μβαδονμβαδον

ΒΒ =

Ε Ω και [ ]

[ ]&

( )΄ ΄

μβαδον ομη ςμβαδον

Ε Τ Α ΒΑ∩Β =

Ε Ω (1.2)

Η δεσμευμένη πιθανότητα ένα γεγονός να ανήκει στο Β (ένα σημείο του επιπέδου Β) δοθέντος ότι ανήκει στο Α (στα σημεία του επιπέδου Α) ( / )p B A εκφράζονται ως λόγος επιφανειών με τον ακόλουθο τρόπο :

( / )p B A [ ][ ]

& ( )( )

΄ ΄ p A B΄ A P A

μβαδον ομη ςμβαδον

Ε Τ Α Β ∩= =

Ε (1.3)

Oμοια μπορούμε να γράψουμε ότι :

171

[ ][ ]

& ( )( / )( )

΄ ΄ p A Bp A B΄ B P B

μβαδον ομη ςμβαδον

Ε Τ Α Β ∩= =

Ε (1.4)

Aπο τις παραπάνω σχέσεις συνάγεται ότι : ( ) ( / ) ( ) ( / ) ( )p A B p A B P B p B A p A∩ = = (1.5) Εάν τα γεγονότα Α και Β είναι ανεξάρτητα και έχουν μη μηδενικές πιθανότητες , από τις σχέσεις βρίσκουμε :

( ) ( ) ( )( / ) ( )( ) ( )

p A B p A p Bp A B p AP B p B∩ ⋅

= = = και (1.6)

( ) ( ) ( )( / ) ( )( ) ( )

p A B p A p Bp B A p BP A p A∩ ⋅

= = = (1.7)

Όπως αναφέραμε δηλαδή και στην προηγούμενη ενότητα , η πιθανότητα επιλογής του δεύτερου γεγονότος από το σύνολο Α δεν εξαρτάται απο την επιλογή του πρώτου γεγονότος , δηλαδή από το εάν προηγουμένως είχε επιλεγεί γεγονός από το σύνολο Β. 1.2 Απόδειξη του νόμου του Bayes Η υπό συνθήκη πιθανότητα ( / )ip A B για κάθε γεγονός iA εξ’ ορισμού δίνεται από τον τύπο

( )( / )( )i

ip A Bp A Bp B∩

= (1.8)

Επίσης από τον ορισμό της υπό συνθήκη πιθανότητας έχουμε :

( )( / ) ( ) ( / ) ( ).( )

ii i i i

i

p B Ap B A p B A p B A p Ap A∩

= ⇒ ∩ = (1.9)

Eφ’όσον όμως το γεγονός Β πραγματοποιείται μόνον εάν πραγματοποιηθεί ένα από τα γεγονότα 1 2, ,..., kA A A τα οποία όπως είπαμε είναι αμοιβαία αποκλειόμενα ,έχουμε : 1 2( ) ( ) ( ) ... ( )kp A P B A P B A p B A= ∩ + ∩ + + ∩ (1.10)

172

Λόγω της (1.15) η (1.17) γίνεται

1

( ) ( ) ( / )k

i ii

p B p A p B A=

= ∑ (1.11)

Εάν αντικαταστήσουμε στην (1.15) το ( )p B από την (1.18) και το ( )ip A B∩ από το δεύτερο μέλος της (1.16) προκύπτει ο τύπος του Bayes . ΚΕΦΑΛΑΙΟ 3 3.1 Eυρεση του τύπου της Συνάρτησης Πυκνότητας Πιθανότητας της κατανομής Poisson

Για να μελετηθούν αυτές οι περιπτώσεις , θεωρούμε ότι ένα χρονικό διάστημα διαιρείται σε n πολύ μικρά και ίσα διαστήματα το καθένα με μέγεθος

ίσο με 1n

.Τα διαστήματα αυτά είναι τόσο μικρά ώστε η πιθανότητα να συμβούν

περισσότερα από ένα γεγονότα στο ίδιο χρονικό διάστημα 1n

, είναι αμελητέα.

Εστω ότι η πιθανότητα να συμβεί ένα γεγονός στο διάστημα 1n

είναι p. H

πιθανότητα αυτή είναι pnλ

= , όπου λ είναι ο αναμενόμενος αριθμός των

γεγονότων που θα συμβούν το χρονικό διάστημα tΔ Ο αριθμός των γεγονότων που θα συμβούν το χρονικό διάστημα tΔ είναι μια τυχαία μεταβλητή η οποία ακολουθεί διωνυμική κατανομή με την προυπόθεση ότι το n είναι αρκετά μεγάλο ( θεωρητικά τείνει στο άπειρο ) και το p είναι αρκετά μικρό ( θεωρητικά τείνει στο μηδέν ) και το n p λ⋅ = παραμένει σταθερό. Η πιθανότητα για r επιτυχίες θα δίνεται από την γνωστή σχέση :

( )

!( ) 1 (1 )! !

r n rn r

r

n nP rr n n r n r n n

λ λ λ λ−−⎛ ⎞⎛ ⎞ ⎛ ⎞= − = −⎜ ⎟⎜ ⎟ ⎜ ⎟ −⎝ ⎠⎝ ⎠⎝ ⎠

(3.1)

Oταν το n→∞ ( ώστε η πιθανότητα να συμβούν δύο γεγονότα να είναι μηδέν ) αλλά το r παραμένει στθερό , ισχύει η επόμενη προσέγγιση :

( )

! ( 1)( 2)...( 1)! !

rn

n n n n n r nr n r →∞= − − − + ⎯⎯⎯→

− καθώς επίσης και ότι

(1 ) (1 )n rn n e

n nλλ λ− −

→∞ →∞− ⎯⎯⎯→ − ⎯⎯⎯→

173

Επομένως η (3.1) παίρνει την μορφή :

( ; )reP r

r

λ λλ− ⋅

= (3.2)

ΚΕΦΑΛΑΙΟ 4 [13] 4.1 Ευρεση του τύπου διάδοσης σφαλμάτων για συνάρτηση με μία μεταβλητή Ας υποθέσουμε την γενική περίπτωση που το μέγεθος φ είναι συνάρτηση του x . Δηλαδή ( )f xφ = . Για μικρές μεταβολές του x μπορούμε να αναπτύξουμε την

( )f x σε σειρά Taylor γύρω από το σημείο 0x :

00 0( ) ( ) ( )( ) x x

dff x f x x xdx =≈ + − (4.1)

H διασπορά της ( )f x δίνεται από την γνωστή σχέση : 22( )V f f f= − (4.2) Eάν αντικαταστήσουμε την (4.17) στην (4.18) θα πάρουμε :

2( ) ( ) ( ) f xdf dfV f V xdx dx

σ σ≈ ⇒ ≈ ⋅ (4.3)

. O παραπάνω τύπος ισχύει για μικρά σφάλματα , που σημαίνει ότι η πρώτη παράγωγος ελάχιστα μεταβάλλεται για μικρή μεταβολή του σ . Πρέπει να υπολογίσουμε την τιμή της παραγώγου για την πραγματική τιμή του x .Εάν αυτή δεν είναι γνωστή χρησιμοποιούμε την τιμή μέτρησης του x . Στην ειδική περίπτωση που η ( )f x είναι γραμμική συνάρτηση του x , δηλαδή : f ax b= + (4.4) είχαμε δείξει (σχέση 1.45 ) ότι : 2( ) ( ) f xV f V x aα σ σ= ⇒ = (4.5)

174

4.2 Ευρεση του τύπου διάδοσης σφαλμάτων για συνάρτηση με δύο μεταβλητές Υποθέτουμε τώρα ότι έχουμε το μέγεθος φ εξαρτάται από δύο μεταβλητές ,δηλαδή ( , )f x yφ = Όπως και προηγουμένως εάν αναπτύξουμε την ( , )f x y κατά Taylor γύρω από το σημείο 0 0( , )x y και αντικαταστήσουμε στην (4.18) θα καταλήξουμε στην σχέση :

2 2( ) ( ) ( ) ( ) ( ) 2( )( )cov( , )df df df dfV f V x V y x ydx dy dx dy

≈ + + ⇒ (4.6)

2 2 2 2 2( ) ( ) 2( )( )f x y x ydf df df dfdx dy dx dy

σ σ σ ρσ σ= + + (4.7)

Eάν οι ,x y είναι ανεξάρτητες μεταβλητές τότε cov( , ) 0x y = και η (4.22) δίνει :

2 2( ) ( ) ( ) ( ) ( )df dfV f V x V ydx dy

≈ + και (4.8)

2 2 2 2 2( ) ( )f x ydf dfdx dy

σ σ σ= + (4.9)

4.3 Ευρεση του τύπου διάδοσης σφαλμάτων για συνάρτηση με Ν μεταβλητές Οι παραπάνω τύποι γενικεύονται για Ν μεταβλητές που παρίστανται από το διάνυσμα :

1

2

...

N

xx

x

x

⎛ ⎞⎜ ⎟⎜ ⎟=⎜ ⎟⎜ ⎟⎜ ⎟⎝ ⎠

σύμφωνα με τον τύπο : (σχέση για διασπορά συνάρτησης των τυχαίων μεταβλητών 1 2( , ,..., )Nf x x x

175

[ ]1 1

( ) ( ) cov ,N N

x x i ji j i j

f fV f x xx xμ μ= =

= =

∂ ∂ ⎡ ⎤= ⋅ ⋅ ⎣ ⎦∑∑ (4.10)

όπου 1 2( , ,..., )μ μ μ μ Τ

Ν= . Οι συνδιασπορές (conariances) cov( , )i jx x μπορούν να θεωρηθούν στοιχεία του πίνακα V .

[ ] [ ] [ ][ ] [ ] [ ]

[ ] [ ] [ ]

1 1 1 2 1

2 1 2 1 1

1 2

cov , ,cov , ...cov ,

cov , ,cov , ...cov ,................,.................,..................cov , ,cov , ...cov ,

N

N

N N N N

x x x x x x

x x x x x xV

x x x x x x

⎛ ⎞⎜ ⎟⎜ ⎟= ⎜ ⎟⎜ ⎟⎜ ⎟⎝ ⎠

(4.11)

Εάν ορίσουμε το διάνυσμα :

1

'2

( )

( )

.............

( )

x

x

x

fxf

f x

fx

μ

μ

μ

=

=

=

∂⎛ ⎞⎜ ⎟∂⎜ ⎟⎜ ⎟∂⎜ ⎟= ∂⎜ ⎟⎜ ⎟⎜ ⎟∂⎜ ⎟⎜ ⎟∂⎝ ⎠

(4.12)

και η σχέση (4.26) γράφεται :

[ ]1 2

( ) ( ) .....( ) ( )x x xN

f f fV f Vx x xμ μ μ= = =

⎛ ⎞∂ ∂ ∂= ⎜ ⎟∂ ∂ ∂⎝ ⎠

1

2

( )

( )

.............

( )

x

x

x

fxfx

fx

μ

μ

μ

=

=

=

∂⎛ ⎞⎜ ⎟∂⎜ ⎟⎜ ⎟∂⎜ ⎟∂⎜ ⎟⎜ ⎟⎜ ⎟∂⎜ ⎟⎜ ⎟∂⎝ ⎠

( ') 'Tf V f= ⋅ ⋅ (4.13)

4.4 Ευρεση του πίνακα συνδιασποράς για δύο μεταβλητές που έχουν τυχαία σφάλματα 1 2,σ σ και ένα κοινό συστηματικό σφάλμα s

176

Ας υποθέσουμε τώρα ότι έχουμε δύο μετρήσεις 1x και 2x , οι οποίες έχουν ένα κοινό συστηματικό σφάλμα ( )s και τυχαία σφάλματα 1σ και 2σ αντίστοιχα. Σύμφωνα με τα προηγούμενα θα ισχύει : 1 1 1

R Sx x x= + και 2 2 2R Sx x x= +

Προφανώς θα ισχύει ότι : [ ] 2 2

1 1V x sσ= + και [ ] 2 22 2V x sσ= +

Η συνδιασπορά των δύο μεταβλητών 1x και 2x θα είναι : [ ] [ ] [ ] [ ]1 2 1 2 1 2cov ,x x E x x E x E x= ⋅ − ⋅ = 1 1 2 2 1 1 2 2( ) ( ) ( ( )R S R S R S R SE x x x x E x x E x x⎡ ⎤ ⎡ ⎤ ⎡ ⎤= + ⋅ + − + ⋅ + =⎣ ⎦ ⎣ ⎦ ⎣ ⎦

1 2R RE x x⎡ ⎤= +⎣ ⎦ 1 2

R SE x x⎡ ⎤ +⎣ ⎦ 1 2S RE x x⎡ ⎤ +⎣ ⎦ 1 2

S SE x x⎡ ⎤ −⎣ ⎦ 1 2R RE x E x⎡ ⎤ ⎡ ⎤⎣ ⎦ ⎣ ⎦

1 2R SE x E x⎡ ⎤ ⎡ ⎤− ⎣ ⎦ ⎣ ⎦ 1 2

S RE x E x⎡ ⎤ ⎡ ⎤− ⎣ ⎦ ⎣ ⎦ 1 2s SE x E x⎡ ⎤ ⎡ ⎤− ⎣ ⎦ ⎣ ⎦

Στην παραπάνω παράσταση εάν λάβουμε υπ’όψιν ότι η συνδιασπορά των ποσοτήτων 1 2,S Rx x καθώς και των 1 2,R Rx x ισούται με μηδέν γιατί είναι ανεξάρτητες μεταξύ

τους ( 1 1

Rx σ= και 2 2Rx σ= ) θα απομείνουν οι όροι :

1 2S SE x x⎡ ⎤= ⎣ ⎦ 1 2

S SE x E x⎡ ⎤ ⎡ ⎤− ⎣ ⎦ ⎣ ⎦2

1 2cov , ( )S Sx x V s s⎡ ⎤= = =⎣ ⎦ Συνεπώς ο πίνακας συνδιασποράς εκφράζεται ως :

2 2 2

2 2

s sV

σ⎛ ⎞+

= ⎜ ⎟⎝ ⎠

ΚΕΦΑΛΑΙΟ 5 [13] 5.1 Aπόδειξη του τύπου ολοκλήρωσης Μonte Carlo Εστω ότι επιθυμούμε να υπολογίσουμε το ολοκλήρωμα :

( )b

a

I g u du= ∫ (5.1)

177

για κάποια συνάρτηση g της τυχαίας μεταβλητής u . Υποθέτουμε ακόμα ότι η μεταβλητή u παίρνει τιμές σύμφωνα με την συνάρτηση πυκνότητας πιθανότητας

( )f u . Εξ’ ορισμού η αναμενόμενη τιμή της συνάρτησης ( )g u που η μεταβλητή της u παίρνει τιμές σύμφωνα με την συνάρτηση πυκνότητας πιθανότητας ( )f u είναι :

( ( )) ( ) ( )b

ga

E g u g u f u du μ= ⋅ =∫ (5.2)

όπου

( ) 1b

a

f u du =∫ (5.3)

Επειδή όπως είπαμε η μέθοδος ολοκλήρωσης Monte Carlo απαιτεί την παραγωγή τυχαίων αριθμών που προέρχονται από την συνάρτηση πυκνότητας πιθανότητας

( )f u , η απλούστερη περίπτωση να είναι τυχαίοι οι αριθμοί αυτοί είναι όταν η ( )f u είναι ομοιόμορφη , δηλαδή :

1

( )0

a u bf u b a

⎧ ≤ ≤⎪= −⎨⎪⎩

(5.4)

Επομένως η (5.22) θα γραφτεί :

1( ) ( )b

a

IE g g u dub a b a

= =− −∫ (5.5)

Θέτουμε ( )i ig g u= όπου η iu παίρνει τιμές από από την συνάρτηση πυκνότητας πιθανότητας ( )f u δηλαδή ομοιόμορφα . Εάν θεωρήσουμε Ν τιμές της συνάρτησης ( )g u , 1 2( ), ( ),..., ( )Ng u g u g u σύμφωνα με το νόμο των μεγάλων αριθμών ο μέσος όρος των παραπάνω τιμών της

( )g u , 1( )

( )

N

ii

i

g ug u

N==∑

θα συγκλίνει στην αναμενόμενη τιμή της ( )g u , ( ( ))E g u

οταν N →∞ δηλαδή :

1( )

( )

N

ii

i

g ug u

N==∑

= 1( ( )) ( )b

a

IE g u g u dub a b a

= =− −∫ (5.6)

178

Επομένως εάν παράγουμε Ν τιμές της iu , στο διάστημα [ ],a b σύμφωνα με την ομοιόμορφη συνάρτηση πυκνότητας πιθανότητας ( )f u και τις αντικαταστήσουμε στην (5.26) και λύσουμε ως προς I προκύπτει το ολοκλήρωμα I :

1

( )N

ii

b aI g u IN =

−= ⋅ =∑ (5.7)

Για να υπολογίσουμε λοιπόν το ολοκλήρωμα (5.21) ακολουθούμε τα παρακάτω βήματα. : - επιλέγουμε ισοπίθανα Ν πραγματικούς αριθμούς ( 1, 2,3,..., )iu i N= στο διάστημα ολοκλήρωσης [ ],a b . - υπολογίζουμε τις αντίστοιχες τιμές της συνάρτησης ( )ig u και - εφαρμόζουμε την σχέση (5.7) Επειδή για τον υπολογισμό του ολοκληρώματος I ,χρησιμοποιήσαμε τυχαίους αριθμούς είναι ευνόητο ότι το I θα είναι τυχαία μεταβλητή η οποία σύμφωνα με το κεντρικό οριακό θεώρημα ακολουθεί κανονική κατανομή

2

( )21( )

2

I I

I

g I e σ

π σΙ

− −

= ⋅⋅

(5.8)

με αναμενόμενη τιμή ( )( )I E g b a= − και διασπορά η οποία για πεπερασμένο αριθμό Ν προσεγγίζεται από την σχέση :

[ ]2 2

2 2( ) ( ) 1( ) ( ( ( )) ( ))b

a

b a b aV g u E g u g u duN N b a

σΙ

− −= ⋅ = ⋅ − ⋅

−∫

( )22 21( ) ( ( )) ( )b a g u g uN

⎡ ⎤− ⋅ ⋅ −⎣ ⎦

(5.9)

5.2 Β. Μέθοδος ( Επιτυχίας – Απώλειας ) Μια άλλη μέθοδος υπολογισμού του ολοκληρώματος είναι με την μέθοδο Επιτυχίας – Απώλειας Monte Carlo .

179

Στην μέθοδο αυτή χρειαζόμαστε δύο τυχαίους αριθμούς για κάθε υπολογισμό της ( )g u . Οι αριθμοί αυτοί ορίζουν ένα σημείο στο ορθογώνιο παραλληλόγραμμο που ορίζεται από το μέγιστο maxg και ελάχιστο ming της συνάρτησης ( )g u και τα όρια της ολοκλήρωσης a και b . (Σχ. 5.2 ) [ ],iu R a b= .Τυχαίοι αριθμοί σύμφωνα με ομοιόμορφη συνάρτηση

πυκνότητας πιθανότητας στο διάστημα [ ],a b [ ],iz R κ λ= .Τυχαίοι αριθμοί σύμφωνα με ομοιόμορφη συνάρτηση

πυκνότητας πιθανότητας στο διάστημα [ ],κ λ όπου mingκ ≤ και maxgλ ≥

Σχήμα 5.2 Μέθοδος Επιτυχίας – Απώλειας [ 2] Ορίζουμε σαν επιτυχία εάν ( )i iz g u≤ Και ορίζουμε σαν αποτυχία όταν : ( )i iz g u≥ . Eάν μετά από Ν δοκιμές δηλαδή Ν επιλογές ζευγών ,i iu z είχαμε n επιτυχίες και ( )N n− απώλειες η εκτίμηση του ολοκληρώματος θα εκφράζεται από την σχέση :

( ) ( ) ( )nI b a b aN

λ κ κ= ⋅ − ⋅ − + ⋅ − (5.10)

180

H ποσότητα n είναι τυχαία μεταβλητή με διωνυμική συνάρτηση πιθανότητας και αναμενόμενη τιμή [ ]E n N p= ⋅ , όπου p είναι η πιθανότητα επιτυχίας σε κάθεμία από τις δοκιμές (επιλογές του ζεύγους σύμφωνα με ) Από το σχ μπορεί να αποδειχθεί γεωμετρικα΄ ότι

( )( ) ( )I b apb a

κλ κ

− − ⋅=

− ⋅ − (5.11)

Aπο τις (5.30) και (5.31) προκύπτει :

( )( ) ( ) ( ) ( )E nE I b a b aN

λ κ κ= ⋅ − ⋅ − + ⋅ − (5.12)

και επειδή ( )E n N p= ⋅ η (5.32) γράφεται : ( ) ( ) ( ) ( )E I p b a b a Iλ κ κ= ⋅ − ⋅ − + ⋅ − = (5.13) H διασπορά της διωνυμικής μεταβλητής n είναι : ( ) (1 )V n N p p= ⋅ ⋅ − (5.34) και συνεπώς η διασπορά της τυχαίας μεταβλητής I θα είναι :

2 21 1(1 ) ( ) ( ) ( ( ) ) (( ) )V I p b a I b a b a IN

λ κ κ λ⎡ ⎤ = ⋅ − ⋅ − ⋅ − = ⋅ − − ⋅ ⋅ − ⋅ −⎣ ⎦ Ν (5.14)

Από την (5.35) και το σχ. συμπεραίνουμε ότι η διασπορά της τυχαίας μεταβλητής I ελαχιστοποιείται με τρείς τρόπους : - Mεγάλο αριθμό δοκιμών Ν

- Ο παράγοντας κ να πάρει την μέγιστη τιμή δηλαδή mingκ = - Ο παράγοντας λ να πάρει την ελάχιστη τιμή δηλαδή maxgλ =

Ο ταν mingκ ≤ η maxgλ ≥ τότε γίνεται σπατάλη τυχαίων αριθμών , δηλαδή επιλέγουμε ζεύγη τυχαίων αριθμών τα οποία στην συνέχεια θα απορριφθούν , χωρίς να συνεισφέρουν στην ακρίβεια της εκτίμησης . Εάν δεν γνωρίζουμε το μέγιστο και ελάχιστο της υπο ολοκλήρωση συνάρτησης , τα εκτιμούμε με κάποια ασφάλεια

181

Για να έχει πρακτική σημασία η (5.14) θα πρέπει να γνωρίζουμε εκ των προτέρων την τιμή του ολοκληρώματος I . Επειδή αυτό συνήθως δεν συμβαίνει στην σχέση (5.14) αντικαθιστούμε I I→ , οπότε παίρνουμε :

1 ( ( ) ) (( ) )V I I b a b a Iκ λ⎡ ⎤ = ⋅ − − ⋅ ⋅ − ⋅ − =⎣ ⎦ Ν

2 22 (1 ) ( ) ( )n n b a

N Nλ κ⋅ − ⋅ − ⋅ −

επομένως η τιμή του ολοκληρώματος θα είναι :

( )I I V I= ± = ( ) ( ) ( )n b a b aN

λ κ κ= ⋅ − ⋅ − + ⋅ − ±

[ ]1 (1 ) ( ) ( )nn b aN N

λ κ⋅ ⋅ − ⋅ − ⋅ − (5.15)

182

ΠΑΡΑΠΟΜΠΕΣ

1. Η εικόνα προέρχεται από το βιβλίο : ΣΤΑΤΙΣΤΙΚΗ ,Δ.Π. ΨΩΙΝΟΥ

ΘΕΣΣΑΛΟΝΙΚΗ 1982 2. Η εικόνα αυτή προέρχεται από το βιβλίο : Μαθηματικές Μέθοδοι

Φυσικής του : Σ.Ε. Τζαμαρία ,ΕΑΠ 2005 3. Η εικόνα αυτή προέρχεται από το βιβλίο : Statistics : A Guide to

the Use of Statistical Methods in the Physical Sciences , R.J.Barlows (Wiley 1989)

4. Η εικόνα αυτή προέρχεται από το βιβλίο : Πιθανοτητες και

Στατιστική M.R.SPIEGEL ,Mc CRAW –HILL,NEW YORK ΕΣΠΙ ,ΑΘΗΝΑ 1977 5. Η εικόνα αυτή προέρχεται από τoν Δικτυακό τόπο 6. Το παράδειγμα αυτό προέρχεται από το βιβλίο : Δ.Π. ΨΩΙΝΟΣ

7. Το παράδειγμα αυτό προέρχεται από το βιβλίο : Μαθηματικές

Μέθοδοι Φυσικής του : Σ.Ε. Τζαμαρία ,ΕΑΠ 2005 8. Το παράδειγμα αυτό προέρχεται από το βιβλίο : Statistics : A

Guide to the Use of Statistical Methods in the Physical Sciences , R.J.Barlows (Wiley 1989)

9. Το παράδειγμα αυτό προέρχεται από το βιβλίο Πιθανότητες και

Στατιστική M.R SPIGEL ,Mc CRAW-HILL,NEW YORK ,ΕΣΠΙ,ΑΘΗΝΑ 1977

10. Ο Πίνακας προέρχεται από το βιβλίο : ΣΤΑΤΙΣΤΙΚΗ

Δ.Π.ΨΩΙΝΟΣ 11. Η εικόνα αυτή προέρχεται από άρθρο του Δικτυακού τόπου

physics4u 12. Η εικόνα αυτή προέρχεται από τον δικτυακό τόπο :

183

http://physicslab.phys.uoa.gr

ΒΙΒΛΙΟΓΡΑΦΙΑ

13. Σπύρος Ευστ. Τζαμαρίας : Στατιστικές Μέθοδοι Ανάλυσης πειραματικών Δεδομένων , ΕΑΠ 2005.

14. Barlow R .J : Statistics : A Guide to the Use of Statistical Methods in the Physical Sciences (Wiley, 1989)

15. Δ.Π. ΨΩΙΝΟΣ : ΣΤΑΤΙΣΤΙΚΗ , Θεσσαλονίκη 1982

16. ΜURRAY R. SPIEGEL : ΠΙΘΑΝΟΤΗΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ Mc GRAW-HILL, NEW YORK ΕΣΠΙ , ΑΘΗΝΑ 1977

17. .Metzeger W. J., : Lecture Notes Statistical Methods in

Data Analysis, Katholieke Universiteit Nijmegen http://www.hef.ru.nl/wes/stat_course/statistical.html