ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ...

86
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΜΑΘΗΜΑ : ΣΤΑΤΙΣΤΙΚΗ I ΣΗΜΕΙΩΣΕΙΣ ΦΡΟΝΤΙΣΤΗΡΙΑΚΩΝ ΜΑΘΗΜΑΤΩΝ ΕΠΙΜΕΛΕΙΑ ΣΗΜΕΙΩΣΕΩΝ : ΚΑΡΠΕΤΗΣ ΧΡΗΣΤΟΣ 1

Transcript of ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ...

Page 1: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΜΑΘΗΜΑ : ΣΤΑΤΙΣΤΙΚΗ I ΣΗΜΕΙΩΣΕΙΣ ΦΡΟΝΤΙΣΤΗΡΙΑΚΩΝ ΜΑΘΗΜΑΤΩΝ ΕΠΙΜΕΛΕΙΑ ΣΗΜΕΙΩΣΕΩΝ : ΚΑΡΠΕΤΗΣ ΧΡΗΣΤΟΣ

1

Page 2: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

ΚΕΦΑΛΑΙΟ 2

§ 2.1 Στατιστικές µονάδες. Στατιστικά γνωρίσµατα και µεταβλητές

Οι σηµαντικότερες έννοιες οι οποίες συναντώνται στα πλαίσια της παραγράφου αυτής είναι οι εξής :

I. Στατιστική µονάδα καλείται το µέλος ενός πληθυσµού.

II. Μεταβλητή καλείται το στατιστικό γνώρισµα , δηλαδή το κοινό χαρακτη-

ριστικό , των µελών ενός πληθυσµού.

III. Ποιοτική µεταβλητή συνιστά εκείνη η µεταβλητή της οποίας οι τιµές δεν µπορούν να µετρηθούν αλλά µόνο να ταξινοµηθούν σε µία συγκεκριµένη κατηγορία.

IV. Ποσοτική µεταβλητή συνιστά εκείνη η µεταβλητή οι τιµές της οποίας είναι

αριθµοί αναφερόµενοι σε συγκεκριµένες µονάδες.

V. ∆ιατάξιµη µεταβλητή είναι εκείνη η µεταβλητή οι παρατηρήσεις της οποίας δεν µπορούν να µετρηθούν αλλά µπορούν να καταταγούν κατά µία φυσική ιεράρχηση. Εάν η ιεράρχηση αυτή µπορεί να γίνει κατά τρόπο τυχαίο , χωρίς όµως να χάνονται πολύτιµες πληροφορίες , τότε θα λέµε ότι είµαστε στην ονοµαστική κλίµακα. Στην αντίθετη περίπτωση που η ιεράρχηση είναι τέτοια ώστε να αντλούµε από αυτήν πληροφορίες, θα λέµε ότι είµαστε στην τακτική κλίµακα.

VI. Συνεχής µεταβλητή είναι η ποσοτική εκείνη µεταβλητή η οποία µπορεί να

πάρει την οποιαδήποτε τιµή από ένα δοσµένο διάστηµα. Συνήθως οι συνεχείς µεταβλητές περιγράφουν στοιχεία που προέρχονται από µετρήσεις και οι τιµές τους µπορεί να είναι ακόµα και δεκαδικοί αριθµοί.

VII. ∆ιακριτή µεταβλητή είναι η ποσοτική εκείνη µεταβλητή η οποία µπορεί να

πάρει µόνο συγκεκριµένες ( ακέραιες ) τιµές από ένα δοσµένο σύνολο τιµών. Συνήθως οι διακριτές µεταβλητές περιγράφουν στοιχεία που προέρχονται από απαριθµήσεις.

VIII. ∆ιαστρωµατικές παρατηρήσεις είναι εκείνες οι οποίες λαµβάνονται την ίδια

χρονική στιγµή

IX. Χρονολογικές παρατηρήσεις είναι εκείνες οι οποίες λαµβάνονται σε διαδοχικούς χρόνους.

2

Page 3: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

ΑΣΚΗΣΕΙΣ 1 ) Ποια από τα παρακάτω στατιστικά γνωρίσµατα είναι διακριτά και ποια συνεχή ;

α ) Ο αριθµός των παιδιών σ’ ένα νοικοκυριό. β ) Η µηνιαία κατανάλωση ηλεκτρικής ενέργειας από ένα νοικοκυριό. γ ) Ο αριθµός των πλοίων που καταφθάνουν σ’ ένα λιµάνι. δ ) Η τιµή του χρυσού. ε ) Ο αριθµός των υπαλλήλων µίας εταιρίας. στ ) Η θερµοκρασία.

2 ) Ο επόµενος πίνακας µας δίνει πληροφορίες γύρω από πέντε άτοµα.

Φύλο Μισθός Εκπαίδευση Έτη Προϋπηρεσίας

Α ( άνδρας ) 250.000 δρχ. Πανεπιστηµιακή 8 Γ ( γυναίκα ) 180.000 δρχ. Μέση 4

Α 220.000 δρχ. Μέση 5 Γ 305.500 δρχ. Πανεπιστηµιακή 10 Γ 195.600 δρχ. Μέση 6

α ) Ποιο από τα παραπάνω γνωρίσµατα είναι ποιοτικά και ποια ποσοτικά ; β ) Σε ποια στατιστικά γνωρίσµατα θα χρησιµοποιήσετε την τακτική και σε ποια

την ονοµαστική κλίµακα ;

3 ) Ποια από τα επόµενα στατιστικά γνωρίσµατα µας δίνουν χρονολογικά και ποια διαστρωµατικά δεδοµένα ;

α ) Η τιµή µίας µετοχής ανά µέρα τα δύο τελευταία χρόνια. β ) Ο αριθµός των τηλεφωνηµάτων που έγινε από κάθε νοικοκυριό χθες. γ ) Η τιµή των σιτηρών τα τελευταία 50 χρόνια. δ ) Οι καταθέσεις που κάνουν 60 άτοµα σε µία τράπεζα. ε ) Το ετήσιο ύψος βροχόπτωσης µίας περιοχής σε µία περίοδο 100 ετών. στ ) Η κατανάλωση λαγάνας από τους κατοίκους µίας αστικής περιοχής.

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 1 ) ∆ιακριτά στατιστικά γνωρίσµατα : ( α ) , ( γ ) , ( ε ) Συνεχή στατιστικά γνωρίσµατα : ( β ) , ( δ ) , ( στ )

Θα πρέπει να παρατηρήσουµε ότι οι οικονοµικές µεταβλητές παρά το γεγονός ότι συνιστούν διακριτές µεταβλητές , στην πραγµατικότητα τις θεωρούµε ως συνεχείς δεδοµένου ότι το πλήθος των τιµών που µπορούν να πάρουν µέσα από ένα διάστηµα τιµών , είναι πάρα πολύ µεγάλο.

3

Page 4: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

2 ) α. Ποιοτικά χαρακτηριστικά : Φύλο & εκπαίδευση Ποσοτικά χαρακτηριστικά : Μισθός & έτη προϋπηρεσίας. β. Ονοµαστική κλίµακα : Φύλο Τακτική κλίµακα : Μισθός , εκπαίδευση & έτη προϋπηρεσίας. 3 ) Χρονολογικά δεδοµένα : ( α ) , ( γ ) , ( ε ) ∆ιαστρωµατικά δεδοµένα : ( β ) , ( δ ) , ( στ ) §§ 2.2 Κατανοµές Συχνοτήτων & 2.3Απόλυτη και Σχετική Συχνότητα Άσκηση 1

Στον παρακάτω πίνακα δίνονται οι εκτιµήσεις του Ο.Η.Ε. για το προσδοκώµενο όριο ζωής ( σε χρόνια ) στην περίπτωση 131 εθνών :

Πίνακας 2.1

39 44 36 47 42 42 42 47 47 44 44 45 45 45 45 46 51 48 48 50 50 48 48 48 49 46 50 53 53 50 54 51 51 52 52 52 55 59 53 52 57 52 54 51 53 60 61 60 60 56 48 55 57 62 62 62 61 63 55 63 64 64 56 61 51 65 54 65 60 67 64 63 67 65 65 66 64 66 67 64 72 69 70 70 69 70 70 68 72 69 69 71 68 71 72 72 71 70 74 73 74 73 72 71 72 74 75 72 75 74 75 74 74 73 75 73 74 74 75 74 76 76 75 76 75 77 76 77 76 75 77

Να κατασκευασθούν : ο πίνακας συχνοτήτων και σχετικών συχνοτήτων , το

πολύγωνο συχνοτήτων καθώς και το κυκλικό διάγραµµα.

Λύση

Για την κατασκευή του πίνακα συχνοτήτων και του πίνακα σχετικών συχνοτήτων ακολουθούµε τα παρακάτω βήµατα :

1ο Βήµα : Προσδιορίζουµε το πλάτος d του δείγµατος µε τη βοήθεια της ακόλουθης

σχέσης :

d = Max xi – Min xi ( 1 )

όπου : Max xi (Min xi) το µεγαλύτερο (µικρότερο) στοιχείο του δείγµατος.

4

Page 5: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

2ο Βήµα : Προσδιορίζουµε τον αριθµό k των κλάσεων µέσω του ακόλουθου εµπει-ρικού τύπου :

k = 1 + 3,3 log n 10 ( 2 )

όπου : n το µέγεθος του δείγµατος

Να σηµειωθεί ότι ο αριθµός των κλάσεων που προκύπτει βάσει της παραπάνω σχέσεως είναι ενδεικτικός. Συνήθως επιλέγεται ένας αριθµός ελαφρώς µεγαλύτερος.

3ο Βήµα : Προσδιορίζουµε το πλάτος των κλάσεων µέσω της ακόλουθης σχέσης : l

l = d k

( 3 )

4ο Βήµα : Προσδιορίζουµε τα διαστήµατα και τα σύνορα των κλάσεων. 5ο Βήµα : Προσδιορίζουµε την κεντρική τιµή χj των κλάσεων µε τη βοήθεια της

ακόλουθης σχέσης :

)4 ( 2

κλάσης όριο Κατώτερο κλάσης όριο Ανώτερο χ j+

=

6ο Βήµα : Καθώς διαβάζουµε τα στοιχεία του πίνακα σηµειώνουµε µε µία πλάγια

γραµµή ( / ) σε πια κλάση ανήκει κάθε ένα από αυτά. 7ο Βήµα : Με τη βοήθεια του έκτου βήµατος προσδιορίζουµε τις απόλυτες συχνό-

τητες h(αj) ή hj, δηλαδή τον αριθµό των στοιχείων που εµπεριέχει η κάθε κλάση1.

8ο Βήµα : Προσδιορίζουµε τις σχετικές συχνότητες f (αj) ή fj µε τη βοήθεια της επόµε-

νης σχέσης2 :

f(α ) = h(α )

n j

j ( 5 )

Βάσει των στοιχείων του πίνακα, το µέγιστο και το ελάχιστο στοιχείο του

δείγµατος έχουν αντιστοίχως ως εξής :

Max xi = x126 = 77 & Min xi = x3 = 36

1 ∆εδοµένου ότι η απόλυτη συχνότητα h(αj) συνιστά τον αριθµό των στοιχείων της j κλάσης, για το

σύνολο των απόλυτων συχνοτήτων θα ισχύει ότι h(α = njj = 1

k

)∑

2 Από τη σχέση (5) προκύπτει ότι f(α = 1

n h(α =

1

n n = 1jj 1

k

jj=1

k) )

=∑ ∑

5

Page 6: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Κατά συνέπεια το πλάτος d του δείγµατος θα έχει ως εξής :

d = Max xi – Min xi = 77 – 36 ⇒ d = 41 έτη

∆εδοµένου ότι το µέγεθος του δείγµατος ισούται µε 131, δηλαδή n = 131 , ο αριθµός των κλάσεων [ ο οποίος προσδιορίζεται µέσω της σχέσης ( 2 ) ] θα έχει ως ακολούθως :

k = 1 + 3,3 log 131 = 1 + (3,3) (2,117) k 7,98610 × ⇒ ≅ ή k = 8

Με άλλα λόγια τα στοιχεία του πίνακα θα τα οµαδοποιήσουµε σε 8 κλάσεις, το πλάτος των οποίων, , θα το προσδιορίσουµε µε τη βοήθεια της σχέσης ( 3 ) . Ειδικότερα :

l

l l = d k

= 418

= 5,125 ⇒ = 5 έτη

∆εδοµένου ότι η µικρότερη παρατήρηση είναι τα 36 χρόνια , ως κατώτερο όριο της κλάσεως θα µπορούσαµε να θέσουµε τα 35 έτη ( καθώς τα 35 έτη αποτελεί το πολλαπλάσιο του 5 το οποίο βρίσκεται εγγύτερα της µικρότερης παρατήρησης, δηλαδή των 36 ετών). Η πρώτη λοιπόν κλάση θα δίνεται από το διάστηµα [ 35 , 40 )3. Η δεύτερη κλάση θα δίνεται από το διάστηµα [ 40 , 45 ) , η τρίτη από το διάστηµα [ 45 , 50 ) κ.ο.κ. . ∆εδοµένου ότι ο µέγιστος αριθµός των κλάσεων έχει οριστεί στις 8, η τελευταία κλάση θα δίνεται από το διάστηµα [ 70 , 75 ). Η τελευταία ωστόσο αυτή Πίνακας 2.2

Κλάσεις

Κεντρική Τιµή

Κλάσης χj

Σηµείωση Απόλυτη Συχνότητα

hj

Σχετική Συχνότητα fj

[ 35 , 40 ) 37,5 // 2 2/131 ≈ 0,015 [ 40 , 45 ) 42,5 ////// 6 6/131 ≈ 0,046 [ 45 , 50 ) 47,5 //////////////// 16 16/131 ≈ 0,122 [ 50 , 55 ) 52,5 ///////////////////// 21 21/131 ≈ 0,160 [ 55 , 60 ) 57,5 //////// 8 8/131 ≈ 0,061 [ 60 , 65 ) 62,5 ////////////////// 18 18/131 ≈ 0,137 [ 65 , 70 ) 67,5 /////////////// 15 15/131 ≈ 0,115 [ 70 , 75 ) 72,5 ///////////////////////////// 29 29/131 ≈ 0,221 [ 75 , 80 ) 77,5 //////////////// 16 16/131 ≈ 0,122

h = 131j

j=1

9

∑ f = 1jj=1

9

3 Το άνω όριο της πρώτης αυτής κλάσης , δηλαδή τα 40 έτη , αποτελούν το άθροισµα του κάτω ορίου της κλάσης, δηλαδή των 35 ετών, µε το πλάτος της κλάσης (το οποίο όπως είδαµε ισούται µε 5 έτη). Με άλλα λόγια έχουµε ότι 40 = 35 + 5.

l

6

Page 7: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

κλάση δεν περιλαµβάνει συνολικά 16 παρατηρήσεις. Έτσι υποχρεωνόµαστε να προσθέσουµε µία ακόµα κλάση, η οποία δίνεται από το διάστηµα [ 75 , 80 ) . Κατ’ αυτόν τον τρόπο ο αριθµός των κλάσεων αυξάνεται από 8 σε 9 και το σύνολο αυτών παρουσιάζεται στην πρώτη στήλη του πίνακα 2.2

Στο πέµπτο βήµα υπολογίζουµε τη κεντρική τιµή της κάθε κλάσης µε τη βοήθεια της σχέσης ( 4 ). Για παράδειγµα η κεντρική τιµή της πρώτης κλάσης υπολογίζεται ως εξής :

χ = 35 + 40

2 =

752

= 37,51

Κατά τρόπο ανάλογο υπολογίζουµε και της κεντρικές τιµές των υπολοίπων κλάσεων, οι οποίες και παρουσιάζονται στη δεύτερη στήλη του πίνακα 2.2 .

Στα πλαίσια του έκτου βήµατος διαβάζουµε ένα προς ένα τα στοιχεία του πίνακα 2.1 και σηµειώνουµε µε µία πλάγια γραµµή την κλάση στην οποία κάθε ένα από αυτά ανήκει. Στη συνέχεια αθροίζουµε τις πλάγιες γραµµές και κατ’ αυτόν τον τρόπο προσδιορίζουµε τις απόλυτες συχνότητες, οι οποίες και παρουσιάζονται στην τέταρτη στήλη του πίνακα 2.2 .

∆ιαιρώντας τέλος τις απόλυτες συχνότητες µε το συνολικό αριθµό των παρατηρήσεων, n , παίρνουµε τις σχετικές συχνότητες fj . Για παράδειγµα η σχετική συχνότητα της πρώτης κλάσης έχει ως εξής :

f = 2

131 0,0151 ≅

Με άλλα λόγια το προσδοκώµενο όριο ζωής δε ξεπερνά τα 40 έτη, για το 1,5 % των εθνών.

Βάσει του πίνακα 2.2 κατασκευάζεται και το πολύγωνο των συχνοτήτων ( frequency polygon ) , το οποίο και παρουσιάζεται µέσω του γραφήµατος 2.1 . Το γράφηµα αυτό δεν είναι τίποτα άλλο από το ιστόγραµµα των απόλυτων συχνοτήτων, ενώ η κόκκινη γραµµή ενώνει το µέσω του άνω µέρους του παραλληλογράµµου που αντιστοιχεί σε κάθε κλάση4.

Tο τρισδιάστατο κυκλικό γράφηµα ( pie chart ) των απόλυτων συχνοτήτων παρουσιάζεται στο γράφηµα 2.2 . Για να κατασκευάσουµε το γράφηµα αυτό θα πρέπει καταρχήν να προσδιορίσουµε τον αριθµό των µοιρών που αντιστοιχεί στο κάθε κοµµάτι της πίττας. Για να το πετύχουµε αυτό πολλαπλασιάζουµε την σχετική συχνότητα fj , j = 1 , …. , 9 , µε το 360 ( µε τον αριθµό δηλαδή των µοιρών του κύκλου ). Στη συνέχεια κατασκευάζουµε ένα κύκλο και µε τη βοήθεια ενός µοιρογνωµονίου χαράσσουµε τα κοµµάτια της πίττας. Για παράδειγµα, για να κατασκευάσουµε το κοµµάτι της πίττας που αντιστοιχεί στην πρώτη κλάση, πολλαπλασιάζουµε την σχετική συχνότητα f1 = 2/131 µε το 360. Έτσι βρίσκουµε ότι η γωνία που θα σχηµατίζει το πρώτο κοµµάτι της πίττας θα ισούται µε

( 2/131 ) × 360ο ≈ 5,5ο

Βάσει του παραπάνω αποτελέσµατος και µε τη βοήθεια του µοιρογνωµονίου σχηµατίζουµε το πρώτο κοµµάτι της πίττας. Ενεργώντας κατά τρόπο ανάλογο χωρίζουµε το υπόλοιπο µέρος του κύκλου σε 8 κοµµάτια.

4 Αυτό το µέσο αντιστοιχεί στην κεντρική τιµή της κάθε κλάσης που υπολογίσαµε στο πέµπτο βήµα

7

Page 8: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Frequency Polygon

Life Expectancy

No

of o

bs

0

3

6

9

12

15

18

21

24

27

30

33

[35,40) [40,45) [45,50) [50,55) [55,60) [60,65) [65,70) [70,75) [75,80)

∆ – 2.1

Pie Chart

2

15

29

166

16

21

8

18

∆ – 2.2

8

Page 9: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Άσκηση 2

Σ’ ένα εργοστάσιο ρωτήθηκαν 40 εργαζόµενοι µε τι τρόπο πηγαίνουν στη δουλειά τους. Είχαµε τις ακόλουθες παρατηρήσεις :

1 1 2 2 4 3 5 2 2 5 2 4 1 1 2 2 1 2 1 2 2 4 2 5 4 22 2 2 2 5 1 1 2 3 1 2 2 1 2

όπου

1 = ∆ηµόσιο Μέσο , 2 = Ιδιωτικό Μέσο , 3 = Μηχανή , 4 = Ποδήλατο , 5 = Οδοιπορικώς . Να κατασκευασθούν : ο πίνακας συχνοτήτων , το ακιδωτό και το κυκλικό

διάγραµµα.

Λύση

Όπως διαπιστώνουµε, ο αριθµός των παρατηρήσεων της παρούσης άσκησης είναι κατά πολύ µικρότερος σε σχέση µε εκείνον του προηγούµενου προβλήµατος. Ως εκ τούτου τίθεται ένα ερώτηµα αναφορικά µε την αναγκαιότητα κατάταξης των παρατηρήσεων σε κλάσεις συγκεκριµένου αριθµού και εύρους.

Εάν ακολουθούσαµε την γνωστή διαδικασία προσδιορισµού του αριθµού και του εύρους των κλάσεων θα βρισκόµασταν προ εκπλήξεως. Ακολουθώντας τα βήµατα 1 έως και 3 θα βρίσκαµε ότι :

1ον Το πλάτος του δείγµατος, d , ισούται µε

d = Max xi – Min xi = 5 – 1 ⇒ d = 4

2ον Ο αριθµός των κλάσεων , k , θα έχει ως εξής :

k = 1 + 3,3 log 40 = 1 + (3,3) (1,602) k 6,28710 × ⇒ ≅ ή k = 6

3ον Το εύρος των κλάσεων , , θα ισούται µε l

l l = d k

= 4

6,287 0,636 ≅ ⇒ 1=

Όπως προκύπτει από το τρίτο βήµα, κάθε µία από τις κλάσεις δεν µπορεί να περιλαµβάνει περισσότερες από µία παρατηρήσεις. ∆εδοµένου ότι οι δυνατές τιµές της µεταβλητής Χ είναι 1 , 2 , 3 , 4 & 5 και δεδοµένου ότι κάθε µία από αυτές τις τιµές αντιστοιχεί σε ένα συγκεκριµένο τύπο µεταφορικού µέσου, η ταξινόµηση των παρατηρήσεων θα µπορούσε να γίνει βάσει των τιµών αυτών. Θέτοντας όπου α1 = 1 , α2 = 2 , …. , α5 = 5 , κατασκευάζουµε τον ακόλουθο πίνακα συχνοτήτων :

9

Page 10: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Πίνακας 2.3

αj Σηµείωση Απόλυτη Συχνότηταh(αj)

Σχετική Συχνότητα f(αj)

α1 = 1 ////////// 10 10/40 ≈ 0,25 α2 = 2 //////////////////// 20 20/40 ≈ 0,50 α3 = 3 // 2 2/40 ≈ 0,05 α4 = 4 //// 4 4/40 ≈ 0,10 α5 = 5 //// 4 4/40 ≈ 0,10

h(α = 40jj=1

5

)∑ f(α = 1jj=1

5

)∑

Στη δεύτερη στήλη του παραπάνω πίνακα έχουµε σηµειώσει τη συχνότητα

εµφάνισης της απάντησης j ( όπου j = 1 , …. , 5 ). Αθροίζοντας τις γραµµές αυτές βρίσκουµε τις απόλυτες συχνότητες , οι οποίες παρουσιάζονται στην τρίτη στήλη του πίνακα και το άθροισµα των οποίων ισούται µε τον συνολικό αριθµό των παρατηρή-σεων (n = 40). ∆ιαιρώντας τις απόλυτες συχνότητες µε το n προσδιορίζουµε τις σχετικές συχνότητες, οι οποίες παρουσιάζονται στην τέταρτη στήλη του πίνακα 2.3 . Όπως προκύπτει από τη στήλη αυτή το 25 % των εργαζοµένων χρησιµοποιεί δηµόσιο µεταφορικό µέσο προκειµένου να µεταβεί στην εργασία του. Το 50 % χρησιµοποιεί ιδιωτικό µεταφορικό µέσο , το 5 % πηγαίνει στη δουλειά του µε µηχανή, το 10 % πηγαίνει µε ποδήλατο ενώ ένα 10 % µεταβαίνει στην εργασία του οδοιπορικώς.

Bar Chart

aj

f(a j

)

0

2

4

6

8

10

12

14

16

18

20

22

1 2 3 4 5

∆ – 2.3

10

Page 11: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Pie Chart

25,0 %

10,0 %

10,0 %

5,0 %

50,0 %

1

2

3

4

5

∆ – 2.4

Στα γραφήµατα ∆ – 2.3 & ∆ – 2.4 παρουσιάζονται αντιστοίχως το ακιδωτό και το

κυκλικό διάγραµµα, για την κατασκευή των οποίων χρησιµοποιήθηκαν τα δεδοµένα του πίνακα 2.3 .

Άσκηση 3

Να σχεδιασθεί το κυκλικό διάγραµµα των επόµενων δεδοµένων :

Πίνακας 2.4 : Μέσα µηνιαία έξοδα σε χιλ. δρχ. Είδος 1988 1990 Τρόφιµα 64 84 Ρούχα 20 28 Ενοίκιο 42 52 ∆ιάφορα 17 30

Λύση

Το κυκλικό διάγραµµα χρησιµοποιείται όταν επιθυµούµε να παρουσιάσουµε την ποσοστιαία συµµετοχή επιµέρους µεγεθών σ’ ένα ολικό µέγεθος. Στην προκειµένη περίπτωση, το ολικό µέγεθος είναι η συνολική µέση µηνιαία κατανάλωση για τα έτη 1988 και 1990 ενώ τα επί µέρους µεγέθη είναι οι δαπάνες κατ’ είδος. Ως εκ τούτου για τα έτη 1988 και 1990 µπορούµε να παράγουµε δύο κυκλικά διαγράµµατα ( ένα για το κάθε έτος ) στα οποία θα παρουσιάζουµε την ποσοστιαία συµµετοχή των δαπανών κατ’ είδος στη µέση µηνιαία δαπάνη.

11

Page 12: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Εάν xi , i = 1 (τρόφιµα), 2 (ρούχα), 3 (ενοίκια) & 4 (διάφορα) , είναι η δαπάνη κατ’ είδος , η συνολική µέση µηνιαία δαπάνη (Χj , j = 1988 , 1990) για τα έτη 1988 και 1990 έχει αντιστοίχως ως εξής :

X 143 X 1941988 1990 = x = & = x = ii = 1

4

ii = 1

4

∑ ∑

Βάσει των µεγεθών Χ1988 και Χ1990 προκύπτει ο ακόλουθος πίνακας : Πίνακας 2.5

Είδος 1988 ( 1 ) [(1)/(2)]×100 1990

( 3 ) [(3)/(4)]×100

Τρόφιµα 64 44,76 % 84 43,30 % Ρούχα 20 13,99 % 28 14,43 % Ενοίκιο 42 29,37 % 52 26,80 % ∆ιάφορα 17 11,89 % 30 15,46 %

Χ1988 = 143 ( 2 ) 100 % Χ1990 = 194

( 4 ) 100 %

Με τη βοήθεια των δεδοµένων του παραπάνω πίνακα παίρνουµε τα διαγράµµατα

∆ – 2.5 & ∆ – 2.6 στα οποία παρουσιάζουµε τη συµµετοχή των εξόδων κατά κατηγορία δαπάνης στη συνολική δαπάνη για τα έτη 1988 και 1990 αντιστοίχως.

Pie Chart for 1988

29%

12%

45%

14%

Τρόφιµα Ρούχα Ενοίκιο ∆ιάφορα

∆ – 2.5

12

Page 13: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Pie Chart for 1990

15%

44%

14%

27%

Τρόφιµα Ρούχα Ενοίκιο ∆ιάφορα

∆ – 2.6

Όπως προκύπτει από τη µελέτη των δύο παραπάνω γραφηµάτων, µεταξύ των ετών 1988 και 1990 είχαµε µία ελαφριά µείωση της συµµετοχής των τροφίµων στη µέση µηνιαία δαπάνη από 45 % σε 44 %. Ελαφρώς µεγαλύτερη ήταν η µείωση στην περίπτωση των δαπανών για ενοίκια ( από 29 % σε 27 % ). Αντιθέτως η ποσοστιαία συµµετοχή των διαφόρων δαπανών στη µέση µηνιαία δαπάνη αυξήθηκε σηµαντικά από 12 % σε 15 %. Τέλος η συµµετοχή της δαπάνης για ρούχα στη µέση µηνιαία δαπάνη παρέµεινε σταθερή στο 14 % περίπου.

§ 2.5 Αθροιστικές Κατανοµές Συχνοτήτων

Η απόλυτη αθροιστική κατανοµή συχνοτήτων ( absolute cumulative frequency distribution ) Hj υπολογίζεται µε τη βοήθεια της ακόλουθης σχέσης :

H = h q jj = 1

q

∑ ( 6 ) όπου q = 1 , …. , k.

Η σχετική αθροιστική κατανοµή συχνοτήτων ( relative cumulative frequency

distribution ) Fj προσδιορίζεται µε τη βοήθεια της σχέσης ( 5 ) ως εξής :

F = f F = Hn

q jj = 1

q

qq∑ ∑ ∑⇒ ⇒ ⇒ F =

hn

F = 1n

h qj

j = 1

q

q jj = 1

q (6)( 7 ) ( 8 )

( )5

όπου q = 1 , …. , k.

13

Page 14: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Άσκηση 1

Οι τιµές του πίνακα 2.6 είναι τα βάρη 48 αθλητών πυγµαχίας :

Πίνακας 2.6 124 106 120 136 124 115 93 134 103 125 91 115 109 137 148 127 141 117 118 125 116 104 123 125 112 153 133 135 88 128 115 119 121 115 105 117 122 113 100 155 130 95 125 110 106 112 120 138

Να οµαδοποιηθούν οι παραπάνω τιµές και να κατασκευασθούν ( i ) ο πίνακας συχνοτήτων , σχετικών συχνοτήτων , αθροιστικών συχνοτήτων και αθροιστικών σχετικών συχνοτήτων . ( ii ) Να κατασκευασθεί το ιστόγραµµα , το πολύγωνο συχνο-τήτων , το ραβδόγραµµα και το πολύγωνο των αθροιστικών συχνοτήτων.

Λύση

Στο πρώτο βήµα της ακολουθούµενης διαδικασίας για την κατασκευή του πίνακα συχνοτήτων, θα προσδιορίσουµε το εύρος του δείγµατος µε τη βοήθεια της σχέσης ( 1 ). Πιο συγκεκριµένα θα έχουµε ότι :

d = Max xi – Min xi = 155 – 88 ⇒ d = 67 κιλά

∆εδοµένου ότι έχουµε στη διάθεσή µας συνολικά 48 τιµές ( δηλ. n = 48 ), ο

αριθµός των κλάσεων ( βάσει των οποίων θα µπορούσαµε να οµαδοποιήσουµε τα βάρη των αθλητών ) θα προσδιορισθεί µε τη βοήθεια της σχέσης ( 2 ). Ειδικότερα :

k = 1 + 3,3 log 48 = 1 + 5,5481 = 6,5481 k 710 ⇒ ≅ κλάσεις

Το εύρος των κλάσεων θα προσδιορισθεί µε τη βοήθεια της σχέσης ( 3 ). Πιο

συγκεκριµένα από τη σχέση αυτή προκύπτει ότι :

l l 10= d k

= 67

6,5481 = 10,232 ⇒ ≅ κιλά

Αν το εύρος της κάθε κλάσης οριστεί στα 10 κιλά, κάποιες τιµές του πίνακα 2.6

δε θα περιλαµβάνονται σε καµία από τις 7 κλάσεις. Για το λόγο αυτό προσθέτουµε ακόµα µία κλάση, δεχόµαστε δηλαδή ότι k = 8. Κατά συνέπεια οι τιµές του πίνακα 2.6 θα ταξινοµηθούν σε 8 κλάσεις µε εύρος 10 κιλά. ∆εδοµένου ότι το 80 είναι το πλησιέστερο πολλαπλάσιο του 10 το οποίο βρίσκεται εγγύτερα του 88 ( δηλαδή της µικρότερης παρατήρησης ) , ως κάτω όριο της πρώτης κλάσης µπορούµε να θεωρή-σουµε τα 80 κιλά. Οι κλάσεις παρουσιάζονται στην πρώτη στήλη του πίνακα 2.7 ενώ στη δεύτερη στήλη του ίδιου πίνακα παρουσιάζονται οι κεντρικές τιµές των κλάσεων. Στη συνέχεια διαβάζουµε τις τιµές του πίνακα 2.6 και σηµειώνουµε µε µία γραµµή στην τρίτη στήλη του πίνακα 2.7, την κλάση που ανήκει κάθε µία από αυτές. Αθροίζοντας τις γραµµές αυτές προσδιορίζουµε τις απόλυτες συχνότητες hj , j = 1 έως 8, και τις παραθέτουµε στην τέταρτη στήλη του πίνακα 2.7 . Το άθροισµα των απόλυτων συχνοτήτων για j από 1 έως 8 ισούται µε το µέγεθος του δείγµατος, δηλαδή

h = 48jj = 1

8

14

Page 15: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Πίνακας 2.7

Κλάσεις

Κεντρική Τιµή

Κλάσης χj

Σηµείωση Απόλυτη Συχνότητα

hj

Σχετική Συχνότητα

fj

Απόλυτη Αθροιστική Συχνότητα

Hq

Σχετική Αθροιστική Συχνότητα

Fq

[80,90 ) 85 / 1 1/48 ≈ 0,021 1 0,021 [90,100) 95 /// 3 3/48 ≈ 0,062 4 0,083

[100,110) 105 /////// 7 7/48 ≈ 0,146 11 0,229 [110,120) 115 ///////////// 13 13/48 ≈ 0,271 24 0,500 [120,130) 125 ///////////// 13 13/48 ≈ 0,271 37 0,771 [130,140) 135 /////// 7 7/48 ≈ 0,146 44 0,917 [140,150) 145 // 2 2/48 ≈ 0,042 46 0,959 [150,160) 155 // 2 2/48 ≈ 0,042 48 1

h = 48jj = 1

8∑ f = 1j

j = 1

8∑

∆ιαιρώντας τις απόλυτες συχνότητες µε το µέγεθος του δείγµατος ( n ) παίρνουµε τις σχετικές συχνότητες fj , j = 1 , …. , 8 , οι οποίες και παρουσιάζονται στην πέµπτη στήλη. Το άθροισµα των σχετικών συχνοτήτων για j από 1 έως 8 ισούται µε τη µονάδα, δηλαδή

f = 1jj = 1

8

Οι απόλυτες αθροιστικές συχνότητες παρουσιάζονται στην έκτη στήλη του

πίνακα 2.7 και προσδιορίζονται µε τη βοήθεια της σχέσης (6). Πιο συγκεκριµένα έχουµε ότι :

• Για q = 1 : H = h = h = 11 jj = 1

1

1∑

• Για q = 2 : H = h = h + h = 1 + 3 = 42 jj = 1

2

1 2∑

• Για q = 3 : H = h = h + h + h = 1 + 3 + 7 = 113 jj = 1

3

1 2 3∑ …………………………………………………………………

• Για q = 9 : H = h = 1 + 3 + 7 + 13 + 13 + 7 + 2 + 2 = 489 jj = 1

9

Οι σχετικές αθροιστικές συχνότητες παρουσιάζονται στην έβδοµη στήλη του πίνακα 2.7 και προσδιορίζονται µε τη βοήθεια της σχέσης (7). Πιο συγκεκριµένα έχουµε ότι :

15

Page 16: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

• Για q = 1 : F = f = f = 0,0211 jj = 1

1

1∑

• Για q = 2 : F = f = f + f = 0,021 + 0,062 = 0,0832 jj = 1

2

1 2∑

• Για q = 3 : F = f = f + f + f = 0,021 + 0,062 + 0,146 = 0,2293 jj = 1

3

1 2 3∑……………………………………………………………………………………… • Για q = 9 :

F = f = 0,021 + 0,062 + 0,146 + 0,271 + 0,271 + 0,146 + 0,042 + 0,042 = 19 jj = 1

9

Αναφορικά µε τις σχετικές αθροιστικές συχνότητες, η χρήση της σχέσης ( 8 ) θα

µας οδηγούσε στα ίδια αποτελέσµατα. Για παράδειγµα για q = 9 θα είχαµε ότι

F = Hn

= 4848

= 199 .

Στο γράφηµα ∆ – 2.7 παρουσιάζεται το ιστόγραµµα και στο γράφηµα ∆ – 2.8 παρουσιάζεται το ραβδόγραµµα. Η διαφορά µεταξύ των δύο γραφηµάτων έγκειται στο ότι µεταξύ των παραλληλογράµµων του ραβδογράµµατος υπάρχει ένα κενό διάστηµα. Τέλος στα γραφήµατα ∆ – 2.9 & ∆ – 2.10 παρουσιάζονται αντιστοίχως το πολύγωνο των συχνοτήτων και το πολύγωνο αθροιστικών συχνοτήτων.

Histogram

X

h j

1

3

7

13 13

7

2 2

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

70 80 90 100 110 120 130 140 150 160

∆ – 2.7

16

Page 17: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Bar Chart

h j

1

3

7

13 13

7

2 2

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

80<=x<9090<=x<100

100<=x<110110<=x<120

120<=x<130130<=x<140

140<=x<150150<=x<160

∆ – 2.8

Frequency Polygon

X

h j

85

95

105

115 125

135

145 155

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

70 80 90 100 110 120 130 140 150 160

∆ – 2.9

17

Page 18: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Cumulative Frequency Polygon

X

Hj

0

5

10

15

20

25

30

35

40

45

50

55

60

80 90 100 110 120 130 140 150 160

14

11

24

37

4446

48

∆ – 2.10

Άσκηση 2

Για τα δεδοµένα της άσκησης 1 των παραγράφων 2.2 & 2.3 να κατασκευασθούν οι πίνακες των απόλυτων και των σχετικών αθροιστικών συχνοτήτων.

Λύση

Πίνακας 2.8

Κλάσεις

Κεντρική Τιµή

Κλάσης χj

Απόλυτη Συχνότητα

hj

Απόλυτη Αθροιστική Συχνότητα

Ηq

Σχετική Συχνότητα

fj

Σχετική Αθροιστική Συχνότητα

Fj [ 35 , 40 ) 37,5 2 2 2/131 2/131 [ 40 , 45 ) 42,5 6 8 6/131 8/131 [ 45 , 50 ) 47,5 16 24 16/131 24/131 [ 50 , 55 ) 52,5 21 45 21/131 45/131 [ 55 , 60 ) 57,5 8 53 8/131 53/131 [ 60 , 65 ) 62,5 18 71 18/131 71/131 [ 65 , 70 ) 67,5 15 86 15/131 86/131 [ 70 , 75 ) 72,5 29 115 29/131 115/131 [ 75 , 80 ) 77,5 16 131 16/131 1

h = 131j

j=1

9

∑ f = 1jj=1

9

18

Page 19: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Προκειµένου να διευκολυνθούµε στην κατασκευή των δύο πινάκων, θα χρησιµοποιήσουµε τα στοιχεία του πίνακα 2.2 τα οποία παρουσιάζονται εκ νέου στον πίνακα 2.8 . Οι απόλυτες αθροιστικές συχνότητες ( Hq ) υπολογίζονται βάσει της σχέσης ( 6 ) και παρουσιάζονται στην τέταρτη στήλη του εν λόγω πίνακα. Οι σχετικές αθροιστικές συχνότητες ( Fq ) υπολογίζονται βάσει της σχέσης ( 8 ) και παρουσιάζονται στην τελευταία στήλη του πίνακα 2.8 .

§ 2.6 Παράµετροι Θέσης ( ή Κεντρικής Τάσης )

Στην περίπτωση που τα δεδοµένα δεν είναι οµαδοποιηµένα σε κλάσεις ο αριθµητικός µέσος ( mean ) x µπορεί να προσδιορισθεί µε έναν από τους παρακάτω τύπους :

x = 1n

( x + x + .... + x ) = 1n

x

x = h a

n =

h a

h x = f a

1 2 n ii=1

n

j jj=1

k

j jj=1

k

jj=1

k j jj=1

k

∑ ∑

∑∑

( 9 )

( 10 ) ( 11 )

όπου xi : η i παρατήρηση του δείγµατος

aj : η j εµφανισθείσα τιµή του Χ γνωρίσµατος hj : ο αριθµός εµφάνισης της aj ή η απόλυτη συχνότητα fj : η j σχετική συχνότητα Στην περίπτωση που οι παρατηρήσεις είναι οµαδοποιηµένες σε κλάσεις ο

αριθµητικός µέσος προσδιορίζεται µέσω των ακόλουθων σχέσεων :

x = h χ

n =

h χ

h x = f χ

j jj=1

k

j jj=1

k

jj=1

k j jj=1

k∑ ∑

∑∑( 12 ) ( 13 )

όπου χj : η κεντρική τιµή της j κλάσης η οποία προσδιορίζεται µε τη βοήθεια της

σχέσης ( 4 ).

Για να προσδιορίσουµε τη διάµεσο ( median ) mn στην περίπτωση που οι παρατηρήσεις µας δεν είναι οµαδοποιηµένες σε κλάσεις, 1ον διατάσουµε τις xj παρατηρήσεις από την µικρότερη προς την µεγαλύτερη, δηλαδή τις διατάσουµε κατά τρόπο ώστε x1 < x2 < …. < xn, και 2ον ανάλογα µε το εάν ο συνολικός αριθµός των παρατηρήσεων είναι άρτιος ή περιττός αριθµός, χρησιµοποιούµε έναν από τους δύο κλάδους της ακόλουθης σχέσης προκειµένου να υπολογίσουµε τη διάµεσο :

19

Page 20: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

)14 (

) άρτιος ( 2k n αν , x x21

) περιττός( 12k n αν , x

m

22 n

2n

21 n

n

=

+

+=

=

+

+

Στην περίπτωση που οι παρατηρήσεις µας είναι οµαδοποιηµένες σε κλάσεις , για

να προσδιορίσουµε την διάµεσο 1ον εντοπίζουµε την κλάση για την οποία ικανοποιείται µία από τις παρακάτω σχέσεις :

H n2

H ή F 12

F j 1 j j 1 j− −≤ ≤ ≤ ≤( 15 ) ( 16 )

όπου Hj : η απόλυτη αθροιστική συχνότητα & Fj : η σχετική αθροιστική συχνότητα Εάν για την κλάση [αj-1 , αj ) ικανοποιείται µία από τις παραπάνω σχέσεις, τότε είναι πολύ πιθανόν ο διάµεσος να εντοπίζεται εντός αυτής της κλάσης. 2ον Για την κλάση [αj-1 , αj ) για την οποία ικανοποιείται η σχέση ( 15 ) ή ( 16 ) υπολογίζουµε τη διάµεσο µε τη βοήθεια µίας εκ των παρακάτω σχέσεων :

m = α + α α

h

n2

H

m = α + α α

f

12

F

n j 1j j 1

jj 1

n j 1j j 1

jj 1

−−

−−

−−

−−

( 17 )

( 18 )

Ο γεωµετρικός µέσος ( Geometric Mean ) των παρατηρήσεων x1 , x2 , …. , xn , στην περίπτωση που αυτές δεν είναι οµαδοποιηµένες, ορίζεται ως η νιοστή ρίζα του γινοµένου των παρατηρήσεων, δηλαδή :

G = x = x x ... x ii=1

nn

1 2 nn∏ ( 19 )

Εάν οµαδοποιήσουµε τις παρατηρήσεις µας και διαπιστώσουµε ότι η αj τιµή

παρατηρείται hj φορές , όπου j = 1 , 2 , …. k, ο γεωµετρικός µέσος µε τη βοήθεια της ακόλουθης σχέσης :

G = α = α α ... α jh

j=1

kh

1h

2h

khnj

jj=1

k

1 2 k∏∑ ( 20 ) όπου h = nj

j=1

k∑

Στην περίπτωση που οι παρατηρήσεις µας είναι οµαδοποιηµένες σε κλάσεις, ο

γεωµετρικός µέσος προσδιορίζεται µέσω της ακόλουθης σχέσης : 20

Page 21: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

G = χ = χ χ ... χ jh

j=1

kh

1h

2h

khnj

jj=1

k

1 2 k∏∑ ( 21 )

όπου & χh = njj=1

k∑ j : η κεντρική τιµή της j κλάσης

Να παρατηρήσουµε στο σηµείο αυτό ότι ο γεωµετρικός µέσος οµαδοποιηµένων

παρατηρήσεων είναι γνωστός και ως σταθµισµένος γεωµετρικός µέσος ( Weighted Geometric Mean )

Άσκηση 1 Οι τιµές του παρακάτω πίνακα είναι οι χρόνοι που µεσολαβούν µεταξύ δύο

διαδοχικών τηλεφωνικών κλήσεων, που φτάνουν σ’ ένα τηλεφωνικό κέντρο .

Πίνακας 2.9 4,0 4,6 4,0 4,2 4,5 3,5 4,7 4,9 3,9 4,8 5,2 4,4 4,7 4,1 4,6 4,9 4,1 5,8 4,2 4,2 4,1 5,0 4,8 4,3 3,7 5,4 4,9 4,6 4,3 5,4 5,0 4,5 4,7 4,3 4,8 4,1 5,6 4,5 5,1 4,6 4,3 5,2 4,7 4,7 3,2 3,2 4,0 3,8 4,2 5,3 4,2 3,6 4,5 4,4 3,8 5,3 4,5 4,6 4,0 5,2 Ζητείται : α ) Να προσδιορισθεί ο αριθµητικός µέσος , ο γεωµετρικός µέσος και η διάµεσος 1ον

µε τη χρήση των σχέσεων ( 9 ) , ( 19 ) & ( 14 ) και 2ον µε τη χρήση των σχέσεων ( 11 ) , ( 20 ) & ( 18 ) αντιστοίχως.

β ) Αφού οµαδοποιηθούν οι παρατηρήσεις σε κλάσεις να προσδιορισθεί ο αριθµη-

τικός µέσος, ο γεωµετρικός µέσος και η διάµεσος. Λύση α.1 ) Με τη βοήθεια των σχέσεων ( 9 ) , ( 19 ) βρίσκουµε ότι:

• x = 160

x = 160

( x + x + .... + x = 160

( 4,0 + 4,6 + .... + 5,2 ) =ii=1

60

1 2 60∑ )

= 160

269,7 x = 4,495⇒

• G = x = x x ... x = (4,0) (4,6) ... (5,2) = 9,09983 10 ii=1

60

601 2 60

60 60 3860∏ × × × × ⇒

21

Page 22: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

⇒ G = 4,460 Για να προσδιορίσουµε τη διάµεσο κατατάσσουµε τις παρατηρήσεις µας κατά

αύξουσα τάξη µεγέθους οπότε προκύπτει ο παρακάτω πίνακας :

Πίνακας 2.10 α/α x α/α x α/α x α/α x α/α x α/α x 1 3,2 11 4,0 21 4,2 31 4,5 41 4,7 51 5,1 2 3,2 12 4,0 22 4,3 32 4,5 42 4,7 52 5,2 3 3,5 13 4,1 23 4,3 33 4,6 43 4,8 53 5,2 4 3,6 14 4,1 24 4,3 34 4,6 44 4,8 54 5,2 5 3,7 15 4,1 25 4,3 35 4,6 45 4,8 55 5,3 6 3,8 16 4,1 26 4,4 36 4,6 46 4,9 56 5,3 7 3,8 17 4,2 27 4,4 37 4,6 47 4,9 57 5,4 8 3,9 18 4,2 28 4,5 38 4,7 48 4,9 58 5,4 9 4,0 19 4,2 29 4,5 39 4,7 49 5,0 59 5,6 10 4,0 20 4,2 30 4,5 40 4,7 50 5,0 60 5,8

∆εδοµένου ότι ο συνολικός αριθµός των παρατηρήσεων ( n ) είναι άρτιος ( n =

= 60 ), η διάµεσος θα προκύψει από τον δεύτερο κλάδο της σχέσης ( 14 ) και θα έχει ως εξής :

( )m = 12

x + x = 12

x + x = 12

( 4,5 + 4,5 ) 60 602

60+22

30 31

⇒m = 4,560

α.2 ) Στον πίνακα 2.11 έχουµε οµαδοποιήσει τις παρατηρήσεις µας βάσει της συχνότητας εµφάνισης της τιµής ( αj ) την οποία παίρνει η µεταβλητή Χ. Στον πίνακα αυτό εκτός από την κατανοµή της απόλυτης συχνότητας ( hj ) έχουµε υπολογίσει βάσει της σχέσης ( 6 ) την κατανοµή της αθροιστικής απόλυτης συχνότητας ( Ηj ), τη σχετική συχνότητα ( fj ), την αθροιστική σχετική συχνότητα ( Fj ), καθώς και τρεις στήλες στις οποίες παρουσιάζουµε τα γινόµενα αjhj , αjfj & α για j = 1 , …. , 23 . j

h j

Η τιµή του αριθµητικού µέσου που προκύπτει βάσει της σχέσης ( 11 ) έχει ως εξής :

x = α f j jj=1

23∑ ⇒ x = 4,495

Όπως διαπιστώνουµε η τιµή του αριθµητικού µέσου που προκύπτει βάσει της σχέσης ( 11 ) είναι ακριβώς η ίδια µε εκείνη που προκύπτει βάσει της σχέσεως ( 9 ).

Η τιµή του γεωµετρικού µέσου που προκύπτει βάσει της σχέσης ( 20 ) έχει ως ακολούθως :

G = χ = α α ... α = 9,09983 10 jh

j=1

kh

1h

2h

60h60 3860j

jj=1

k

1 2 60∏∑× ⇒ G = 4,460

22

Page 23: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Πίνακας 2.11 j αj hj Hj fj Fj αj hj αj fj 1 3,2 2 2 0,0333333 0,0333333 6,40 0,1066667 10,24000002 3,5 1 3 0,0166667 0,0500000 3,50 0,0583333 3,50000003 3,6 1 4 0,0166667 0,0666667 3,60 0,0600000 3,60000004 3,7 1 5 0,0166667 0,0833333 3,70 0,0616667 3,70000005 3,8 2 7 0,0333333 0,1166667 7,60 0,1266667 14,44000006 3,9 1 8 0,0166667 0,1333333 3,90 0,0650000 3,90000007 4,0 4 12 0,0666667 0,2000000 16,00 0,2666667 256,00000008 4,1 4 16 0,0666667 0,2666667 16,40 0,2733333 282,57610009 4,2 5 21 0,0833333 0,3500000 21,00 0,3500000 1306,9123200

10 4,3 4 25 0,0666667 0,4166667 17,20 0,2866667 341,880100011 4,4 2 27 0,0333333 0,4500000 8,80 0,1466667 19,360000012 4,5 5 32 0,0833333 0,5333333 22,50 0,3750000 1845,281250013 4,6 5 37 0,0833333 0,6166667 23,00 0,3833333 2059,629760014 4,7 5 42 0,0833333 0,7000000 23,50 0,3916667 2293,450070015 4,8 3 45 0,0500000 0,7500000 14,40 0,2400000 110,592000016 4,9 3 48 0,0500000 0,8000000 14,70 0,2450000 117,649000017 5,0 2 50 0,0333333 0,8333333 10,00 0,1666667 25,000000018 5,1 1 51 0,0166667 0,8500000 5,10 0,0850000 5,100000019 5,2 3 54 0,0500000 0,9000000 15,60 0,2600000 140,608000020 5,3 2 56 0,0333333 0,9333333 10,60 0,1766667 28,090000021 5,4 2 58 0,0333333 0,9666667 10,80 0,1800000 29,160000022 5,6 1 59 0,0166667 0,9833333 5,60 0,0933333 5,600000023 5,8 1 60 0,0166667 1 5,80 0,0966667 5,8000000

Άθροισµα ~ 60 ~ 1 ~ 269,70 4,495 ~ Γινόµενο ~ ~ ~ ~ ~ ~ ~ 9,09983E+38

∆εδοµένου ότι οι παρατηρήσεις µας είναι οµαδοποιηµένες, για την εύρεση της

διάµεσου θα χρησιµοποιήσουµε τη σχέση ( 18 ) αφού όµως προηγουµένως εντοπί-σουµε για ποια τιµή j ικανοποιείται η σχέση ( 16 ).

Όπως διαπιστώνουµε και από την έκτη στήλη του πίνακα 2.11 , το 1/2 = 0,5 εντοπίζεται µεταξύ F12 και F11 ( καθώς 0,450 = F11 < 0,5 < F12 = 0,533 ). Ως εκ τούτου έχουµε ότι j = 12 και από τη σχέση ( 18 ) προκύπτει ότι :

( )

( )

m = α + α α

f

12

F = α + α α

f 0,5 F =

= 4,4 + 4,5 4,4

0,0833333 0,5 0,45

60 12 112 12 1

1212 1 11

12 11

1211−

−−

−−

−−

−− ⇒ m = 4,5560

β ) Για να προσδιορίσουµε τον κατά προσέγγιση αριθµό των κλάσεων θα χρησιµο-ποιήσουµε τη σχέση ( 2 ) από την οποία προκύπτει ότι :

k = 1 + 3,3 log 60 k = 6,868 ή 10 ⇒ ≅k 7

23

Page 24: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Με άλλα λόγια θα µπορούσαµε να οµαδοποιήσουµε τις παρατηρήσεις µας σε 7 κλάσεις το εύρος των οποίων θα το προσδιορίσουµε µε τη βοήθεια της σχέσης ( 3 ), αφού όµως προηγουµένως προσδιορίσουµε το πλάτος του δείγµατος µέσω της σχέσης ( 1 ). Από την τελευταία αυτή σχέση, και δεδοµένου ότι Μax x = 5,8 & Min x = 3,2 , προκύπτει ότι :

d = Max x – Min x = 5,8 – 3,2 ⇒ d = 2,6 κλήσεις

Το εύρος της κλάσης θα έχει κατά συνέπεια ως εξής :

l l = d k

= 2,6

6,868 = 0,379 ή 0,4≅ κλήσεις

Βάσει των παραπάνω, θα µπορούσαµε να οµαδοποιήσουµε τα δεδοµένα µας σε 7

κλάσεις εύρους 0.4 , µε το κάτω όριο της πρώτης κλάσης να ισούται µε 3,2 . Οι κλάσεις παρουσιάζονται στην πρώτη στήλη του πίνακα 2.12 . Στη δεύτερη στήλη του ιδίου πίνακα παρουσιάζονται οι κεντρικές τιµές των κλάσεων, οι οποίες προσδιορί-ζονται µε τη βοήθεια της σχέσης ( 4 ). Στην τρίτη και τέταρτη στήλη παρουσιάζονται αντιστοίχως οι κατανοµές των απόλυτων συχνοτήτων και των αθροιστικών απόλυτων συχνοτήτων. Τέλος στην πέµπτη στήλη παρουσιάζουµε υπολογισµένες τις δυνάµεις

. χ jh j

Πίνακας 2.12 Κλάσεις χj hj Hj χj hj [3.2 , 3.6) 3,4 3 3 10,2 39,304 [3.6 , 4.0) 3,8 5 8 19,0 792,35168 [4.0 , 4.4) 4,2 17 25 71,4 39376574867 [4.4 , 4.8) 6,8 17 42 115,6 1,42119×1014

[4.8 , 5.2) 5,0 9 51 45,0 1953125 [5.2 , 5.6) 5,4 7 58 37,8 133892,521 [5.6 , 6.0) 5,8 2 60 11,6 33,64 Άθροισµα ~ 60 ~ 310,6 ~ Γινόµενο ~ ~ ~ ~ 1,53316×1042

Για τον προσδιορισµό του αριθµητικού µέσου θα χρησιµοποιήσουµε τη σχέση ( 12 ). Από τη σχέση αυτή προκύπτει ότι :

x x = 5,177 = h χ

h =

310,660

j jj=1

7

jj=1

7

∑⇒

Όπως διαπιστώνουµε ο αριθµητικός µέσος που προκύπτει από τη σχέση ( 12 ) είναι µεγαλύτερος εκείνου που προκύπτει από τη σχέση ( 9 ).

24

Page 25: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Για τον προσδιορισµό του γεωµετρικού µέσου θα χρησιµοποιήσουµε τη σχέση ( 21 ) από την οποία προκύπτει ότι :

G = χ = 1,53316 10jh

j=1

kh 4260jj

j=1

k

∏∑× ⇒ G = 5,048

Όπως γίνεται εύκολα αντιληπτό, ο γεωµετρικός µέσος που προκύπτει από τη σχέση ( 21 ) είναι µεγαλύτερος εκείνου που προκύπτει από τη σχέση ( 19 ).

Η διάµεσος θα προσδιορισθεί µε τη βοήθεια της σχέσης ( 17 ), αφού όµως προη-γουµένως προσδιορίσουµε την τιµή του j για την οποία ικανοποιείται η σχέση ( 15 ). Ο αριθµός n/2 = 60/2 = 30 εντοπίζεται µεταξύ των Η3 = 25 και Η4 = 42. Εφόσον έχουµε ότι Η3 < n/2 < Η4 , οδηγούµαστε στο συµπέρασµα ότι j = 4 και ως εκ τούτου Hj = H4 = 42 , Ηj-1 = H3 = 25 , αj = α4 = 4,8 & αj-1 = α3 = 4,4. Κατά συνέπεια από τη σχέση ( 17 ) προκύπτει ότι :

m = α + α α

h

602

H 4,4 +4,8 4,4

17

602

25 60 34 3

33

−−

−−

⇒ = m = 4,51860

Όπως διαπιστώνουµε η διάµεσος που µόλις υπολογίσαµε βρίσκεται πολύ κοντά σε εκείνον που υπολογίσαµε βάσει της σχέσης ( 14 ).

Άσκηση 2

∆ίνονται τα παρακάτω στοιχεία που είναι πρωτογενή στοιχεία µίας έρευνας αγοράς :

Πίνακας 2.13

4,6 8,2 3,7 7,8 6,4 5,6 4,2 7,7 5,5 7,5 8,6 5,5 7,9 5,3 9,0 9,5 8,0 5,0 7,9 5,1 5,4 8,3 7,3 8,8 4,9 5,8 5,0 8,0 5,2 6,9 7,7 6,6 8,5 7,8 9,3 4,0 8,1 5,9 8,4 4,5 3,6 5,4 4,7 5,5 7,6 5,4 6,2 8,3 5,4 7,2

Ζητείται :

α ) Η οµαδοποίηση των στοιχείων του πίνακα σε κλάσεις. β ) Ο υπολογισµός του αριθµητικού µέσου, της διαµέσου και του γεωµετρικού

µέσου Λύση

α ) Απαραίτητη προϋπόθεση για την οµαδοποίηση των στοιχείων του πίνακα 2.13 σε κλάσεις, είναι να έχουµε προηγουµένως προσδιορίσει τον αριθµό καθώς και το εύρος των κλάσεων.

25

Page 26: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Για τον κατά προσέγγιση προσδιορισµό του αριθµού των κλάσεων , και δεδοµένου ότι έχουµε συνολικά n = 50 παρατηρήσεις , θα χρησιµοποιήσουµε τη σχέση ( 2 ) από την οποία προκύπτει ότι :

k = 1 + 3,3 log 50 k = 6,607 ή 10 ⇒ ≅k 7 κλάσεις

∆ε δοµένου ότι η µέγιστη ( Max x ) και η ελάχιστη ( Min x ) παρατήρηση είναι

ίση µε 9,5 και 3,6 αντιστοίχως, το εύρος του δείγµατος θα είναι ίσο µε

d = Max x – Min x = 9,5 – 3,6 ⇒ d = 5,9 κλήσεις

Ως εκ τούτου το εύρος των κλήσεων θα είναι ίσο µε

l l = d k

= 5,9

6,607 = 0,8939 ή 0,9≅ κλήσεις

Όπως γίνεται αντιληπτό από την παραπάνω ανάλυση, οι παρατηρήσεις του

πίνακα 2.13 θα µπορούσαν να οµαδοποιηθούν σε 7 κλάσεις, εύρους 0,9 κλήσεων και µε το κάτω όριο της πρώτης κλάσης να αποτελείται από την µικρότερη παρατήρηση ( καθώς το 3,6 είναι πολλαπλάσιο του 0,9 ). Το σύνολο των κλάσεων και η οµαδο-ποίηση σ’ αυτές των παρατηρήσεων παρουσιάζονται στην πρώτη και τρίτη στήλη του πίνακα 2.14 . Στη δεύτερη στήλη του ίδιου πίνακα παρουσιάζονται οι κεντρικές τιµές των κλάσεων οι οποίες προσδιορίζονται µέσω της σχέσης ( 4 ). Στην τέταρτη στήλη παρουσιάζονται οι απόλυτες αθροιστικές συχνότητες ( Ηj ). Στην πέµπτη και έκτη στήλη παρουσιάζονται αντιστοίχως οι σχετικές συχνότητες ( fj ) και αθροιστικές σχετικές συχνότητες ( Fj ). Στην έβδοµη και όγδοη στήλη παρουσιάζεται, για κάθε κλάση, το γινόµενο χjfj και το µέγεθος . Τέλος στην προτελευταία και στην τελευταία γραµµή παρουσιάζονται αντιστοίχως το άθροισµα και το γινόµενο συγκε-κριµένων στηλών.

χ jh j

Πίνακας 2.14 Κλάσεις χj hj Hj fj Fj χj fj [3.6 , 4.5) 4,05 4 4 0,08 0,08 0,3 269,042 [4.5 , 5.4) 4,95 9 13 0,18 0,26 0,9 1784213,374 [5.4 , 6.3) 5,85 11 24 0,22 0,48 1,3 2,746×108 [6.3 , 7.2) 6,75 3 27 0,06 0,54 0,4 307,547

[7.2 , 8.1) 7,65 12 39 0,24 0,78 1,8 40,173×109 [8.1 , 9.0) 8,55 8 47 0,16 0,94 1,4 28558074,211[9.0 , 9.9) 9,45 3 50 0,06 1 0,6 843,909 Άθροισµα ~ 50 ~ 1 ~ 6,678 ~ Γινόµενο ~ ~ ~ ~ ~ ~ 3,92513×1040

26

Page 27: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

β) Από την έβδοµη στήλη του παραπάνω πίνακα προκύπτει ότι .

Το µέγεθος αυτό αποτελεί και τον αριθµητικό µέσο των παρατηρήσεων του δείγµατος , καθώς από τη σχέση ( 11 ) έχουµε ότι :

f χ = 6,678j jj=1

7

x 6,678 = f χ = j jj=1

7

Για τον προσδιορισµό της διάµεσου θα χρησιµοποιήσουµε τη σχέση ( 18 ) αφού

όµως προηγουµένως προσδιορίσουµε την τιµή j για την οποία ικανοποιείται η σχέση ( 16 ). ∆εδοµένου ότι το ½ = 0,5 βρίσκεται µεταξύ των σχετικών αθροιστικών συχνοτήτων F3 = 0,48 & F4 = 0,54 , δηλαδή 0,48 = F3 < 1/2 = 0,5 < F4 = 0,54 , οδηγούµαστε στο συµπέρασµα ότι j = 4, αj = α4 = 7,2 , αj-1 = α3 = 6,3 , fj = f4 = 0,06 & Fj-1 = F3 = 0,48. Από τη σχέση ( 18 ) προκύπτει λοιπόν ότι η διάµεσος έχει ως εξής :

m = α + α α

f

12

F = α + α α

f

12

F =

= 6,3 + 7,2 6,3

0,06

12

0,48

n j 1j j 1

jj 1

4

4−

−−

−−

−−

−−

33

3

m = 6,650

Τέλος για τον προσδιορισµό του γεωµετρικού µέσου θα χρησιµοποιήσουµε τη

σχέση ( 21 ) από την οποία προκύπτει ότι :

G = χ = 3,92513 10jh

j=1

kh4050j

jj=1

k

∏∑× ⇒ G = 6,484

§ 2.7 Παράµετροι Απόκλισης

Στα πλαίσια αυτής της παραγράφου θα ασχοληθούµε µε τον προσδιορισµό της διακύµανσης και της τυπικής απόκλισης συνεχών και ασυνεχών µεταβλητών, καθώς και της απόλυτης διακύµανσης και του συντελεστή µεταβλητότητας.

Αν x1 , x2 , …. , xn είναι οι παρατηρούµενες τιµές µίας µεταβλητής Χ από ένα δείγµα µεγέθους n , η διακύµανση ή διασπορά ( variation ) του δείγµατος προσδιορί-ζεται µε τη βοήθεια της ακόλουθής σχέσης :

( )S = 1n

x x 2i

2

i=1

n

−∑ ( 22 )

όπου x : ο µέσος του δείγµατος.

Στο σηµείο αυτό θα πρέπει να επισηµάνουµε το γεγονός ότι συχνά, η διακύµανση του δείγµατος υπολογίζεται εναλλακτικά και µέσω της ακόλουθης σχέσης5 :

5 Συνήθως η σχέση αυτή χρησιµοποιείται όταν το µέγεθος του δείγµατος είναι µικρό ( δηλαδή n ≤ 30 ).

27

Page 28: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( )S = 1

n 1 x x 2

i

2

i=1

n

−−∑ ( 23 )

Αν πάρουµε τώρα την τετραγωνική ρίζα της δειγµατικής διακύµανσης, το

µέγεθος που προκύπτει συνιστά την τυπική απόκλιση ( standard deviation ) του δείγµατος. Στην περίπτωση λοιπόν που η διακύµανση υπολογίστηκε µε τη χρήση των σχέσεων ( 22 ) ή ( 23 ), η τυπική απόκλιση των παρατηρήσεων από το µέσο του δείγµατος θα έχει αντιστοίχως ως εξής :

( ) ( )S = 1n

x x S = 1

n 1 x x i

2

i=1

n

i

2

i=1

n

−−

−∑ ∑( 24 ) & ( 25 )

Έστω τώρα ότι οι παρατηρήσεις των τιµών µιας ασυνεχούς µεταβλητής Χ είναι

οµαδοποιηµένες και ας υποθέσουµε ότι α1 , α2 , …. , αk είναι οι παρατηρούµενες τιµές, ενώ h1 , h2 , …. , hk και f1 , f2 , …. , fk είναι οι απόλυτες και οι σχετικές συχνότητες αντιστοίχως. Σ’ αυτήν την περίπτωση η διακύµανση και η τυπική απόκλιση του δείγµατος προσδιορίζονται αντιστοίχως από τις ακόλουθες σχέσεις :

( ) ( )S = 1n

h α x S = 1n

h α x 2j j

2

j=1

k

j j

2

j=1

k

− −∑ ∑( 26 ) & ( 27 )

ή εναλλακτικά από τις σχέσεις

( ) ( )S = 1

n 1 h α x S =

1n 1

h α x 2j j

2

j=1

k

j j

2

j=1

k

−−

−−∑ ∑( 28 ) & ( 29 )

Στην περίπτωση που οι παρατηρήσεις µας είναι οµαδοποιηµένες σε κλάσεις6,

τότε στις σχέσεις ( 26 ) ~ ( 29 ) όπου αj θέτουµε χj ( αντικαθιστούµε δηλαδή την αj µε την κεντρική τιµή της κλάσης ). Σ’ αυτήν λοιπόν την περίπτωση η διακύµανση και η τυπική απόκλιση προσδιορίζονται αντιστοίχως µε τη βοήθεια των παρακάτω σχέσεων

( ) ( )S = 1n

h χ x S = 1n

h χ x 2j j

2

j=1

k

j j

2

j=1

k

− −∑ ∑( 30 ) & ( 31 )

ή εναλλακτικά από τις σχέσεις :

( ) ( )S = 1

n 1 h χ x S =

1n 1

h χ x 2j j

2

j=1

k

j j

2

j=1

k

−−

−−∑ ∑( 32 ) & ( 33 )

Επειδή ο υπολογισµός της διακύµανσης µέσω κάποιου από τους παραπάνω

τύπους είναι αφενός δύσκολος και αφετέρου όχι και τόσο ακριβής ( κυρίως λόγω των στρογγυλοποιήσεων στις οποίες προβαίνουµε κατά τη διάρκεια των υπολογισµών των

6 Το δείγµα δηλαδή περιλαµβάνει τιµές µίας ποιοτικής µεταβλητής

28

Page 29: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

επιµέρους µεγεθών ), θα µπορούσαµε να προσδιορίσουµε κάποιους περισσότερο εύχρηστους τύπους για τον υπολογισµό των εν λόγω µεγεθών. Για παράδειγµα από τη σχέση ( 24 ) µπορούµε να πάρουµε τον ακόλουθο τύπο προσδιορισµού της διακύ-µανσης :

( ) ( )S = 1n

x x = 1n

x 2x x + x = 1n

x 2xn

x + 1n

x =

= 1n

x 2x x + 1n

nx = 1n

x 2x + x

2i

2

i=1

n

i2

i2

i=1

n

i2

i=1

n

ii=1

n2

i=1

n

i2

i=1

n2

i2

i=1

n2 2

− − −

− − ⇒ −

∑ ∑ ∑ ∑ ∑

∑ ∑ ∑S = 1n

x x 2i2

i=1

n2 ( 34 )

Επίσης από τη σχέση ( 26 ) προκύπτουν οι παρακάτω σχέσεις :

( ) ( )S = 1n

h α x = 1n

h α 2α x + x =

= 1n

h α 2xn

h α + 1n

h x =

= 1n

h α 2x x + xn

h = 1n

h α 2x + xn

n

2j j

2

j=1

k

j j2

j2

j=1

k

j j2

j=1

k

j jj=1

k

j2

j=1

k

j j2

j=1

k 2

jj=1

k

j j2

j=1

k2

2

− −

− − ⇒

⇒ −

∑ ∑

∑ ∑ ∑

∑ ∑ ∑

∑S = 1n

h α x 2j j

2

j=1

k2 ( 34 ) S =

1n

h α + 1n

h α + .... + 1n

h α x =

= f α + f α + .... + f α x

21 1

22 2

2k k

2 2

1 12

2 22

k k2 2

⇒ −

− ⇒ −∑S = f α x 2j j

2

j=1

k2 ( 35 )

Στην περίπτωση που x1, x2, ... , xn είναι παρατηρούµενες τιµές της µεταβλητής Χ,

για τον προσδιορισµό της µέσης απόκλισης ( mean deviation ) των παρατηρήσεων από την παράµετρο θέσης λ χρησιµοποιούµε την παρακάτω σχέση7 :

S = 1n

x λ ii 1

n

−=∑ ( 36 )

Στην περίπτωση που α1 , α2 , …. , αk είναι παρατηρούµενες τιµές της ασυνεχούς

µεταβλητής Χ και h1 , h2 , …. , hk είναι οι απόλυτες συχνότητες, τότε η µέση απόκλιση προσδιορίζεται µε τη βοήθεια της ακόλουθης σχέσης :

7 Η σχέση αυτή ελαχιστοποιείται όταν λ = mn , όπου mn η διάµεσος του δείγµατος .

29

Page 30: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

S = 1n

h α λ j jj 1

k

−=∑ ( 37 )

Τέλος ο συντελεστής µεταβλητότητας ή διαφορετικά συντελεστής σχετικής

διασποράς ( coefficient of relative dispersion ) προσδιορίζεται µε τη βοήθεια της ακόλουθης σχέσης :

V = Sx

( 38 )

Ο παραπάνω συντελεστής εκφράζει την τυπική απόκλιση του δείγµατος ως

ποσοστό του αριθµητικού µέσου και είναι απαλλαγµένος από τις µονάδες µέτρησης των δεδοµένων µας.

Άσκηση 1 Κατά τη διάρκεια ενός έτους, 10 υπάλληλοι µιας ασφαλιστικής εταιρείας έκαναν

τις παρακάτω ασφάλειες ζωής :

72 , 54 , 46 , 37 , 51 , 72 , 64 , 32 , 46 , 58

Να προσδιορισθεί η µέση τιµή , η διασπορά , η τυπική απόκλιση , ο διάµεσος και η τιµή της µέσης απόκλισης. Λύση

Το µέγεθος της µέσης τιµής και της διασποράς θα το προσδιορίσουµε µε τη βοήθεια του πίνακα 2.15 . Στην πρώτη στήλη ( xi ) του πίνακα αυτού παραθέτουµε το πλήθος των ασφαλειών ζωής που έκανε ο κάθε υπάλληλος. Η δεύτερη στήλη περιλαµβάνει το µέγεθος της διαφοράς της xi από το δειγµατικό µέσο ( x xi − ). Στην

Πίνακας 2.15 xi 72 18,8 353,44 54 0,8 0,64 46 -7,2 51,84 37 -16,2 262,44 51 -2,2 4,84 72 18,8 353,44 64 10,8 116,64 32 -21,2 449,44 46 -7,2 51,84 58 4,8 23,04

x 532ii=1

10

∑ = ( )x x 1667,60i

2

i=1

10

− =∑

30

Page 31: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

τρίτη στήλη παρουσιάζεται το τετράγωνο των µέσων αποκλίσεων ( )[ ]x xi

2− . Στην

τελευταία τέλος γραµµή του πίνακα παρουσιάζονται τα αθροίσµατα των επιµέρους στηλών.

Για τον προσδιορισµό του µέσου θα χρησιµοποιήσουµε τη σχέση ( 9 ) από την οποία προκύπτει ότι :

x = 1

10 x =

53210

ii=1

10

∑ ⇒ x = 53,2

Όπως διαπιστώνουµε, κατά τη διάρκεια ενός έτους ο κάθε υπάλληλος έκανε κατά µέσο όρο 53,2 ασφαλιστήρια.

Για τον προσδιορισµό της διασποράς, και δεδοµένου ότι το µέγεθος του δείγµατος είναι µικρό, θα χρησιµοποιήσουµε τη σχέση (23) από την οποία προκύπτει ότι :

( ) ( )S = 1

n 1x x

110 1

x x 1667,60

9 2

i

2

i=1

n

i

2

i=1

10

−− =

−− = ⇒∑ ∑ S = 185,2892

Παίρνοντας την τετραγωνική ρίζα της διασποράς που µόλις προσδιορίσαµε,

προκύπτει το µέγεθος της τυπικής απόκλισης το οποίο έχει ως εξής :

( ) ( )S = 1

n 1x x

110 1

x x 185,289 i

2

i=1

n

i

2

i=1

10

−− =

−− = ⇒∑ ∑ S = 13,612

Να σηµειώσουµε εδώ ότι η διακύµανση και η τυπική απόκλιση που θα

προέκυπτε εάν έναντι της σχέσης ( 23 ) χρησιµοποιούσαµε τη σχέση ( 22 ) θα είχε ως εξής :

( ) ( )S = 1n

x x1

10x x

1667,610

166,76 2i

2

i=1

n

i

2

i=1

10

− = − = ⇒ ⇒∑ ∑ S = 166,76 S = = 12,9142

Όπως διαπιστώνουµε υπάρχει µια µικρή διαφορά µεταξύ των αποτελεσµάτων που µας δίνουν οι δύο τύποι υπολογισµού της διασποράς. Η διαφορά αυτή είναι τόσο µικρότερη όσο µεγαλύτερο είναι το µέγεθος του δείγµατος.

Ως πρώτο βήµα για τον προσδιορισµό της διαµέσου, κατατάσσουµε τις παρατηρήσεις µας κατά αύξουσα τάξη µεγέθους :

Πίνακας 2.16 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 32 37 46 46 51 54 58 64 72 72

∆εδοµένου ότι το µέγεθος του δείγµατος ( n = 10 ) είναι ένας άρτιος αριθµός, θα χρησιµοποιήσουµε τον δεύτερο κλάδο της σχέσης (14) προκειµένου να υπολογίσουµε τη διάµεσό του. Πιο συγκεκριµένα έχουµε ότι :

31

Page 32: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( ) ( )m = 12

x + x m = 12

x + x = 12

51 + 54 = 105

2n n2

n+22

10 5 6

⇒ ⇒ m = 52,510

Πίνακας 2.17 xi xi – m10 72 19,5 19,5 54 1,5 1,5 46 -6,5 6,5 37 -15,5 15,5 51 -1,5 1,5 72 19,5 19,5 64 11,5 11,5 32 -20,5 20,5 46 -6,5 6,5 58 5,5 5,5

x m = 108i 10i=1

10

−∑

Με τη βοήθεια του πίνακα 2.17 θα προσδιορίσουµε στη συνέχεια το µέγεθος της

µέσης απόκλισης. Από την τελευταία γραµµή της τρίτης στήλης παίρνουµε ότι

x m = 108i 10i=1

10

−∑ . Αντικαθιστώντας το µέγεθος αυτό στη σχέση ( 36 ) βρίσκουµε το

µέγεθος της µέσης απόκλισης το οποίο έχει ως εξής :

S = 1n

x m = 1

10x m =

10810

i ni=1

n

i 10i=1

10

− − ⇒∑ ∑ S = 10,8

Άσκηση 2

Το διάστηµα του χρόνου ( σε εβδοµάδες ) µεταξύ της εµφάνισης µιας αρρώστιας και της ίασής της έχει καταγραφεί για 50 αρρώστους και παρουσιάζεται στον παρακάτω πίνακα :

Πίνακας 2.18 2,1 4,4 2,7 32,3 9,9 9,0 2,0 6,6 3,9 1,6 14,7 9,6 16,7 7,4 8,2 19,2 6,9 4,3 3,3 1,2 4,1 18,4 0,2 6,1 13,5 7,4 0,2 8,3 0,3 1,3 14,1 1,0 2,4 2,4 18,0 8,7 24,0 1,4 8,2 5,8 1,6 3,5 11,4 18,0 26,7 3,7 12,6 23,1 5,6 0,4

32

Page 33: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Για τα δεδοµένα του παραπάνω πίνακα ζητείται : α ) Η οµαδοποίηση των παρατηρήσεων σε κλάσεις και η κατασκευή του ραβδογράµ-

µατος των σχετικών συχνοτήτων. β ) Ο υπολογισµός του αριθµητικού µέσου και της διαµέσου γ ) Ο υπολογισµός της διασποράς και της τυπικής απόκλισης δ ) Να προσδιορισθεί το µέγεθος της µέσης απόκλισης ε ) Ο υπολογισµός του συντελεστή µεταβλητότητας. Λύση

α) Η οµαδοποίηση των παρατηρήσεων σε κλάσεις θα ξεκινήσει µε τον κατά προσέγγιση προσδιορισµό του αριθµού των κλάσεων. ∆εδοµένου ότι έχουµε στη διάθεσή µας 50 παρατηρήσεις ( n = 50 ), από τη σχέση ( 2 ) προκύπτει ότι αυτές θα µπορούσαν να οµαδοποιηθούν σε περίπου

k = 1 + 3,3log n = 1+ 3,3log 50 = 6,607 10 10 ⇒ k = 7 κλάσεις

Το πλάτος του δείγµατος θα το προσδιορίσουµε µε τη βοήθεια της σχέσης ( 1 )

από την οποία προκύπτει ότι :

d = Max x Min x = 32,3 0,2 − − ⇒ d = 32,1 εβδοµάδες

Από τη σχέση ( 3 ) προκύπτει ότι το εύρος της κάθε κλάσης θα είναι ίσο µε

l l = d k

= 32,1

6,607 4,858 ≅ ⇒ 5≅ εβδοµάδες

Βάσει της παραπάνω ανάλυσης θα µπορούσαµε να οµαδοποιήσουµε τις

παρατηρήσεις µας σε 7 κλάσεις εύρους 5 εβδοµάδων η κάθε µία, θέτοντας το κάτω όριο της πρώτης κλάσης ίσο µε το µηδέν8. Οι 7 κλάσεις και το πλήθος των παρατη-ρήσεων που αντιστοιχεί σε κάθε µία από αυτές ( δηλαδή οι απόλυτες συχνότητες ) παρουσιάζονται στην πρώτη και τρίτη στήλη του πίνακα 2.19 αντιστοίχως. Στη δεύτερη στήλη παρουσιάζονται οι κεντρικές τιµές των κλάσεων ( χj ), όπως αυτές

Πίνακας 2.19 Κλάσεις χj j Hj fj Fj χj fj

[0 , 5) 2,5 22 22 0,44 0,44 1,10 [5,10) 7,5 14 36 0,28 0,72 2,10

[10 , 15) 12,5 5 41 0,10 0,82 1,25 [15 , 20) 17,5 5 46 0,10 0,92 1,75 [20 , 25) 22,5 2 48 0,04 0,96 0,90 [25 , 30) 27,5 1 49 0,02 0,98 0,55 [30 , 35) 32,5 1 50 0,02 1 0,65 Άθροισµα ~ 50 ~ 1 ~ 8,30

h

8 Εάν ως κάτω όριο της πρώτης κλάσης θέταµε την ελάχιστη παρατηρούµενη τιµή ( δηλαδή το 0,2 ) η οµαδοποίηση των παρατηρήσεων δεν θα διαφοροποιούνταν και ιδιαίτερα.

33

Page 34: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

προσδιορίζονται από τη σχέση (4), στην τέταρτη στήλη παρουσιάζονται οι απόλυτες αθροιστικές συχνότητες ( Hj ) οι οποίες προσδιορίζονται µε τη βοήθεια της σχέσης (6), στην πέµπτη και έκτη στήλη παρουσιάζονται αντιστοίχως οι σχετικές συχνότητες ( fj ) και οι αθροιστικές σχετικές συχνότητες ( Fj ) , ενώ στην έβδοµη στήλη παρου-σιάζονται τα γινόµενα των τιµών της δεύτερης και πέµπτης στήλης. Τέλος στην τελευταία γραµµή του πίνακα παρουσιάζεται το άθροισµα των επί µέρους στηλών.

Το ραβδόγραµµα των σχετικών συχνοτήτων παρουσιάζεται γραφικά στο διάγραµµα ∆ – 2.11 .

Bar Chart of fj

f j

0,44

0,28

0,10 0,10

0,040,02 0,02

0,0

0,1

0,2

0,3

0,4

0,5

[0,5) [5,10) [10,15) [15,20) [20,25) [25.30) [30,35)

β ) Από την τελευταία γραµµή τη

. Βάσει της σχέσης ( 1

µέσο των παρατηρήσεών µας, δηλαδή

f χ = 8,30j jj=1

7

x = ∑

Με άλλα λόγια ο µέσος χρόνος που µµίας ασθένειας είναι 8,3 εβδοµάδες.

∆εδοµένου ότι οι παρατηρήσεις µπροσδιορισµό της διαµέσου θα χρησιµχρησιµοποιήσουµε όµως τη σχέση (προσδιορίσει την τιµή j για την οποία του πίνακα 2.19 προκύπτει ότι :

∆ – 2.11

ς έβδοµης στήλης του πίνακα 2.19 έχουµε ότι

3 ) το µέγεθος αυτό αποτελεί τον αριθµητικό

:

f χ = 8,30j jj=1

7

εσολαβεί µεταξύ της εκδήλωσης και της ίασης

ας έχουν ήδη οµαδοποιηθεί σε κλάσεις, για τον οποιήσουµε τη σχέση ( 17 ). Προκειµένου να 17 ), θα πρέπει προηγουµένως να έχουµε ικανοποιείται η σχέση ( 15 ). Από τα δεδοµένα

34

Page 35: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

0,44 = F1 < 0,5 < F2 = 0,72

Ως εκ τούτου θα έχουµε ότι αj = α2 = 10, αj-1 = α1 = 5, fj = f2 = 0,28 & Fj-1 = F1 = 0,44. Από τη σχέση ( 18 ) προκύπτει λοιπόν ότι η τιµή της διαµέσου θα είναι ίση µε :

m = α + α α

f

12

F = α + α α

f

12

F =

= 5 + 10 50,28

12

0,44

n j 1j j 1

jj 1

2

2−

−−

−−

−−

−−

⇒ ≅

11

1

m 6,07150

γ ) Για τον προσδιορισµό της διασποράς και της τυπικής απόκλισης θα

χρησιµοποιήσουµε τα δεδοµένα του πίνακα 2.20 . Οι τρεις πρώτες στήλες είναι ακριβώς οι ίδιες µε εκείνες του πίνακα 2.19 . Στην τέταρτη και πέµπτη στήλη παρουσιάζονται οι διαφορές των στοιχείων της δεύτερης στήλης ( δηλαδή των κεντρικών τιµών των κλάσεων ) από τον αριθµητικό µέσο ( την τιµή του οποίου προσδιορίσαµε στο δεύτερο υποερώτηµα ) και οι τετραγωνικές τιµές των µέσων αποκλίσεων αντιστοίχως. Τέλος στην έκτη στήλη παρουσιάζεται το γινόµενο των στοιχείων της τρίτης κλάσης µε εκείνα της πέµπτης κλάσης. Στην τελευταία γραµµή της έκτης στήλης παρουσιάζεται το άθροισµα των τιµών της στήλης αυτής για j = 1 , …. 7.

Πίνακας 2.20

Κλάσεις χj hj [0 , 5) 2,5 22 -5,8 33,64 740,08 [5,10) 7,5 14 -0,8 0,64 8,96

[10 , 15) 12,5 5 4,2 17,64 88,20 [15 , 20) 17,5 5 9,2 84,64 423,20 [20 , 25) 22,5 2 14,2 201,64 403,28 [25 , 30) 27,5 1 19,2 368,64 368,64 [30 , 35) 32,5 1 24,2 585,64 585,64 Άθροισµα ~ 50 ~ ~ 2618

∆εδοµένου ότι n = 50 & ( )h χ xj j

2

j=1

7

−∑ = 2618, από τη σχέση (30) προκύπτει ότι :

( ) ( )S = 1n

h χ x1

50 h χ x =

261850

2j j

2

j=1

k

j j

2

j=1

7

− − ⇒∑ ∑ = S = 52,362

Παίρνοντας την τετραγωνική ρίζα της διακύµανσης, προσδιορίζουµε το µέγεθος

της τυπικής απόκλισης το οποίο έχει ως ακολούθως :

S = 52,36 S 7,236⇒ ≅

35

Page 36: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

δ ) Η µέση απόκλιση θα προσδιορισθεί µε τη βοήθεια της σχέσης ( 36 ) και των δεδοµένων του πίνακα 2.21 . Από την τελευταία γραµµή της τρίτης και έκτης στήλης του πίνακα αυτού παίρνουµε ότι :

x m = 130,487 & x m = 156,971i 50i 1

25

i 50i

50

− −= =∑ ∑

26

Αντικαθιστώντας τα δύο παραπάνω µεγέθη στη σχέση ( 36 ) παίρνουµε το µέγεθος της µέσης απόκλισης το οποίο έχει ως εξής :

S = 1n

x m = 1

50 x m =

150

x m + x m =

= 130,487 + 156,971

50

i ni 1

n

i 50i 1

50

i 50i 1

25

i 50i

50

− − − −

= = = =∑ ∑ ∑ ∑

26

S = 5,749

Πίνακας 2.21 i xi i xi 1 2,1 3,971 26 7,4 1,329 2 4,4 1,671 27 0,2 5,871 3 2,7 3,371 28 8,3 2,229 4 32,3 26,229 29 0,3 5,771 5 9,9 3,829 30 1,3 4,771 6 9 2,929 31 14,1 8,029 7 2 4,071 32 1 5,071 8 6,6 0,529 33 2,4 3,671 9 3,9 2,171 34 2,4 3,671 10 1,6 4,471 35 18 11,929 11 14,7 8,629 36 8,7 2,629 12 9,6 3,529 37 24 17,929 13 16,7 10,629 38 1,4 4,671 14 7,4 1,329 39 8,2 2,129 15 8,2 2,129 40 5,8 0,271 16 19,2 13,129 41 1,6 4,471 17 6,9 0,829 42 3,5 2,571 18 4,3 1,771 43 11,4 5,329 19 3,3 2,771 44 18 11,929 20 1,2 4,871 45 26,7 20,629 21 4,1 1,971 46 3,7 2,371 22 18,4 12,329 47 12,6 6,529 23 0,2 5,871 48 23,1 17,029 24 6,1 0,029 49 5,6 0,471 25 13,5 7,429 50 0,4 5,671

Άθροισµα 130,487 156,971

36

Page 37: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

ε ) Το µέγεθος του συντελεστή µεταβλητότητας θα το προσδιορίσουµε µε τη βοήθεια της σχέσης ( 38 ) από την οποία προκύπτει ότι :

V = Sx

= 7,2368,30

⇒ ≅V 0,872

§ 2.8 Άλλες παράµετροι κατανοµών συχνοτήτων

Η ν – οστή ροπή ( moment ) από την παράµετρο θέσης λ ενός συνόλου στοιχείων x1 , x2 ,…., xn ορίζεται (ισοδύναµα) µέσω µίας εκ των παρακάτω σχέσεων :

( ) ( )

( )

M = 1 n

x λ ή M = 1 n

h α λ

ή M = f α λ

νλ

j

ν

j=1

n

νλ

j j

ν

j=1

k

νλ

j j

ν

j=1

k

− −

∑ ∑

( 39 ) ( 40 )

( 41 )

όπου ν ∈ Ν = 0 , 1 , 2 , …. , αj : η παρατηρούµενη τιµή της µεταβλητής Χ , hj : η

απόλυτη συχνότητα εµφάνισης της αj & fj : η σχετική συχνότητα της αj.

Στην περίπτωση που οι παρατηρήσεις µας είναι οµαδοποιηµένες σε j κλάσεις µε κεντρικές τιµές χj και απόλυτες & σχετικές συχνότητες hj & fj αντιστοίχως, η ν – οστή ροπή δίνεται από τις σχέσεις :

( ) ( )M = 1 n

h χ λ ή M = f χ λ νλ

j j

ν

j=1

n

νλ

j j

ν

j=1

n

− −∑ ∑( 42 ) ( 43 )

Όταν λ = x , η ροπή που προκύπτει ονοµάζεται κεντρική (central moment), ενώ

εάν αντί για (xj – λ) θέσουµε x λj− τότε η ροπή ονοµάζεται απόλυτη ( absolute moment ).

Επικρατούσα τιµή ( the mode ) D καλείται η συχνότερα εµφανιζόµενη τιµή αj των παρατηρήσεων x1 , x2 ,…., xn. Με άλλα λόγια ισχύει ότι9 :

D = Max hj ( 44 )

Στην περίπτωση που ισχύει ότι :

x ( αριθµητικός µέσος ) = mn ( διάµεσος ) = D ( επικρατούσα τιµή ) ( 45 )

9 Στην περίπτωση που η µεταβλητή Χ είναι συνεχής και οι παρατηρήσεις x1 , x2 , …. , xn είναι οµαδοποιηµένες σε τάξεις ίσου πλάτους, τότε η επικρατούσα τιµή προσδιορίζεται µέσω της ακόλουθης

σχέσης : D = α + dh h

2h h h j 1 j j j 1

j j 1 j 1−

− +

− − , όπου j η τυπική κλάση ( δηλ. η κλάση στην οποία

εµφανίζεται η Max hj ) και αj-1 : το κάτω όριο της τυπικής κλάσης.

37

Page 38: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

τότε η κατανοµή συχνοτήτων θα καλείται συµµετρική. Εάν δεν ικανοποιείται η σχέση ( 45 ), η κατανοµή συχνοτήτων θα καλείται λοξή ή ασύµµετρη. Ειδικότερα διακρίνουµε µεταξύ των ακόλουθων περιπτώσεων : ( i ) Αν x > m > Dn η κατανοµή συχνοτήτων είναι λοξή προς τα δεξιά ( ii ) Αν D > x > mn η κατανοµή συχνοτήτων είναι λοξή προς τα αριστερά

Για τον προσδιορισµό της ασυµµετρίας (skewness) µίας κατανοµής συχνοτήτων µπορούµε να χρησιµοποιήσουµε και έναν από τα παρακάτω µέτρα ασυµµετρίας :

(α) Pearson : g = x D

S 1

−( 46 )

(β) Yule – Pearson : ( )

g = 3 x m

S 2

n−( 47 )

(γ) Μέτρο λοξότητας τρίτης ροπής : g = M S

33x

3 ( 48 )

Στην περίπτωση που gi = 0 , i = 1,2,3 , τότε η κατανοµή είναι συµµετρική. Εάν

gi > 0 ( gi < 0 ) , i = 1,2,3 , η κατανοµή είναι ασύµµετρη προς τα αριστερά ( δεξιά ). Τέλος η κυρτότητα ( kurtosis ) µίας κατανοµής συχνοτήτων προσδιορίζεται

µέσω της ακόλουθης σχέσης :

W = M S

3 4x

4 − ( 49 )

Εάν W >,=,< 0 τότε η κατανοµή θα είναι αντιστοίχως λεπτόκυρτη , µεσόκυρτη ,

πλατόκυρτη.

Άσκηση : Στον πίνακα 2.22 δίνονται τα αποτελέσµατα της µέτρησης του αριθµού των παιδιών σε 30 οικογένειες Πίνακας 2.22 2 0 2 7 2 3 0 3 2 0 1 2 3 2 3 2 4 1 1 1 4 1 3 2 1 0 1 9 2 5

Ζητείται : (α) Να οµαδοποιηθούν οι παρατηρήσεις σε µία κατανοµή συχνοτήτων και να

δηµιουργηθεί το ιστόγραµµα των συχνοτήτων. (β) Να υπολογιστεί η µέση τιµή, η διακύµανση, η τυπική απόκλιση και η διάµεσος. (γ) Να υπολογιστεί η τρίτη κεντρική ροπή (δ) Να ελεγχθεί η κατανοµή των συχνοτήτων ως προς την ασυµµετρία και την

κυρτότητα.

38

Page 39: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Λύση (α) Στον πίνακα 2.23 έχουµε οµαδοποιήσει της παρατηρήσεις µας και έχουµε υπολογίσει τις απόλυτες συχνότητες hj ( 2η στήλη ), τις απόλυτες αθροιστικές συχνότητες Ηj ( 3η στήλη ) και τα µεγέθη αjhj ( 4η στήλη ), (α x)j

2− ( 5η στήλη ) και

h (α x)j j2− ( 6η στήλη ).

Πίνακας 2.23 j αj hj Hj αj hj 1 0 4 4 0 5,29 21,16 2 1 7 11 7 1,69 11,83 3 2 9 20 18 0,09 0,81 4 3 5 25 15 0,49 2,45 5 4 2 27 8 2,89 5,78 6 5 1 28 5 7,29 7,29 7 7 1 29 7 22,09 22,09 8 9 1 30 9 44,89 44,89

Άθροισµα 30 69 116,3 Στο γράφηµα 2.12 παρουσιάζεται το ιστόγραµµα συχνοτήτων

Histogram

aj

h j

4

7

9

5

2

1

0

1

0

1

0

1

2

3

4

5

6

7

8

9

10

-1 0 1 2 3 4 5 6 7 8 9 10

∆ – 2.12

Όπως διαπιστώνουµε από το παραπάνω γράφηµα η κατανοµή συχνοτήτων είναι λοξή προς τα δεξιά .

39

Page 40: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( β )

Για τον προσδιορισµό του αριθµητικού µέσου θα χρησιµοποιήσουµε τη σχέση ( 10 ) από την οποία, και µέσω των δεδοµένων του πίνακα 2.23 , προκύπτει ότι :

x = 1n

h α = 130

69 j jj=1

8

∑ ⇒ x = 2,3

∆εδοµένου ότι ο αριθµός των παρατηρήσεων είναι ίσος µε το 30 ( n = 30 ), για

τον προσδιορισµό της διακύµανσης και της τυπικής απόκλισης θα χρησιµοποιήσουµε τις σχέσεις ( 28 ) και ( 29 ) αντιστοίχως. Βάσει των δεδοµένων του πίνακα 2.23, από τις δύο αυτές σχέσεις προκύπτει ότι :

( )S = 1

n 1 h α x =

1 30 1

116,3 = 116,3

9 2

j j

2

j=1

8

−−

−⇒∑ 2

S = 4,0102

&

( )S = 1

n 1 h α x = 4,010 j j

2

j=1

8

−− ⇒∑ S = 2,003

Στον πίνακα 2.24 έχουµε κατατάξει τις παρατηρήσεις µας κατά αύξουσα τάξη

µεγέθους. Βάσει του πίνακα αυτού και µε τη βοήθεια της σχέσης ( 14 ) θα προσδιορίσουµε την τιµή της διαµέσου.

Πίνακας 2.24 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 0 0 0 0 1 1 1 1 1 1 1 2 2 2 2

x16 x17 x18 x19 x20 x21 x22 x23 x24 x25 x26 x27 x28 x29 x30 2 2 2 2 2 3 3 3 3 3 4 4 5 7 9

∆εδοµένου ότι ο συνολικός αριθµός των παρατηρήσεων µας είναι άρτιος, θα

χρησιµοποιήσουµε το δεύτερο κλάδο για τον προσδιορισµό της τιµής της διαµέσου από τον οποίο και προκύπτει ότι :

( ) ( )m = 12

x + x = 12

2 + 2 30 15 16 ⇒ m = 230

( γ ) Η τιµή της δεύτερης κεντρικής ροπής θα προσδιορισθεί µέσω της σχέσης ( 40 ) και µε τη βοήθεια των δεδοµένων του πίνακα 2.25 . Πιο συγκεκριµένα η τρίτη κεντρική ροπή θα έχει ως εξής :

( ) ( )M = 1 n

h α x M = 1 30

h α x130

371,520 vx

j j

ν

j=1

k

3x

j j

3

j=1

8

− ⇒ − ⇒ ≅∑ ∑ = M3x 12,384

40

Page 41: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Πίνακας 2.25 j αj hj 1 0 4 -48,668 111,9364 2 1 7 -15,379 19,9927 3 2 9 -0,243 0,0729 4 3 5 1,715 1,2005 5 4 2 9,826 16,7042 6 5 1 19,683 53,1441 7 7 1 103,823 487,9681 8 9 1 300,763 2015,1121

Άθροισµα 30 371,520 2706,131

( δ ) Από τη σχέση ( 48 ) προκύπτει ότι

( )g =

M S

12,3842,0033

3x

3 3 = g = 1,5413⇒

∆εδοµένου ότι g3 > 0 η κατανοµή των συχνοτήτων είναι ασύµµετρη προς τ’ αριστερά ( είναι δηλαδή λοξή προς τα δεξιά ), κάτι που επιβεβαιώνεται και από το γράφηµα ∆ – 2.12 .

Προκειµένου να ελέγξουµε την κυρτότητα της κατανοµής συχνοτήτων µέσω της σχέσης ( 49 ), θα πρέπει προηγουµένως να έχουµε προσδιορίσει την τέταρτη κεντρική ροπή. Από την τελευταία γραµµή της πέµπτης στήλης του πίνακα 2.25 έχουµε ότι

(h α xj j

4

j=1

k

−∑ ) = 2706,131. Ως εκ τούτου η τέταρτη κεντρική ροπή θα έχει ως εξής :

( )M = 1 30

h α x2706,131

30 4

xj j

4

j=1

8

− ⇒∑ = M4x 9,204≅

Από τη σχέση λοιπόν ( 49 ) προκύπτει ότι

( )W =

M S

3 = 9,2042,003

3 4x

4 3− − ⇒ − W = 2,428

Εφόσον W < 0, η κατανοµή θα είναι πλατόκυρτη.

41

Page 42: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

ΚΕΦΑΛΑΙΟ 3

ΠΙΘΑΝΟΤΗΤΕΣ

§ 3.1 Εισαγωγικές έννοιες και ορισµοί

Στην παρούσα ενότητα θα δώσουµε τους ορισµούς ορισµένων εκ των βασικών εννοιών που θα συναντήσουµε στα πλαίσια του τρίτου κεφαλαίου, όπως για παράδειγµα του τυχαίου και του αιτιοκρατικού πειράµατος, του δειγµατοχώρου, των δειγµατοσηµείων, του ενδεχοµένου κ.τ.λ..

Πείραµα ( experiment ) είναι µία ενέργεια η οποία έχει ένα αποτέλεσµα και

µπορεί, υπό τις ίδιες συνθήκες, να επαναληφθεί άπειρες φορές. Τα πειράµατα διακρίνονται σε τυχαία και αιτιοκρατικά.

Τυχαίο πείραµα ( random experiment ) είναι εκείνο το οποίο µπορεί να µας οδηγήσει σε περισσότερα του ενός αποτελέσµατα, χωρίς να είναι βέβαιο πιο από αυτά τελικώς θα πραγµατοποιηθεί.

Αιτιοκρατικό πείραµα είναι εκείνο το πείραµα του οποίου το πραγµατο-

ποιηθέν αποτέλεσµα είναι µε βεβαιότητα γνωστό. ∆ειγµατοχώρος ή δειγµατικός χώρος ( sample space ) είναι το σύνολο των

δυνατών αποτελεσµάτων ενός τυχαίου προβλήµατος και συµβολίζεται µε Ω. ∆ειγµατοσηµεία ή δειγµατικά σηµεία ( sample points ) είναι τα σηµεία του

δειγµατοχώρου και θα τα συµβολίζουµε µε ω. Κάθε υποσύνολο του Ω καλείται ενδεχόµενο (event). Τα ενδεχόµενα µπορούµε

να τα διακρίνουµε σε απλά , σύνθετα , βέβαια και αδύνατα.

Απλό ενδεχόµενο ( simple event ) είναι εκείνο το υποσύνολο του Ω το οποίο περιλαµβάνει µόνο ένα δειγµατοσηµείο.

Σύνθετο ενδεχόµενο ( composite event ) είναι εκείνο το υποσύνολο του Ω

το οποίο περιλαµβάνει περισσότερα του ενός δειγµατοσηµεία.

Το ενδεχόµενο Α θα λέµε ότι συµβαίνει εάν από την εκτέλεση ενός τυχαίου πειράµατος προκύψει ένα δειγµατοσηµείο ω το οποίο ανήκει στο Α ( ω∈Α ). Στην περίπτωση που το ω∉Α τότε θα λέµε ότι το ενδεχόµενο Α δεν πραγµατοποιείται.

Ο δειγµατοχώρος Ω συνιστά όχι µόνο ένα σύνθετο ενδεχόµενο ( καθώς

περιλαµβάνει όλα τα δυνατά αποτελέσµατα ενός πειράµατος ) αλλά και ένα βέβαιο ενδεχόµενο καθώς είναι απολύτως σίγουρο ότι το αποτέλεσµα µίας δοκιµής ( trial ) ω∈Ω.

42

Page 43: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Το ενδεχόµενο το οποίο δεν περιέχει κανένα δειγµατοσηµείο του Ω θα το συµβολίζουµε όπως και το κενό σύνολο ( δηλ. µε ∅ ). Το ενδεχόµενο αυτό καλείται αδύνατο ενδεχόµενο καθώς είναι απολύτως βέβαιο ότι δεν θα πραγµατοποιηθεί σε καµία δοκιµή.

Εάν Α = 1 , 2 , 3 , 4 & Β = 2 , 4 , 5 , 7 δύο ενδεχόµενα τότε :

i ) Το ενδεχόµενο C1 θα αποτελεί ένωση (union) των Α και Β, δηλαδή θα ισχύει ότι:

C1 = Α ∪ Β ( 3.1 )

εάν τα στοιχεία του C1 συνιστούν δειγµατοσηµείο ή του Α ή του Β ή και των δύο. Σ΄ αυτήν την περίπτωση θα έχουµε λοιπόν ότι το C1 = 1 , 2 , 3 , 4 , 5 , 7 .

ii ) Το ενδεχόµενο C2 θα αποτελεί τοµή (intersection) των Α και Β, δηλαδή θα ισχύει ότι :

C2 = Α ∩ Β ( 3.2 )

εάν τα στοιχεία του ανήκουν και στο Α και στο Β. Στην περίπτωση αυτή θα έχουµε ότι C2 = 2 , 4 . Να σηµειώσουµε εδώ ότι εάν τα Α , Β είναι ξένα µεταξύ τους τότε θα ισχύει ότι C2 = Α ∩ Β = ∅ ( δηλαδή τα δειγµατοσηµεία του C2 δεν θα ανήκουν ούτε στο Α ούτε στο Β ) και τα ενδεχόµενα Α , Β θα καλούνται ασυµβίβαστα ή αµοιβαίως αποκλειόµενα.

iii ) Το ενδεχόµενο C3 θα αποτελεί διαφορά ( difference ) των Α και Β, δηλαδή θα ισχύει ότι :

C3 = Α – Β ( 3.3 )

εάν τα στοιχεία του ανήκουν στο Α αλλά όχι και στο Β. Με άλλα λόγια θα έχουµε ότι C3 = Α – Β = 1 , 3 . Να παρατηρήσουµε στο σηµείο αυτό ότι στην περίπτωση που το Α = Ω τότε το Ω – Β καλείται συµπλήρωµα ( complement ) του Β και συµβολίζεται µε Β’.

Για τα ενδεχόµενα A , B & C ορίζονται οι ακόλουθες πράξεις :

(α) Α ∪ Β = Β ∪ Α (β) Α ∪ ( Β ∪ C ) = ( A ∪ B ) ∪ C = A ∪ B ∪ C (γ) A ∩ B = B ∩ A (δ) A ∩ ( B ∩ C ) = ( A ∩ B ) ∩ C = A ∩ B ∩ C (ε) Α ∩ ( Β ∪ C ) = ( A ∩ B ) ∪ ( A ∩ C ) (στ) Α ∪ ( Β ∩ C ) = ( A ∪ B ) ∩ ( A ∪ C ) (ζ) Α – Β = Α ∩ Β’ (η) Α ∪ ∅ = Α & Α ∩ ∅ = ∅ (θ) ( Α ∪ Β )’ = Α’ ∩ Β’ (ι) ( Α ∩ Β )’ = Α’ ∪ Β’ (ια) Α = ( Α ∩ Β ) ∪ ( Α ∩ Β’ ) (ιβ) (Α’)’ = Α

43

Page 44: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Άσκηση 1 : Έστω το σύνολο S = 1,2,3,4,5 και τα υποσύνολά του A = 1,5 , B = 2,5,3 & C = 4,2. Να βρεθούν τα σύνολα ( a ) Α ∪ (Β ∪ C), ( b ) ( A ∪ B ) ∪ C, ( c ) A ∩ ( B ∪ C ), ( d ) ( A ∩ B ) ∪ ( A ∩ C ), ( e ) A’ ∩ ( B’ ∩ C’ ), ( f ) ( A ∪ B ) – ( A ∪ C ), ( g ) ( A ∩ C )’ ∪ B, ( h ) A – ( B’ ∪ C’ )

Λύση

( a ) Αν θέσουµε όπου D1 = Β ∪ C θα έχουµε ότι : B = 2,5,3C = 4,2

A = 1,5

⇒ ∪

⇒ ∪ ∪ ∪D = B C = 2,3,4,5 A ( B C ) = A D = 1,2,3,4,5 = S1

1

( b ) Αν θέσουµε όπου D2 = Α ∪ Β θα έχουµε ότι : A = 1,5B = 2,5,3

C = 4,2 (

⇒ ∪

⇒ ∪ ∪ ∪D = A B = 1,2,3,5 A B ) C = D C = 1,2,3,4,5 = S2

2

( c ) Αν θέσουµε όπου D3 = Α ∩ Β & D4 = Α ∩ C θα έχουµε ότι : A = 1,5B = 2,5,3

A = 1,5C = 4,2

A ( B C ) = ( A B ) ( A C ) = D D

3 4

⇒ ∩

⇒ ∩ ∅

∩ ∪ ∩ ∪ ∩ ∪

⇒ ∩ ∪

D = A B = 5

D = A C = A ( B C ) = 5

3

4

( d ) Στο προηγούµενο υποερώτηµα είδαµε ότι A ∩ B = D3 = 5 & A ∩ C = D4 = ∅. Κατά συνέπεια :

( A ∩ B ) ∪ ( A ∩ C ) = D3 ∪ D4 = D3 ∪ ∅ = D3 = 5 ( e ) ∆εδοµένου ότι Α’ = S – A , B’ = S – B & C’ = S – C και θέτοντας όπου D5 = = B’ ∩ C’ βρίσκουµε ότι :

44

Page 45: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

A' = S A = 2,3,4

B' = S B = 1,4C' = S C = 1,3,5 D = B' C' = 1

A' ( B' C' ) = A' D =

5

5

−−

⇒ ∩

⇒ ∩ ∩ ∩

( f ) ∆εδοµένου ότι A ∪ B = D2 = 1,2,3,5 και θέτοντας όπου D6 = A ∪ C βρίσκουµε ότι :

D = A B = 1,2,3,5

A = 1,5C = 4,2

(A B) (A C) = (A B) (A C) = D D

2

2 6

D = A C = 1,2,4,5 (A B) (A C) = 36

⇒ ∪

∪ − ∪ ∪ ∩ ∪ ′ ∩ ′

⇒ ∪ − ∪

( g ) Θέτοντας όπου D7 = ( Α ∩ C )’ και δεδοµένου ότι Α ∩ C = ∅ → ( Α ∩ C )’ = = S – ( Α ∩ C ) = S – ∅ ⇒ D7 = ( Α ∩ C )’ = S = 1 , 2 , 3 , 4 , 5 . Θα έχουµε λοιπόν ότι D = = 1,2,3,4,5

(A C )' B = 1,2,3,4,5 7 (A C )' B = 2,5,3 D B = S B 7

⇒ ∪ ∪ ⇒ ∩ ∪

( h ) ∆εδοµένου ότι [( D1 )’]’ = D1 και εφόσον έχουµε ήδη θέσει όπου D1 = B ∩ C = = 2,3,4,5 , εύκολα προκύπτει ότι :

[ ]A ( B C ) = A ( B C ) = A ( D ) = A D

D = ( B C ) = 2,3,4,5

A = 1,5

1 1

1

− ′ ∩ ′ − ∪ ′ ∩ ′′

⇒ − ′ ∩ ′A ( B C ) = 5

Άσκηση 2 : Περιγράψτε ένα δειγµατοχώρο για ( a ) τρεις ρίψεις ενός νοµίσµατος,

( b ) το πλήθος των καπνιστών σε µία οµάδα 500 ενήλικων ανδρών, ( c ) το πλήθος των τηλεφωνηµάτων που εισέρχονται σ’ ένα τηλεφωνικό κέντρο, ( d ) τη ρίψη ενός νοµίσµατος και ενός ζαριού, ( e ) της ρίψης δύο ζαριών.

45

Page 46: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Λύση ( a ) Αν µε τη ρίψη του νοµίσµατος Κ είναι το ενδεχόµενο να έρθει κεφάλι και Γ το ενδεχόµενο να έρθει γράµµατα τότε ο δειγµατοχώρος των τριών ρίψεων του νοµίσµα-τος έχει ως εξής :

Ω = ΚΚΚ , ΚΚΓ , ΚΓΚ , ΓΚΚ , ΚΓΓ , ΓΓΚ , ΓΚΓ, ΓΓΓ

( b ) Αν Α το ενδεχόµενο ένας άνδρας να είναι καπνιστής και Β το ενδεχόµενο να είναι µη καπνιστής, τότε ο δειγµατοχώρος του πλήθους των καπνιστών σε µία οµάδα 500 ενηλίκων ανδρών έχει ως εξής :

Ω = Α , Β

( c ) Αν m είναι ο µέγιστος αριθµός των τηλεφωνηµάτων που µπορεί να δεχτεί το τηλεφωνικό κέντρο, ο δειγµατοχώρος του πλήθους των τηλεφωνηµάτων που εισέρχονται στο τηλεφωνικό κέντρο θα έχει τη µορφή :

Ω = 0 , 1 , …. , m ( d ) Αν µε τη ρίψη του νοµίσµατος Κ είναι το ενδεχόµενο να έρθει κεφάλι και Γ το ενδεχόµενο να έρθει γράµµατα και µε τη ρίψη του ζαριού A , B , C , D , E , F είναι αντιστοίχως τα ενδεχόµενα να έρθει 1 , 2 , 3 , 4 , 5 & 6 , ο δειγµατοχώρος της ρίψης ενός νοµίσµατος και ενός ζαριού είναι ο ακόλουθος :

Ω = KA, ΓA , KB , ΓB , KC , ΓC , KD , ΓD , KE , ΓE , KF , ΓF

( e ) Εάν µε τη ρίψη ενός ζαριού Α , Β , C , D , E , F είναι αντιστοίχως το ενδεχόµενο να έρθει 1 , 2 , 3 , 4 , 5 & 6 , ο δειγµατοχώρος της ρίψης δύο ζαριών είναι ο εξής : Ω = ΑΑ , ΑΒ , ΑC , AD , AE , AF , BB , BC , BD , BE , BF , CD , CE , CF , DE ,

DF , FF Άσκηση 3 : Σ’ ένα πείραµα τύχης ρίχνουµε ένα νόµισµα και ένα ζάρι. Εάν Α είναι το

ενδεχόµενο « κεφάλι » για το νόµισµα και Β το ενδεχόµενο « 3 ή 6 » για το ζάρι, περιγράψτε µε λόγια τη σηµασία των παρακάτω ενδεχοµένων : ( a ) A’ , ( b ) B’ , ( c ) A ∩ B , ( d ) A ∩ B’ , ( e ) A – B , ( f ) B – A , ( g ) A’ ∪ B.

Λύση ( a ) Εφόσον Α είναι το γεγονός « κεφάλι », ο δειγµατοχώρος από τη ρίψη ενός νοµίσµατος είναι ο εξής :

Ω1 = Α , C

όπου C το ενδεχόµενο « γράµµατα ». Είναι λοιπόν φανερό ότι το Α’ θα δηλώνει το γεγονός « γράµµατα ». Θα ισχύει δηλαδή ότι Α’ = C.

46

Page 47: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( b ) Εφόσον Β είναι το ενδεχόµενο « 3 ή 6 », ο δειγµατοχώρος από τη ρίψη ενός ζαριού είναι ο εξής :

Ω2 = Β , D

όπου D το ενδεχόµενο « 1 ή 2 ή 4 ή 5 ». Είναι λοιπόν φανερό ότι το Β’ θα είναι το ενδεχόµενο « όχι 3 ή 6 » ή ισοδύναµα το ενδεχόµενο « 1 ή 2 ή 4 ή 5 ». Θα ισχύει δηλαδή ότι Β’ = D. ( c ) A ∩ B είναι το ενδεχόµενο « κεφάλι και 3 ή 6 ». ( d ) A ∩ B’ είναι το ενδεχόµενο « κεφάλι και όχι 3 ή 6 ». ( e ) Το A – B = Α ∩ Β’ και είναι το ενδεχόµενο « κεφάλι και όχι 3 ή 6 ». ( f ) Το B – A = Β ∩ Α’ και είναι το ενδεχόµενο « 3 ή 6 και όχι κεφάλι ». ( g ) A’ ∪ B είναι το ενδεχόµενο « όχι κεφάλι ή 3 ή 6 ». § 3.2 Ορισµός της πιθανότητας

Αν από τα N δυνατά αποτελέσµατα ενός τυχαίου προβλήµατος ( τα οποία όλα έχουν την ίδια πιθανότητα εµφάνισης ) το ενδεχόµενο Α εµφανίζεται nA φορές, τότε σύµφωνα µε τον κλασικό ορισµό η πιθανότητα να συµβεί το ενδεχοµένο Α [P(A)] δίνεται από την ακόλουθη σχέση10 :

P(A) = nN

A ( 3.4 )

Εναλλακτικά, η πιθανότητα εµφάνισης του ενδεχοµένου Α θα µπορούσε να

παρουσιαστεί και µέσω της ακόλουθης σχέσης :

P(A) = lim f (A) n n→∞

( 3.5 )

όπου fn(A) : η σχετική συχνότητα εµφάνισης του ενδεχοµένου Α, η οποία ορίζεται ως ο

λόγος του πλήθους εµφάνισης του ενδεχοµένου Α ( hA ) κατά τη διάρκεια n δοκιµών ενός τυχαίου πειράµατος, δηλαδή :

f (A) = hnn

A ( 3.6 )

Για τη σχέση ( 3.6 ) ισχύουν οι παρακάτω ιδιότητες :

10 Στη σχέση αυτή το Ν είναι ουσιαστικά το πλήθος των δειγµατοσηµείων ( ωi ) του δειγµατοχώρου Ω και nA είναι ο αριθµός των ευνοϊκών δειγµατοσηµείων, δηλαδή εκείνων που δηλώνουν εµφάνιση του ενδεχοµένου Α.

47

Page 48: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( i ) 0 ≤ fn(A) ≤ 1 , ( ii ) fn( A ∪ B ) = fn(A) + fn(B) όταν Α ∩ Β = ∅ ,

( iii ) fn(A’) = 1 – fn(A) , ( iv ) fn(A) ≤ fn(B) , αν Α ⊂ Β.

Η πιθανότητα εµφάνισης του ενδεχοµένου Α θα µπορούσε να οριστεί και

αξιωµατικά. Πιο συγκεκριµένα, σε κάθε δειγµατοχώρο Ω ενός τυχαίου πειράµατος µπορούµε να ορίσουµε µία συνάρτηση P, που για κάθε ενδεχόµενο Α να µας δίνει την πιθανότητα P(A) έτσι ώστε να ικανοποιούνται τα παρακάτω αξιώµατα :

( α ) P(A) ≥ 0 , ( β ) P(Ω) = 1 ∀ A ( γ ) P(A1 ∪ A2 ∪ A3 ∪ ….) = P(A1) + P(A2) + P(A3) + …. όταν Αi ∩ Aj = ∅ ∀ i ≠ j µε i,j = 1 , 2 , 3 , …. § 3.2.1 Κανόνες πιθανοτήτων

Βάσει των παραπάνω αξιωµάτων µπορούµε να εξάγουµε ορισµένους κανόνες, οι οποίοι θα µας φανούν ιδιαίτερα χρήσιµοι στην επίλυση προβληµάτων µε πιθανότητες και οι οποίοι έχουν ως ακολούθως : ( i ) Για κάθε ενδεχόµενο Α ισχύει ότι 0 ≤ P(A) ≤ 1 ( 3.7 )

( ii ) P(∅) = 0 ( 3.8 ) ( iii ) P(A’) = 1 – P(A) ( 3.9 ) όπου Α’ το συµπλήρωµα του Α ( iv ) Αν Α ⊂ Β τότε P(A) ≤ P(B) ( 3.10 ) ( v ) Εάν Α = Α1 ∪ Α2 ∪ …. Αn και Αi ∩ Αj = ∅ ∀ i ≠ j όταν i,j = 1 , 2 , …. , n τότε

P(A) = P( Α1 ∪ Α2 ∪ …. Αn ) = P(Α1) + P(Α2) + …. + P(Αn) ( 3.11 ) Στην ειδική περίπτωση που Α = Ω θα έχουµε ότι

P(A) = P(A ) = 1 = P(Ω) ii 1

n

=∑ ( 3.12 )

48

Page 49: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( v ) Στην περίπτωση των n τυχαίων ενδεχοµένων Α1 , Α2 , …. , Αn ισχύει η ακόλουθη σχέση :

P(Α1 ∪ Α2 ∪…. ∪ Αn) = P(A1) + P(A’1 ∩ A2) + P(A’

1 ∩ A’2 ∩ A’

3) + …. + + P(A’

1 ∩ A’n – 1 ∩ A’

n) ( 3.13 ) Εάν Α1 , Α2 , Α3 τρία οποιαδήποτε ενδεχόµενα τότε P(Α1 ∪ Α2 ∪ Α3) = P(Α1) + P(Α2) + P(Α3) – P(A1 ∩ A2 ) – P(A2 ∩ A3 ) – P(A1 ∩ A3 ) + P( Α1 ∩ Α2 ∩ Α3 ) ( 3.14 ) Στην περίπτωση που είχαµε δύο οποιαδήποτε ενδεχόµενα Α1 , Α2 θα ίσχυε ότι :

P(Α1 ∪ Α2) = P(Α1) + P(Α2) – P(A1 ∩ A2 ) ( 3.15 )

( vi ) Αν τα ενδεχόµενα Α1 , Α2 , Α3 , …. αποτελούν µία διαµέριση του Ω, τότε για κάθε άλλο ενδεχόµενο Β του δειγµατοχώρου ισχύει ότι :

P(B) = P(B ∩ A1) + P(B ∩ A2) + P(B ∩ A3) + …. ( 3.16 )

Άσκηση 1 : (α) Να υπολογισθεί ο δειγµατοχώρος που δηµιουργείται από την ρίψη δύο ζαριών. (β) Να υπολογισθεί η πιθανότητα : (i) Να έρθει ο ίδιος αριθµός κατά την ρίψη δύο ζαριών (ii) Το άθροισµα των αριθµών των δύο ζαριών να ισούται µε 6 (iii) Το άθροισµα των αριθµών να ισούται είτε µε 6 είτε µε 10.

Λύση ( α ) Ο δειγµατοχώρος Ω που δηµιουργείται από τη ρήψη δύο ζαριών περιλαµβάνει 36 συνολικά δειγµατοσηµεία ( 62 = 36 δυνατά αποτελέσµατα ) και έχει ως εξής : Πίνακας 3.1

Ρίψη δεύτερου ζαριού Ω 1 2 3 4 5 6

1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) 2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) 3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) 4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) 5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

Ρίψη πρώτου

ζαριού

6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

Άθροισµα 6 Άθροισµα 10

49

Page 50: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( β ) Ας παραστήσουµε µε Αi & Βi τα ενδεχόµενα ο αριθµός του πρώτου και του δεύτερου ζαριού αντιστοίχως να είναι i , όπου i = 1 , 2 , … , 6 και µε Εi το ενδεχόµενο τόσο στην πρώτη όσο και στη δεύτερη ρίψη ο αριθµός να είναι i, δηλαδή Εi = Ai ∩ Bi . Επίσης έστω ότι C , D είναι τα ενδεχόµενα το άθροισµα των αριθµών µετά τη ρίψη των δύο ζαριών να ισούται µε 6 και 10 αντιστοίχως. ( i ) Ο υπολογισµός της πιθανότητας να έρθει ο ίδιος αριθµός στις ρίψεις και των δύο ζαριών µπορεί να γίνει µε δύο τρόπους : 1ος τρόπος : Όπως προκύπτει από τον πίνακα 3.1, το πλήθος των ευνοϊκών αποτελε-

σµάτων Ei, όπως αυτά δίνονται από τη κύρια διαγώνιο του πίνακα, ισούται µε 6 ενώ ο συνολικός αριθµός των αποτελεσµάτων ισούται µε 36. Ως εκ τούτου η πιθανότητα P(Ei) θα έχει ως εξής :

61)P(Ei

366

αποτ/των τωναριθµός συνολικόςτωναποτελεσµά ευνοϊκών πλήθος ===

2ος τρόπος : Κάθε ένα από τα 36 δυνατά αποτελέσµατα έχει πιθανότητα εµφάνισης

ίση µε 1/36 . ∆εδοµένου ότι τα ευνοϊκά δειγµατοσηµεία είναι 6, η πιθανότητα P(Ei) θα ισούται µε :

P(E ) = = 16i 6

136

= 636

×

3ος τρόπος : Καλούµαστε να προσδιορίσουµε την πιθανότητα κατά τη ρήψη των

δύο ζαριών να έρθουν ή δύο άσοι ( E1 = Α1 ∩ Β1 ) ή δύο δυάρια ( E1 = = Α2 ∩ Β2 ) ή δύο τριάρια ( E3 = Α3 ∩ Β3 ) ή …. ή δύο εξάρια (Α6 ∩ Β6). ∆εδοµένου ότι τα ενδεχόµενα Ei είναι ανά δύο ασυµβίβαστα, δηλαδή για i ≠ j µε i , j = 1 , … , 6 ισχύει ότι Ei ∩ Ej = ∅, και έχουν την ίδια πιθανότητα εµφάνισης ( η οποία όπως έχουµε ήδη αναφέρει είναι ίση µε 1/36 ), η πιθανότητα που θα πρέπει να υπολογίσουµε έχει ως εξής :

P(E1 ∪ E2 ∪ E3 ∪ E4 ∪ E5 ∪ E6) = = P(E1) + P(E2) + P(E3) + P(E4) + P(E5) + P(E6) =

= 136

+ 136

+ 136

+ 136

+ 136

+ 136

= 636

= 16

( ii ) Από τους συνολικά 36 συνδυασµούς, εκείνοι που µας δίνουν άθροισµα 6 δίνονται από τη χρωµατισµένη µε ανοιχτό γκρι διαγώνιο, η οποία περιλαµβάνει 5 ευνοϊκά αποτελέσµατα. ∆εδοµένου ότι η πιθανότητα εµφάνισης κάθε ενός από τα δυνατά αποτελέσµατα είναι ίση µε 1/36, η πιθανότητα του ενδεχοµένου C θα έχει ως εξής :

P(C) = = 536

5136

×

50

Page 51: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( iii ) Από τα 36 συνολικά αποτελέσµατα τα 3 µας δίνουν άθροισµα 10 ( οι συνδυα-σµοί αυτοί δίνονται από τη σκιαγραφηµένη µε σκούρο γκρι διαγώνιο ). Ως εκ τούτου η πιθανότητα εµφάνισης του ενδεχοµένου D θα έχει ως εξής :

121P(D)

363

αποτ/των τωναριθµός συνολικόςτωναποτελεσµά ευνοϊκών πλήθος ===

∆εδοµένου ότι τα ενδεχόµενα C και D είναι ασυµβίβαστα, η πιθανότητα το

άθροισµα των αριθµών των δύο ζαριών να ισούται ή µε 6 ή µε 10 θα έχει ως εξής :

P(C D) = = 29

∪ P(C) + P(D) = 536

+ 1

12 =

5 + 336

= 836

Άσκηση 2 : Τραβάµε στην τύχη τρία χαρτιά από µία συνηθισµένη τράπουλα. Ας είναι Α1 το γεγονός « ρήγας στο πρώτο τράβηγµα », Α2 το γεγονός « ρήγας στο δεύτερο τράβηγµα » και Α3 το γεγονός « ρήγας στο τρίτο τράβηγµα ». Περιγράψτε µε λόγια τη σηµασία των εξής :

(a) , (b) , (c) P(A A )1 2∩ ′ P(A A )1 2∪ P(A A )1 2′∪ ′ , (d) , P(A A A )1 2 3′∩ ′ ∩ ′

(e) ( ) ( )[ ]P A A A A1 2 2 3∩ ∪ ′ ∩ Λύση (a) είναι η πιθανότητα να έρθει ρήγας στο πρώτο αλλά όχι και στο

δεύτερο τράβηγµα. P(A A )1 2∩ ′

(b) είναι η πιθανότητα να έρθει ρήγας ή στο πρώτο τράβηγµα ή στο

δεύτερο τράβηγµα ή και στο πρώτο και στο δεύτερο τράβηγµα. P(A A )1 2∪

(c) είναι η πιθανότητα να µην έρθει ρήγας ή στο πρώτο ή στο δεύτερο ή

και στα δύο τραβήγµατα. P(A A )1 2′∪ ′

(d) P(A A A )1 2 3′∩ ′ ∩ ′ είναι η πιθανότητα να µην έρθει ρήγας ούτε στο πρώτο, ούτε στο

δεύτερο ούτε και στο τρίτο τράβηγµα. (e) ∆εδοµένου ότι τα γεγονότα Α1∩Α2 και ′ ∩A A2 3 είναι ασυµβίβαστα, η πιθανότητα

( ) ( )[P A A A A1 2 2 3∩ ∪ ′ ∩ ] εκφράζει το ενδεχόµενο ή να έρθει ρήγας στο πρώτο και στο δεύτερο τράβηγµα ή να έρθει ρήγας στο τρίτο αλλά όχι και στο δεύτερο τράβηγµα.

Άσκηση 2 : Κατά τη διάρκεια µίας εξεταστικής περιόδου, 200 φοιτητές κατάφεραν να “περάσουν” τουλάχιστον ένα από τα παρακάτω µαθήµατα : Μαθηµατικά , Στατιστική και Λογιστική. Από αυτούς οι 110 “πέρασαν” στα Μαθηµατικά, οι 120 στη Στατιστική, οι 100 στη Λογιστική, οι 95 “πέρασαν” και στα Μαθηµατικά και στη Στατιστική, οι 90 “πέρασαν” και στα Μαθηµατικά και στη Λογιστική και τέλος οι 80

51

Page 52: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

“πέρασαν” και στη Στατιστική και στη Λογιστική. Εάν επιλέξουµε έναν από τους 200 φοιτητές, ποια η πιθανότητα να έχει “περάσει” και στα τρία µαθήµατα; Λύση

Έστω Μ , Σ , Λ τα ενδεχόµενα ο φοιτητής να έχει περάσει αντιστοίχως στα Μαθηµατικά, τη Στατιστική και τη Λογιστική. Η πιθανότητα ο φοιτητής να έχει περάσει και τα τρία µαθήµατα [P(M ∩ Σ ∩ Λ)] θα υπολογιστεί µε τη βοήθεια της σχέσης ( 3.14 ) από την οποία προκύπτει ότι :

P( Α1 ∩ Α2 ∩ Α3 ) = P(Α1 ∪ Α2 ∪ Α3) – P(Α1) – P(Α2) – P(Α3) + P(A1 ∩ A2 ) + + P(A2 ∩ A3 ) + P(A1 ∩ A3 ) ( i )

Το ενδεχόµενο Α1 ∪ Α2 ∪ Α3 συνιστά το δειγµατοχώρο του προβλήµατος, οπότε η πιθανότητα επίτευξής του ισούται µε τη µονάδα, δηλαδή :

P(Α1 ∪ Α2 ∪ Α3) = 1 ( ii )

Επίσης από τα δεδοµένα του προβλήµατος έχουµε ότι :

P(A ) = 110200

, P(A ) = 120200

, P(A ) = 100200

,

P(A A ) = 95

200 , P(A A ) =

90200

,

P(A A ) = 80200

1 2 3

1 2 1 3

2 3

( iii ) ( iv ) ( v )

( vi ) ( vii )

( viii )

∩ ∩

Αντικαθιστώντας τις σχέσεις ( ii ) ~ ( viii ) στη σχέση ( i ) προκύπτει ότι :

P(A A A ) = 1 110200

120200

100200

+ 95

200 +

90200

+ 80200

=

= 200 ( 110 + 120 + 100 ) + 165

200 =

465 330200

= 135200

1 2 3∩ ∩ − − −

− −=

⇒ ∩ ∩P(A A A ) = 0,675 ή 67,5 %1 2 3

Άσκηση 4 : Να υπολογιστεί η πιθανότητα τραβώντας ένα χαρτί από µία καλά ανακατεµένη τράπουλα 52 χαρτιών, να έρθει ή ρήγας ή άσος ή βαλές σπαθί ή ντάµα καρρό.

52

Page 53: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Λύση

Έστω ότι ΚΑ , ΚΟ , ΣΙ & ΜΙ είναι τα ενδεχόµενα το χαρτί που θα τραβήξουµε να είναι κούπα , καρρό , σπαθί & µπαστούνι αντιστοίχως και ότι Α1 , Α2 , …. , Α11 , Α12 , Α13 είναι τα ενδεχόµενα το χαρτί να είναι άσος , δυό , …. , βαλές , ντάµα και ρήγας αντιστοίχως . Ο δειγµατοχώρος του προβλήµατος, δηλαδή το πλήθος των δυνατών αποτελεσµάτων του πειράµατος, περιλαµβάνει συνολικά 52 δειγµατοσηµεία και παρουσιάζεται µέσω του διαγράµµατος του Venn :

∆ιάγραµµα του Venn Ω Α1 Α2 Α3 Α4 Α5 Α6 Α7 Α8 Α9 Α10 Α11 Α12 Α13 ΚΟ ΚΑ ΣΙ ΜΙ

Ευνοϊκά αποτ/τα

Η παρούσα άσκηση θα µπορούσε να λυθεί µε τρεις τρόπους.

1ος τρόπος : Όπως προκύπτει από το διάγραµµα του Venn, ο αριθµός των ευνοϊκών αποτελεσµάτων είναι ίσος µε 10. Ως εκ τούτου αν Ε είναι το ενδεχόµενο µε το τράβηγµα του χαρτιού να έρθει ή ρήγας ή άσος ή βαλές σπαθί ή ντάµα καρρό, η πιθανότητα πραγµατοποίησης αυτού του ενδεχοµένου θα ισούται µε :

265 P(E) ===

5210

αποτ/των τωναριθµός συνολικός τωναποτελεσµά ευνοϊκών πλήθος

2ος τρόπος : Κάθε ένα από τα 52 δυνατά αποτελέσµατα έχει µία πιθανότητα εµφά-

νισης ίση µε 1/52. ∆εδοµένου ότι τα ευνοϊκά αποτελέσµατα είναι 10, η πιθανότητα να πραγµατοποιηθεί το ενδεχόµενο Ε ισούται µε :

P(E) = = 526

101

52 =

1052

×

3ος τρόπος : Έστω ότι Ε1 , Ε2 , Ε3 και Ε4 είναι τα ενδεχόµενα µε το τράβηγµα του

χαρτιού να έρθει αντιστοίχως ρήγας , άσος , βαλές σπαθί & ντάµα καρρό. Η πιθανότητα πραγµατοποίησης κάθε ενός από αυτά τα ενδεχόµενα έχει ως ακολούθως :

P(E ) = P(E ) = 4

52 και P(E ) = P(E ) =

1521 2 3 4

Όπως προκύπτει και από το διάγραµµα του Venn, τα ενδεχόµενα Εi ,

i = 1 , 2 , 3 & 4, είναι ανά δύο ασυµβίβαστα. Ως εκ τούτου η πιθανότητα πραγµατοποίησης του ενδεχοµένου Ε ( το οποία συνιστά την ένωση των ενδεχοµένων Εi , i = 1 , 2 , 3 & 4 ) θα ισούται µε :

53

Page 54: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

P(E) = P(E E E E ) = P(E ) + P(E ) + P(E ) + P(E ) =

= 4

52 +

452

+ 1

52 +

152

= 4 + 4 + 1 + 1

52 =

1052

1 2 3 4 1 2 3 4∪ ∪ ∪

⇒ P(E) = 526

§ 3.3 Συνδυαστική ανάλυση

Σε ορισµένες περιπτώσεις, τόσο ο προσδιορισµός του αριθµού των σηµείων ενός δειγµατοχώρου, όσο και ο προσδιορισµός του αριθµού των σηµείων που περιέχει ένα ενδεχόµενο Α καθίσταται ιδιαίτερα δύσκολος, µε αποτέλεσµα να συναντούµε σηµαντικές δυσκολίες στον προσδιορισµό της πιθανότητας πραγµατοποίησης του ενδεχόµενου Α. Για το λόγο αυτό χρησιµοποιούµε ορισµένες από τις αρχές της συνδυαστικής ανάλυσης.

Ας υποθέσουµε λοιπόν ότι ο δειγµατοχώρος Ω περιλαµβάνει n σηµεία και ότι επιλέγουµε m από αυτά προκειµένου να σχηµατίσουµε ένα δείγµα µεγέθους m. Ένα ερώτηµα που θα µπορούσε να τεθεί στο σηµείο αυτό είναι πόσα διαφορετικά δείγµατα θα µπορούµε να σχηµατίσουµε.

Η απάντηση α’ αυτό το ερώτηµα εξαρτάται 1ον από το εάν µας ενδιαφέρει η σειρά µε την οποία επιλέγονται τα m σηµεία ή όχι [ εάν δηλαδή µας ενδιαφέρει η διάταξη ( permutation ) των σηµείων αυτών ] και 2ον εάν έχουµε επανατοποθέτηση ή όχι. Αν P είναι το πλήθος των δυνατών διατάξεων και C είναι το πλήθος των δυνατών συνδυασµών, τότε µπορούµε να διακρίνουµε µεταξύ των ακόλουθων περιπτώσεων :

( i ) Μας ενδιαφέρει η διάταξη και δεν έχουµε επανατοποθέτηση : Σ’ αυτήν την

περίπτωση θα έχουµε ότι

P = ∆ = n!

(n m)! m

n

−( 3.17 ) όπου : n! = 1 × 2 × …. × n – 1 × n µε 0! = 1

( ii ) Μας ενδιαφέρει η διάταξη και έχουµε επανατοποθέτηση : Εδώ θα έχουµε ότι :

P = n m ( 3.18 )

( iii ) ∆εν µας ενδιαφέρει η διάταξη και δεν έχουµε επανατοποθέτηση : Σ’ αυτήν την περίπτωση το πλήθος των συνδυασµών ( combinations ) ισούται µε :

C = nm =

n!m! (n m)!

= ∆m!

(3.17)

mn

−( 3.19 )

( iv ) ∆εν µας ενδιαφέρει η διάταξη και έχουµε επανατοποθέτηση : Εν προκειµένω

έχουµε ότι :

C = n+m 1

m = (n+m 1)!m! (n 1)!

−−

( 3.20 )

54

Page 55: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Άσκηση 1 : Πόσα διαφορετικά τηλεφωνικά νούµερα έξι ψηφίων µπορούν να σχηµατίσουν οι αριθµοί 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 και 9 εάν (a) δεν επιτρέπονται οι επαναλήψεις (b) επιτρέπονται οι επαναλήψεις ; Λύση

Στο παρόν πρόβληµα µας ενδιαφέρει η σειρά µε την οποία θα τοποθετηθούν οι αριθµοί προκειµένου να σχηµατισθούν τα τηλεφωνικά νούµερα, καθώς στο πρώτο ψηφίο δεν µπορούµε να τοποθετήσουµε τον αριθµό µηδέν.

(a) Μπορούµε να προσδιορίσουµε το πλήθος των εξαψήφιων τηλεφωνικών

αριθµών που σχηµατίζονται από τα νούµερα 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 και 9 µε δύο τρόπους :

1ος τρόπος : Ως πρώτο ψηφίο µπορούµε να τοποθετήσουµε τον οποιοδήποτε από τους 9 µη µηδενικούς αριθµούς. Ως δεύτερο ψηφίο µπορούµε να επιλέξουµε τον οποιοδήποτε από τους υπόλοιπους 9 αριθµούς. Ως τρίτο ψηφίο µπορούµε να επιλέξουµε τον οποιοδήποτε από τους υπόλοιπους 8 αριθµούς κ.ο.κ.. Το σύνολο των τηλεφωνικών αριθµών θα είναι συνεπώς ίσο µε :

9 × 9 × 8 × 7 × 6 × 5 = 136.080

2ος τρόπος : Όπως ήδη αναφέραµε ως πρώτο ψηφίο του τηλεφωνικού αριθµού µπορούµε να θέσουµε το οποιοδήποτε από τα 9 µη µηδενικά νούµερα. Τα υπόλοιπα 9 νούµερα µπορούν να διαταχθούν κατά :

9!(9 5)!

= 9!4!

= 1

= 5120−

× × × × × × × ×× × ×

× × × × =2 3 4 5 6 7 8 9

1 2 3 45 6 7 8 9 1 τρόπους

Με άλλα λόγια θα µπορούσαν συνολικά να συγκροτηθούν :

9 × 15.120 = 136.080 τηλεφωνικοί αριθµοί (b) Στην περίπτωση που επιτρέπονται οι επαναλήψεις, το σύνολο των τηλεφω-

νικών αριθµών που µπορούν να σχηµατίσουν τα νούµερα από 0 έως και 9 µπορεί και πάλι να προσδιορισθεί ως εξής.

Στο πρώτο ψηφίο δεν µπορούµε να τοποθετήσουµε το µηδέν αλλά οποιοδήποτε από τα υπόλοιπα 9 µη µηδενικά νούµερα. Στη δεύτερη, τρίτη , …. , έκτη θέση µπορούµε να τοποθετήσουµε το οποιοδήποτε από τα 10 νούµερα που έχουµε στη διάθεσή µας. Με άλλα λόγια θα είµαστε σε θέση να σχηµατίσουµε συνολικά :

9 × 10 × 10 × 10 × 10 × 10 = 9 × 105 = 900.000 τηλεφωνικούς αριθµούς

Άσκηση 2 : Ας υποθέσουµε ότι έχουµε 10 διαφορετικά βάζα, εκ των οποίων τα τέσσερα είναι κόκκινα , τα τρία είναι λευκά, τα δύο είναι µπλε και το ένα πορτοκαλί χρώµατος. Με πόσους τρόπους µπορούµε να τοποθετήσουµε τα βάζα αυτά σ’ ένα ράφι εάν (a) δεν επιβάλουµε κανένα περιορισµό (b) τα βάζα τοποθετηθούν ανά χρωµατικές οµάδες ;

55

Page 56: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Λύση

(a) Στην περίπτωση που δεν έχουµε κανένα περιορισµό το πλήθος των δυνατών διατάξεων των 10 διαφορετικών βάζων θα ισούται µε :

P = n! = 10! = 3.628.800

(b) Έχουµε τέσσερις διαφορετικές χρωµατικές οµάδες ( n1 = 4 ) βάζων: την

κόκκινη , την λευκή , την µπλε και την πορτοκαλί. Οι τέσσερις αυτές χρωµατικές οµάδες θα µπορούσαν να διαταχθούν κατά :

P1 = (n1)! = 4! = 24 τρόπους

Τα τέσσερα κόκκινα βάζα ( n2 = 4 ) µπορούν να διαταχθούν µεταξύ τους κατά :

P2 = (n2)! = 4! = 24 τρόπους

Τα τρία λευκά βάζα ( n3 = 3 ) µπορούν να διαταχθούν κατά :

P3 = (n3)! = 3! = 6 τρόπους

Τα δύο µπλε βάζα ( n4 = 2 ) µπορούν να διαταχθούν κατά :

P4 = (n4)! = 2! = 4 τρόπους

και τέλος το πορτοκαλί βάζο µπορεί να διαταχθεί κατά ένα και µοναδικό τρόπο ( P5 = = 1).

Το σύνολο των διατάξεων των βάζων ανά χρωµατική οµάδα θα έχει κατά συνέπεια ως εξής :

P = P1 × P2 × P3 × P4 × P5 = 24 × 24 × 6 × 4 × 1 ⇒ P = 13.824

Άσκηση 3 : Πόσες διαφορετικές εξάδες µπορεί να σχηµατίσει ένας προπονητής βόλεϊ από 10 παίκτες ; Λύση

∆εδοµένου ότι δεν µας ενδιαφέρει η διάταξη των παικτών στην εξάδα και δεν µπορούµε να έχουµε επανατοποθετήσεις παικτών, το πλήθος των διαφορετικών εξάδων που µπορεί να σχηµατίσει ο προπονητής ισούται µε :

C = 106 =

10!6! (10 6)!

= 10!

6! 4! =

7 8 9 14!

= 5.040

24

−× × ×

⇒0

C = 210

Άσκηση 4 : Από 5 διοικητικούς υπαλλήλους και 6 οικονοµολόγους σχηµατίζουµε µία επιτροπή 3 διοικητικών υπαλλήλων και 2 οικονοµολόγων. Πόσες διαφορετικές

56

Page 57: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

επιτροπές µπορούν να σχηµατιστούν εάν (a) δεν επιβληθούν περιορισµοί, (b) δύο συγκεκριµένοι διοικητικοί υπάλληλοι πρέπει να είναι στην επιτροπή, (c) ένας συγκεκριµένος οικονοµολόγος δεν πρέπει να είναι στην επιτροπή. Λύση

(a) Οι τρεις διοικητικοί υπάλληλοι από τους 5 µπορούν να επιλεγούν κατά :

C = 53 =

5!3! (5 3)!

= 5!

3! 2! =

42!

= 202

1

−×

⇒5

C = 101 τρόπους

Οι δύο οικονοµολόγοι από τους 6 µπορούν να επιλεγούν κατά :

C = 62 =

6!2! (6 2)!

= 6!

2! 4! =

52!

= 302

2

−×

⇒6

C = 152 τρόπους

Κατά συνέπεια το πλήθος των διαφορετικών επιτροπών ( E ) θα έχει ως εξής :

Ε = C1 × C2 = 10 × 15 = 150 (b) Εφόσον δύο συγκεκριµένοι διοικητικοί υπάλληλοι πρέπει να είναι στην

επιτροπή, τότε ο ένας από τους τρεις διοικητικούς υπαλλήλους µπορεί να επιλεγεί κατά :

C = 31 =

3!1! (3 )!

= 3!

1! 2! =

1! =

31

3

−⇒

13

C = 33

Κατά συνέπεια είναι δυνατό να σχηµατισθούν :

Ε = C3 × C2 = 3 × 15 = 45 διαφορετικές επιτροπές

(c) Εφόσον ένας οικονοµολόγος δεν µπορεί να συµµετέχει στην επιτροπή, τότε οι δύο οικονοµολόγοι από τους 5 µπορούν να επιλεγούν κατά :

C = 52 =

5!2! (5 )!

= 5!

2! 3! =

2! =

202

4

−×

⇒2

4 5C = 104

Κατά συνέπεια µπορούν να σχηµατισθούν :

Ε = C1 × C4 = 10 × 10 = 100 διαφορετικές επιτροπές

Άσκηση 5 : Πόσες εξάδες αριθµών µπορούµε να σχηµατίσουµε βάσει του συνόλου των αριθµών 1 , 2 , …. , 48 & 49, στην περίπτωση (a) που έχουµε επαναλήψεις (b) έχουµε επαναλήψεις αλλά δεν µπορούµε να έχουµε δύο ίδιους αριθµούς στην σειρά. Λύση

57

Page 58: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

(a) ∆εδοµένου ότι δεν µας ενδιαφέρει η διάταξη των αριθµών και εφόσον µπορούµε να έχουµε επαναλήψεις αυτών, το πλήθος των εξάδων που µπορούµε να σχηµατίσουµε θα το προσδιορίσουµε µε τη βοήθεια της σχέσης ( 3.20 ) από την οποία προκύπτει ότι :

C =

= 25.827.165

49+6-1

6 = 546 =

54!6! (54-6)!

= 54!

6! 53! =

49 =

= 18.595.558.800

720

× × × × ×50 51 52 53 546!

(b) ∆εδοµένου ότι δεν έχουµε επαναλήψεις και δεν µας ενδιαφέρει η διάταξη των

αριθµών, το πλήθος των εξάδων που µπορούµε να σχηµατίσουµε θα το προσδιορίσουµε µε τη βοήθεια της σχέσης ( 3.19 ) από την οποία προκύπτει ότι :

C =

= 13.983.816

496 =

49!6! (49-6)!

= 49!

6! 43! =

46!

=

= 10.068.347.520

720

× × × × ×4 45 46 47 48 49

§ 3.4 ∆εσµευµένες πιθανότητες

Σε ορισµένες περιπτώσεις µας ενδιαφέρει να προσδιορίσουµε την πιθανότητα πραγµατοποίησης ενός ενδεχοµένου Α, όταν έχει προηγηθεί η πραγµατοποίηση ενός ή περισσοτέρων ενδεχοµένων. Πιο συγκεκριµένα ας υποθέσουµε ότι Β είναι ένα υποσύνολο του δειγµατοχώρου Ω. Η πιθανότητα πραγµατοποίησης του ενδεχοµένου Α, µε δεδοµένο ότι έχει πραγµατοποιηθεί το ενδεχόµενο Β καλείται δεσµευµένη πιθανότητα ή πιθανότητα του Α υπό συνθήκη Β ( conditional probability ) , συµβο-λίζεται µε P(Α/Β) και προσδιορίζεται µε τη βοήθεια της ακόλουθης σχέσης :

P(A/B) = P(A B)

P(B) , 0 < P(B) 1

∩≤ ( 3.21 )

Όπως εύκολα προκύπτει από την παραπάνω σχέση, η πιθανότητα να συµβεί και

το ενδεχόµενο Α και το ενδεχόµενο Β θα προσδιορίζεται µέσω της ακόλουθης σχέσης

P(A B) = P(B) P(A/B) ∩ ( 3.22 )

Η πιθανότητα τώρα να πραγµατοποιηθεί το ενδεχόµενο Α1 και το Α2 και το …. και το Αn , όπου Α1,Α2, …. , Αn ⊂ Ω , µπορεί να προσδιορισθεί µε τη βοήθεια της ακόλουθης σχέσης :

P(A A ... A ) = P(A )P(A /A )P(A /A A )...P(A /A A ... A ) 1 2 n 1 2 1 3 1 2 n 1 2 n 1∩ ∩ ∩ ∩ ∩ ∩ ∩ − ( 3.23 )

58

Page 59: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

όταν . 0 < P(A A ... A ) 11 2 n∩ ∩ ∩ ≤

Στην περίπτωση που n = 3, από την παραπάνω σχέση εύκολα προκύπτει ότι :

P(A A A ) = P(A )P(A /A ) P(A /A A ) 1 2 3 1 2 1 3 1 2∩ ∩ ∩ ( 3.23 )

εφόσον . 0 < P(A A A ) 11 2 3∩ ∩ ≤ Όταν η πραγµατοποίηση του ενδεχοµένου Α δεν εξαρτάται από το εάν έχει

προηγηθεί ή όχι η πραγµατοποίηση του Β, τότε θα λέµε ότι το ενδεχόµενο Α είναι στατιστικά ανεξάρτητο ( statistically independent ) του Β και θα ισχύει ότι :

P(A/B) = P(A) ( 3.24 )

Σ’ αυτήν την περίπτωση από τη σχέση ( 3.22 ) προκύπτει ότι :

P(A B) = P(A) P(B) ∩ ( 3.25 )

Εάν τα ενδεχόµενα Α1 , Α2 & Α3 είναι ανά δύο ανεξάρτητα, τότε από τη σχέση ( 3.23 ) προκύπτει ότι :

P(A A A ) = P(A )P(A ) P(A ) 1 2 3 1 2 3∩ ∩ ( 3.26 )

Άσκηση 1 : Τραβάµε διαδοχικά δύο χαρτιά στην τύχη από µία τράπουλα. Να βρεθεί η πιθανότητα (a) το πρώτο χαρτί να µην είναι δέκα σπαθί ή άσος, (b) το πρώτο χαρτί να είναι άσος όχι όµως και το δεύτερο, (c) τουλάχιστον ένα χαρτί να είναι καρρό, (d) το πολύ ένα χαρτί να είναι φιγούρα, (e) το δεύτερο χαρτί να µην είναι φιγούρα, (f) τα χαρτιά να είναι φιγούρες ή µπαστούνια ή και τα δύο. Λύση

Έστω ΚΑ , ΚΟ , ΣΙ , ΜΙ τα ενδεχόµενα το χαρτί που τραβιέται να είναι κούπα , καρρό , σπαθί & µπαστούνι αντιστοίχως και 1 , 2 , …. , 11 , 12 , 13 τα ενδεχόµενα το χαρτί να είναι άσος , δύο , …. , βαλές , ντάµα και ρήγας αντιστοίχως.

(a) Έστω Α1 το ενδεχόµενο το πρώτο χαρτί που τραβάµε να είναι δέκα σπαθί , δηλ. Α1 = 10 ∩ ΣΙ, µε πιθανότητα εµφάνισης P(A1) = 1/52 και έστω Α2 το ενδεχόµενο το πρώτο χαρτί να είναι άσος, δηλ. Α2 = ( 1 ∩ ΚΑ ) ∪ ( 1 ∩ ΚΟ ) ∪ ( 1 ∩ ΣΙ ) ∪ ∪ ( 1 ∩ ΜΙ ), µε πιθανότητα εµφάνισης P(A2) = 4/52 = 1/13.

∆εδοµένου ότι Α1 ∩ Α2 = ∅, η πιθανότητα το πρώτο χαρτί να είναι 10 σπαθί ή άσος θα έχει ως εξής :

P(A A ) = P(A ) + P(A ) P(A A ) = 1

52 +

452

0 1 2 1 2 1 2∪ − ∩ − ⇒ ∪P(A A ) = 5521 2

Κατά συνέπεια η πιθανότητα το πρώτο χαρτί να µην είναι δέκα σπαθί ή άσος θα

ισούται µε :

59

Page 60: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

[ ] [ ]P 1 (A A ) = 1 5

52 =

52 5 1 2− ∪ ′ −

−⇒ − ∪ ′ P 1 (A A ) =

47521 252

(b) Αν Α3 το ενδεχόµενο το δεύτερο χαρτί που τραβάµε να µην είναι άσος, τότε η

πιθανότητα αυτού του ενδεχοµένου µε δεδοµένο ότι στο πρώτο χαρτί τραβήξαµε άσο θα ισούται µε P(A3/A2) = 48/51 = 16/17.

Η ζητούµενη πιθανότητα έχει ως εξής :

P(A3∩A2) = P(A2) P(A3/A2) ⇒ P(A2∩A3) = = 16221

1

13 1617

(c) Αν Α4 και Α5 τα ενδεχόµενα το χαρτί στο πρώτο και στο δεύτερο τράβηγµα

αντιστοίχως να είναι καρρό, τότε η πιθανότητα P(A4∪A5) θα µπορούσε να προσδιο-ρισθεί µε δύο τρόπους :

1ος τρόπος : Η πιθανότητα το χαρτί στο πρώτο τράβηγµα να µην είναι καρρό ισούται µε , ενώ η πιθανότητα το χαρτί στο δεύτερο τράβηγµα να µην είναι καρρό µε δεδοµένο ότι και στο πρώτο τράβηγµα δεν είχαµε καρρό ισούται µε . Ως εκ τούτου η πιθανότητα να µην έχουµε κανένα καρρό θα έχει ως εξής :

P(A ) = 1 13/52 = 1 1/4 = 3/44′ − −

P(A A ) = 38/515 4′ ′/

P(A A ) = = 19344 5′ ∩ ′ ′∩ ′ ′ ′ ′ P(A A ) = P(A ) P(A A ) =

34

3851

5 4 4 5 4/

Γίνεται λοιπόν φανερό ότι η πιθανότητα να έχουµε τουλάχιστον ένα χαρτί καρρό

θα ισούται µε :

P(A A ) = = 15344 5∪ − ′ ∩ ′ −

− 1 P(A A ) = 1

1934

= 34 19

34 4 5

2ος τρόπος : Η πιθανότητα να µην έχουµε κανένα καρρό µπορεί να υπολογιστεί ως εξής :

=

−=

==′∩′

2)!(52 2!52!

2)!(39 2!39!

252

2

39

52 τααπό χαρτιών 2 επιλογών τωνπλήθος

39 τααπό χαρτιών 2 επιλογών τωνπλήθος )AAP( 54

3419 )AAP( 54 =′∩′⇒===

×

×

==

−= 21

1719

43

5138

5239

5138

!25251

!23938

50! 2!52!

37! 2!39!

2)!(52 2!52!

2)!(39 2!39!

Κατά συνέπεια η πιθανότητα να έχουµε τουλάχιστον ένα καρρό χαρτί θα ισούται µε :

60

Page 61: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

P(A A ) = = 15344 5∪ − ′ ∩ ′ −

− 1 P(A A ) = 1

1934

= 34 19

34 4 5

(d) Η πιθανότητα του ενδεχοµένου ( έστω Α7 ) το πολύ ένα χαρτί να είναι φιγούρα ισούται µε 1 µείον την πιθανότητα του ενδεχοµένου ( έστω Α8 ) και τα δύο χαρτιά να είναι φιγούρες.

Στην περίπτωση που και τα δύο χαρτιά είναι φιγούρες, το πλήθος των συνδυασµών ισούται µε

C =11 12

24 =

−×

122 =

12!2! (12 2)!

= 12!

2! 10!

Θα έχουµε λοιπόν ότι :

P(A ) = 1 P(A ) = 1 CC

= 1

11 122

51 522

= 1 11 3 4

3 4 = 1

11 =

= 221

7 84

1− − −

×

× −× ×

× × ×−

×

−⇒

17 13 17 13

11221

P(A ) = 2102217

(g) Αν από τα 52 χαρτιά µίας τράπουλας αφαιρέσουµε εκείνα τα οποία δεν είναι φιγούρες ή µπαστούνια, θα µας µείνουν 22 χαρτιά. Το πλήθος των δυνατών συνδυασµών των 22 αυτών χαρτιών ( έστω C5 ) ως προς C1 µας δίνει την πιθανότητα του ενδεχοµένου ( έστω Α9 ) τα χαρτιά να είναι φιγούρες ή µπαστούνια ή και τα δύο.

Εφόσον :

C = 21 115 =

−×

× 222 =

22!2! (22 2)!

= 22!

2! 20! =

21 222

θα έχουµε ότι :

P(A ) = CC

= 21 11 51 52

2

= 2 3 7 11 3 4

= 7 11

95

1

××

× × ×× × ×

×× ×

⇒17 13 17 2 13

P(A ) = 774429

Άσκηση 2 : Αφού τοποθετήσουµε σε µία κληρωτίδα 7 κόκκινα, 4 λευκά και 13 µπλε όχι όµοια µεταξύ τους σφαιρίδια, επιλέγουµε ( χωρίς επανατοποθέτηση ) τρία από αυτά. Ποια η πιθανότητα (a) και τα τρία να είναι λευκά, (b) τα δύο πρώτα να είναι µπλε και το τρίτο να είναι κόκκινο, (c) κανένα από τα τρία να µην είναι µπλε, (d) το πρώτο να είναι κόκκινο, το δεύτερο µπλε και το τρίτο άσπρο, (e) το ένα να είναι λευκό και τα δύο να είναι κόκκινα.

61

Page 62: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Λύση

Έστω Κi , Λi & Μi τα ενδεχόµενα το χρώµα του σφαιριδίου που προκύπτει κατά την i επιλογή να είναι κόκκινο, λευκό και µπλε αντιστοίχως.

Η ζητούµενες πιθανότητες έχουν ως εξής :

(a) P( Λ Λ Λ ) = = 1

5061 2 3∩ ∩ ∩

P(Λ ) P(Λ /Λ ) P(Λ /Λ Λ ) =

424

323

2

22 1 2 1 3 1 2

Στο ίδιο συµπέρασµα θα καταλήγαµε εάν υπολογίζαµε την πιθανότητα βάσει της

συνδυαστικής ανάλυσης. ∆εδοµένου ότι 1ον ο µέγιστος αριθµός των συνδυασµών ανά τρία των εικοσιτεσσέρων σφαιριδίων ισούται µε

C = = 22 23 41 243 =

24!3! (24 3)!

= 24!

3! 21! =

22 23 246

−× ×

× ×

και 2ον τα λευκά σφαιρίδια µπορούν να συνδυασθούν ανά τρία κατά :

C = = 42 43 =

4!3! (4 3)!

= 4!

3! 1! =

41!

− φορές

, η ζητούµενη πιθανότητα θα έχει ως εξής :

P(Λ Λ Λ ) = = = = 1

5061 2 3∩ ∩× × ×

CC

422 23

122 23

2

1 4

(b) P( Μ Μ Κ ) = = 91

10121 2 3∩ ∩ ∩

P(Μ ) P(Μ /Μ ) P(Κ /Μ Μ ) =

1324

1223

7

22 1 2 1 3 1 2

(c) Τα κόκκινα και λευκά σφαιρίδια µπορούν ανά τρία να συνδυασθούν κατά

C = = 1653 113 =

11!3! (11 3)!

= 11!

3! 8! =

9 10 113!

= 9 10 111 2

−× × × ×

× ×3 τρόπους

, οπότε η πιθανότητα κανένα από τα τρία σφαιρίδια να µην είναι µπλε θα είναι ίση µε

P(M M M ) = = = 151841 2 3′∩ ′ ∩ ′

× ×× ×

×× ×

CC

= 3 5 11

22 233 523

3

1 4 2 4

Η παραπάνω πιθανότητα θα µπορούσε να υπολογιστεί και µε τον ακόλουθο

τρόπο :

P(M M M ) = = 151841 2 3′∩ ′ ∩ ′ ′ ′ ′ ′ ′∩ ′

P(M P(M /M ) P(M /M M ) =

1124

1023

922

1 2 1 3 1 2)

62

Page 63: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

(d) Και σ’ αυτήν την περίπτωση η ζητούµενη πιθανότητα µπορεί να προσδιορισθεί µε δύο τρόπους. Τα τρία διαφορετικά χρώµατα µπορούν να διαταχθούν κατά :

P = = 6 3!

(3 0)! = 3!

− τρόπους

Από τις 6 αυτές διατάξεις εµάς µας ενδιαφέρει µόνο µία, δηλαδή εκείνη που στην πρώτη επιλογή έχουµε κόκκινο, στη δεύτερη έχουµε λευκό και στη τρίτη µπλε. Η πιθανότητα πραγµατοποίησης του συγκεκριµένου χρωµατικού συνδυασµού έχει ως εξής :

P(K Λ Μ ) = = 91

30361 2 3∩ ∩

× × × ×× ×

×× ×

1P

71

41

131

243

= 13!

7 4 13

24!3! 21!

= 7 4 13

22 =

7 1322

23 24 23 6

Ένας δεύτερος τρόπος υπολογισµού της ζητούµενης πιθανότητας είναι διαµέσου

της σχέσης ( 3.23 ). Πιο συγκεκριµένα θα έχουµε ότι :

P(Κ Λ M ) = = 91

30361 2 3∩ ∩ ∩

P(Κ ) P(Λ /Κ ) P(M /Κ Λ ) =

724

1323

422

1 2 1 3 1 2

§ 3.5 Νόµος του Bayes & υποκειµενικές πιθανότητες

Έστω ότι τα ενδεχόµενα Α1 , Α2 , …. , Αn αποτελούν µία διαµέριση του δειγµατικού χώρου Ω ενός τυχαίου πειράµατος, ισχύει δηλαδή ότι

Α1 ∪ Α2 ∪ …. ∪ Αn = Ω & Αi ∩ Aj = ∅ ∀ ≠ i j

Εάν Β ένα οποιοδήποτε ενδεχόµενο του Ω, τότε βάσει της σχέσης ( 3.16 ) θα ισχύει ότι :

P(B) = P(B ∩ A1) + P(B ∩ A2) + …. + P(B ∩ An) = ∑ ( 3.25 ) P(B A )ii 1

n

∩=

Από τη σχέση ( 3.22 ) έχουµε ότι : P(B A ) = P(A ) P(B/A ) , i = 1 , 2 , .... , n & 0 < P(A ) 1 i i i i∩ ≤ ( 3.26 )

Αντικαθιστώντας τη σχέση ( 3.26 ) στη σχέση ( 3.25 ) προκύπτει ότι :

P(B) = P(B A ) ii 1

n (3.26)∩ ⇒

= =∑ ∑P(B) = P(A ) P(B/A )i i

i 1

n

( 3.27 )

63

Page 64: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Όπως γνωρίζουµε η πιθανότητα του Αi υπό συνθήκη Β δίνεται από την ακόλουθη σχέση :

P(A /B) = P(A B)

P(B) P(A /B) =

P(A B)

P(A ) P(B/A )i

i(3.27)

ii

i ii 1

n∩

⇒∩

⇒ ≤

=

=

P(A /B) = P(A ) P(B/A )

P(A ) P(B/A ) , 0 < P(B),P(A ) 1 i

i i

i ii 1

n i ( 3.28 )

Η σχέση ( 3.28 ) είναι γνωστή ως εξίσωση ή θεώρηµα του Bayes ( Bayes’

equation or theorem ) και χρησιµοποιείται προκειµένου να προσδιορίσουµε την πιθανότητα των ενδεχοµένων Α1 , Α2 , …. , Αn τα οποία έχουν ως αποτέλεσµα την πραγµατοποίηση του ενδεχοµένου Β.

Άσκηση 1 : Εταιρεία διανοµής ειδών παντοπωλείου έχει δύο υπαλλήλους τους Α και Β οι οποίοι δέχονται τηλεφωνικώς παραγγελίες. Απ’ αυτές το 60% γίνονται στον Α και το 40% στον Β. Ο Α κάνει λάθος στο 4% των παραγγελιών που δέχεται, ενώ ο Β στο 2%. Ένας πελάτης διαµαρτύρεται ότι έγινε λάθος στην παραγγελία του. Ποια η πιθανότητα να την πήρε ο υπάλληλος Α; Λύση

Έστω Α1 ( Α2 ) το ενδεχόµενο µία παραγγελία να έχει γίνει στον Α ( Β ). Η πιθανότητα την λάθος παραγγελία να την πήρε ο υπάλληλος Α ισούται µε :

P(A /Λ) = P(A P(Λ/Α )

P(A P(Λ/Α ) =

P(A P(Λ/Α )P(A P(Λ/Α ) + P(A P(Λ/Α )

( i )11 1

i ii=1

21 1

1 1 2 2

)

)

)) )∑

∆εδοµένου ότι P(A1) = 0,6 ( καθώς το 60% των παραγγελιών γίνονται στον Α ),

P(A2) = 0,4 , P(Λ/Α1) = 0,04 ( καθώς ο Α κάνει λάθος στο 4% των παραγγελιών που δέχεται ) και P(Λ/Α2) = 0,02 , από τη σχέση ( i ) προκύπτει ότι :

P(A /Λ) = P(A P(Λ/Α )

P(A P(Λ/Α ) + P(A P(Λ/Α ) =

(0,6) (0,04)(0,6) (0,04) + (0,4) (0,02)

=

= 0,024

0,024 + 0,008 =

0,0240,032

11 1

1 1 2 2

)) )

⇒ P(A /Λ) = 0,751

Με άλλα λόγια υπάρχει 75% πιθανότητα η λάθος παραγγελία να λήφθηκε από

τον Α υπάλληλο.

64

Page 65: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Άσκηση 2 : Κατά την παραγωγική διαδικασία σ’ ένα εργοστάσιο, όταν τα προϊόντα έρχονται στο τέλος της γραµµής παραγωγής επιθεωρούνται και ορισµένα απ΄ αυτά περνούν από πλήρη έλεγχο. ∆εδοµένου ότι ένα προϊόν έχει ελεγχθεί πλήρως, ποια η πιθανότητα να είναι ελαττωµατικό εάν γνωρίζουµε ότι: 1ον τα ελαττωµατικά προϊόντα αποτελούν το 10 % της συνολικής παραγωγής και 2ον από πλήρη έλεγχο περνούν το 60 % των ελαττωµατικών και το 20 % των καλών προϊόντων; Λύση

Έστω Α1 ( Α2 ) το ενδεχόµενο το προϊόν να είναι ελαττωµατικό ( µη ελαττωµα-τικό ) και Β το ενδεχόµενο το προϊόν να έχει ελεγχθεί πλήρως. Η πιθανότητα το προϊόν να είναι ελαττωµατικό µε δεδοµένο ότι έχει ελεγχθεί πλήρως θα έχει ως εξής :

P(A /B) = P(A P(B/Α )

P(A P(B/Α ) + P(A P(B/Α ) ( i )1

1 1

1 1 2 2

)) )

∆εδοµένου ότι P(A1) = 0,1 ( καθώς τα ελαττωµατικά προϊόντα αποτελούν το

10% της συνολικά παραγόµενης ποσότητας ), P(A2) = 1 – P(A1) = 0,9 , P(B/A1) = 0,6 ( καθώς από πλήρη έλεγχο περνά το 60% των ελαττωµατικών προϊόντων ) και P(B/A2) = 0,2 , από τη σχέση ( i ) προκύπτει ότι :

P(A /B) = P(A P(B/Α )

P(A P(B/Α ) + P(A P(B/Α ) =

(0,1) (0,6)(0,1) (0,6) + (0,9) (0,2)

=

= 0,06

0,06 + 0,18 =

0,060,24

11 1

1 1 2 2

)) )

⇒ P(A /B) = 0,251

Με άλλα λόγια η πιθανότητα το προϊόν να είναι ελαττωµατικό µε δεδοµένο ότι

έχει ελεγχθεί πλήρως ισούται µε 25% .

65

Page 66: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

ΚΕΦΑΛΑΙΟ 4

ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ & ΚΑΤΑΝΟΜΕΣ

§ 4.1 Εισαγωγή Αν σε κάθε δειγµατοσηµείο ωi του δειγµατοχώρου Ω αντιστοιχίσουµε έναν

αριθµό, τότε θα σχηµατιστεί µία συνάρτηση η οποία θα είναι ορισµένη στο δειγµατικό χώρο και η οποία θα καλείται τυχαία µεταβλητή ( random variable ). Οι τυχαίες µεταβλητές συνήθως συµβολίζονται µε ένα κεφαλαίο γράµµα ( Χ ή Υ ) και διακρίνονται σε δύο κατηγορίες 1ον στις διακριτές ( όταν παίρνουν µόνο διακριτές πραγµατικές τιµές ) και σε συνεχείς ( όταν παίρνουν την οποιαδήποτε τιµή στα πλαίσια ενός συνεχούς διαστήµατος πραγµατικών τιµών ).

§ 4.1 ∆ιακριτές τυχαίες µεταβλητές

Αν η Χ είναι µία διακριτή τυχαία µεταβλητή, τότε η συνάρτηση

f(x) = P(X = x) = P(X = x ) p , αν x = x 0 , αν x x

i i i

i

=≠

( 4.1 )

θα καλείται συνάρτηση πιθανότητας ( probability function ) ή συνάρτηση πυκνότη-τας πιθανότητας ( density probability function ) της µεταβλητής Χ και γι’ αυτήν θα ισχύουν οι παρακάτω ιδιότητες :

( i ) f(xi) ≥ 0 x∀ i & ( ii ) ( )f x = 1ii=1

n

∑ Η συνάρτηση που µας δίνει την πιθανότητα P(X ≤ xi) καλείται συνάρτηση

κατανοµής ( distribution function ) F της µεταβλητής Χ και ορίζεται ως εξής :

( ) ( ) ( )F x = P X x = f x i i ix xi

≤≤∑ ( 4.2 )

Για την παραπάνω συνάρτηση ισχύουν οι εξής ιδιότητες :

( i ) 0 ≤ F(xi) ≤ 1 ( ii ) Εάν xi < xj τότε F(xi) ≤ F(xj) ( iii ) f(xi) = F(xi) – F(xi-1) ( iv ) ( )P( a < X b ) = F(b) F(a) = f xi

a<x bi

≤ −∀ ≤∑

66

Page 67: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Άσκηση : Η τυχαία µεταβλητή Χ παριστάνει το πλήθος των άσων σε τέσσερα χαρτιά που τραβάµε στην τύχη από µία συνηθισµένη τράπουλα. (α) ∆ώστε σ’ ένα πίνακα τη συνάρτηση πιθανότητας της Χ. (β) Παραστήστε τη συνάρτηση κατανοµής γραφικά. ( «Πιθανότητες & Στατιστική» , M. R. Spiegel , άσκηση 2.42 , σελ. 69 )

Λύση ( α ) Αν P( X = xi ) , µε xi = 0 , …. , 4 , είναι η πιθανότητα να έχουµε xi άσους στα τέσσερα χαρτιά που τραβάµε τότε :

( )P X = 0 = = 194580 270725

484

524

( )P X = 1 = = 69184

270725

483

524

=

4 17296270725

41

×

( )P X = 2 = = 6768

270725

482

524

=

6 1128270725

42

×

( )P X = 3 = = 192

270725

481

524

=

4 48270725

43

× ( )P X = 4 = =

1 270725

480

524

44

Κατά συνέπεια η κατανοµή πιθανότητας της Χ θα έχει ως εξής : x 0 1 2 3 4

f(x)

194580270725

69184270725

6768

270725

192

270725

1

270725

(β) Βάση των στοιχείων του παραπάνω πίνακα θα µπορούσαµε να εξάγουµε τη συνάρτηση κατανοµής του προβλήµατος. Πιο συγκεκριµένα θα έχουµε ότι :

67

Page 68: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

F(x) =

194580270725

, 0 x < 1

263764270725

, 1 x < 2

270532270725

, 2 x < 3

270724270725

, 3 x < 4

, 4 x

1

Η παραπάνω συνάρτηση κατανοµής παρουσιάζεται γραφικά στο παρακάτω

διάγραµµα.

§ 4.2 ∆ιακριτές κατανοµές

Στα πλαίσια αυτής της παραγράφου θα δούµε τρεις κατανοµές και πιο συγκεκριµένα θα δούµε την διωνυµική κατανοµή, την υπεργεωµετρική κατανοµή και την κατανοµή Poisson.

§ 4.2.1 ∆ιωνυµική κατανοµή

Ας υποθέσουµε ότι ένα τυχαίο πείραµα τύχης παρουσιάζει τα παρακάτω

χαρακτηριστικά :

68

Page 69: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

(α) Σε κάθε µία από τις n δοκιµές του πειράµατος µπορούµε να έχουµε µόνο δύο αποτελέσµατα, είτε επιτυχία είτε αποτυχία.

(β) Η πιθανότητα επιτυχίας p παραµένει σταθερή στις n δοκιµές του πειράµατος11. (γ) Τα αποτελέσµατα των δοκιµών είναι ανεξάρτητα µεταξύ τους.

Αν στις n δοκιµές ενός τυχαίου πειράµατος που συγκεντρώνει τα παραπάνω χαρακτηριστικά έχουµε x επιτυχίες, τότε για την τυχαία µεταβλητή Χ ( η οποία παριστά τον αριθµό των επιτυχιών στις n δοκιµές ) θα ισχύει ότι :

Χ ~ Β(n,p)

Με άλλα λόγια η Χ θα ακολουθεί τη διωνυµική κατανοµή ( binomial distribution ) ή την κατανοµή Bernoulli και η συνάρτηση πυκνότητας πιθανότητάς της θα έχει ως εξής :

f(x) = P(X = x) = nx p q =

n!x! (n x)!

p q x n x x n x

−− − ( 4.3 )

όπου q = 1 – p : η πιθανότητα µη εµφάνισης του γεγονότος, x = 0 , 1 , …. n , και

n – x : το πλήθος των αποτυχιών στις n δοκιµές

Άσκηση : Υποθέτουµε ότι το 15% των κοµµατιών που παράγονται από µία αυτόµατη

µηχανή είναι ελαττωµατικά. Ένα δείγµα 5 κοµµατιών εκλέγεται στην τύχη και ελέγχεται. Να βρεθεί η πιθανότητα : α) στο δείγµα να µην υπάρχει κανένα ελαττωµατικό, β) τουλάχιστον ένα κοµµάτι του δείγµατος να είναι ελαττωµατικό και γ) το πολύ τέσσερα κοµµάτια του δείγµατος να είναι ελαττωµατικά. ( « Εφαρµοσµένη Στατιστική » , Μ. Μανατάκη , σελ. 3.38 , άσκηση 3.12 )

Λύση

Έστω Χ η τυχαία µεταβλητή η οποία µας δίνει τον αριθµό των ελαττωµατικών κοµµατιών από το δείγµα των 5 τα οποία εξετάζονται. Το γεγονός ότι 1ον κάθε ένα από τα κοµµάτια που εξετάζονται έχει µία πιθανότητα ίση µε 5% να είναι ελαττωµατικό και 2ον τα αποτελέσµατα των ελέγχων είναι ανεξάρτητα µεταξύ τους, µας οδηγεί στο συµπέρασµα ότι η µεταβλητή Χ ακολουθεί τη διωνυµική κατανοµή, δηλαδή Χ ~ Β(n = 5 , p = 0,15). Ως εκ τούτου οι πιθανότητα P( X = x ) µε x = 0, … ,5 θα προσδιορισθεί µε τη βοήθεια της ακόλουθης σχέσης :

P(X = x) = nx p q =

n!x! (n x)!

p qx n x x n

−− −x

11 Στην περίπτωση που έχουµε δειγµατοληψία η πιθανότητα παραµένει σταθερή µόνο εάν το δείγµα λαµβάνεται µε επανατοποθέτηση ή το µέγεθος του δείγµατος είναι πολύ µικρό σε σχέση µε το µέγεθος του πληθυσµού από τον οποίο εξάγεται.

69

Page 70: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Από την παραπάνω σχέση και δεδοµένου ότι p = 0,15 , q = 0,85 & n = 5 προκύ-πτει ότι :

( ) ( )P(X = 0) = 50 0,15 0,85 =

5!0! (5 0)!

1720

0,44370 5 0

−5

( ) ( )P(X = 1) = 51 0,15 0,85 =

5!1! (5 1)!

3

201720

0,39151 5 1

−4

( ) ( )P(X = 2) = 52 0,15 0,85 =

5!2! (5 2)!

3

201720

0,13822 5 2

−2 3

( ) ( )P(X = 3) = 53 0,15 0,85 =

5!3! (5 3)!

3

201720

0,02443 5

−33 2

( ) ( )P(X = 4) = 54 0,15 0,85 =

5!4! (5 4)!

3

201720

0,00214 5

−44 1

( ) ( )P(X = 5) = 55 0,15 0,85 =

5!5! (5 5)!

3

201720

0,0000765 5

−55 0

Βάσει των παραπάνω αποτελεσµάτων έχουµε ότι :

(α) Η πιθανότητα κανένα από τα πέντε να µην είναι ελαττωµατικό ισούται µε 0,4437. Έχουµε δηλαδή ότι P( X = 0 ) = 44,37 %. (β) Η πιθανότητα τουλάχιστον ένα να είναι ελαττωµατικό ισούται µε

P( X ≥ 1 ) = P ( X > 0 ) = 1 – P( X = 0 ) = 1 – 0,4437 = 0,5563 ή 55,63 %

(γ) Η πιθανότητα το πολύ τέσσερα κοµµάτια να είναι ελαττωµατικά έχει ως εξής : P( X ≤ 4 ) = P( X = 0 ) + P( X = 1 ) + P( X = 2 ) + P( X = 3 ) + P( X = 4 ) = = 0,4437 + 0,3915 + 0,1382 + 0,0244 + 0,0021 = 0,9999 = 1 – P( X = 5 ) § 4.2.2 Υπεργεωµετρική κατανοµή

Ας υποθέσουµε ότι από ένα πληθυσµό Ν αντικειµένων σχηµατίζουµε ( χωρίς επανατοποθέτηση ) ένα δείγµα από n αντικείµενα και ότι m ( Ν – m ) από τα Ν αντικείµενα ( δεν ) έχουν ένα συγκεκριµένο χαρακτηριστικό γνώρισµα. Εάν η τυχαία µεταβλητή Χ παριστάνει το πλήθος των αντικειµένων από τα n που έχουν το συγκεκριµένο χαρακτηριστικό γνώρισµα, τότε γι’ αυτήν θα ισχύει ότι :

70

Page 71: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Χ ~ Η( N , n , m )

, δηλαδή η Χ ακολουθεί την υπεργεωµετρική κατανοµή ( hypergeometric distribu-tion ). Η συνάρτηση

f(x) = P(X = x) =

mx

N mn x

Nn

−−

( 4.4 )

όπου x = 0 , 1 , 2 , …. , n ή m αποτελεί τη συνάρτηση της πυκνότητας πιθανότητας της τυχαίας µεταβλητής Χ και µας δίνει την πιθανότητα x από τα n αντικείµενα του δείγµατος να έχουν το συγκεκριµένο χαρακτηριστικό γνώρισµα.

Στην περίπτωση που ο πληθυσµός είναι πολύ µεγάλος τότε οι δειγµατοληψίες χωρίς επανατοποθέτηση ή µε επανατοποθέτηση είναι ταυτόσηµες και η υπεργεω-

µετρική κατανοµή προσεγγίζεται από τη διωνυµική κατανοµή B n,mN

. Ισχύει

δηλαδή ότι :

H(N,n,m) B n,mN

ή

mx

N mn x

Nn

nx p qx n≈

−−

−x , όπου p = m N .

Άσκηση : Εάν διαλέξουµε 13 χαρτιά στην τύχη και χωρίς επανατοποθέτηση από µία

τράπουλα 52 χαρτιών, υπολογίστε την πιθανότητα: α) 6 να είναι φιγούρες , β) να µην περιέχουν φιγούρα. ( « Πιθανότητες και Στατιστική », M.R. Spiegel, σελ. 104, άσκηση 4.105 )

Λύση

Έστω ότι η τυχαία µεταβλητή Χ παριστά τον αριθµό των χαρτιών που είναι φιγούρα. ∆εδοµένου ότι η επιλογή των 13 χαρτιών ( n = 13 ) από την τράπουλα ( Ν = = 52 ) έγινε χωρίς επανατοποθέτηση και εφόσον στην τράπουλα υπάρχουν 12 φιγούρες ( m = 12 ), θα έχουµε ότι X ~ H( 52 , 13 , 12 ). Κατά συνέπεια η πιθανότητα από τα 13 χαρτιά του δείγµατος τα x να είναι φιγούρες θα υπολογιστεί µε τη βοήθεια της ακόλουθης σχέσης :

P(X = x) =

mx

N mn x

Nn

=

12x

4013 x

5213

−−

71

Page 72: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

(α) Η πιθανότητα 6 από τα χαρτιά να είναι φιγούρες ισούται µε

P(X = 6) 0,027 =

126

40

5213

≅7

(β) Η πιθανότητα να µην έχουν φιγούρα έχει ως εξής :

P(X = 0) 0,01895 =

120

40

5213

≅13

§ 4.2.3 Κατανοµή Poisson

Αν η συνάρτηση πιθανότητας µίας τυχαίας µεταβλητής Χ δίνεται από τη σχέση :

f(x) = P(X = x) = e λ

x!

λ x−

( 4.5 )

όπου λ > 0 , e ≈ 2,71828 : η βάση των νεπέριων λογαρίθµων και x = 0 , 1 , 2 , …. τότε η τυχαία µεταβλητή Χ θα λέµε ότι ακολουθεί την κατανοµή Poisson ( Poisson distribution ), θα ισχύει δηλαδή ότι :

Χ ~ P(λ)

όπου λ η µέση τιµή & η διακύµανση της κατανοµής

Η κατανοµή Poisson χρησιµοποιείται πολύ συχνά για την περιγραφή διαφόρων γεγονότων τα οποία λαµβάνουν χώρα εντός µίας συγκεκριµένης χρονικής περιόδου όπως :

ο αριθµός των ατυχηµάτων σε µία γεωγραφική περιοχή ο αριθµός των απεργιών σε µία επιχείρηση ορισµένου µεγέθους ο αριθµός των αφίξεων µεταφορικών µέσων ο αριθµός των βλαβών µίας συσκευής ο αριθµός των ζητούµενων µονάδων ενός προϊόντος ο αριθµός των τυπογραφικών λαθών σε µία σελίδα βιβλίου ο αριθµός των κλήσεων που δέχεται ή στέλνει ένα τηλεφωνικό κέντρο κατά τη

διάρκεια µίας χρονικής περιόδου το πλήθος των ελαττωµάτων στην επιφάνεια διαφόρων αντικειµένων ανά µία

συγκεκριµένη µονάδα µέτρησης µήκους ή όγκου

72

Page 73: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Τα παραπάνω γεγονότα έχουν τα εξής κοινά χαρακτηριστικά :

1ον Γεγονότα που συµβαίνουν σ’ ένα χρονικό διάστηµα είναι ανεξάρτητα από εκείνα που συµβαίνουν σε κάθε άλλο χρονικό διάστηµα, που δεν υπερκαλύπτει το προηγούµενο χρονικό διάστηµα.

2ον Για µικρό χρονικό διάστηµα η πιθανότητα επιτυχίας είναι ανάλογη του εύρους του χρονικού διαστήµατος.

3ον Η πιθανότητα να συµβούν δύο ή περισσότερα γεγονότα σ’ ένα πολύ µικρό χρονικό διάστηµα είναι µηδενική.

Να σηµειώσουµε τέλος ότι στην περίπτωση που n ≥ 50 και np < 5, η κατανοµή

Poisson προσεγγίζει αρκετά καλά τη διωνυµική κατανοµή µε λ = np.

Άσκηση : Έστω ότι ο αριθµός Χ των θανατηφόρων εργατικών ατυχηµάτων σε µία χώρα ακολουθεί την κατανοµή Poisson, µε λ = 1 ατύχηµα ανά µήνα και σε κάθε τέτοιο ατύχηµα ο εθνικός ασφαλιστικός οργανισµός πληρώνει αποζηµίωση ίση µε ένα εκατοµµύριο δραχµές. Αν για το σκοπό αυτόν ο οργανισµός έχει προϋπολογίσει ποσό ύψους 20 εκατοµµυρίων δραχµών το χρόνο, ποια η πιθανότητα να µην επαρκέσει το ποσό αυτό; ( « Στατιστική – Μέθοδοι & Εφαρµογές » , τόµος Α’ , Χ. Ζαχαροπούλου , άσκηση 8 , σελ. 288 )

Λύση

Ο ασφαλιστικός οργανισµός έχει προϋπολογίσει ένα ποσό ύψους 20 εκατοµ-µυρίων δραχµών ανά έτος, για την καταβολή αποζηµιώσεων στην περίπτωση θανατηφόρων εργατικών ατυχηµάτων. ∆εδοµένου ότι το ύψος της αποζηµίωσης ανέρχεται σε ένα εκατοµµύριο δραχµές ανά ατύχηµα, το προϋπολογισθέν ποσό δεν θα επαρκέσει εάν κατά τη διάρκεια ενός έτους έχουµε περισσότερα των 20 ατυχη-µάτων. Ως εκ τούτου καλούµαστε να υπολογίσουµε την πιθανότητα P( X > 20 ) = 1 – – P( X ≤ 20 ). Η πιθανότητα αυτή θα υπολογισθεί µε τη βοήθεια της ακόλουθης σχέσης :

P( X > 20 ) = 1 e λ

i!

λ i

i = 0

20

−−

∆εδοµένου ότι το µέγεθος της µέσης τιµής λ της κατανοµής Poisson είναι ανάλογη µε το µήκος του διαστήµατος στο οποίο ορίζεται η τυχαία µεταβλητή Χ, η τιµή της λ που θα χρησιµοποιήσουµε στον παραπάνω τύπο θα ισούται όχι µε 1 αλλά µε 12 ( = 1 ανά µήνα × 12 µήνες ). Θα έχουµε λοιπόν ότι :

P( X > 20 ) = 1 e 12

i! 1 0,9884

12 i

i = 0

20

− ≅ − ⇒ ≅−

∑ P( X > 20 ) 0,0116

Με άλλα λόγια η πιθανότητα να µην επαρκέσει το προϋπολογισθέν ποσό ισούται

µε 1,16 %

73

Page 74: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

§ 4.3 Συνεχείς κατανοµές

Όταν η τυχαία µεταβλητή Χ µπορεί να πάρει την οποιαδήποτε τιµή από το σύνολο ℜ+ , τότε αυτή συνιστά µία συνεχή τυχαία µεταβλητή και η συνάρτηση πυκνότητας πιθανότητάς της , f(x) , έχει τις εξής ιδιότητες :

f(x) 0 , f(x) dx = 1

P(a < X < b) = P(a X < b) = P(a X b) = P(a X b) = f(x) dx

+

a

b

≤ < ≤ ≤ ≤

−∞

( 4.6.1 ) ( 4.6.2 )

&

( 4.6.3 )

Η συνάρτηση κατανοµής F(x) της συνεχούς τυχαίας µεταβλητής Χ δίνεται από

την ακόλουθη σχέση :

F(x) = P(X x) = f(t) dt x

≤−∞∫ ( 4.7 )

Η πρώτη παράγωγος της συνάρτησης κατανοµής ως προς x µας δίνει τη

συνάρτηση πυκνότητας πιθανότητας της Χ, ισχύει δηλαδή ότι :

F’(x) = f(x) ( 4.8 )

Άσκηση : Μία τυχαία µεταβλητή Χ έχει την ακόλουθη συνάρτηση πυκνότητας πιθα-νότητας :

f(x) = ce x > 0 x 0

3x−

0

Υπολογίστε : α) την τιµή της c και τις β) P(1 < X < 2), γ) P(X < 1) . ( « Πιθανότητες και Στατιστική », M.R. Spiegel, σελ. 69, άσκηση 2.47 )

Λύση

(α) Όπως γνωρίζουµε το ολοκλήρωµα της συνάρτησης πυκνότητας πιθανότητας από το – ∞ έως το + ∞ ισούται µε 1, ισχύει δηλαδή ότι :

f(x) dx = 1+

−∞

Βάσει της παραπάνω σχέσης θα υπολογίσουµε την τιµή της σταθερής c. Πιο

συγκεκριµένα θα έχουµε ότι :

f(x) dx = 1 f(x) dx + f(x) dx = 1 0 + lim ce dx = 1 + +

u +

3xu

−∞

−∞

→ ∞

−∫ ∫ ∫ ∫⇒ ⇒ 0

0 0⇒

74

Page 75: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( ) [ ] ( )⇒ −′

⇒ − ⇒ −

⇒ − − ⇒

→ ∞

→ ∞

→ ∞

−∫c3

lim e dx = c lim e = 3 c lim e e = 3

c ( 0 1) = 3 c = 3

u +

3xu

u +

3x0

u

u +

3u 0

01 − ⇒

Για c = 3 η συνάρτηση πυκνότητας πιθανότητας παίρνει την ακόλουθη µορφή :

f(x) = 3e x > 0 x 0

3x−

0

(β) Η πιθανότητα P( 1 < X < 2 ) έχει ως εξής :

( ) [ ]P( 1 < X < 2 ) = 3e dx = e dx = e = e e 0,0473x

1

2 3x

1

2 3x1

2 3 6− − − − −∫ ∫−′

− − ≅

(γ) Η πιθανότητα P( X < 1 ) ισούται µε :

( )

[ ]

P( X < 1 ) = f(x) dx = f(x) dx + f(x) dx = 0 + 3e dx = e dx =

= e = ( e e ) = e 0,9502

1 1 3x1 3x1

3x0

1 3

−∞ −∞

− −

− − −

∫ ∫ ∫ ∫ ∫−′

− − − − ≅

0

0 0 0

0 31

§ 4.3.1 Κανονική κατανοµή

Η πιο σηµαντική από όλες της κατανοµές, διακριτές ή συνεχείς, είναι ίσως η κανονική κατανοµή ( normal distribution ) καθώς 1ον προσεγγίζει την κατανοµή πολλών ποσοτήτων πρακτικού ενδιαφέροντος ( όπως για παράδειγµα µετρήσεων µήκους, βάρους, όγκου, παραγωγή αγροτικών προϊόντων ανά m2 , µετρήσεων του ανθρώπινου δείκτη ευφυΐας και της αρτηριακής πίεσης , αποτελεσµάτων σε ψυχολο-γικά tests κ.α. ) και 2ον αποτελεί όριο άλλων κατανοµών.

Για την τυχαία µεταβλητή Χ θα ισχύει ότι

Χ ~ Ν ( µ,σ2 )

δηλαδή η Χ θα ακολουθεί την κανονική κατανοµή µε µέση τιµή µ και διακύµανση σ2, εάν η συνάρτηση πυκνότητας πιθανότητας f(x) αυτής δίνεται από την ακόλουθη σχέση :

f(x) = 1

σ 2π e

(x µ)2σ

2

2−−

( 4.9 )

όπου µ , σ2 οι παράµετροι της κατανοµής και x ∈ ℜ .

Στην περίπτωση που µ = 0 και σ2 = 1, τότε θα έχουµε ότι

Χ ~ Ν ( 0,1 )

75

Page 76: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

και θα λέµε ότι η τυχαία µεταβλητή Χ ακολουθεί την τυποποιηµένη κανονική κατά-νοµή.

Η συνάρτηση πυκνότητας πιθανότητας της κανονικής κατανοµής έχει της παρακάτω ιδιότητες :

f(x) 0 f(x) dx = 1 ≥−∞

+∞

∫( 4.10.1 ) & ( 4.10.2 )

Η συνάρτηση κατανοµής F(x) της κανονικής κατανοµής δίνεται από τη σχέση :

F(x) = 1

σ 2π e du

(u µ)2σ

x2

2−−

−∞∫ ( 4.11 )

και εφόσον η Χ ~ Ν( µ,σ2 ) ισχύει ότι :

P(a < X b) = F(b) F(a) = 1

σ 2π e du

(u µ)2σ

a

b2

2< −−

∫ ( 4.12 )

Επειδή ο υπολογισµός του ολοκληρώµατος της σχέσης ( 4.11 ) είναι πολύ

δύσκολος, έναντι της σχέσης αυτής χρησιµοποιούµε τη σχέση :

Φ(z) =12π

e dtt 2z 2

( 4.13 )−

−∞∫

Η παραπάνω συνάρτηση αποτελεί τη συνάρτηση κατανοµής της τυποποιηµένης ( standardized ) µεταβλητής

Z = Χ µσ−

( 4.14 )

η οποία ακολουθεί την τυποποιηµένη κανονική κατανοµή, δηλαδή η Ζ ~ Ν ( 0,1 ).

∆εδοµένου ότι F(x) = Φ(z), από τη σχέση ( 4.12 ) προκύπτει ότι :

P( a < X < b ) = F(b) F(a) = Φb µσ

Φa µσ

−−

( 4.15 )

Επίσης ισχύουν οι παρακάτω σχέσεις :

F(x) = P( X x ) = PX µσ

< x µσ

= P Z < x µσ

= Φx µσ

≤− −

( 4.16 )

&

Φ( – x ) = 1 – Φ( x ) ( 4.17 )

76

Page 77: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Άσκηση 1 : Η περιεκτικότητα νικοτίνης σε 80 διαφορετικές µάρκες σιγαρέττων βρέθηκε ότι ακολουθεί προσεγγιστικά την κανονική κατανοµή, µε µέσο 5,62 και τυπική απόκλιση 0,42 . Να βρεθεί η πιθανότητα ώστε σε ένα τυχαίο δείγµα από 18 µάρκες, η µέση περιεκτικότητα νικοτίνης είναι µεγαλύτερη από 5,72 . («Ασκήσεις Στατιστικής» , Γ.∆. Πέκου , άσκηση 19 σελ. 113)

Λύση

Έστω ότι η τυχαία µεταβλητή Χ παριστά τη µέση περιεκτικότητα νικοτίνης του δείγµατος. ∆εδοµένου ότι µ = 5,62 και σ = 0,42 , η πιθανότητα ώστε η µέση περιεκτικότητα νικοτίνης του τυχαίου δείγµατος από 18 µάρκες σιγαρέττων να είναι µεγαλύτερη από 5,72 έχει ως ακολούθως :

( )P(X > 5,72) = 1 P(X < 5,72) = 1 P X µσ

< 5,72 5,62

0,42 = 1 P Z < ,24 =

= 1 Φ(0,24) = 1 0,5948 = 0,4052 ή 40,52%

− −− −

− −

0

Άσκηση 2 : Η διάρκεια ζωής των µπαταριών που παράγει µια εταιρεία ακολουθεί την κανονική κατανοµή µε µέσο 1000 ώρες και τυπική απόκλιση 50 ώρες. Να υπολογιστεί η πιθανότητα ότι µία, τυχαία εκλεγµένη µπαταρία, θα « ζήσει » : α) το πολύ 900 ώρες β) 900 ~ 1050 ώρες και γ) τουλάχιστον 1100 ώρες. (« Εφαρµοσµένη Στατιστική » , Μ. Μανατάκη , σελ. 3.38 , άσκηση 3.11)

Λύση

Έστω Χ η συνεχής τυχαία µεταβλητή που µας δείχνει τη διάρκεια ζωής των µπαταριών που παράγει η εταιρεία, για την οποία ισχύει ότι Χ ~ Ν(1000,50). Ως εκ τούτου θα έχουµε ότι :

( α ) ( ) ( ) ( ) (P X < 900 = PX µσ

< 900 1000

50 = P Z < 2 = Φ 2 = 1 Φ 2 =

− −

− − − )

( )= 1 0,97725 0,02275 ή − ⇒ P X < 900 = 2,275 %

( β ) ( ) ( )P 900 < X < 1050 = P900 1000

50 <

X µσ

< 1050 1000

50 = P 2 < Z < 1 =

− − −

( ) ( ) ( )= Φ Φ 2 = 0,841345 0,02275 0,818595 ή 1 − − − ⇒ P 900 < X < 1050 = 81,8595 %

(γ) ( ) ( ) ( )P X > 1100 = 1 P X < 1100 = 1 PX µσ

< 1100 1000

50 = 1 P Z < 2 =− −

− −

( ) ( )= 1 Φ 2 = 1 0,97725 0,02275 ή − − ⇒ P X > 1100 = 2,275 %

77

Page 78: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

§ 4.3.2 Οµοιόµορφη κατανοµή

Έστω η τυχαία µεταβλητή Χ µε πεδίο ορισµού το διάστηµα των πραγµατικών αριθµών [α , β]. Αν όλα τα διαστήµατα ίσου µήκους τα οποία ανήκουν στο [α , β] έχουν την ίδια πιθανότητα να περιέχουν µία τιµή της Χ, τότε λέµε ότι η Χ ακολουθεί την οµοιόµορφη κατανοµή ( uniform distribution ) µε παραµέτρους α , β , κάτι που συµβολίζεται ως εξής :

Χ ~ U(α,β)

όπου α , β οι παράµετροι της κατανοµής.

Η συνάρτησης πυκνότητας πιθανότητας και η συνάρτηση κατανοµής της µεταβλητής Χ ~ U(α,β) έχουν αντιστοίχως ως ακολούθως :

f(x) =

1β α

, αν α x β

0 , αν x [α , β]

F(x) = P(X x) = f(t) dt =

0 , x < α

x αβ α

, για α x β

1 , β < x

x

−≤ ≤

≤−−

≤ ≤

−∞∫

( 4.18 )

( 4.19 )

Η οµοιόµορφη συνάρτηση κατανοµής , µεταξύ των άλλων, χρησιµοποιείται :

1ον Στη µέτρηση των σφαλµάτων στρογγυλοποίησης ( rounding errors ) 2ον Στη προσοµοίωση των στατιστικών πειραµάτων (random experiments simulation)

ή αλλιώς στη µέθοδο Monte Carlo 3ον Στον έλεγχο της ποιότητας του προϊόντος. Άσκηση : Ειδικά αυτοκίνητα της Express Service βρίσκονται στα σηµεία Α και Β της

εθνικής οδού που απέχουν 50 χιλιόµετρα και όταν ένας συνδροµητής ζητάει βοήθεια, σ’ αυτό το διάστηµα του δρόµου , πηγαίνει το κοντινότερο αυτοκίνητο. Αν Χ η απόσταση του συνδροµητή από το σηµείο Α και Χ ~ U(0,50) , ποια η πιθανότητα ένα αυτοκίνητο να χρειαστεί να κάνει περισσότερα από 20 χιλιόµετρα; ( « Στατιστική – Μέθοδοι & Εφαρµογές » , τόµος Α’ , Χ. Ζαχαροπούλου , άσκηση 21 , σελ. 291 )

Λύση

Η ζητούµενη πιθανότητα έχει ως ακολούθως :

78

Page 79: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

P(X 20) = 1 P(X 20) = 1 F(20) = 1 20 050 0

= 3 5

≥ − ≤ − −−−

⇒ ≥P(X 20) = 0,6 ή 60 %

§ 4.3.3 Αρνητική εκθετική κατανοµή

Στην περίπτωση που η τυχαία µεταβλητή Χ είναι : i) ο χρόνος µεταξύ δύο διαδο-χικών βλαβών ενός µηχανήµατος, ii) ο χρόνος διάρκειας ενός αστικού τηλεφωνή-µατος iii) ο χρόνος µεταξύ δύο αφίξεων σ’ ένα αεροδρόµιο είτε τέλος iv) η διάρκεια συνεχούς λειτουργίας ενός λαµπτήρα έως ότου καεί , τότε η Χ θα λέµε ότι ακολουθεί την αρνητική εκθετική κατανοµή (negative exponential distribution) & η συνάρτηση πυκνότητας πιθανότητάς της θα έχει ως εξής :

f(x) = λ e , x 0

0 , x < 0

λx− ≥

( 4.20 )

όπου λ µια παράµετρος της κατανοµής η αριθµητική τιµή της οποίας είναι άγνωστη.

Η συνάρτηση κατανοµής της Χ δίνεται από την ακόλουθη σχέση :

[ ]F(x) = P(X x) = f(t) dt = = 1 e 0

x λx≤ − −∫ ∫ − − − λ e dt = e λt

0

x λt0

x( 4.21 )

από την οποία και προκύπτει ότι :

P(X > x) = 1 – F(x) = 1 – 1 + = ( 4.22 ) e λx− e λx−

Να σηµειώσουµε τέλος ότι :

( )P x < X < x = F(x ) F(x ) = e e 1 2 2 1

λx λx1 2− −− − ( 4.23 )

Άσκηση : Ο αριθµός των πελατών που φτάνουν στο ταµείο µιας τράπεζας µεταξύ 8 – 9 το πρωί ακολουθεί την κατανοµή Poisson µε λ = 2 πελάτες το λεπτό. Ποια είναι η πιθανότητα ο χρόνος µεταξύ δύο διαδοχικών αφίξεων να ισούται από µισό έως ένα λεπτό; ( « Στατιστική – Μέθοδοι & Εφαρµογές » , τόµος Α’ , Χ. Ζαχαροπούλου , άσκηση 23 , σελ. 292 )

Λύση

Αν Χ η τυχαία µεταβλητή που µας δίνει το χρόνο που µεσολαβεί µεταξύ δύο διαδοχικών αφίξεων , τότε η ζητούµενη πιθανότητα βάσει της αρνητικής εκθετικής κατανοµής έχει ως εξής :

( ) ( )P 1/2 < X < 1 = 0,23254 ή 23,254 % F(1) F(1/2) = e e = e e 2 2 1 2− − − ≅− − − −( / )1 2 1

79

Page 80: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

ΚΕΦΑΛΑΙΟ 5

ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

§ 5.1 Μέση τιµή διακριτών και συνεχών µεταβλητών

Αν x1, x2, …. , xn είναι οι δυνατές τιµές που παίρνει η διακριτή τυχαία µεταβλητή Χ και P( X = xj ) = f( xj ), j = 1 , …. , n , η πιθανότητα η µεταβλητή Χ να πάρει την τιµή xj , τότε η µαθηµατική ελπίδα ( mathematic expectation ) ή αναµενόµενη τιµή ( expected value ) ή µέση τιµή ( mean ) της διακριτής τυχαίας µεταβλητής Χ θα δίνεται από την ακόλουθη σχέση :

( ) ( ) ( )E(X) = x P X = x + x P X = x + .... + x P X = x =

= x f( x ) + x f( x ) + .... + x f( x )

1 1 2 2 j j

1 1 2 2 j j ⇒ ∑E(X) = x f( x ) j jj=1

n

( 5.1 )

Στην περίπτωση που P( X = x1 ) = P( X = x2 ) = …. = P( X = xj ), από την παραπάνω σχέση προκύπτει ο αριθµητικός µέσος όρος των x1 , x2 , …. , xj ο οποίος και έχει ως εξής :

E(X) = x + x + .... + x

n 1 2 j ⇒ ∑µ =

1n

xx jj=1

n

( 5.2 )

Εάν η τυχαία µεταβλητή Χ είναι συνεχής µε συνάρτηση πυκνότητας πιθανότητας

την f(x), τότε η αναµενόµενη ή µέση τιµή της δίνεται από την ακόλουθη σχέση :

E(X) = µ = xf(x) dxx

+

−∞

∫ ( 5.3 )

Η µέση τιµή συνιστά τη µία από τις δύο παραµέτρους µίας κατανοµής. Η

δεύτερη παράµετρος της κατανοµής είναι η διακύµανση ή διασπορά ( variance ), η οποία αποτελεί µέτρο της διασποράς των δυνατών τιµών της ( διακριτής ή συνεχούς ) µεταβλητής Χ γύρο από το µέσο της µx ( δηλαδή µας δείχνει πόσο « απλωµένη » είναι η κατανοµή της Χ) και η οποία προσδιορίζεται µε τη βοήθεια της ακόλουθης σχέσης :

( ) [ ]Var(X) = σ = E X µ = = E(X ) E (X)x

2x

2 2− − −2 2 E X E(X) ( 5.4 )

Όπως προκύπτει από την παραπάνω σχέση η διασπορά αποτελεί ένα θετικό

µέγεθος. Η τετραγωνική ρίζα της µας δίνει το µέγεθος της τυπικής απόκλισης (standard deviation) το οποίο θα το συµβολίζουµε µε σx. Ισχύει δηλαδή ότι :

80

Page 81: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( )σ = Var(X) = E X µx x2

− ( 5.5 ) Στην περίπτωση που η Χ είναι µία διακριτή τυχαία µεταβλητή, η διασπορά της

δίνεται από την σχέση :

( ) ( ) ( )σ = E X µ = x µ f x x2

x2

j x

2

jj=1

n

− −∑ ( 5.6 )

από την οποία για f(x1) = f(x2) = …. = f(xn) προκύπτει ότι :

( ) ( )σ = E X µ = 1n

x µ x2

x2

j x

2

j=1

n

− −∑ ( 5.7 )

Εάν η Χ είναι µία συνεχής µεταβλητή τότε η διασπορά της θα υπολογίζεται µε τη

βοήθεια της ακόλουθης σχέσης :

( ) ( )σ = E X µ = x µ f(x) dx x2

x2

x2

− −−∞

∫+

( 5.8 )

Η γνώση των παρακάτω κανόνων αναφορικά µε τη µαθηµατική ελπίδα και τη

διασπορά, θα µας χρησιµεύσουν ιδιαίτερα προκειµένου να προσδιορίσουµε το µέγεθος αυτών των παραµέτρων :

( i ) E(α) = α , όπου α µία σταθερά ( ii ) E( α + βΧ) = α + βΕ(Χ) , όπου α , β δύο σταθερές ( iii ) E[(αΧ)2] = α2 Ε(Χ2) ( iv ) E(X1 + X2 + .... + Xn) = E(X1) + E(X2) + .... + E(Xn) ( v ) Var(α) = 0 ( vi ) Var( α + βΧ ) = β2 Var(X) ( vii ) Var( βΧ ) = β2 Var(X) ( viii ) Var( X1 ± X2 ) = Var(X1) + Var(X2) ± 2Cov( X1 , X2 )

(ix) ( )( ) ( ) ( )

ςανεξάρτητεείναι δεν Χ , Χοι εάν , XE XE X XE

µεταβλητές ςανεξάρτητε δύοείναι Χ , Χ εάν , 0 X , XCov

212121

21

21

−=

81

Page 82: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Άσκηση 1 : Αν η τυχαία µεταβλητή Χ εκφράζει τον αριθµό που έρχεται όταν ρίχνεται ένα ζάρι να υπολογιστεί η µέση τιµή, η διακύµανση και η τυπική απόκλιση της Χ. ( « Εφαρµοσµένη Στατιστική » , Μ. Μανατάκη , σελ. 4.1 , παράδ. 4.1 )

Λύση

Κατά την ρήψη του ζαριού κάθε ένας από τους έξι αριθµούς έχει την ίδια πιθανό-τητα επιτυχίας. Με άλλα λόγια η συνάρτηση πυκνότητας πιθανότητας της διακριτής µεταβλητής Χ έχει ως εξής :

f(xj) = 1/6 , xj = j µε j = 1 , 2 , …. , 6

Η µέση τιµή και η διακύµανση της Χ έχουν αντιστοίχως ως εξής :

( )

µ = x f( x ) = x f(x ) + x f(x ) + x f(x ) + x f(x ) + x f(x ) + x f(x ) =

= 1 16

+ 2 16

+ 3 16

+ 4 16

+ 5 16

+ 6 16

= 16

1 + 2 + 3 + 4 + 5 + 6 = 216

= 3,5

x j jj=1

6

1 1 2 2 3 3 4 4 5 6 6 6∑

και

( ) ( ) ( )

( ) ( ) ( ) ( ) ( ) ( ) ( ) (

( ) ( ) ( ) ( )

)

σ = E X µ = x µ f x =

= x µ f x + x µ f x + x µ f x + x µ f x +

+ x µ f x + x µ f x =

= 1 216

16

+ 2 216

16

+ 3 216

16

+

x2

x2

j

2

jj=1

n

1 x2

1 2 x2

2 3 x2

3 4 x2

4

5 x2

5 6 x2

6

2 2 2

− −

− − − −

− −

4 216

16

+

+ 5 216

16

+ 6 216

16

= 16

352

= 3512

2,917

2

2 2

Η τυπική απόκλιση της Χ δίνεται όπως γνωρίζουµε από την τετραγωνική ρίζα

της διακύµανσης. Έχουµε έτσι ότι :

σ = σ = 3512

1,708x x2 ≅

82

Page 83: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Άσκηση 2 : Αν η τυχαία µεταβλητή Χ ακολουθεί την οµοιόµορφη κατανοµή, να δειχθεί ότι :

( ) ( )( i ) ( ii ) µ = 12

α + β & σ = 1

12 β αx x

2 2−

Λύση

∆εδοµένου ότι η τυχαία µεταβλητή X ~ U(α,β) , η µέση τιµή και η διασπορά της θα προσδιορισθούν αντιστοίχως µε τη βοήθεια των παρακάτω σχέσεων :

( ) ( ) ( )µ = x f x dx & σ = E X E Xx

+

x2 2 2

−∞

∫ −

όπου

( )[ ]

f x =

1β α

, αν α x β

, αν x α , β

−≤ ≤

0

η συνάρτηση πυκνότητας πιθανότητας της Χ.

Έχουµε λοιπόν ότι :

(i) ( ) ( ) ( ) ( ) [ ]µ = Ε Χ =x x f x dx = x

β α dx =

1β α

x dx = 1

β α x

+

α

β 2

α

β 2α

β

−∞

∫ ∫ ∫− −=

′−

22

( ) ( ) ( ) ( )( )= 1

β α β α =

1β α

β + α β α 2 2

2 2−−

−− =

β + α2

(ii) ∆εδοµένου ότι :

( ) ( ) ( ) ( ) [ ]

( )( ) ( )

( )( )

E X = x f x dx = x

β α dx =

1β α

x dx = 1

β α x

= β αβ α

= β α β + βα + α

β α =

β + α βα

2 2+ 2

α

β 3

α

β 3α

β

3 3 2 2

−∞

∫ ∫ ∫− −′

−−

33

3 3 3

2

=

η διακύµανση της Χ θα έχει ως ακολούθως :

( ) ( ) ( ) ( ) ( )σ = E X E X =x

2 2 2−−

−−

β + α βα

β + α2

= β + α βα

β + α

=22 2

3 3

2

4

83

Page 84: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( ) ( ) ( ) ( )

= β + α 4βα 3 β + α

12 =

β + α 4βα12

4

2 2 2− − − −

= β α

12

2

Άσκηση 3 : Να προσδιορισθούν τα παρακάτω µεγέθη εάν είναι γνωστό ότι η τυχαία

µεταβλητή Χ ακολουθεί την αρνητική εκθετική κατανοµή :

( i ) E( a – bX2 ) ( ii ) Var( a – bX ) όπου a , b δύο θετικές σταθερές.

Λύση

Η συνάρτηση πυκνότητας πιθανότητας της µεταβλητής Χ η οποία ακολουθεί την αρνητική εκθετική κατανοµή έχει ως εξής :

f(x) = λ e , x 0

0 , x < 0

λx− ≥

Βάσει αυτής µπορούµε να προσδιορίσουµε τα παρακάτω µεγέθη :

( ) ( )

[ ] ( )

[ ]( )

( )

• −′

− ′ − −′

− − −′

′ − −

−∞

∞−

→ ∞

→ ∞

→ ∞

→ ∞

→ ∞

→ ∞ → ∞

→ ∞ → ∞

∫ ∫ ∫

∫ ∫

E X = x f(x) dx = λ x e dx = lim x e dx =

= lim xe + lim x e dx = lim ue + 0 1λ

lim e dx =

= limu

e 1λ

lim e = limu

e

lim e 1 =

=

+ λx

0

+

u +

λx

0

u

u +

λx0

u

u +

λx

0

u

u +

λu

u +

λx

0

u

u + λu u +

λx0

u

u + λu u +

λu

− − −→ ∞ → ∞

−lim1

λe

lim e + 1λ

= 0 0 + 1λ

u + λu u +

λu = 1λ

( ) ( )

[ ] ( )

( ) ( )( )

• −′

−′

− −

− − −′

′ − −

−∞

∞ −∞

→ ∞

→ ∞

→ ∞

→ ∞

→ ∞

→ ∞ → ∞ → ∞

∫ ∫ ∫

∫ ∫

E X =2 x f(x) dx = λ x e dx = lim x e dx =

= lim x e + lim x e dx = lim u e + 0 2λ

lim λxe dx =

= limue

Ε Χ = limu

e

= lim

2+ 2 λx

0

+

u +

2 λx

0

u

u +

2 λx0

u

u +

2 λx

0

u

u +

2 λu

u +

λx

0

u

u +

2

λu u +

2

λu u +

2uλe

=λu 2−

84

Page 85: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

( )

= 2λ

limu

e

= 2λ

lim1

λe

= 0 2λ

= u + λu

2 u + λu 2 2−′

′ − − − − −→ ∞ → ∞

2λ 2

( ) ( ) ( )• − −

Var X = =

1λ 2 E X E X =

2 22

2

Έχουµε λοιπόν ότι :

( i ) E( a – bX2 ) = E( a ) – b E( X2 ) = a + 2b/λ2 ( ii ) Var( a – bX ) = b2 Var( X ) = b2/λ2 Άσκηση 4 : Αν γνωρίζουµε ότι η µέση τιµή και η διακύµανση της τυχαίας

µεταβλητής Χ ~ U(α,β) είναι αντιστοίχως ίσες µε 1/2 και 1/3, να προσδιορισθούν οι θετικές τιµές των παραµέτρων α & β της οµοιό-µορφης κατανοµής.

Λύση

Όπως γνωρίζουµε η µέση τιµή και η διακύµανση µίας τυχαίας µεταβλητής Χ η οποία ακολουθεί την οµοιόµορφη κατανοµή U(α,β) δίνονται αντιστοίχως από τις παρακάτω σχέσεις :

( ) ( )µ =

β + α2

& Var X = β α

12x

2−

Βάσει αυτών των σχέσεων, και δεδοµένου ότι µx = 1/2 και Var(X) = 1/3,

µπορούµε να σχηµατίσουµε ένα καλά ορισµένο σύστηµα εξισώσεων από την επίλυση του οποίου θα προκύψουν οι τιµές των α και β. Πιο συγκεκριµένα έχουµε ότι :

( ) ( ) ( )

µ = 12

Var X = 13

β + α2

= 12

β α12

= 13

β + α = 1

β α = 4

α = 1 β

β α = 2

α = 1 β

β = α 2

α = 1 α 2

β = α 2

2α = 1 2

β = α 2

x

2 2

⇒−

⇒−

⇒−

− ±

⇒−

±

⇒−

±

⇒±

⇒±

m m mα = 1/2 1

β = 1/2 1

85

Page 86: ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ∆ΟΝΙΑ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ …users.uom.gr/~dimioan/files/statistiki_Ι.pdfΚατά συνέπεια το πλάτος d του

Βιβλιογραφία • Ιωαννίδης ∆. (1999), « Στατιστικές Μέθοδοι » , τόµος Α’ , εκδόσεις ΖΗΤΗ. • Κάτος Α. (1986), « Στατιστική » , εκδόσεις Παρατηρητής. • Μανατάκης Α. (1993), « Εφαρµοσµένη Στατιστική » , εκδόσεις Συµµετρία. • Πέκος Γ. (1993), « Ασκήσεις Στατιστικής ». • Ζαχαροπούλου Χ. (1993), « Στατιστική – Μέθοδοι και Εφαρµογές » , τόµος Α’. • Ζαχαροπούλου Χ. (1995), « Ασκήσεις Στατιστικής ». • Spiegel M.R. (1977), « Πιθανότητες και Στατιστική » , Μετάφραση Περσίδης

Σ.Κ. , Mc Graw Hill – New York , ΕΣΠΙ – ΑΘΗΝΑ.

86