Στατιστικές Κατανομές και Πιθανότητες. Θεωρία και...

Στατιστικές Κατανομές και Πιθανότητες. Θεωρία και παραδείγματα. Γκούμας Στράτος. Πτυχιούχος Οικονομολόγος.

MSc ‘Εφαρμοσμένη Οικονομική και Χρηματοοικονομική (Ε.Κ.Π.Α./ Τμήμα Οικονομικών)’

Team Site: A.E.A.C. Co. Project Manager-Site Administrator

e-mail: [email protected] , My Blog, Twitter 16/07/2011

ΕΙΣΑΓΩΓΗ Η στατιστική αποτελεί ένα επιστημονικό κλάδο όπου το πεδίο εφαρμογής της

συγκαταλέγεται σε πλήθος άλλων επιστημών. Η συλλογή και η ανάλυση δεδομένων

έχει γίνει πλέον επιτακτική πριν τη λήψη αποφάσεων. Έτσι λοιπόν σε μια επιχείρηση/

οργανισμό οι ερευνητές ασχολούνται με τη συλλογή και την επεξεργασία

στατιστικών στοιχείων ώστε να διευκολύνουν τα υπόλοιπα στελέχη στη λήψη ορθών

αποφάσεων όπου θα ωφελήσουν την πορεία την επιχείρησης.

Ένας βασικός κλάδος της στατιστικής είναι η κατανόηση των στατιστικών

κατανομών. Οι κατανομές αποτελούν ένα μαθηματικό υπόδειγμα μοντελοποίησης

των στατιστικών δεδομένων. Τα μαθηματικά μοντέλα απαλλάσσουν τους ερευνητές

από περιορισμός και τους επιτρέπουν να εργαστούν και να αναπτύξουν θεωρίες υπό

ιδανικές συνθήκες. Σκοπός των κατανομών είναι να προσομοιωθεί μια σειρά

δεδομένων με βάση ένα μαθηματικό μοντέλο το οποίο έχει συγκεκριμένες ιδιότητες.

Η κατανόηση και η μοντελοποίηση του συνόλου υπό μια στατιστική κατανομή έχει

πολλαπλά οφέλη όπως 1) Είναι δυνατή η πρόβλεψη των μελλοντικών τιμών της

σειράς 2) Κατανόηση των περιγραφικών μεγεθών (μέση τιμή, διακύμανση, διάμεσος

κτλ), το οποίο συνεπάγεται ότι υπάρχει η δυνατότητα να κατανοούμε εκ των

πρότερων της εξέλιξη της σειράς. 3) Μοντελοποίηση πολλαπλών σειρών σε πιο

σύνθετα υποδείγματα με γνώστες ιδιότητες. 4) Έχοντας γνώση των αδυναμιών του

εκάστοτε μοντέλου/ κατανομής έχουμε τη δυνατότητα διόρθωσης αυτών των

σφαλμάτων και των αποτελεσμάτων.

https://sites.google.com/site/econewssg/home

http://econews-sg.blogspot.com/

https://twitter.com/peri_oikonomias

https://twitter.com/peri_oikonomias

ΠΕΡΙΛΗΨΗ

Στην παρουσιαση αυτή θα επιδείξουμε μερικες βασικές στατιστικές κατανομές

που χρησιμοποιούνται ευρέως καθώς και μερικές πιο προχωρημένες. Οι κατανομές

κατηγοριοποιούνται σε δυο βασικές ομάδες. 1) Διακριτές 2) Συνεχείς. Οι Συνεχείς

χωρίζονται στις εξής υποομάδες α) Φραγμένες β) Μη Φραγμένες 3) Μη Αρνητικές.

Διακριτή Κατανομή. Η μεταβλητή λαμβάνει μεμονωμένες τιμές σε ένα διάστημα

[α,β].

Παράδειγμα. 1) Αριθμός παιδιών (0,1,2,3, κτλ), 2) Φορολογικός Συντελεστής (0%,

10%, 30%, 40%). Μεταξύ αυτών των μεμονωμένων τιμών ΔΕΝ λαμβάνονται άλλες

τιμές. Τουτέστιν, δεν είναι δυνατό να υπάρξουν 2.5 παιδιά. Επίσης δεν είναι δυνατό

(προς το παρόν) να υπάρξει Φορολογικός Συντελεστής 10.78%.

Συνεχής Κατανομή. Η μεταβλητή λαμβάνει οποιεσδήποτε τιμές μεταξύ δυο

μεμονωμένων τιμών σε ένα διάστημα [α,β]. Όταν η κατανομή είναι συνεχής τότε η

πιθανότητα Ρ υπολογίζεται ως ∫=<<b

a

dxxfbxaP )()(

Παράδειγμα. 1) Ηλικία (15, 50, 60 κτλ), 2)Ύψος (1.75, 1.80, 1.90 κτλ). Μεταξύ

αυτών των μεμονωμένων τιμών λαμβάνονται όλες οι ενδιάμεσες τιμές. Δηλαδή,

υφίστανται ηλικίες 20 ετών και 2 μηνών, 35 ετών 5 μηνών και 4 ημερών κτλ. Ομοίως

υπάρχει τιμή ύψους 1.76, 1.77, 1.80 και 4 χιλιοστά κτλ

Συνεχής Κατανομή (Μη Φραγμένη). Τούτη η κατανομή λαμβάνει όλες τις πιθανές

τιμές στο διάστημα (-∞,+∞).

Συνεχής Κατανομή (Φραγμένη). Τούτη η κατανομή λαμβάνει όλες τις πιθανές τιμές

στο διάστημα [α,β]

Συνεχής Κατανομή (Μη αρνητική). Οι περισσότερες μη αρνητικές κατανομές

ορίζονται για x>γ ετσι ώστε x-γ>0, όπου γ είναι συνεχής παράμετρος.

Για την παρουσίαση των συνεχών στατιστικών κατανομών έχουμε χρησιμοποιήσει

κυρίως το πρόγραμμα Easy Fit 5.1 καθώς και μερικές στατιστικές συναρτήσεις του

excel. Το Easy Fit 5.1 περιλαμβάνει περίπου 50 κατανομές, οπότε ο ενδιαφερόμενος

έχει μεγάλο εύρος επιλογής. Κατά την άποψή μου, είναι ένα πλήρες πρόγραμμα

οπότε είναι βέβαιο ότι οι δυνατότητες του θα εξυπηρετήσουν τις ανάγκες που

εκάστοτε ενδιαφερομένου.

Για τις διακριτές κατανομές θα παρουσιάσουμε παραδείγματα και εφαρμογές σε κάθε

ενότητα.

Για τις συνεχείς κατανομής έχουμε χρησιμοποιήσει τις αποδόσεις μιας μετοχής

λαμβάνοντας δεδομένα για 4 μήνες. Σκοπός μας είναι χρησιμοποιώντας το

πρόγραμμα Easy Fit 5.1 να μελετήσουμε και να κατανοήσουμε την προσαρμογή των

συνεχών κατανομών στα δεδομένα που διαθέτουμε.

Κατανομές που διαθέτει το Easy Fit 5.1.

Συνεχείς Φραγμένες: Beta, Johnson SB, Kumaraswamy, Pert, Power Function,

Reciprocal, Triangular, Uniform,

Συνεχείς Μη Φραγμένες: Cauchy, Error, Gumbel Max Gumbel Min, Hyperbolic

Secant, Johnson SU, Laplace (Double Exponential), Logistic, Normal, t-Student

Συνεχείς Μη Αρνητικές Burr, Levy, Gamma, Inverse Gaussian, F Distribution,

Fatigue Life (Birnbaum-Saunders), Frechet, Chi-Squared, Dagum, Erlang,

Exponential, Weibull, Rice, Rayleigh, Pearson, Pareto, Nakagami, Lognormal,

Log-Logistic, Log-Gamma.

Διακριτές: Bernoulli, Binomial Discrete Uniform, Geometric, Hypergeometric,

Logarithmic, Negative Binomial, Poisson.

Προχωρημένες Κατανομές: Generalized Extreme Value, Generalized Logistic,

Generalized Pareto, Phased Bi-Exponential, Phased Bi-Weibull, Wakeby.

Στην παρουσίασή μας δεν είναι δυνατόν να αναλύσουμε λεπτομερώς όλες τις

παραπανω κατανομές. Θα επιλέξουμε μερικές από αυτές οι οποίες έχουν ευρεία

χρήση και εφαρμογή. Εξάλλου πολλές από αυτές προσεγγίζονται ικανοποιητικά από

την κανονική κατανομή, όπως θα εξηγήσουμε παρακάτω, οπότε έχουμε την ευχέρεια

να χρησιμοποιούμε την κανονική κατανομή στην περίπτωση που αντιμετωπίζουμε

δυσκολίες με τη χρήση άλλων πιο εξειδικευμένων κατανομών.

----------------ΣΥΝΕΧΕΙΣ ΚΑΤΑΝΟΜΕΣ

Α) ΜΗ ΦΡΑΓΜΕΝΕΣ ΚΑΤΑΝΟΜΕΣ [διάστημα (-∞, +∞)]

ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ (Laplace-Gauss ή NORMAL DISTRIBUTION)

Η κανονική κατανομή είναι η πιο συνήθης συνεχής συνάρτηση κατανομής.

Επινοήθηκε από τον Gauss και χρησιμοποιείται για να περιγράψει μεγέθη που είναι

συγκεντρωμένα γύρω από μια μέση τιμή. Η κανονική κατανομή, γνωστή και ως

‘’καμπάνα’’, προσαρμόζεται σε δεδομένα όπου υποθέτουμε ότι η κατανομή είναι

μεσοκυρτη (βαθμός κυρτωσης=3) και συμμετρική (βαθμός ασυμμετριας=0)

Η σημασία της προέρχεται κυρίως από το κεντρικό οριακό θεώρημα, σύμφωνα με το

οποίο το άθροισμα μεγάλου αριθμού ανεξάρτητων και ισόνομων τυχαίων

μεταβλητών είναι κανονικά κατανεμημένο.

Συνάρτηση Πυκνότητας Πιθανότητας1 (σ.π.π.)

2)(*2

1

2*1)( σ

μ

πσ

−−=

xexf , Συμβολισμός Χ~Ν(μ,σ)

1 Συνάρτηση Πυκνότητας Πιθανότητας- Probability Density Function

Αθροιστική Συνάρτηση Πιθανότητας- Cumulative Distribution Function

Αθροιστική Συνάρτηση Πιθανότητας1

F(x)= ⎟⎠⎞

⎜⎝⎛ −

Φσμx

, Φ είναι το ολοκλήρωμα Laplace // Φ(x)= dtex t

∫−

02

2

*21π

Εναλλακτικά με μετασχηματισμό έχουμε ότι F(x)=z=σμ−x

,

Όπου σ>0 (scale parameter/ τυπική απόκλιση),

R∈μ (location parameter/ μέση τιμή) και +∞<<∞− x

ΓΡΑΦΗΜΑ NORMAL ΚΑΤΑΝΟΜΗΣ

Probability Density Function

Histogram Normal

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

Ορισμός

Αν η τυχαία μεταβλητή Χ~ Ν(μ,σ2) τότε για τα κατωθι διαστήματα ισχύει

[μ-σ, μ+σ] 68.28%

[μ-2σ, μ+2σ] 95.44%

[μ-3σ, μ+3σ] 99.75%

Παράδειγμα 1) Έστω μια μεταβλητή Χ ακολουθεί την κανονική κατανομή Χ~Ν(8,9). Να βρεθεί η

πιθανότητα . )105( ≤≤ XP

Από τα δεδομένα έχουμε ότι μ=8 και σ2=9

Χρησιμοποιώντας τον μετασχηματισμό z=σμ−x

θα έχουμε ότι

z=3

85−= -1

z=3

810 −= 0.66

Άρα θα έχουμε ότι

)105( ≤≤ XP = = )66,01( ≤≤− zP

)66,0( ≤zP - )1( −≤zP = -)66,0( ≤zP ))1(1( ≤− zP

0,7454-(1-0,8413) = 0,8413

(βλ. πινάκες της κανονικής κατανομής από βιβλία στατιστικής )

Για να κατανοήσουμε την παραπανω διαδικασία έχουμε σχεδιάσει προσεγγιστικά το

εξής γράφημα, όπου ουσιαστικά έχουμε υπολογίσει το εμβαδόν από το (-∞, 0.66) και

το εμβαδόν από το (-∞, -1). Έπειτα αφαιρώντας αυτά τα δυο εμβαδά υπολογίσουμε το

εμβαδόν στο (-1, 0.66)

2) Έστω Χ~Ν(3,σ2) και έχουμε επίσης ότι .7291,0)5,1( =≥XP

Να βρεθεί το σ2

Από τον μετασχηματισμό z=σμ−x

έχουμε ότι z=σ

35,1 − z=

σ5,1−

.7291,0)5,1( =≥XP z= 0.61 (Βλ. πινάκες της κανονικής κατανομής από βιβλία

στατιστικής)

Επειδή όμως z<0, (εξ ορισμού τυπική απόκλιση (σ) > 0), λογω συμμετρίας θα έχουμε

z= -0.61

Αρά -0.61=σ

5,1− σ=2,46 (Αν καταλήγαμε ότι σ<0 οφείλουμε να ελέγξουμε για την

ύπαρξη σφάλματος στην διαδικασία μας))

ΛΟΓΙΣΤΙΚΗ ΚΑΤΑΝΟΜΗ (LOGISTIC DISTRIBUTION) Συνάρτηση Πυκνότητας Πιθανότητας

2)1(*)(

ze

zexf−+

−=σ

, Συμβολισμός X~Logistic(μ,σ)

Αθροιστική Συνάρτηση Πιθανότητας

zexF −+=

11)( ,

Όπου σμ−

=xz ,

σ>0 (scale parameter), R∈μ (location parameter) και +∞<<∞− x

Παρατήρηση: Η λογιστική κατανομή εμφανίζει πολλές ομοιότητες με την κανονική

κατανομή. Χρησιμοποιείται κυρίως στην περίπτωση που η σειρά προσεγγίζεται από

την κανονική κατανομή αλλά εμφανίζει παχιές ουρές 2.

Εφαρμογές Λογιστικής Κατανομής: Επιδημιολογία, Βιολογία (Ρυθμός αύξησης

πληθυσμού), Ψυχολογία (Ρυθμός μάθησης) κτλ

2 Παχιές ουρές Πλακυκυρτη (Βαθμός Κυρτωσης<3) Λεπτές ουρές Λεπτοκυρτη (Βαθμός Κυρτωσης>3)

ΓΡΑΦΗΜΑ LOGISTIC ΚΑΤΑΝΟΜΗΣ


Histogram Logistic

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

CAUCHY ΚΑΤΑΝΟΜΗ (CAUCHY DISTRIBUTION)

Η κατανομή Cauchy επινοήθηκε από τους Augustin Cauchy και Hendrik Lorentz

Τούτη η κατανομή αποτελεί ένα πρότυπο για κατανομές που δεν έχουν μέση τιμή και

διακύμανση, εντούτοις η επικρατούσα τιμή και η διάμεσος είναι καλά ορισμένες.

Μοιάζει πολύ με την κατανομή Poisson Kernel.

Όταν δυο μεταβλητές Χ,Υ ακολουθούν την κανονική κατανομή με μέση τιμή ιση με

μηδέν και σταθερή διακύμανση ίση με την μονάδα, τότε το πηλίκο Χ/Υ ακολουθεί

την τυπική Cauchy κατανομή.

http://en.wikipedia.org/wiki/Augustin_Cauchy

http://en.wikipedia.org/wiki/Hendrik_Lorentz

Συνάρτηση Πυκνότητας Πιθανότητας

12)))(1(**()( −−+=σμσπ xxf , Συμβολισμός X~C(μ,σ)


5.0arctan1)( +−= ⎟⎠⎞

⎜⎝⎛

σμ

πxxF

όπου σ>0 (scale parameter ) , R∈μ (location parameter)

arctan αντίστροφη συνάρτηση εφαπτομένης και +∞<<∞− x

ΓΡΑΦΗΜΑ CAUCHY ΚΑΤΑΝΟΜΗΣ


Histogram Cauchy

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

JOHNSON SU ΚΑΤΑΝΟΜΗ (JOHNSON SU DISTRIBUTION) Τούτη η κατανομή που επινοήθηκε από τον Norman Lloyd Johnson (1917-2004).

Στην ίδια οικογένεια ανήκουν η Johnson SB και Log-Normal κατανομές. Αυτές οι

τρεις κατανομές είναι παρόμοιες με την κανονική κατανομή ωστόσο δεν έχουν τους

περιορισμούς της, καθώς διαθέτουν εκείνες τις ιδιότητες που τις καθιστούν ικανές να

προσαρμοστούν σε δεδομένα με διάφορες τιμές ασυμμετρίας και κύρτωσης, ιδιότητες

τις οποίες δεν διαθέτει η κανονική κατανομή.

Η κανονική κατανομή, γνωστή και ως ‘’καμπάνα’’, προσαρμόζεται σε δεδομένα

όπου υποθέτουμε ακολουθούν μια κατανομή μεσόκυρτη (βαθμός κυρτωσης=3) και

συμμετρική (βαθμός ασυμετριας=0). Ωστόσο, επειδή στην πράξη τούτο σπάνια

συμβαίνει, οι προαναφερθείσες κατανομές είναι ιδανικές σε περιπτώσεις όπου δεν

ισχύουν οι υποθέσεις της κανονικής κατανομής. Ειδικότερα για τις λεπτοκυρτες

κατανομές, οι Johnson SB, Johnson, SU και Log-Normal είναι αποτελεσματικότερες

και πιο ιδανικές από την κανονική.


2))12ln(*(*5.0

*)(1*2* 2

+++−

+=

zzexf

z

δγ

πλδ ,

Συμβολισμός Χ~ Jsu(γ,δ,λ,ξ)


))1ln(* 2()( +++Φ= zzxF δγ

όπου λξ−

=xz , Φ Ολοκλήρωμα Laplace // Φ(x)= dte

x t∫−

0

2

2*21π

Επίσης τα γ,δ,λ,ξ είναι παράμετροι με δ,λ>0. ),( +∞−∞∈x

γ,δ (shape parameter), λ (scale parameter), ξ (location parameter)

ΓΡΑΦΗΜΑ JOHNSON SU ΚΑΤΑΝΟΜΗΣ


Histogram Johnson SU

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

LAPLACE ή DOUBLE EXPONENTIAL ΚΑΤΑΝΟΜΗ (LAPLACE ή DOUBLE EXPONENTIAL DISTRIBUTION)

Τούτη η κατανομή επινοήθηκε από τον Pierre-Simon Laplace. Ονομάζεται και double

exponential (διπλή εκθετική) κατανομή διοτι το γράφημά της μοιάζει με δυο

εκθετικές κατανομές η μια διπλά στην άλλη και συμμετρικές ως προς τον

κατακόρυφο άξονα..

Από μαθηματικής απόψεως έχει κοινά χαρακτηριστικά με την κανονική κατανομή

καθώς η μεν Laplace εκφράζεται σε απόλυτες διαφορές η δε κανονική σε διαφορές

τετραγώνων (βλ τα αντίστοιχα ‘’Συνάρτηση Πυκνότητας Πιθανότητας’’).


||**)(

2

μλλ −−=

xexf , Συμβολισμός Χ~ Laplace(μ,λ)


μ

μ

μλ

μλ

>−

≤

=−−

−−

xe

xe

xFx

x

)(*

)(*

*211

*21

)(

Όπου λ, μ είναι παράμετροι με λ>0. ),( +∞−∞∈x

λ (scale parameter ) , μ (location parameter)

ΓΡΑΦΗΜΑ LAPLACE ΚΑΤΑΝΟΜΗΣ


Histogram Laplace

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

LOG-NORNAL ΚΑΤΑΝΟΜΗ με 3- παραμέτρους (LOG-NORNAL DISTRIBUTION 3Ρ)

Μια μεταβλητή Χ ακολουθεί την Log-Normal κατανομή όταν ο λογάριθμός της

ακολουθεί την κανονική κατανομή.

Μια μεταβλητή είναι πιθανό να ακολουθεί την Log-Normal κατανομή όταν είναι

αποτέλεσμα πολλών τυχαίων θετικών μεταβλητών. Συνήθως οι χρηματοοικονομικές

σειρές3 (μετοχές, παράγωγα κτλ) προσεγγίζονται ικανοποιητικά από την Log-Normal

κατανομή. Επίσης έχει παρατηρηθεί ότι οι λογάριθμοι βιολογικών μεταβλητών

(μήκος μαλλιών/ νυχιών, ύψος, βάρος, πίεση) τείνουν να ακολουθούν την κανονική

κατανομή)

3 Για μετοχές ισχύει συνήθως το εξής: Όταν η απόδοση μια μετοχής ακολουθει την κανονική κατανομή τότε η τιμή ακολουθει την Log-Normal κατανομή


πσγ

σμγ

*2**)()(

2)ln(*5.0

−=

⎟⎠⎞

⎜⎝⎛ −−−

xxf

x

e , Συμβολισμός Χ~ LogN(μ,σ,γ)


⎟⎠⎞

⎜⎝⎛ −−Φ=

σμγ )ln()( xxF

Φ Ολοκλήρωμα Laplace // Φ(x)= dtex t∫−

0

2

2*21π

Όπου σ, μ, γ είναι παράμετροι με σ>0. ),( +∞∈ γx

σ (scale parameter ), μ (shape parameter), γ (location parameter)

Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Log-Normal

κατανομή 2-παραμετρων (Log-Normal 2Ρ). Το τυπολογιο των συναρτήσεων των

πιθανοτήτων της Log-Normal 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι

θέτουμε γ=0

ΓΡΑΦΗΜΑ LOG-NORMAL ΚΑΤΑΝΟΜΗΣ


Histogram Lognormal (3P)

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

GAMMA ΚΑΤΑΝΟΜΗ με 3-παραμέτρους (GAMMA 3Ρ DISTRIBUTION)

Τούτη η κατανομή προσεγγίζει συχνά μοντέλα μεταβλητών αναμονής (waiting time

models). Λόγου χάρη, η αναμονή μέχρι την απεβίωση, ο υπολογισμός του ρυθμού της

βροχόπτωσης και οι ασφαλιστικές αποζημιώσεις είναι μερικές μεταβλητές που

προσεγγίζονται από την Gamma κατανομή.


β

γ

α

α

αβγ

)(1

*)(*

)()(

−−−

Γ

−=

x

exxf , Συμβολισμός Χ~ Γ(α,β,γ)


)(

)(/)()(α

αβγΓ

Γ −= xxF

Γx(α) ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = dtet tax −−∫ *0

1

Όπου α, β, γ είναι παράμετροι με α,β>0, R∈γ ),( +∞∈ γx

α (shape parameter), β (scale parameter) , γ (location parameter)

Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Gamma κατανομή

2-παραμετρων (Gamma 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της

Gamma 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0

Αν Ζ∈α τότε η Gamma κατανομή αναπαριστά την Erlang κατανομή

ΓΡΑΦΗΜΑ GAMMA ΚΑΤΑΝΟΜΗΣ


Histogram Gamma (3P)

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

WEIBULL ΚΑΤΑΝΟΜΗ με 3-παραμέτρους (WEIBULL 3Ρ DISTRIBUTION)

Τούτη η κατανομή περιγράφθηκε ολοκληρωμένα και από τον Waloddi Weibull

(1887-1979), ωστόσο υπήρχαν και προγενέστερες αναφορές από άλλους επιστήμονες.

Έχει κοινά χαρακτηριστικά με την Εκθετική (Exponential) και την Rayleigh

κατανομή. Πιο συγκεκριμένα, παρεμβάλλεται μεταξύ της Εκθετικής (α=1) και της

Rayleigh (α=2). Η Weibull κατανομή υπολογίζει τον ρυθμό αποτυχίας ενός

ενδεχόμενου για ένα χρονικό διάστημα. Για α<1, ο ρυθμός αποτυχίας φθίνει καθώς ο

χρόνος κυλάει, για α=1 ο ρυθμός αποτυχία είναι σταθερός, ενώ για α>1 ο ρυθμός

αποτυχίας αυξάνει με το πέρασμα του χρόνου. (βλ. παρακάτω το τυπολόγιο)

Η Weibull κατανομή χρησιμοποιείται στην βιομηχανία για να περιγράψει το χρόνο

κατασκευής και παράδοσης ενός προϊόντος, στην μετεωρολογία, στις τηλεπικοινωνίες

κ.α.


α

βγα

βγ

βα ⎟

⎠⎞

⎜⎝⎛

⎟⎟⎠

⎞⎜⎜⎝

⎛−

−−

−=

x

exxf **)(

1

, Συμβολισμός Χ~ W(α,β,γ)


α

βγ⎟⎠⎞

⎜⎝⎛ −

−−=

x

exF 1)(

Όπου α, β, γ είναι παράμετροι με α,β>0, R∈γ ),( +∞∈ γx


http://en.wikipedia.org/wiki/Rayleigh_distribution

http://en.wikipedia.org/wiki/Rayleigh_distribution

Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Weibull κατανομή

2-παραμετρων (Weibull 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της

Weibull 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0

ΓΡΑΦΗΜΑ WEIBULL ΚΑΤΑΝΟΜΗΣ


Histogram Weibull (3P)

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

FATIGUE LIFE ΚΑΤΑΝΟΜΗ ή (Birnbaum–Saunders) με 3-παραμέτρους

(FATIGUE LIFE 3Ρ DISTRIBUTION)

Τούτη η κατανομή επινοήθηκε για να προσδιοριστεί η αποτυχία στον κύκλο ζωής

μιας κατασκευής εξαιτίας των φθορών. Με το μοντέλο αυτό, είναι δυνατό να

εντείνουμε το ρυθμό των φθορών ώστε να προσεγγιστεί το μέγεθος εκείνο που θα

προκαλέσει την κατάρρευση της κατασκευής. Στην ιδία κατηγορία με αυτή την

κατανομή ανήκουν η Lognormal, Exponential and Weibull.

http://www.vosesoftware.com/ModelRiskHelp/Distributions/Continuous_distributions/Lognormal_distribution.htm

http://www.vosesoftware.com/ModelRiskHelp/Distributions/Continuous_distributions/Exponential_distribution.htm

http://www.vosesoftware.com/ModelRiskHelp/Distributions/Continuous_distributions/Weibull_distribution.htm

Χρησιμοποιείται κυρίως για να καθοριστεί η ζημία σε μηχανικά, ηλεκτρολογικά,

οικοδομικά υλικά, στις ασφαλιστικές απαιτήσεις αλλά και στα σοκ των αγορών.


⎟⎟

⎠

⎞

⎜⎜

⎝

⎛

⎟⎟

⎠

⎞

⎜⎜

⎝

⎛

−−−

−−

+−

=γ

ββγ

αφ

γγ

ββγ

xx

xax

x

xf *1*)(**2

)(

Συμβολισμός Χ~ BS(α,β,γ)


⎟⎟

⎠

⎞

⎜⎜

⎝

⎛

⎟⎟

⎠

⎞

⎜⎜

⎝

⎛

−−−Φ=

γβ

βγ

α xxxF *1)(

Όπου Φ Ολοκλήρωμα Laplace // Φ(x)= dtex t∫−

0

2

2*21π

φ π*2

22x

e−

α, β, γ είναι παράμετροι με α,β>0, R∈γ ),( +∞∈ γx


Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Fatigue Life

κατανομή 2-παραμετρων (Fatigue Life 2Ρ). Το τυπολόγιο των συναρτήσεων των

πιθανοτήτων της Fatigue Life 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι

θέτουμε γ=0

ΓΡΑΦΗΜΑ FATIGUE LIFE ΚΑΤΑΝΟΜΗΣ


Histogram Fatigue Life (3P)

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

ERLANG ΚΑΤΑΝΟΜΗ με 3 παραμέτρους (ERLANG 3Ρ DISTRIBUTION)

Η κατανομή Erlang επινοήθηκε από τον μαθηματικό Agner Krarup Erlang (1878 –

1929). Ανήκει στην ίδια οικογένεια και έχει πολλές ομοιότητες με την Gamma και

Exponential κατανομή. Αρχικά χρησιμοποιήθηκε από τον Agner Krarup Erlang για

να μελετήσει τον ρυθμό των τηλεφωνικών κλήσεων που γίνονται την ίδια ώρα σε ένα

σταθμό. Μετέπειτα εφαρμόστηκε στις στοχαστικές διαδικασίες και τα

βιομαθηματικά.

http://en.wikipedia.org/wiki/Exponential_distribution

Παρατηρώντας προσεκτικά το τυπολόγιο της Erlang και της Gamma κατανομής θα

διαπιστώσουμε ότι πρόκειται για ακριβώς τις ίδιες εξισώσεις με την μόνη διαφορά ότι

η shape parameter της Erlang (m) ανήκει στους θετικούς ακέραιους αριθμούς ενώ η

shape parameter της Gamma (α) ανήκει στους θετικούς αριθμούς. Εναλλακτικά

μπορεί να ειπωθεί ότι η Erlang αποτελεί ειδική περίπτωση της Gamma. Να

σημειώσουμε επιπλέον ότι για m=1 η Erlang καταλήγει στην Exponential κατανομή.


β

γ

βγ

)(1

*)(*

)()(

−−−

Γ

−=

xm

emm

xxf , Συμβολισμός Χ~ Erlang(m,β,γ)


)(

)(/)()(m

mxxFΓ

Γ −= βγ


1

Όπου m, β, γ είναι παράμετροι με m *N∈ , β>0, R∈γ ),( +∞∈ γx

m (shape parameter), β (scale parameter) , γ (location parameter)

Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Erlang κατανομή 2-

παραμετρων (Erlang 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της

Erlang 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0

http://en.wikipedia.org/wiki/Exponential_distribution

ΓΡΑΦΗΜΑ ERLANG ΚΑΤΑΝΟΜΗΣ


Histogram Erlang (3P)

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

ΕΚΘΕΤΙΚΗ ΚΑΤΑΝΟΜΗ (EXPONENTIAL DISTRIBUTION)

Η εκθετική κατανομή χρησιμοποιείται πρωτίστως για να περιγράψει τα χρονικά

διαστήματα που μεσολαβούν μεταξύ δυο γεγονότων μιας Poisson διαδικασίας.

Μπορεί επίσης να εφαρμοστεί σε πειράματα φυσικής (π.χ. παρατήρηση της

μεταβολής του όγκου ενός αερίου με σταθερή θερμοκρασία), στην υδρολογία για να

υπολογιστεί ο ρυθμός βροχόπτωσης για μια συγκεκριμένη χρονική περίοδο, στις

τηλεπικοινωνίες, στην μηχανική για να εξεταστεί η σταθερότητα ενός συστήματος,

στο οδικό δίκτυο για να μελετηθεί ο ρυθμός ατυχημάτων κ.α.

Το μειονέκτημα της εκθετικής κατανομής είναι ότι υποθέτουμε ένα σταθερό ρυθμό

μεταβολής ίσο με λ. Ωστόσο, αν επιλεγεί εκ των πρότερων ένα χρονικό διάστημα

όπου είναι γνωστό ότι ο ρυθμός μεταβολής είναι σταθερός ή περίπου σταθερός τότε η

εκθετική κατανομή προσεγγίζει αρκετά ικανοποιητικά τις παρατηρήσεις.


)(*exp*)( γλλ −−= xxf , Συμβολισμός Χ~ Exp(λ,γ)


)(*exp1)( γλ −−−= xxF

Όπου λ, γ είναι παράμετροι λ>0, R∈γ ),( +∞∈ γx

λ (scale parameter) , γ (location parameter)

ΓΡΑΦΗΜΑ ΕΚΘΕΤΙΚΗΣ ΚΑΤΑΝΟΜΗΣ


Histogram Exponential (2P)

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

PEARSON TYPE 6 ΚΑΤΑΝΟΜΗ 4- ΠΑΡΑΜΕΤΡΟΙ (PEARSON TYPE 6 4Ρ DISTRIBUTION)

Αυτή η κατανομή επινοήθηκε από τον Άγγλο μαθηματικό Karl Pearson (1857-1936)

και χρησιμοποιήθηκε αρχικά για μελέτες βιοστατιστικης. Μετέπειτα και με την

εξέλιξη των υπολογιστών εφαρμόστηκε στις χρηματοοικονομικές αναλύσεις, στην

συμπεριφορά των αποδοσεων των μετοχών, στα επιτόκια, στις συναλλαγματικές

ισοτιμίες, στις συχνότητα των πλημμύρων και των σεισμών κτλ. Είναι επίσης

ιδιαίτερα χρήσιμη στις περιπτώσεις όπου η κατανομή εμφανίζει διάφορες μορφές

κύρτωσης. Εκτός από την Pearson Type6 κατανομή προηγήθηκαν 5 ακόμα τύποι

κατανομών οι όποιοι είτε βελτίωναν είτε συμπλήρωναν είτε επέκτειναν τις

δυνατότητες τις προηγούμενης εξίσωσης της κατανομής.

Σε ότι αφόρα την σχέση της με τις υπόλοιπες κατανομές, έχει αποδειχτεί ότι

εμφανίζει αρκετές ομοιότητες με την Cauchy, Κανονική, Βeta, Gamma, X2 και την F

κατανομή.


21*)21

11

))(1(,(*

)()(

aa

a

bxaaBb

bx

xf+

−

−+

−

=γ

γ

Συμβολισμός Χ~ Pearson6(α1,α2, b,γ)


),()( 21aaIxF

bx

x

+−

−=

γ

γ

Όπου α1, α2, b, γ είναι παράμετροι με α1,α2,b>0 , +∞≤≤ xγ

α1,α2 (shape parameter) , b (scale parameter), γ (location parameter)

B Συνάρτηση Beta: B(α1,α2)= dttaa

t∫−−

−1

0

11 21 )1(*

Iz Κανονικοποιημένη ‘’Ατελής’’ Συνάρτηση Beta: Ix=),(),(

21

21

aaBaaBx

Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Pearson κατανομή

3-παραμετρων (Pearson 3Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της

Pearson 3Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0

ΓΡΑΦΗΜΑ PEARSON TYPE 6 ΚΑΤΑΝΟΜΗΣ


Histogram Pearson 6 (4P)

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

GENERALIZED EXTREME VALUE ΚΑΤΑΝΟΜΗ

(GENERALIZED EXTREME VALUE DISTRIBUTION)

Η generalized extreme value κατανομή αναπτύχθηκε παράλληλα με τον κλάδο της

στατιστικής που αφορά την θεωρία ακραίων τιμών (extreme value theory). Αρχικά

τέτοιου είδους σειρές μελετήθηκαν από τους Fisher και Tippett, (1928) οι οποίοι

περιέγραψαν το πρώτο θεώρημα ακραίων τιμών και αργότερα από τον Gnedenko

(1943) ο οποίος περιέγραψε το δεύτερο θεώρημα ακραίων τιμών.

Η κατανομή αυτή αποσκοπεί να συνδυάσει τις οικογένειες των κατανομών Gumbel,

Fréchet και Weibull καθώς συσχετίζει παραδοχές και από τις τρεις αυτές κατανομές.

Είναι εξαιρετικά χρήσιμη για τη μελέτη φαινομένων που δεν παρουσιάζονται συχνά

και αντιμετωπίζονται ως ακραία. Εφαρμόζεται για την μελέτη και την πρόβλεψη

γιγαντιαίων κυμάτων (τσουναμι), για πυρκαγιές μεγάλης έκτασης πλημμύρες-

κατακλυσμούς, στα χρηματοοικονομικά, στην μέτρηση του χρηματοοικονομικού-

πιστωτικού κινδύνου, στον υπολογισμό της πιθανότητας μεγάλων αποζημιώσεων κτλ.

Από υπολογιστικής πλευράς, θα μπορούσαμε να αναφέρουμε ότι χρησιμοποιείται

συχνά σε σειρές που εμφανίζουν μεγάλη και ασυνήθιστη διακύμανση.


0*1

0*1

)()(

11

)*1(*

1

)*1(

=

≠

=−−−

−−+

−+−

ke

kexf

zez

kzkkzk

σ

σ

Συμβολισμός Χ~ GEV(μ,σ,k)

http://en.wikipedia.org/wiki/Gumbel_distribution

http://en.wikipedia.org/wiki/Frechet_distribution

http://en.wikipedia.org/wiki/Weibull_distribution


0

0)(

)(

1

)*1(

=

≠=

−−−

−+−

ke

kexF

zez

kzk

Όπου z=σμ−x

, σ>0

001 ≠>−

+ kxk γιασμ

και 0=+∞<<∞− kx για

k (shape parameter), σ (scale parameter ) , μ (location parameter)

ΓΡΑΦΗΜΑ GENERALIZED EXTREME VALUE ΚΑΤΑΝΟΜΗ


Histogram Gen. Extreme Value

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

ERROR ΚΑΤΑΝΟΜΗ (ERROR DISTRIBUTION)

Τούτη η κατανομή χρησιμοποιείται κυρίως σε σειρές όπου εμφανίζουν ασυμμετρία ή/

και κύρτωση, εν αντίθεση με την κανονική κατανομή όπου δεν λαμβάνει υπόψη

αυτούς τους δυο παράγοντες. Εμφανίζει αρκετές ομοιότητες με την κατανομές

Generalized Extreme Value, Weibull, Log-Normal και χρησιμοποιείται σε αρκετές

εφαρμογές όπως σε χρηματοοικονομικά μοντέλα, εκτίμηση αποδοσεων για μετοχές,

παράγωγα, μοντέλα VaR (Value at Risk) κτλ. Ειδικότερα στα οικονομετρικά μοντέλα

GARCH, είναι η συνηθέστερη κατανομή που επιλέγεται για την εκτίμηση των

δεδομένων


11

1

|*0

|**)(

−−

−=

zcecxf σ Συμβολισμός Χ~ Error(μ,σ,k)


μ

μ

<Γ

Γ

−

≥Γ

Γ

+

=

⎟⎟⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜⎜⎜

⎝

⎛

⎟⎟⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜⎜⎜

⎝

⎛

x

k

k

x

k

k

xFkzc

kzc

)1(

)1(

1*5.0

)1(

)1(

1*5.0

)(

|*0

|

|*0

|

Όπου

21

0

)1(

)3(

⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

Γ

Γ=

k

kc ⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

Γ=

)1(*2

* 01

k

ckc

σμ−

=xz


1

+∞<<∞− x , k (shape parameter), σ (scale parameter ) , μ (location parameter)

Σημείωση: Για k=2 η Error καταλήγει στην Κανονική κατανομή ενώ για k=1

καταλήγει στην Laplace

ΓΡΑΦΗΜΑ ERROR ΚΑΤΑΝΟΜΗ


Histogram Error

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

F -ΚΑΤΑΝΟΜΗ (F- DISTRIBUTION)

Η κατανομή F επινοήθηκε από τους R.A. Fisher και George W. Snedecor.

Εφαρμόζεται κυρίως για στατιστικούς ελέγχους και στην ανάλυση διακύμανσης.


21)2

*1

21

1*1

21 (

*)(*

),(*1)( νν

νν

νν

νν

νν ++

=x

x

Bxxf Συμβολισμός Χ~ F(ν1,ν2)


),()(21 νν

zxF Ι=


t∫−−

−1

0

11 21 )1(*

Iz Κανονικοποιημενη ‘’Ατελής’’ Συνάρτηση Beta: Ix=),(),(

21

21

aaBaaBx

21

1*

*νν

ν+

=x

xz

+∞<≤ x0 , (ν1,ν2 βαθμοί ελευθερίας) Nvv ∈21 ,

http://en.wikipedia.org/wiki/Ronald_Fisher

http://en.wikipedia.org/wiki/George_W._Snedecor

Χ2 -ΚΑΤΑΝΟΜΗ (CHI-SQUARED DISTRIBUTION)

Η κατανομή X2 αποτελεί το άθροισμα των τετραγώνων κ ανεξάρτητων μεταβλητών

οι οποίες ακολουθούν την κανονική κατανομή. Εφαρμόζεται κυρίως για στατιστικούς

ελέγχους, τεστ υποθέσεων και την κατασκευή των διαστημάτων εμπιστοσύνης.

Να σημειώσουμε επίσης ότι η X2 αποτελεί μια ειδική περίπτωση της κατανομής

Gamma.


)2

(*2

*)()(

2

2

)(

12

ν

γν

γν

Γ

−=

−−

−

x

exxf Συμβολισμός Χ~ Χ2(ν,γ)


)2

(

)2

()

2(

)(ν

ν

Γ

Γ

=x

xF


1

Γ(α) Συνάρτηση Gamma// Γ(α) = dtet ta −−∫∞

*0

1

Όπου ν βαθμοί ελευθερίας // Ν∈ν , R∈γ , ),( +∞∈ γx

γ (location parameter)

Σημείωση: Για γ=0 καταλήγουμε στην X2 με μια παράμετρο.

B) ΦΡΑΓΜΕΝΕΣ ΚΑΤΑΝΟΜΕΣ (διάστημα [α,β])

ΟΜΟΙΟΜΟΡΦΗ ΚΑΤΑΝΟΜΗ (UNIFORM DISTRIBUTION)

Η ομοιόμορφη κατανομή είναι μια από τις πιο συχνές και απλές κατανομές που

μπορούν να συναντηθούν στις αναλύσεις και τη έρευνα. Είναι επίσης γνωστή με το

όνομα ορθογωνική κατανομή εξαιτίας του σχήματός της. Μερικές μεταβλητές που

συνήθως ακολουθούν την ομοιόμορφη κατανομή είναι το ύψος, ηλικία και βάρος των

μαθητών μιας συγκεκριμένης σχολικής τάξης (π.χ. οι μαθητές τη Γ λυκείου έχουν

άλικα από 17-18 ετών με όλες τις ενδιάμεσες τιμές να είναι πιθανές, έχουν περίπου

ίδιο ύψος (τόσο τα αγόρια οσο και τα κορίτσια) και περίπου ίδιο βάρος. Άλλο

παράδειγμα είναι ο μισθός μιας συγκεκριμένης κατηγορίας υπάλληλων σε μια

επιχείρηση (π.χ. υπάλληλοι γραφείου)

Τούτη η κατανομή είναι εύκολη στη χρήση της, ενώ παράλληλα το τυπολογιο της

είναι εξαιρετικά απλό και εύχρηστο, όπου δεν χρειάζεται η χρήση Η/Υ. Επιπλέον με

την χρήση διαφόρων μετασχηματισμών η ομοιόμορφη κατανομή σχετίζεται με την

εκθετική, την Beta και την τριγωνική κατανομή


abxf

−= 1)( , Συμβολισμός Χ~ U(a,b)


abaxxF

−−=)(

όπου a<b και a<x<b.

Παρατήρηση: To χαρακτηριστικό της ομοιόμορφης κατανομής είναι ότι όλα τα

ενδεχόμενα είναι ισοπίθανο να εμφανιστούν.

ΓΡΑΦΗΜΑ UNIFORM ΚΑΤΑΝΟΜΗΣ


Histogram Uniform

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

Παράδειγμα

1) Ρίχνουμε ένα ζάρι. Ποια η πιθανότητα να φέρουμε 6;

Η πιθανότητα εμφάνισης ενός αριθμού του ζαριού είναι ίση με 1/6, καθώς όλοι οι

αριθμοί είναι ισοπίθανο να εμφανιστούν.

Άρα η πιθανότητα να φέρουμε 6 είναι p=1/6

2) Ρίχνουμε ένα ζάρι. Ποια η πιθανότητα να φέρουμε ένα αριθμό μικρότερο του 5;

Τα πιθανά ενδεχόμενα είναι να φέρουμε τους αριθμός Α1,2,3,4

Αρά Ρ(Χ<5)= P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4)

Ρ(Χ<5)= 1/6 + 1/6 + 1/6 + 1/6 = 4/6

2) Ρίχνουμε δυο ζάρια. Υπολογίστε τις εξής πιθανότητες

ι) Το άθροισμα τους να είναι ίσο με 10

ιι) Το άθροισμα τους να είναι μικρότερο από 7

ιιι) Να φέρουμε πεντάρες

ιv) Να φέρουμε δυο και τρία Αρχικά κατασκευάζουμε τον παρακάτω πίνακα στον οποίο έχουμε υπολογίσει όλα τα

πιθανά αθροίσματα

1 2 3 4 5 61 2 3 4 5 6 72 3 4 5 6 7 83 4 5 6 7 8 94 5 6 7 8 9 105 6 7 8 9 10 116 7 8 9 10 11 12

Παρατηρούμε ότι έχουμε 36 (6*6) πιθανά ενδεχόμενα. Έχοντας τούτο υπόψη μας

μπορούμε να απαντήσουμε στα ερωτήματα.

ι) Έστω S το άθροισμα. Από τον παραπάνω πίνακα υπολογίζουμε ότι υπάρχουν 3

παρατηρήσεις που έχουν αθροισμα=10. Το σύνολο των παρατηρήσεων είναι 36. Αρά

Ρ(S=10)= 3/36

ιι) Έστω S το άθροισμα. Από τον παραπάνω πίνακα υπολογίζουμε ότι υπάρχουν 15

παρατηρήσεις που έχουν άθροισμα < 7. Το σύνολο των παρατηρήσεων είναι 36. Αρά

Ρ(S<7)= 15/36

ιιι) Η πιθανότητα να φέρουμε πεντάρες υπολογίζεται ως εξής.

Πρώτο ζάρι: Ρ(Χ=5)=1/6 και Δεύτερο ζάρι: Ρ(Χ=5)=1/6 (βλ. Παράδειγμα 1)

Αρά Ρ(πεντάρες)=1/6*1/6=1/36

Ομοίως από τον παραπανω πίνακα παρατηρούμε ότι ο αριθμός ‘’5’’ των Στηλών και

ο αριθμός ‘’5’’ των Γραμμών τέμνονται μια μόνο φορά.

Γενικά όλα τα διπλά νούμερα (άσσοι, δίπλες, τριάρες…..) έχουν πιθανότητα p=1/36

να εμφανιστούν

ιv) Ο συλλογισμός είναι ίδιος όπως στο προηγούμενο ερώτημα

Πρώτο ζάρι: Ρ(Χ=2)=1/6 και Δεύτερο ζάρι: Ρ(Χ=3)=1/6 Ρ(2,3)= 1/6*1/6

Όμως θα έχουμε ακόμα ότι

Πρώτο ζάρι: Ρ(Χ=3)=1/6 και Δεύτερο ζάρι: Ρ(Χ=2)=1/6 Ρ(3,2)= 1/6*1/6

Αρά Ρ(ολικό)=Ρ(2,3)+Ρ(3,2)=1/6*1/6+1/6*1/6=1/36+1/36=2/36

Ομοίως στο ίδιο συμπέρασμα καταλήγουμε από τον παραπανω πίνακα.

ΒΕΤΑ ΚΑΤΑΝΟΜΗ (ΒΕΤΑ DISTRIBUTION)

Τούτη η κατανομή χρησιμοποιείται κυρίως για να περιγράψει την κατανομή μιας

μεταβλητής με άγνωστη πιθανότητα. Τυπικά περιγράφει την εκ των πρότερων

(a-priori)4 κατανομή μιας πιθανότητας όπως την πιθανότητα επιτυχώς ενός

πειράματος (Διωνυμικη, Bernoulli κατανομή). Στην πραγματικότητα η Beta

κατανομή είναι ένα συνονθύλευμα της Διωνυμικής με την Bernoulli κατανομή.

4 A-Priori Οι πιθανότητες των ενδεχομένων είναι γνώστες εκ των πρότερων. π.χ. Ρίψη ενός ζαριού Α-Posteriori (εμπειρική πιθανότητα) Οι πιθανότητες των ενδεχομένων είναι γνωστές αφού ολοκληρωθεί το πείραμα. Π.χ. Σουτ από την γραμμή των βολών σε έναν αγώνα μπάσκετ.


1)(

1)(*

1)(*

,(1)(

21

21

)21

−+−

−−

−−= aa

ab

axb

aax

aaBxf

Συμβολισμός Χ~ Βeta(α1,α2, α, b)


),()( 21aaIxF

z=

Όπου α1, α2, α, b είναι παράμετροι με α1,α2>0 και α<b, bxa ≤≤

α1,α2 (shape parameter)


t∫−−

−1

0

11 21 )1(*

Iz Κανονικοποιημενη ‘’Ατελής’’ Συνάρτηση Beta: Ix=),(),(

21

21

aaBaaBx

Παρατηρήσεις

Για α1= α2=1 Η Beta κατανομή καταλήγει στην ομοιόμορφη κατανομή

Για α1<1 και α2≥ 1 ή α1=1 και α2>1 Η Beta κατανομή είναι φθίνουσα συνάρτηση

Για α1>1 και α2≤ 1 ή α2=1 α2<1 Η Beta κατανομή είναι αύξουσα συνάρτηση

Για α1<1 και α2<1 Η Beta κατανομή έχει σχήμα U (U-shaped). Μοιάζει με το

παρακάτω γράφημα γυρνώντας το ανάποδα

Για α1=1 και α2>2 Η Beta κατανομή είναι κυρτή

Για α1=1 και α2=2 Η Beta κατανομή είναι ευθεία γραμμή

Για α1=1 και 1< α2<2 Η Beta κατανομή είναι κοίλη

Για α1>2 και α2=1 Η Beta κατανομή είναι κυρτή

Για α1=2 και α2=1 Η Beta κατανομή είναι ευθεία γραμμή

Για 1< α1<2 και α2=1 Η Beta κατανομή είναι κοίλη

Για α1>1, α2>1 Η Beta είναι unimodal (Έχει δηλαδή μια επικρατούσα τιμη.

Γραφικά αυτό ορίζεται με τη συνάρτηση πυκνότητας πιθανότητας να έχει μια μόνο

κορυφή. Βλ το παρακάτω γράφημα ‘’unimodal-bimodal’’ )

ΓΡΑΦΗΜΑ BETA ΚΑΤΑΝΟΜΗΣ


Histogram Beta

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

KUMARASWAMY ΚΑΤΑΝΟΜΗ (KUMARASWAMY DISTRIBUTION)

Αυτή η κατανομή επινοήθηκε από τον μηχανικό- υδρολόγο Ponnambalam

Kumaraswamy. Εχει πολλές ομοιότητες με την κατανομή Beta και αρκετά συχνά

χρησιμοποιείται αντ’ αυτης λογω της απλούστερης εξίσωσης της συνάρτησης

πιθανότητας και της αθροιστικής συνάρτησης.

Παρόλο που έχει κοινά χαρακτηριστικά με την Beta, η χρήση και οι εφαρμογές της

δεν είναι διαδεδομένες.


)(

)1(***)(

121

11

21ab

aaz

azaa

xf−

−=

−−

Συμβολισμός Χ~ Kumaraswamy(α1,α2, α, b)


21 )1(1)( aazxF −−=

Όπου α1, α2, α, b είναι παράμετροι με α1,α2>0 και α<b, bxa ≤≤ , z= abax

−−

,

α1,α2 (shape parameter)

Παρατηρήσεις

Για α1<1 και α2≥ 1 ή α1=1 και α2>1 Η Kumaraswamy είναι φθίνουσα συνάρτηση

Για α1>1 και α2≤ 1 ή α2=1 α2<1 Η Kumaraswamy είναι αύξουσα συνάρτηση

Για α1<1 και α2<1 Η Kumaraswamy κατανομή έχει σχήμα U (U-shaped). Μοιάζει

με το παρακάτω γράφημα γυρνώντας το ανάποδα

Για α1=1 και α2>2 Η Kumaraswamy κατανομή είναι κυρτή

Για α1=1 και α2=2 Η Kumaraswamy κατανομή είναι ευθεία γραμμή

Για α1=1 και 1< α2<2 Η Kumaraswamy κατανομή είναι κοίλη

Για α1>2 και α2=1 Η Kumaraswamy κατανομή είναι κυρτή

Για α1=2 και α2=1 Η Kumaraswamy κατανομή είναι ευθεία γραμμή

Για 1< α1<2 και α2=1 Η Kumaraswamy κατανομή είναι κοίλη

Για α1>1, α2>1 Η Kumaraswamy είναι unimodal (Έχει δηλαδή μια επικρατούσα

τιμη)

ΓΡΑΦΗΜΑ KUMARASWAMY ΚΑΤΑΝΟΜΗΣ


Histogram Kumaraswamy

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

Στα παρακάτω γραφήματα συγκρίνουμε την κανονική κατανομή με τις υπόλοιπες

κατανομές ώστε να κατανοήσουμε τις διαφορές τους. Στο κάτω μέρος του κάθε

γραφήματος γίνεται επεξήγηση των κατανομών.

ΓΡΑΦΗΜΑ (Κανονική-Johnson SU- LogNormal κατανομες)


Histogram Lognormal (3P) Normal Johnson SU

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

ΓΡΑΦΗΜΑ (Κανονική-Error- Logistic κατανομές)


Histogram Error Logistic Normal

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

ΓΡΑΦΗΜΑ (Κανονική-Gamma- Weibull κατανομές)


Histogram Normal Weibull (3P) Gamma (3P)

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

ΓΡΑΦΗΜΑ (Κανονική-Gen. Extreme Value- Pearson 6 κατανομές)


Histogram Gen. Extreme Value NormalPearson 6 (4P)

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

ΓΡΑΦΗΜΑ (Κανονική-Fatigue Life- Erlang κατανομές)


Histogram Normal Erlang (3P) Fatigue Life (3P)

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

ΓΡΑΦΗΜΑ (Κανονική-Beta- Kumaraswamy κατανομές)


Histogram Normal Kumaraswamy Beta

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

ΓΡΑΦΗΜΑ (Κανονική-Laplace- Cauchy κατανομές)


Histogram Cauchy Laplace Normal

x0,060,040,020-0,02-0,04-0,06

f(x)

0,32

0,28

0,24

0,2

0,16

0,12

0,08

0,04

0

Από τα γραφήματα διαπιστώνουμε ότι όλες σχεδόν οι κατανομές συγκλίνουν

ουσιαστικά με την κανονική κατανομή. Σε πολλές περιπτώσεις μάλιστα συμπίπτουν

εξ’ ολόκληρου με την προσέγγιση της κανονικής κατανομής. Οι μοναδικές που έχουν

μερικές ουσιαστικές διαφοροποιήσεις είναι η Laplace και η Cauchy, όπου είναι

περισσότερο λεπτοκυρτες από τις υπόλοιπες.

Τελειώνοντας να τονίσουμε ότι το πρόγραμμα Easy Fit 5.1 εχει την δυνατότητα

σύγκρισης των κατανομών με τρία κριτήρια ώστε να επιλέξουμε ποια από όλες

προσαρμόζεται καλύτερα στα δεδομένα μας. Τα κριτήρια που χρησιμοποιούνται είναι

οι στατιστικές Kolmogorov-Smirnov, Anderson-Darling και η Chi-Squared, Καθεμία

επικεντρώνεται σε διαφορετικά γνωρίσματα και χαρακτηριστικά και εξάγει

διαφορετικά αποτελέσματα. Ωστόσο είναι στην διακριτική ευχέρεια του αναλυτή να

δώσει βαρύτητα στα κριτήρια που επιθυμεί και να επιλέξει τη στατιστική μέθοδο με

την οποία θα γίνει η σύγκριση των κατανομών. Παρακάτω ακολουθεί ο πίνακας με

την ταξινόμηση των κατανομών.

Goodness of Fit – Summary

Distribution

Kolmogorov Smirnov

Anderson Darling Chi-Squared

Statistic Rank Statistic Rank Statistic Rank

Normal 0,05615 1 0,23175 9 1,5421 5

Beta 0,05627 2 0,22765 8 1,5311 2

Pearson 6 (4P) 0,05665 3 0,22592 6 1,5333 3

Fatigue Life (3P) 0,05684 4 0,22559 5 1,5337 4

Johnson SU 0,05764 5 0,19995 1 1,9826 9

Lognormal (3P) 0,05888 6 0,22212 3 2,0897 10

Error 0,05989 7 0,20537 2 1,5881 8

Gen. Extreme Value 0,06144 8 0,27963 11 1,0682 1

Gamma (3P) 0,06228 9 0,22488 4 1,5591 7

Logistic 0,06339 10 0,22756 7 2,2183 11

Weibull (3P) 0,06475 11 0,3477 12 2,5702 12

Kumaraswamy 0,06487 12 0,34846 13 2,5706 13

Erlang (3P) 0,0685 13 0,2426 10 1,5534 6

Cauchy 0,0892 14 1,2244 15 10,665 14

Laplace 0,10541 15 0,87108 14 14,147 15

Στον παραπανω πίνακα έχουμε επιλέξει την ταξινόμηση με τη μέθοδο Kolmogorov-

Smirnov. Σύμφωνα με αυτή τη μέθοδο πρώτη στην κατάταξη (rank) έρχεται η

κανονική κατανομή και ακολουθούν η Beta και η Pearson 6 (4P).

Στη δεύτερη στήλη φαίνονται τα αποτελέσματα με τη μέθοδο Anderson-Darling όπου

πρώτη στην κατάταξη (rank) έρχεται η κατανομή Johnson SU και ακολουθούν η

Error και η Lognormal (3P).

Τέλος, έχουμε τη μέθοδο Chi-Squared, όπου εξάγεται το συμπέρασμα ότι καλύτερη

προσαρμογή επιτυγχάνεται με την κατανομή Gen. Extreme Value και έπονται η Beta

και η Pearson 6 (4P)

----------------ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ

BERNOULLI ΚΑΤΑΝΟΜΗ (BERNOULLI DISTRIBUTION)

Η κατανομή Bernoulli είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής.

Περιγράφει ένα τυχαίο πείραμα με δυο μόνο πιθανά ενδεχόμενα (επιτυχία-αποτυχία).

Μερικά παραδείγματα της Bernoulli κατανομής είναι η ρίψη ενός νομίσματος

(κορώνα-γράμματα), το φύλο ενός παιδιού (αγόρι-κορίτσι) πιθανότητα ευστοχίας

μιας βολής κτλ.


pxf −=1)( για x=0 και pxf =)( για x=1


pxF −=1)( για x=0 και 1)( =xF για x=1

όπου πιθανότητα 0<p<1 και x=0,1

Μαθηματική Ελπίδα: E(X)= p

Διακύμανση V(X)= p*(1-p)

ΔΙΩΝΥΜΙΚΗ ΚΑΤΑΝΟΜΗ (BINOMIAL DISTRIBUTION)

Η διωνυμική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας

μεταβλητής. Περιγράφει ένα τυχαίο πείραμα με δυο πιθανά αποτελέσματα (επιτυχία -

αποτυχία) και πιθανότητα επιτυχίας p που επαναλαμβάνεται n φορές. Η διωνυμία

κατανομή αποτελεί το άθροισμα των μεταβλητών της Bernoulli.

Παρατήρηση: Για n=1 η δυωνυμική κατανομή καταλήγει στην κατανομή Bernoulli.

Για μεγάλο n η διωνυμική κατανομή συγκλίνει σύμφωνα με το θεώρημα ‘’de

Moivre–Laplace’’ στην κανονική κατανομή με μέση τιμή np και διασπορά np(1 − p)

Θεωρούμε την τυχαία μεταβλητή Χ που εκφράζει τον αριθμό των επιτυχιών. Η

πιθανότητα να έχουμε k επιτυχίες σε n ανεξάρτητα πειράματα με πιθανότητα

επιτυχίας p κάθε φορά είναι:


xnpxpxn

xf −−= ⎟⎟⎠

⎞⎜⎜⎝

⎛)1(**)( , Συμβολισμός Χ ~ Β(n,p)


inppn

ixF −−∑

=

= )1(*0

)(

Όπου !)!(

!xxn

nxn

−=⎟⎟

⎠

⎞⎜⎜⎝

⎛, πιθανότητα 0<p<1 και nx ≤≤0

n αριθμός δοκίμων του πειράματος, με Nn∈

p πιθανότητα επιτυχίας 1-p πιθανότητα αποτυχίας, x=0,1,2,….n

(x καλείται διωνυμική τυχαία μεταβλητή)

Μαθηματική Ελπίδα: E(X)=n*p

Διακύμανση V(X)=n*p*(1-p)

Παράδειγμα 1.

Σε μια πολύ το 48% των παιδιών είναι αγόρια (Α) και το 52% κορίτσια (Κ). Αν

επιλέξουμε μια πενταμελή οικογένεια να βρεθούν

ι) Πιθανότητα να έχει μόνο αγόρια.

ιι) Πιθανότητα να έχει ένα κορίτσι

ιιι) Πιθανότητα να έχει τουλάχιστον ένα αγόρι

ιv) Πιθανότητα να έχει το πολύ ένα κορίτσι.

Έστω Α ο αριθμός των αγοριών και Κ ο αριθμός των κοριτσιών. Από τα δεδομένα

του προβλήματος έχουμε ότι το Α είναι τυχαία μεταβλητή λαμβάνοντας τις τιμές

0,1,2,3,4,5 και ακολουθεί την διωνυμική κατανομή Β(5,0.48) Ομοίως και για το Κ

ακολουθεί την διωνυμικη κατανομή Β(5,0.52).

ι) Ρ(Α=5) = = 0.025 555 )48.01(*48.0*55 −⎟⎟⎠

⎞⎜⎜⎝

⎛−

ιι) Ρ(Κ=1) = = 0.138 151 )52.01(*52.0*15 −⎟⎟⎠

⎞⎜⎜⎝

⎛−

iii) Ρ(Α≥ 1) = 1-Ρ(Α=0)= 1- = 0.962 050 )48.01(*48.0*05 −⎟⎟⎠

⎞⎜⎜⎝

⎛−

iv) Ρ(Κ 1) = Ρ(Κ=0) + Ρ(Κ=1) = ≤

15)52.01(*152.0*1505)52.01(*052.0*

05 −−+−− ⎟⎟

⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛= 0.025+0.138=0.163

(Το πολύ ένα κορίτσι συνεπάγεται ότι θα έχουμε είτε ένα είτε κανένα κορίτσι) Παράδειγμα 2.

Έστω ότι ένας πωλητής εχει πιθανότητα p=28% να επιτύχει πώληση. Έστω ότι ο

πωλητής σε μια τυχαία ημέρα τηλεφωνεί σε 12 άτομα.

Να υπολογισθούν:

i) Η πιθανότητα να επιτύχει 4 πωλήσεις.

ii) Η πιθανότητα να επιτύχει το πολύ 2 πωλήσεις.

iii) Η πιθανότητα να επιτύχει τουλάχιστον 3 πωλήσεις.

Έστω Χ ο αριθμός πωλήσεων του πωλητή. Η πιθανότητα επιτυχίας των πωλήσεων

ακολουθεί την διωνυμική κατανομή Β(n=12, p=28%).

i) Ρ(Χ=4) = = 0.2197 4124 )28.01(*28.0*4

12 −⎟⎟⎠

⎞⎜⎜⎝

⎛−

ii) Ρ(Χ≤ 2) = Ρ(Χ=0) + Ρ(Χ=1) + Ρ(Χ=2)

212211210120 )28.01(28.02

12)28.01(28.0

112

)28.01(28.00

12 −⎟⎟⎠

⎞⎜⎜⎝

⎛−⎟⎟⎠

⎞⎜⎜⎝

⎛−⎟⎟⎠

⎞⎜⎜⎝

⎛−+−+−

= 0.3037

iii) Ρ(Χ≥ 3) = 1- Ρ(Χ 2) = 1- 0.3037= 0.6963 (βλ προηγούμενο ερώτημα) ≤

POISSON ΚΑΤΑΝΟΜΗ (POISSON DISTRIBUTION)

Η κατανομή Poisson είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής

που περιγράφει τον αριθμό εμφανίσεων ενός γεγονότος σε ένα συγκεκριμένο χρονικό

διάστημα. Έχει πάρει το όνομά της από τον Γάλλο μαθηματικό, Siméon Denis

Poisson, (1781–1840).

Η κατανομή Poisson έχει την παράμετρο λ που δηλώνει τη μέση τιμή αριθμού

εμφανίσεων ενός γεγονότος, οι οποίες είναι ανεξάρτητες της τελευταίας χρονικής

στιγμής εμφάνισης του γεγονότος.

Παρατήρηση: Πρακτικά ισχύει ότι αν πιθανότητα p<0.2 και δείγμα n>20 η

προσέγγιση της μεταβλητής επιτυγχάνεται ικανοποιητικά από την κατανομή Poisson.

Σε άλλες βιβλιογραφίες αναφέρεται ότι η προσέγγιση ισχύει για n>50 και p<0.1

Ορίζουμε την παράμετρο λ= n* p. Όσο το λ αυξάνει η κατανομή Poisson συγκλίνει

στην κανονική κατανομή.


!*)(xex

xfλλ −

= Συμβολισμός Χ~ Po(np)


∑=

−=x

ie

i

ixF

0*

!)( λλ

όπου παράμετρος λ=n*p>0 (n μέγεθος δείγματος, p Πιθανότητα επιτυχίας)

και +∞<≤ x0

Μαθηματική Ελπίδα: E(X)=λ

Διακύμανση V(X)=λ

Παράδειγμα.

1) Η πιθανότητα κάποιος οδηγός να μην έχει θεωρημένη άδεια οδήγησης είναι

p=0.05. Έστω ότι σε μια μέρα έγιναν 50 έλεγχοι. Να βρεθούν

ι) Δυο οδηγοί να μην έχουν θεωρήσει την άδεια τους

ιι) Το πολύ δυο οδηγοί να μην έχουν θεωρήσει την άδεια τους.

Έστω Χ η μεταβλητή που εκφράζει τον αριθμό των οδηγών που δεν έχουν θεωρήσει

το δίπλωμά τους. Επειδή πιθανότητα p=0.05<0.2 και δείγμα n=50>20, η μεταβλητή

προσεγγίζεται από την κατανομή Poisson. Άρα έχουμε ότι λ=n*p=0.05*20 λ=2.5

i) p(X=2)= !2

*5.2 5,22 −e =0.2562

iι) p(X≤ 2)= p(X=0)+ p(X=1)+ p(X=2) =

!0*5.2 5.20 −e

+ !1

*5.2 5.21 −e+

!2*5.2 5.22 −e

=0.5432

2) Έστω σε ένα γραφείο δέχονται 2 φαξ ανα 4 ώρες τα οποία απαντώνται με ρυθμό 2

φαξ ανα 6 ώρες

i) Ποια η πιθανότητα σε μια μέρα να λάβουμε τουλάχιστον 4 φαξ;

ii) Ποια η πιθανότητα να απαντήσουμε σε τρία φαξ σε μια μερα;

iii) Έστω ότι δεν έχουμε κανένα φαξ. Ποια η πιθανότητα να λάβουμε 6 φαξ σε μια

μέρα και να μην προλάβουμε απαντήσουμε σε όλα;

Έστω Χ ο αριθμός των φαξ που λαμβάνουμε κα Υ ο αριθμός των φαξ που απαντάμε

Από τα δεδομένα έχουμε ότι λαμβάνουμε 2 φαξ/ 4 ώρες 12 φαξ/ 24ώρες. Επίσης

απαντάμε σε 2 φαξ/6ωρες 8 φαξ/24 ώρες

Αρά θα έχουμε ότι Χ~Ρο(λ1=12|24ωρες) και Υ~Ρο(λ2=8|24ωρες)

i) = =≥ )4(XP )3(1 ≤− XP )]0()1()2()3([1 =+=+=+=− XPXPXPXP =

]!0

12*!1

12*!2

12*!3

12*[10

121

122

123

12 −−−− +++− eeee =

=+++− − ]!0

12!1

12!2

12!3

12[*10123

12e

=+++− − ]112144288[*1 12e

1-0.0027=0,9973

ii) Ρ(Υ=3) = !3

8*3

8−e = 0,0286

iii) =<Υ= )66( καιXP Ρ(Χ=6) * Ρ(Υ<6) =

)]0()1()2()3()4()5([*)!6

12*(6

12 =+=+=+=+=+=− YPYPYPYPYPYPe

]!0

8*!1

8*!2

8*!3

8*!4

8*!5

8*[*)!6

12*(0

81

82

83

84

85

86

12 −−−−−−− +++++ eeeeeee = 0,0048

ΓΕΩΜΕΤΡΙΚΗ ΚΑΤΑΝΟΜΗ (GEOMETRIC DISTRIBUTION)

Η γεωμετρική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας


αποτυχία) και πιθανότητα επιτυχίας p.

Θεωρούμε την τυχαία μεταβλητή Χ που εκφράζει τον αριθμό των δοκιμών. Η

πιθανότητα να χρειαστούμε n δοκιμές έως ότου να έχουμε μια επιτυχία με πιθανότητα

p κάθε δοκιμης είναι:


xppxf )1(*)( −= Συμβολισμός Χ~Ge(p)


1)1(1)( +−−= xpxF

όπου πιθανότητα 0<p<1 και +∞<≤ x0

Μαθηματική Ελπίδα: E(X)= p1

Διακύμανση V(X)= 2

1p

p−

Με άλλα λόγια, προσπαθούμε να υπολογίσουμε την πιθανότητα να έχουμε επιτυχία

στην n-οστη δόκιμη έπειτα από n-1 αποτυχίες, με πιθανότητα επιτυχίας της κάθε

δόκιμης ιση με p.

Παράδειγμα.

1) Ρίχνουμε ένα ζάρι. Ποια η πιθανότητα να φέρουμε 1 μετά από 5 ρίψεις;

Αρχικά υπολογίζουμε την πιθανότητα να φέρουμε 1. Όπως γνωρίζουμε, η πιθανότητα

να φέρουμε οποιοδήποτε αριθμό ενός ζαριού είναι p=1/6 (ισοπίθανα ενδεχόμενα).

Άρα έχουμε ότι

p = 1/6. Πιθανότητα (επιτυχία) για να φέρουμε 1

q = 1-1/6=5/6. Πιθανότητα (αποτυχία) για να φέρουμε οποιοδήποτε άλλο αριθμό

εκτός από το 1.

Υποθέτουμε ότι x είναι α αριθμός των αποτυχιών πριν την επιτυχία. Άρα, θεωρώντας

ότι η 5η ρίψη είναι επιτυχής (δηλαδή στην 5η ρίψη θα φέρουμε 1) θα έχουμε ότι x=4

(αποτυχίες).

Με τα δεδομένα αυτά p=1/6, q=5/6 και x=4 έχουμε ότι

P(x)= 4)65(*

61

= 0,0803. Η πιθανότητα να φέρουμε 1 στην 5η ρίψη είναι p=0.0803

2) Ένας παίχτης μπάσκετ ρίχνει βολές με επιτυχία 93%. Ποια η πιθανότητα να μην

αστοχήσει μέχρι την 20η βολή;

Από τα δεδομένα του προβλήματος καταλαβαίνουμε θα πρέπει να υπολογίσουμε την

πιθανότητα ο παίχτης να ευστοχήσει σε 19 βολές και να αστοχήσει στην 20η βολή.

Στην περίπτωση αυτού του προβλήματος, ο συλλογισμός μας θα λειτουργήσει

αντίστροφα. Ο ορισμός της γεωμετρικής κατανομής είναι ο εξής: ‘’Η πιθανότητα να

χρειαστούμε n δοκιμές έως ότου να έχουμε μια επιτυχία με πιθανότητα p σε κάθε

δοκιμή’’.

Άρα στην περίπτωσή μας η επιτυχής δοκιμή είναι να αστοχήσει στην βολή, ενώ η

αποτυχία είναι να ευστοχεί στις βολές.

Συνοψίζοντας έχουμε ότι

Εύστοχη Βολή Αποτυχία με πιθανότητα q=0.93

Άστοχη Βολή Επιτυχία με πιθανότητα p=1-q =0.07

x=19 εύστοχες βολές (αποτυχία)

Ρ(x)= 0.07*0.9319 = 0.0176. Η πιθανότητα να μην αστοχήσει μέχρι την 20η βολή είναι

0.0176

ΥΠΕΡΓΕΩΜΕΤΡΙΚΗ ΚΑΤΑΝΟΜΗ (HYPERGEOMETRIC DISTRIBUTION) Η υπεργεωμετρική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας


αποτυχία) σε πεπερασμένο πληθυσμό που επαναλαμβάνεται n φορές χωρίς

επαναφορά.

Η κατανομή γίνεται εύκολα κατανοητή με την περιγραφή ενός μοντέλου κάλπης:

Θεωρούμε μια κάλπη με Ν μπάλες από τις οποίες οι m είναι λευκές (επιτυχίες) και

Ν-m μαύρες (αποτυχίες). Από την κάλπη παίρνουμε χωρίς επαναφορά n μπάλες. Η

υπεργεωμετρική κατανομή μας δίνει την πιθανότητα οι x από αυτές να είναι λευκές. Συνάρτηση Πυκνότητας Πιθανότητας

⎟⎠⎞

⎜⎝⎛

⎟⎠⎞

⎜⎝⎛

−−

⎟⎠⎞

⎜⎝⎛

=

nN

xnmN

xm

xf*

)( , Συμβολισμός X ~ h(N,m,n)


∑= ⎟

⎠

⎞⎜⎝

⎛

⎟⎠

⎞⎜⎝

⎛−−

⎟⎠

⎞⎜⎝

⎛

=x

inN

inmN

im

xF0

*)(

Μαθηματική Ελπίδα: E(X)=N

mn*

Διακύμανση V(X)=)1(*

)(*)(**2 −

−−NN

nNmNmn

Όπου n Μέγεθος δείγματος , m Αριθμός επιτυχιών πληθυσμού,

N Μέγεθος πληθυσμού, x Αριθμός επιτυχιών δείγματος

Ισχύουν επίσης ότι

max(0, n+m-N)< x <min(n,m) , 0<n N≤ , 0<m N≤

Υπενθυμίζουμε επίσης ότι !)!(

!bba

aba

−=⎟⎟

⎠

⎞⎜⎜⎝

⎛

Παρατήρηση. Αν η επιλογή γίνεται με επαναφορά τότε η μεταβλητή ακολουθεί την

Διωνυμικη Κατανομή (βλ. αντίστοιχη ενότητα). Επίσης για n=1 η υπεργεωμετρική

κατανομή συμπίπτει με την Bernoulli. Για υψηλές τιμές των Ν, m οι οποίες είναι

επίσης συγκριτικά υψηλές με το n και για πιθανότητα p η οποία δεν είναι κοντά στο 0

ή 1, τότε η υπεργεωμετρική κατανομή προσεγγίζει την κανονική.

Παράδειγμα

1) Υποθέτουμε ότι σε ένα δοχείο έχουμε 50 βόλους. Από αυτούς 5 είναι άσπροι ναι

45 μαύροι. Επιλεγούμε στην τύχη 10 βόλους χωρίς επαναφορά στο δοχείο. Ποια η

πιθανότητα να έχουμε 4 άσπρους από τους 10 βόλους που επιλέξαμε;

Από τα δεδομένα του προβλήματος έχουμε ότι

Μέγεθος πληθυσμού Ν=50

Μέγεθος δείγματος n=10

Αριθμός επιτυχιών πληθυσμού m=5 (Υπάρχουν 5 άσπροι βόλοι)

Αριθμός επιτυχιών δείγματος x=4 (Θέλουμε να επιλέξουμε 4 άσπρους βόλους)

⎟⎠

⎞⎜⎝

⎛

⎟⎠

⎞⎜⎝

⎛−−

⎟⎠⎞

⎜⎝⎛

=

1050

410550

*45

)(xf =

⎟⎠

⎞⎜⎝

⎛

⎟⎠

⎞⎜⎝

⎛⎟⎠⎞

⎜⎝⎛

1050

645

*45

=……=0.0039

Η πιθανότητα να έχουμε 4 άσπρους βόλους από τους 10 βόλους που επιλέξαμε είναι

0.0039

2) Διαθέτουμε μια τράπουλα 52 φύλλων. Επιλεγούμε 8 φύλλα χωρίς επαναφορά.

Ποια η πιθανότητα να έχουμε 2 Βαλέδες στα 8 φύλλα;

(Η τράπουλα διαθέτει τους αριθμούς 1,2,3….,10 και τις 3 φιγούρες στα τέσσερα

χρώματα: καρό, μπαστούνι, σπαθί και κούπα. Σύνολο 52 τραπουλόχαρτα)

Από τα δεδομένα του προβλήματος έχουμε ότι

Μέγεθος πληθυσμού Ν=52

Μέγεθος δείγματος n=8

Αριθμός επιτυχιών πληθυσμού m=4 (Μια τράπουλα έχει 4 Βαλέδες)

Αριθμός επιτυχιών δείγματος x=2 (Θέλουμε να επιλέξουμε 2 Βαλέδες)

⎟⎠

⎞⎜⎝

⎛

⎟⎠

⎞⎜⎝

⎛−−

⎟⎠

⎞⎜⎝

⎛

=

852

28452

*24

)(xf =

⎟⎠

⎞⎜⎝

⎛

⎟⎠

⎞⎜⎝

⎛⎟⎠

⎞⎜⎝

⎛

852

648

*24

=……=0.0978

Η πιθανότητα να έχουμε 2 Βαλέδες στα 8 επιλεγμένα φύλλα είναι p=0.0978 ΛΟΓΑΡΙΘΜΙΚΗ ΚΑΤΑΝΟΜΗ (LOGARITHMIC DISTRIBUTION) Συνάρτηση Πυκνότητας Πιθανότητας

)1ln(*)(

θθ−

−=

x

xxf , Συμβολισμός Χ~log(θ)


∑=−

−=

xxF

1*

)1ln(1)(

ι ι

ιθθ

όπου παράμετρος 0<θ<1 και +∞<≤ x1

Μαθηματική Ελπίδα: E(X)=)1(*)1ln( pp

p−−

−

Διακύμανση V(X)=)1(ln*)1(

)1ln(* 22 ppppp−−

−+−

ΠΑΡΑΡΤΗΜΑ Το excel διαθέτει τις εξης κατανομές, οι οποίες είναι αρκετά εύκολες στη χρήση τους.

1) Κατανομή Beta

Αθροιστική Συνάρτηση Πιθανότητας BETADIST

Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας BETAINV

2) Κατανομή Nomral

Αθροιστική Συνάρτηση Πιθανότητας NORMDIST

Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας NORMINV

3) Κατανομή X2

Αθροιστική Συνάρτηση Πιθανότητας CHIDIST

Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας CHIINV

4) Κατανομή F

Αθροιστική Συνάρτηση Πιθανότητας FDIST

Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας FINV

5) Κατανομή Gamma

Αθροιστική Συνάρτηση Πιθανότητας GAMMADIST

Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας GAMMAINV

6) Κατανομή T-student (Παρομοια με την Κανονιμη. Χρησιμοποιειται όταν εχουμε

μικρο αριθμο παρατηρησεω, λιγοτερες από 50)

Αθροιστική Συνάρτηση Πιθανότητας ΤDIST

Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας ΤINV

7) Διωνυμικη BINOMDIST

8) Υπεργεωμετρικη HYPDEOMDIST

9) Poisson POISSON

ΑΝΑΦΟΡΕΣ- ΒΙΒΛΙΟΓΡΑΦΙΑ Πιθανότητες και στατιστική (J. Fourastie- F. Laslier)

Στατιστικές Μέθοδοι ( Δονάτος Γ.- Χομπας Β.)

Πιθανότητες και στατιστική (Δάρας Τ.)

Θεωρία πιθανοτήτων και εφαρμογές (Χαραλαμπιδης Χ.)

Θεωρία Πιθανοτήτων 1 - Λογισμός Πιθανοτήτων Τυχαίων Γεγονότων

(Αθανασόπουλος Δ.)

Wikipedia

Manual Easy Fit 5.1

Manual Excel 2003

Στατιστικές Κατανομές και Πιθανότητες. Θεωρία και...

Data & Analytics

Transcript of Στατιστικές Κατανομές και Πιθανότητες. Θεωρία και...