eisagwgi
description
Transcript of eisagwgi
1
ΣΤΑΤΙΣΤΙΚΗ I
ΕΙΣΑΓΩΓΗ
Πιθανότητες
Η θεωρία πιθανοτήτων ασχολείται µε τη µελέτη στοχαστικών φαινοµένων.
Πείραµα → διάφορα αποτελέσµατα / ενδεχόµενα, το καθένα από τα ο-
ποία συµβαίνει µε κάποια πιθανότητα.
π.χ. ρίψεις νοµισµάτων, ζαριού, µοίρασµα χαρτιών, απλές καθηµερινές
καταστάσεις (όπου υπάρχει τυχαιότητα).
Για την περιγραφή στοχαστικών φαινοµένων εισάγουµε την έννοια της
τ.µ., π.χ.
∆ιακριτές
1. Ο αριθµός πελατών που µπαίνουν ανά ώρα σε ένα κατάστηµα.
2. Ο αριθµός των φορών που θα έρθει κορώνα, αν στρίψω ένα νόµισµα 20 φορές.
Συνεχείς
1. Το ύψος ενός αγοριού 12 χρόνων.
2. Ο χρόνος αναµονής σε µια τράπεζα.
Κάθε τ.µ. έχει ένα σύνολο τιµών, που µπορεί να πάρει τιµές, οι οποίες
συνδέονται µε κάποιες πιθανότητες.
Το πώς συνδέονται, µας το λέει η κατανοµή πιθανότητας.
Έστω Χ µια διακριτή τ.µ. και ( )P X x= , η συνάρτηση κατανοµής της
( )P X x= .
Π.χ. ( ) 1, 1, 2,...,6
6P X x x= = =
( )6
1
1P X x= =∑
( )0 1P X x≤ = ≤
( ) ( )E X x P X x µ= ⋅ = =∑
( ) ( ) ( )x
E g x g x P X x= = ∑
( ) ( ) ( ) ( )2 2 2
x
V x E x x P X xµ µ σ = − = − = = ∑
Ροπές περί την αρχή: ( ) '
1' k
kE xµ µ µ= → =
0
2
Ροπές περί το µέσο: ( ) 2
2
k
k E xµ µ µ σ = − → =
Έστω Χ µια συνεχής τ.µ. και ( )f x η συνάρτηση πυκνότητας πιθανότητας.
π.χ. ( ) 2 ,0 1f x x x= < <
( ) 1f x dx =∫
( ) ( )a
f x dx P a X
β
β= < <∫
( ) ( )E X xf x dx= ∫
( ) ( ) ( )E g x g x f x dx= ∫
( ) ( ) ( ) ( )2 2 2V X E x x f x dxµ µ σ = − = − = ∫
( ) '
1' k
kE xµ µ µ= → =
( ) 2
2
k
k E xµ µ µ σ = − → =
Παράδειγµα:
Έστω Χ ο αριθµός των φορών που θα έλθει κορώνα, αν στρίψω ένα νόµι-
σµα 20 φορές.
Στρίβω το νόµισµα 20 φορές, άρα έχω 20 ανεξάρτητες δοκιµές.
Σε κάθε δοκιµή, η πιθανότητα να έλθει κορώνα είναι 0,5.
Συνολικά έρχεται κ φορές κορώνα και 20-κ φορές γράµµατα
( )20
201 1 1 1 1... ...
2 2 2 2 2x x
P X xx
−
= = ⋅ ⋅ ⋅ ⋅ ⋅ =
2020 1 1
2 2
x x
x
−
(∆ιωνυµική κατα-
νοµή)
( ) 10E x =
! Αν το νόµισµα δεν είναι δίκαιο, θα τείνει να έρχεται πιο συχνά , είτε κο-
ρώνα, είτε γράµµατα.
Έστω ότι η πιθανότητα να έρθει σε µια δοκιµή κορώνα είναι p.
( ) ( ) ( )20
1 120
... ...x x
p p pP X x p px
−
− −
= = ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ =
( )2020
1xx
p px
− −
( ) 20E x p= .
0 x
f(x)
3
Η πιθανότητα επιτυχίας p είναι η άγνωστη παράµετρος. Μπορούµε να ε-
κτιµήσουµε την άγνωστη παράµετρο p, αν στρίψουµε το νόµισµα 20 φορές και
µετρήσουµεότι ήρθε π.χ. 15 φορές κορώνα εκτίµηση 15
20p = .
Η στατιστική είναι η επιστήµη της τυχαιότητας.
Τα πάντα στη φύση είναι τυχαία και η σύγχρονη στατιστική επιστήµη α-
σχολείται µε την περιγραφή, ποσοτικοποίηση και την ερµηνεία αυτής της τυ-
χαιότητας. Τα εργαλεία που επιστρατεύονται στην προσπάθεια αυτή είναι η
στατιστική µοντελοποίηση και η στατιστική συµπερασµατολογία.
Στατιστική Μοντελοποίηση
Η ανάπτυξη πιθανοθεωρητικών υποδειγµάτων µε λίγες παραµέτρους για
την περιγραφή στοχαστικών φαινοµένων / διαδικασιών.
(π.χ. µοντελοποιώ τον αριθµό αφίξεων πελατών σε ένα κατάστηµα µε µια
κατανοµή Poisson (λ)).
Στατιστική Συµπερασµατολογία
Η εκτίµηση των αγνώστων παραµέτρων και την ποσοτικοποίηση της αβε-
βαιότητας, σχετικά µε τις εκτιµήσεις.
(Π.χ. σε ένα τυχαίο δείγµα 20 ωρών µετράω τον αριθµό αφίξεων ανά ώρα
και εκτιµώ το λ της Poisson).
• Εφαρµογές της Στατιστικής
• ∆ηµογραφία
• Έρευες αγοράς
• ∆ηµοσκοπήσεις
• Μάρκετινγκ
• Ψυχολογία
• Ιατρική
• Βιολογία – Γενετική
• Οικονοµία
• Φυσική
• Αναλυση εικόνας / ήχου.
Τα προβλήµατα που αντιµετωπίζουµε στη Στατιστική αφορούν την εξα-
γωγή συµπερασµάτων για ένα πληθυσµό από ένα τυχαίο δείγµα (τ.δ.).
Ο πληθυσµός αποτελείται από το σύνολο τιµών µιας τ.µ. Υ, η οποία εκ-
φράζει ποσοτικά το υπό µελέτη χαρακτηριστικό ή φαινόµενο.
Τυχαίο δείγµα:
Λέµε ότι ο τ.µ. 1 2, ,..., vX X X αποτελούν τυχαίο δείγµα, αν είναι ανεξάρτη-
τες και ισόνοµες.
Ανεξαρτησία:
( ) ( ) ( ) ( )1 1 2 2 1 1 2 2, ,..., ...v v v vP X x X x X x P X x P X x P X x= = = = = ⋅ = ⋅ ⋅ =
Ισόνοµες (ή ταυτοτικά κατανεµηµένες): Ακολουθούν την ίδια κατανοµή (µε τις ίδιες παραµέτρους)
4
Παράδειγµα
Έστω x ο αριθµός πελατών ανά ώρα σε ένα κατάστηµα. Με ενδιαφέρει
να εκτιµήσω τον αναµενόµενο αριθµό πελατών ανά ώρα.
α) Στατιστική Μοντελοποίηση:
Έστω ( )~X Poisson λ
( ) , 0,1,2,..., 0!
x
P X x e xx
λ λ λ−= = = >
β) Έστω 1 2, ,..., vX X X ένα τυχαίο δείγµα 10 εργάσιµων ωρών για ένα
κατάστηµα και έστω 1 2, ,..., vx x x στο διάστηµα παρατηρήσεως.
Εκτίµηση του λ: ɵ
10
1
10
i
i
x
λ ==∑
5
Επανάληψη στις Κατανοµές
1. ∆ιακριτές Κατανοµές
α) Bernoulli (p)
∆είχνει ποια η πιθανότητα να έχουµε επιτυχία ενός πειράµατος (x=1) , ή
αποτυχία (x=0)
( ) 1 , 0,1x xP X x p q x
−= = ⋅ =
( )E X p= , ( ) ( )1V X p q p p= ⋅ = −
β) Binomial(n,p) ∆ιωνυµική
∆είχνει ποια η πιθανότητα να έχουµε x επιτυχίες σε n επαναλήψεις ενός
πειράµατος (χ=0,1,…,ν).
( ) , 0,1,...,x n xn
P X x p q x nx
− = = ⋅ =
,
( ) ,E X n p= ⋅ ( ) ( )1V X n p q n p p= ⋅ ⋅ = ⋅ ⋅ −
! Για 1n = η κατανοµή είναι η Bernoulli
γ) Discrete Uniform (∆ιακριτή Οµοιόµορφη)
Εκφράζει το αποτέλεσµα µιας δοκιµής µε Ν ισοπίθανα ενδεχόµενα
( ) 1P X x
N= = ,
( ) ( )1
11 1 1
2 2
N
k
k
N N NE X x
v N=
+ += = ⋅ =∑ ,
( ) ( )21
1 v
k
k
V X x xv =
= −∑
( ) ( )( )1 1
12
N NV X
+ −=
δ) Geometric (p) Γεωµετρική
∆είχνει το πλήθος των δοκιµών, µέχρι την πρώτη επιτυχία.
( ) ( ) 11 , 0,1,2,...,0 1
xP X x p p x p
−= = − = ≤ ≤
( ) 1E X
p= , ( ) 2
1 pV X
p
−=
ε) Poisson (λ)
∆είχνει ποια η πιθανότητα να έχουµε x γεγονότα σε ένα προκαθορισµένο
διάστηµα, όχι απαραίτητα χρονικό.
( )!
x
P X x ex
λ λ−
−= = , [ ]E X λ= , [ ]V X λ=
1. Συνεχείς Κατανοµές
6
Έστω Χ µια τυχαία µεταβλητή, η οποία ακολουθεί συνεχή κατανοµή. Τό-
τε µιλάµε για συνάρτηση πυκνότητας πιθανότητας ( )f x . Έχουµε τότε
( ) 1a
f x dx
β
=∫ , όπου (α,β) το πεδίο ορισµού της κατανοµής
( ) ( ) ( ), : 0, ,f
S a P X x x aβ β= = > ∀ ∈ .
Αθροιστική συνάρτηση κατανοµής: ( ) ( )F x P X x= ≤
Θα έχουµε ( ) ( )dF x f x
dx= , ( ) ( )
x
F x f t dt−∞
= ∫ και
( ) ( ) ( ) ( )a
P a x f x dx F F a
β
β β≤ ≤ = = −∫
Αναµενόµενες τιµές: ( ) ( ) ( )E g x g x f x dx= ∫
π.χ.
( )g x x= ⇒ ( ) ( )E g x E x µ= =
( ) ( )2g x x µ= − ⇒ ( ) ( ) ( )2 2E g x E x V xµ σ = − = =
Συνεχής οµοιόµορφη (α,β) Εκθετική
α) Uniform (a,b) Οµοιόµορφη (συνεχής)
( ) 1; ,f x a
aβ
β=
−, ( )
2
aE X
β+= , ( ) ( ) 2
12
aV X
β −= .
β) Exponential (β) Εκθετική
( ) 1; ,0 , 0.
x
f x e xββ ββ
−
= ≤ < ∞ >
( )E X β= , ( ) 2V X β= .
γ) Beta (α,β) Βήτα
0
0 β α
7
0 1 1/2
( )( )
( ) 1111 ,0 1, , 0
,
af x x x x a
B a
β ββ
−−= ⋅ ⋅ − ≤ ≤ >
Η Β(α,β) λέγεται συνάρτηση Β, ή Β ολοκλήρωµα.
( ) ( )1
11
0
, 1aB a x x dx
ββ −−= ⋅ −∫
(Ορίζεται έτσι, ώστε: ( )( )
( )1 1
11
0 0
11 1 1
,
af x dx x x dx
B a
β
β−−= ⇒ ⋅ − = ⇒∫ ∫
( ) ( )1
11
0
, 1aB a x x dx
ββ −−= ⋅ −∫ )
( ) aE X
a b=
+, ( )
( ) ( )21
aV X
a a
β
β β=
+ ⋅ + +
Παρατηρήσεις
Αν α=β ( ) 1
2E X→ = ,
αν α=β=2 αν α=β=1
Συνεχής οµοιόµορφη (0,1)
αν α=β=1/2 αν α<β ( ) 1
2E X→ <
π.χ. α=2,β=5
0 1
8
0 1 1/2
0 µ
2
1σ
2
2σ
δ) Gamma (α,β) Γάµα
Έστω µία τ.µ. που ακολουθεί κατανοµή Γάµµα (λ,p) και σ.π.π.
( )( )
11; , , 0
x
a
af x a x e x
a
βββ
−−= >
Γ ⋅
( )E X aβ= , ( ) 2V X aβ= .
Για α=1, έχουµε εκθετική (β)
ε) Normal (µ, σ2) Κανονική ή κατανοµή Gauss.
( ) ( )22
22
1| , exp , ,
22
xf x x
µµ σ µ
σπσ
− = − −∞ < < ∞
( )E X µ= , ( ) 2V X σ= .
Αν µ=0 και σ2=1, η κανονική κατανοµή (0,1) λέγεται τυπική ή τυποποιη-
µένη κανονική κατανοµή.
Π.χ. η τ.µ. x
zµ
σ−
= ακολουθεί την τυποποιηµένη κανονική κατανοµή.
∆ύο κανονικές κατανοµές µε ίδιο µέσο
µ και διαφορετικές διασπορές 2 2
1 2σ σ<
Γενικά
Οι παράµετροι µιας κατανοµής είναι αριθµητικές εκφράσεις, που καθορίζουν
1) Τη θέση
2) τη διασπορά και
3) τη µορφή της κατανοµής και
0 1 1/2
9
δεν είναι µοναδικές.
Π.χ. στην κατανοµή Γάµµα, ( )E X aβ= , ( ) 2V X aβ= ,
αν θέσουµε ( )E X aβ µ= = και ( ) 2 2V X aβ σ= = , τότε
2 2
a
a
β µ
β σ
= ⇒
=
2 2
aµβ
µβ σ
β
= ⇒=
2
2
aµσµ
σβ
µ
= ⇒=
2
2
2
aµσσ
βµ
=
=
, οπότε
( )( )
11; ,
x
a
af x a x e
a
βββ
−−= =
Γ ⋅
22
2
2
2
2 2 1
2
2 2
2
1; ,
x
f x x e
σµµσ
µσ
µ σσ µ
µ σσ µ
− −
=
Γ ⋅
Πληθυσµός: τ.µ. Χ, η οποία ακολουθεί µία κατανοµή.
Έστω 1 2, ,..., vX X X τυχαίο δείγµα (τ.δ.) πραγµατοποιήσεων της τ.µ. Χ.
Εµπειρική κατανοµή του δείγµατος.
( ) 1P X x
v= = , είναι διακριτή κατανοµή, που δίνει ίση πιθανότητα σε κάθε πα-
ρατήρηση (όχι σε κάθε παρατηρούµενη τιµή!)
3 2 3 2 3 4
↓ ↓ ↓ ↓ ↓ ↓
1/6 1/6 1/6 1/6 1/6 1/6
⇓
0 1 2 3 4 5
↓ ↓ ↓ ↓ ↓ ↓
π.χ. δείγµα
0 0 2/6 3/6 1/6 0
δεν είναι ίδια µε τη διακριτή οµοιόµορφη, γιατί τότε θα ίσχυε:
0 1 2 3 4 5
↓ ↓ ↓ ↓ ↓ ↓
1/6 1/6 1/6 1/6 1/6 1/6
10
Η εµπειρική κατανοµή βοηθάει να υπολογίζουµε τις δειγµατικές αναµενόµενες
τιµές.
Πληθυσµός (τ.µ. Χ) ∆είγµα ( )1 2, ,..., vx x x
µ=Ε(Χ) δειγµατικός µέσος : ( )
1
v
i i
i
x P X x=
= =∑
1
1v
i
i
xv=
=∑ 1
1 v
i
i
x Xv =
=∑
( )22 E xσ µ = = ∆ειγµατική διασπορά:
( ) ( )2
1
v
i i
i
x X P X x=
− = =∑
( )21
1v
i
i
x Xv=
− =∑ ( )2 2
*
1
1 v
i
i
x X sv =
− =∑ (1)
1 Ενώ η X είναι αµερόληπτη, η
2
*s δεν είναι, όπως θα δούµε στην εκτιµητική. Αµερόληπτη θα είναι η
( )22
1
1
1
v
i
i
s x Xv =
= −− ∑ .