eisagwgi

10
1 ΣΤΑΤΙΣΤΙΚΗ I ΕΙΣΑΓΩΓΗ Πιθανότητες Η θεωρία πιθανοτήτων ασχολείται με τη μελέτη στοχαστικών φαινομένων. Πείραμα διάφορα αποτελέσματα / ενδεχόμενα, το καθένα από τα ο- ποία συμβαίνει με κάποια πιθανότητα. π.χ. ρίψεις νομισμάτων, ζαριού, μοίρασμα χαρτιών, απλές καθημερινές καταστάσεις (όπου υπάρχει τυχαιότητα). Για την περιγραφή στοχαστικών φαινομένων εισάγουμε την έννοια της τ.μ., π.χ. Διακριτές 1. Ο αριθμός πελατών που μπαίνουν ανά ώρα σε ένα κατάστημα. 2. Ο αριθμός των φορών που θα έρθει κορώνα, αν στρίψω ένα νόμισμα 20 φορές. Συνεχείς 1. Το ύψος ενός αγοριού 12 χρόνων. 2. Ο χρόνος αναμονής σε μια τράπεζα. Κάθε τ.μ. έχει ένα σύνολο τιμών, που μπορεί να πάρει τιμές, οι οποίες συνδέονται με κάποιες πιθανότητες. Το πώς συνδέονται, μας το λέει η κατανομή πιθανότητας. Έστω Χ μια διακριτή τ.μ. και ( ) PX x = , η συνάρτηση κατανομής της ( ) PX x = . Π.χ. ( ) 1 , 1, 2,..., 6 6 PX x x == = ( ) 6 1 1 PX x == ( ) 0 1 PX x =≤ ( ) ( ) EX xPX x μ = == ( ) ( ) ( ) x E gx gxPX x = = () ( ) ( )( ) 2 2 2 x V x E x x PX x μ μ σ = = == Ροπές περί την αρχή: ( ) ' 1 ' k k Ex μ μμ = →= 0

description

= → = E g x gxPX x = = ⋅ = = xPX x µ =   ∑ Π.χ. ( ) 1, 1,2,...,6 6 P X x x = = = = .  ∑ Κάθε τ.µ. έχει ένα σύνολο τιµών, που µπορεί να πάρει τιµές, οι οποίες συνδέονται µε κάποιες πιθανότητες. Το πώς συνδέονται, µας το λέει η κατανοµή πιθανότητας. P X x P X x 1 P X x = = Έστω Χ µια διακριτή τ.µ. και ( ) ∑ ∑ E X E x 1 0

Transcript of eisagwgi

Page 1: eisagwgi

1

ΣΤΑΤΙΣΤΙΚΗ I

ΕΙΣΑΓΩΓΗ

Πιθανότητες

Η θεωρία πιθανοτήτων ασχολείται µε τη µελέτη στοχαστικών φαινοµένων.

Πείραµα → διάφορα αποτελέσµατα / ενδεχόµενα, το καθένα από τα ο-

ποία συµβαίνει µε κάποια πιθανότητα.

π.χ. ρίψεις νοµισµάτων, ζαριού, µοίρασµα χαρτιών, απλές καθηµερινές

καταστάσεις (όπου υπάρχει τυχαιότητα).

Για την περιγραφή στοχαστικών φαινοµένων εισάγουµε την έννοια της

τ.µ., π.χ.

∆ιακριτές

1. Ο αριθµός πελατών που µπαίνουν ανά ώρα σε ένα κατάστηµα.

2. Ο αριθµός των φορών που θα έρθει κορώνα, αν στρίψω ένα νόµισµα 20 φορές.

Συνεχείς

1. Το ύψος ενός αγοριού 12 χρόνων.

2. Ο χρόνος αναµονής σε µια τράπεζα.

Κάθε τ.µ. έχει ένα σύνολο τιµών, που µπορεί να πάρει τιµές, οι οποίες

συνδέονται µε κάποιες πιθανότητες.

Το πώς συνδέονται, µας το λέει η κατανοµή πιθανότητας.

Έστω Χ µια διακριτή τ.µ. και ( )P X x= , η συνάρτηση κατανοµής της

( )P X x= .

Π.χ. ( ) 1, 1, 2,...,6

6P X x x= = =

( )6

1

1P X x= =∑

( )0 1P X x≤ = ≤

( ) ( )E X x P X x µ= ⋅ = =∑

( ) ( ) ( )x

E g x g x P X x= = ∑

( ) ( ) ( ) ( )2 2 2

x

V x E x x P X xµ µ σ = − = − = = ∑

Ροπές περί την αρχή: ( ) '

1' k

kE xµ µ µ= → =

0

Page 2: eisagwgi

2

Ροπές περί το µέσο: ( ) 2

2

k

k E xµ µ µ σ = − → =

Έστω Χ µια συνεχής τ.µ. και ( )f x η συνάρτηση πυκνότητας πιθανότητας.

π.χ. ( ) 2 ,0 1f x x x= < <

( ) 1f x dx =∫

( ) ( )a

f x dx P a X

β

β= < <∫

( ) ( )E X xf x dx= ∫

( ) ( ) ( )E g x g x f x dx= ∫

( ) ( ) ( ) ( )2 2 2V X E x x f x dxµ µ σ = − = − = ∫

( ) '

1' k

kE xµ µ µ= → =

( ) 2

2

k

k E xµ µ µ σ = − → =

Παράδειγµα:

Έστω Χ ο αριθµός των φορών που θα έλθει κορώνα, αν στρίψω ένα νόµι-

σµα 20 φορές.

Στρίβω το νόµισµα 20 φορές, άρα έχω 20 ανεξάρτητες δοκιµές.

Σε κάθε δοκιµή, η πιθανότητα να έλθει κορώνα είναι 0,5.

Συνολικά έρχεται κ φορές κορώνα και 20-κ φορές γράµµατα

( )20

201 1 1 1 1... ...

2 2 2 2 2x x

P X xx

= = ⋅ ⋅ ⋅ ⋅ ⋅ =

2020 1 1

2 2

x x

x

(∆ιωνυµική κατα-

νοµή)

( ) 10E x =

! Αν το νόµισµα δεν είναι δίκαιο, θα τείνει να έρχεται πιο συχνά , είτε κο-

ρώνα, είτε γράµµατα.

Έστω ότι η πιθανότητα να έρθει σε µια δοκιµή κορώνα είναι p.

( ) ( ) ( )20

1 120

... ...x x

p p pP X x p px

− −

= = ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ =

( )2020

1xx

p px

− −

( ) 20E x p= .

0 x

f(x)

Page 3: eisagwgi

3

Η πιθανότητα επιτυχίας p είναι η άγνωστη παράµετρος. Μπορούµε να ε-

κτιµήσουµε την άγνωστη παράµετρο p, αν στρίψουµε το νόµισµα 20 φορές και

µετρήσουµεότι ήρθε π.χ. 15 φορές κορώνα εκτίµηση 15

20p = .

Η στατιστική είναι η επιστήµη της τυχαιότητας.

Τα πάντα στη φύση είναι τυχαία και η σύγχρονη στατιστική επιστήµη α-

σχολείται µε την περιγραφή, ποσοτικοποίηση και την ερµηνεία αυτής της τυ-

χαιότητας. Τα εργαλεία που επιστρατεύονται στην προσπάθεια αυτή είναι η

στατιστική µοντελοποίηση και η στατιστική συµπερασµατολογία.

Στατιστική Μοντελοποίηση

Η ανάπτυξη πιθανοθεωρητικών υποδειγµάτων µε λίγες παραµέτρους για

την περιγραφή στοχαστικών φαινοµένων / διαδικασιών.

(π.χ. µοντελοποιώ τον αριθµό αφίξεων πελατών σε ένα κατάστηµα µε µια

κατανοµή Poisson (λ)).

Στατιστική Συµπερασµατολογία

Η εκτίµηση των αγνώστων παραµέτρων και την ποσοτικοποίηση της αβε-

βαιότητας, σχετικά µε τις εκτιµήσεις.

(Π.χ. σε ένα τυχαίο δείγµα 20 ωρών µετράω τον αριθµό αφίξεων ανά ώρα

και εκτιµώ το λ της Poisson).

• Εφαρµογές της Στατιστικής

• ∆ηµογραφία

• Έρευες αγοράς

• ∆ηµοσκοπήσεις

• Μάρκετινγκ

• Ψυχολογία

• Ιατρική

• Βιολογία – Γενετική

• Οικονοµία

• Φυσική

• Αναλυση εικόνας / ήχου.

Τα προβλήµατα που αντιµετωπίζουµε στη Στατιστική αφορούν την εξα-

γωγή συµπερασµάτων για ένα πληθυσµό από ένα τυχαίο δείγµα (τ.δ.).

Ο πληθυσµός αποτελείται από το σύνολο τιµών µιας τ.µ. Υ, η οποία εκ-

φράζει ποσοτικά το υπό µελέτη χαρακτηριστικό ή φαινόµενο.

Τυχαίο δείγµα:

Λέµε ότι ο τ.µ. 1 2, ,..., vX X X αποτελούν τυχαίο δείγµα, αν είναι ανεξάρτη-

τες και ισόνοµες.

Ανεξαρτησία:

( ) ( ) ( ) ( )1 1 2 2 1 1 2 2, ,..., ...v v v vP X x X x X x P X x P X x P X x= = = = = ⋅ = ⋅ ⋅ =

Ισόνοµες (ή ταυτοτικά κατανεµηµένες): Ακολουθούν την ίδια κατανοµή (µε τις ίδιες παραµέτρους)

Page 4: eisagwgi

4

Παράδειγµα

Έστω x ο αριθµός πελατών ανά ώρα σε ένα κατάστηµα. Με ενδιαφέρει

να εκτιµήσω τον αναµενόµενο αριθµό πελατών ανά ώρα.

α) Στατιστική Μοντελοποίηση:

Έστω ( )~X Poisson λ

( ) , 0,1,2,..., 0!

x

P X x e xx

λ λ λ−= = = >

β) Έστω 1 2, ,..., vX X X ένα τυχαίο δείγµα 10 εργάσιµων ωρών για ένα

κατάστηµα και έστω 1 2, ,..., vx x x στο διάστηµα παρατηρήσεως.

Εκτίµηση του λ: ɵ

10

1

10

i

i

x

λ ==∑

Page 5: eisagwgi

5

Επανάληψη στις Κατανοµές

1. ∆ιακριτές Κατανοµές

α) Bernoulli (p)

∆είχνει ποια η πιθανότητα να έχουµε επιτυχία ενός πειράµατος (x=1) , ή

αποτυχία (x=0)

( ) 1 , 0,1x xP X x p q x

−= = ⋅ =

( )E X p= , ( ) ( )1V X p q p p= ⋅ = −

β) Binomial(n,p) ∆ιωνυµική

∆είχνει ποια η πιθανότητα να έχουµε x επιτυχίες σε n επαναλήψεις ενός

πειράµατος (χ=0,1,…,ν).

( ) , 0,1,...,x n xn

P X x p q x nx

− = = ⋅ =

,

( ) ,E X n p= ⋅ ( ) ( )1V X n p q n p p= ⋅ ⋅ = ⋅ ⋅ −

! Για 1n = η κατανοµή είναι η Bernoulli

γ) Discrete Uniform (∆ιακριτή Οµοιόµορφη)

Εκφράζει το αποτέλεσµα µιας δοκιµής µε Ν ισοπίθανα ενδεχόµενα

( ) 1P X x

N= = ,

( ) ( )1

11 1 1

2 2

N

k

k

N N NE X x

v N=

+ += = ⋅ =∑ ,

( ) ( )21

1 v

k

k

V X x xv =

= −∑

( ) ( )( )1 1

12

N NV X

+ −=

δ) Geometric (p) Γεωµετρική

∆είχνει το πλήθος των δοκιµών, µέχρι την πρώτη επιτυχία.

( ) ( ) 11 , 0,1,2,...,0 1

xP X x p p x p

−= = − = ≤ ≤

( ) 1E X

p= , ( ) 2

1 pV X

p

−=

ε) Poisson (λ)

∆είχνει ποια η πιθανότητα να έχουµε x γεγονότα σε ένα προκαθορισµένο

διάστηµα, όχι απαραίτητα χρονικό.

( )!

x

P X x ex

λ λ−

−= = , [ ]E X λ= , [ ]V X λ=

1. Συνεχείς Κατανοµές

Page 6: eisagwgi

6

Έστω Χ µια τυχαία µεταβλητή, η οποία ακολουθεί συνεχή κατανοµή. Τό-

τε µιλάµε για συνάρτηση πυκνότητας πιθανότητας ( )f x . Έχουµε τότε

( ) 1a

f x dx

β

=∫ , όπου (α,β) το πεδίο ορισµού της κατανοµής

( ) ( ) ( ), : 0, ,f

S a P X x x aβ β= = > ∀ ∈ .

Αθροιστική συνάρτηση κατανοµής: ( ) ( )F x P X x= ≤

Θα έχουµε ( ) ( )dF x f x

dx= , ( ) ( )

x

F x f t dt−∞

= ∫ και

( ) ( ) ( ) ( )a

P a x f x dx F F a

β

β β≤ ≤ = = −∫

Αναµενόµενες τιµές: ( ) ( ) ( )E g x g x f x dx= ∫

π.χ.

( )g x x= ⇒ ( ) ( )E g x E x µ= =

( ) ( )2g x x µ= − ⇒ ( ) ( ) ( )2 2E g x E x V xµ σ = − = =

Συνεχής οµοιόµορφη (α,β) Εκθετική

α) Uniform (a,b) Οµοιόµορφη (συνεχής)

( ) 1; ,f x a

β=

−, ( )

2

aE X

β+= , ( ) ( ) 2

12

aV X

β −= .

β) Exponential (β) Εκθετική

( ) 1; ,0 , 0.

x

f x e xββ ββ

= ≤ < ∞ >

( )E X β= , ( ) 2V X β= .

γ) Beta (α,β) Βήτα

0

0 β α

Page 7: eisagwgi

7

0 1 1/2

( )( )

( ) 1111 ,0 1, , 0

,

af x x x x a

B a

β ββ

−−= ⋅ ⋅ − ≤ ≤ >

Η Β(α,β) λέγεται συνάρτηση Β, ή Β ολοκλήρωµα.

( ) ( )1

11

0

, 1aB a x x dx

ββ −−= ⋅ −∫

(Ορίζεται έτσι, ώστε: ( )( )

( )1 1

11

0 0

11 1 1

,

af x dx x x dx

B a

β

β−−= ⇒ ⋅ − = ⇒∫ ∫

( ) ( )1

11

0

, 1aB a x x dx

ββ −−= ⋅ −∫ )

( ) aE X

a b=

+, ( )

( ) ( )21

aV X

a a

β

β β=

+ ⋅ + +

Παρατηρήσεις

Αν α=β ( ) 1

2E X→ = ,

αν α=β=2 αν α=β=1

Συνεχής οµοιόµορφη (0,1)

αν α=β=1/2 αν α<β ( ) 1

2E X→ <

π.χ. α=2,β=5

0 1

Page 8: eisagwgi

8

0 1 1/2

0 µ

2

2

δ) Gamma (α,β) Γάµα

Έστω µία τ.µ. που ακολουθεί κατανοµή Γάµµα (λ,p) και σ.π.π.

( )( )

11; , , 0

x

a

af x a x e x

a

βββ

−−= >

Γ ⋅

( )E X aβ= , ( ) 2V X aβ= .

Για α=1, έχουµε εκθετική (β)

ε) Normal (µ, σ2) Κανονική ή κατανοµή Gauss.

( ) ( )22

22

1| , exp , ,

22

xf x x

µµ σ µ

σπσ

− = − −∞ < < ∞

( )E X µ= , ( ) 2V X σ= .

Αν µ=0 και σ2=1, η κανονική κατανοµή (0,1) λέγεται τυπική ή τυποποιη-

µένη κανονική κατανοµή.

Π.χ. η τ.µ. x

σ−

= ακολουθεί την τυποποιηµένη κανονική κατανοµή.

∆ύο κανονικές κατανοµές µε ίδιο µέσο

µ και διαφορετικές διασπορές 2 2

1 2σ σ<

Γενικά

Οι παράµετροι µιας κατανοµής είναι αριθµητικές εκφράσεις, που καθορίζουν

1) Τη θέση

2) τη διασπορά και

3) τη µορφή της κατανοµής και

0 1 1/2

Page 9: eisagwgi

9

δεν είναι µοναδικές.

Π.χ. στην κατανοµή Γάµµα, ( )E X aβ= , ( ) 2V X aβ= ,

αν θέσουµε ( )E X aβ µ= = και ( ) 2 2V X aβ σ= = , τότε

2 2

a

a

β µ

β σ

= ⇒

=

2 2

aµβ

µβ σ

β

= ⇒=

2

2

aµσµ

σβ

µ

= ⇒=

2

2

2

aµσσ

βµ

=

=

, οπότε

( )( )

11; ,

x

a

af x a x e

a

βββ

−−= =

Γ ⋅

22

2

2

2

2 2 1

2

2 2

2

1; ,

x

f x x e

σµµσ

µσ

µ σσ µ

µ σσ µ

− −

=

Γ ⋅

Πληθυσµός: τ.µ. Χ, η οποία ακολουθεί µία κατανοµή.

Έστω 1 2, ,..., vX X X τυχαίο δείγµα (τ.δ.) πραγµατοποιήσεων της τ.µ. Χ.

Εµπειρική κατανοµή του δείγµατος.

( ) 1P X x

v= = , είναι διακριτή κατανοµή, που δίνει ίση πιθανότητα σε κάθε πα-

ρατήρηση (όχι σε κάθε παρατηρούµενη τιµή!)

3 2 3 2 3 4

↓ ↓ ↓ ↓ ↓ ↓

1/6 1/6 1/6 1/6 1/6 1/6

0 1 2 3 4 5

↓ ↓ ↓ ↓ ↓ ↓

π.χ. δείγµα

0 0 2/6 3/6 1/6 0

δεν είναι ίδια µε τη διακριτή οµοιόµορφη, γιατί τότε θα ίσχυε:

0 1 2 3 4 5

↓ ↓ ↓ ↓ ↓ ↓

1/6 1/6 1/6 1/6 1/6 1/6

Page 10: eisagwgi

10

Η εµπειρική κατανοµή βοηθάει να υπολογίζουµε τις δειγµατικές αναµενόµενες

τιµές.

Πληθυσµός (τ.µ. Χ) ∆είγµα ( )1 2, ,..., vx x x

µ=Ε(Χ) δειγµατικός µέσος : ( )

1

v

i i

i

x P X x=

= =∑

1

1v

i

i

xv=

=∑ 1

1 v

i

i

x Xv =

=∑

( )22 E xσ µ = = ∆ειγµατική διασπορά:

( ) ( )2

1

v

i i

i

x X P X x=

− = =∑

( )21

1v

i

i

x Xv=

− =∑ ( )2 2

*

1

1 v

i

i

x X sv =

− =∑ (1)

1 Ενώ η X είναι αµερόληπτη, η

2

*s δεν είναι, όπως θα δούµε στην εκτιµητική. Αµερόληπτη θα είναι η

( )22

1

1

1

v

i

i

s x Xv =

= −− ∑ .