Statistik – Lektion 2

26
Statistik – Lektion 2 Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

description

Statistik – Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition. Population Populationsstørrelse N Populationsmiddelværdi μ Populationsvarians σ 2. Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi - PowerPoint PPT Presentation

Transcript of Statistik – Lektion 2

Page 1: Statistik – Lektion 2

Statistik – Lektion 2

Uafhængighed

Stokastiske Variable

Sandsynlighedsfordeling

Middelværdi og Varians for Stok. Var.

Page 2: Statistik – Lektion 2

Repetition

StikprøveStikprøvestørrelse nStikprøvemiddelværdi Stikprøvevarians s2

PopulationPopulationsstørrelse NPopulationsmiddelværdi μPopulationsvarians σ2

Sandsynligheder

x

Hændelser

SA

SA

S

Hændelse

hændelse Simpel

Udfaldsrum

)(/)()|()()()()(

)(1)(

1)(1)(0

BPBAPBAPBAPBPAPBAP

APAP

SPAP

Page 3: Statistik – Lektion 2

Simultan og marginal sandsynlighed

Fælles fond bedst B1

Fælles fond dårligst B1

Total

God skole A1 P(A1∩B1) =0.11 0.29 P(A1) = 0.40

Dårlig skole A2 0.06 0.54 0.60

Total 0.17 0.83 P(A)=P(B)=1.00

Simultan sandsynlighed er sandsynligheden for at en eller flere hændelser indtræffer simultant, fx P(A1∩B1)Marginale sandsynligheder beregnes ved at summere over rækker og søjler Holdning til fælles fond B

Sko

le B

Page 4: Statistik – Lektion 2

Uafhængighed To hændelser er uafhængige hvis:

Lige meget hvilken kombination af hændelser vi vælger, skal uafhængigheden gælde. Hvis bare en kombination viser afhængighed, er hændelserne afhængige.

P(A)P(B)B) P(ALigeledes

P(B)A)|P(Bog

P(A)B)|P(A

Page 5: Statistik – Lektion 2

Uafhængighed Eksempel: Er der uafhængighed mellem om en fælles

fond er god eller dårlig og om manageren kom fra en god eller dårlig skole?

Fælles fond bedst B1

Fælles fond dårligst B2

Total

God skole A1 0.11 0.29 0.40

Dårlig skole A2 0.06 0.54 0.60

Total 0.17 0.83 1.00

Holdning til fælles fond B

Sko

le B

Check fx om P(B1|A1) = P(B1) el. P(A2∩B2)= P(A2)P(B2)

Page 6: Statistik – Lektion 2

Lov om Total Sandsynlighed Lov om total sandsynlighed:

I ord: Sandsynligheden for A er lig sandsynligheden for A og B plus sandsynligheden for A og B’s kompliment.

)BP(AB)P(AP(A)

AB

_B

Page 7: Statistik – Lektion 2

Eksempel – Lov om Totalsandsynlighed Kortspil – find sandsynligheden for at trække et billedkort, A: Det må være sandsynligheden for at trække en billedkort i Hjerter

(H), Spar (S), Ruder (R) eller Klør (K): P(A)=P(A∩H) + P(A∩S) + P(A∩R) + P(A∩K)

= 3/52 + 3/52 + 3/52 + 3/52 = 12/52

Hjerter Spar Ruder Klør

A

A∩H A∩S A∩R A∩K

Page 8: Statistik – Lektion 2

Bayes’ sætning

P B AP A B

P A

P A B

P A B P A B

P AB P B

P AB P B P AB P B

( )( )

( )

( )

( ) ( )

( ) ( )

( ) ( ) ( ) ( )

Bemærk: Vi har ”vendt” de betingede sandsynligheder!

Page 9: Statistik – Lektion 2

Bayes’ sætning – Eksempel 2-10 En test for en sjælden sygdom, der rammer 0,1% af

befolkningen (P(I)=0,001), er upræcis. Lad i det følgende:

Sandsynligheden for at testen er positiv når man er syg:

Sandsynligheden for at testen er positiv, når man er rask:

Hvad er så sandsynligheden for at man er syg, givet at testen var positiv?

92.)( IZP

test negativ og test positiv

syg ikke og syg

ZZ

II

04.0)( IZP

)( ZIP

Page 10: Statistik – Lektion 2

Betragt de forskellig mulige ordninger af drenge (B) og piger (G) i fire fødsler. Der er 2*2*2*2=24 = 16 muligheder og udfaldsrummet er:

BBBB BGBB GBBB GGBB BBBG BGBG GBBG GGBGBBGB BGGB GBGB GGGBBBGG BGGG GBGG GGGG

Hvis pige og dreng er lige sandsynlige, [P(G) = P(B) = 1/2], og kønnet af hvert barn er uafhængig af kønnet på det foregående barn, så er sandsynligheden for hver af disse 16 muligheder:(1/2)(1/2)(1/2)(1/2) = 1/16.

Stokastisk Variabel: Et eksempel

Page 11: Statistik – Lektion 2

Tæl antallet af piger i hver af de fire fødsler:

BBBB (0) BGBB (1) GBBB (1) GGBB (2)BBBG (1) BGBG (2) GBBG (2) GGBG (3)BBGB (1) BGGB (2) GBGB (2) GGGB (3)BBGG (2) BGGG (3) GBGG (3) GGGG (4)

Bemærk at:• hvert mulig udfald tildeles en enkelt værdi• værdierne, der tildeles varierer over de forskellige udfald

Antallet af piger er en stokastisk variabel:

En stokastisk variabel , X, er en funktion, der tildeler en enkelt, men variabel værdi til hvert element i udfaldsrummet.

Eksempel - fortsat

Page 12: Statistik – Lektion 2

Eksempel - fortsat

BBBB BGBB GBBB

BBBG BBGB

GGBB GBBG BGBG

BGGB GBGB BBGG BGGG GBGG

GGGB GGBG

GGGG

0

1

2

3

4

XX

Udfalds rumPunkter på den reelle linie

Page 13: Statistik – Lektion 2

Stokastisk variabel En stokastisk variabel X er en funktion defineret på S

(udfaldsrummet), der antager værdier på R (reelle tal)

I eksperimenter knyttes en talværdi til hvert udfald:

Stokastiske variable kan enten være diskrete eller kontinuerte. Diskrete: Antager et endeligt antal værdier Kontinuerte: Antager værdier i en mængde af reelle tal

X: S R

S

oi

RX(oi)

X

0

Page 14: Statistik – Lektion 2

Eksempler på diskrete og kontinuerte variable

EksperimentEksperiment Stokastisk variabelStokastisk variabel TypeType

Kast med terning Antal øjne Diskret

Kast med 2 terninger Sum af antal øjne Diskret

Familie i Danmark Antal børn Diskret

Familie i Danmark Indkomst Kontinuert

Kvinder i Danmark Højde Kontinuert

Baby Fødselsvægt Kontinuert

Resten af denne forelæsning ser vi på diskrete stokastiske variable

Page 15: Statistik – Lektion 2

Eksempel: Den stokastisk variabel X = 3 når de følgende fire hændelser BGGG, GBGG, GGBG, eller GGGB forekommer,

P(X = 3) = P(BGGG) + P(GBGG) + P(GGBG) + P(GGGB) = 4/16

Sandsynligheds fordelingen af en stokastisk variabel er en tabel, der opskriver alle de mulige værdier af en stokastisk variabel og deres tilknyttede sandsynligheder.

x P(x)For eksemplet: 0 1/16

1 4/162 6/163 4/164 1/16

16/16=1

Eksempel - fortsat

Page 16: Statistik – Lektion 2

Eksempel - fortsat

Number of Girls, X

Pro

bability

, P(X

)

43210

0.4

0.3

0.2

0.1

0.0

1/ 16

4/ 16

6/ 16

4/ 16

1/ 16

Probability Distribution of the Number of Girls in Four Births

Number of Girls, X

Pro

bability

, P(X

)

43210

0.4

0.3

0.2

0.1

0.0

1/ 16

4/ 16

6/ 16

4/ 16

1/ 16

Probability Distribution of the Number of Girls in Four Births

Page 17: Statistik – Lektion 2

Sandsynligheds fordeling

x.af værdier alle for 0)( .1 xP

Definition: Lad X:S→R være en diskret stokastisk variabel.

P(X=x) = P(x) er en sandsynligheds-fordeling (-funktion) for X, hvis:

1)( 2. xallexP

Page 18: Statistik – Lektion 2

Kumulativ fordelingsfunktion

xi

iPxXPxF )( )()(

Den kumulative fordelingsfunktion, F(x), for en diskret stokastisk variabel X er:

x P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16

1.00

x P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16

1.0043210

1 .0

0 .9

0 .8

0 .7

0 .6

0 .5

0 .4

0 .3

0 .2

0 .1

0 .0

x

F(x

)

Kumulative fordelingsfunktions for antallet af piger ved 4 fødsler:

16

4

Page 19: Statistik – Lektion 2

Eksempel - fortsat

16/1416/116150331

16111651112

16/1122

/)F()F()XP(

//)F()P(X

)F()P(Xx P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16

1.00

x P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16

1.00

Page 20: Statistik – Lektion 2

Middelværdi Middelværdien af en diskret stokastisk variabel X er

givet ved:

Dvs. summen af værdien gange sandsynligheden for værdien – et vægtet gennemsnit.

Bemærk! Middelværdi kaldes også den forventede værdi.

x

xxPXE )()(

Page 21: Statistik – Lektion 2

Middelværdi - Eksempelx P(x) xP(x)0 1/161 4/162 6/163 4/164 1/16

16/16=1

Eksempel: X er antal øjne ved terningkast. Dvs. P(X=1) = P(X=2) = … = P(X=6) =1/6.Middelværdien er da:

5,36

1654321

6

1)()(

6

1

6

1

xx

xxxPXE

Page 22: Statistik – Lektion 2

Variansen er den vægtede gennemsnitlige kvadrerede afvigelse af værdierne af en stokastisk variabel fra gennemsnittet.

Standard afvigelsen er kvadratroden af variansen:

Varians

2

222

222

)()()]([)(

)()(])[()(

xx

x

xxPxPxXEXE

xPxXEXV

)()( XVXSD

Page 23: Statistik – Lektion 2

Varians - eksempelx x2 P(x) x2P(x) xP(x)0 0 1/16 0 01 1 4/16 4/16 4/16 2 4 6/16 24/16 12/163 9 4/16 36/16 12/164 16 1/16 16/16 4/16

1 80/16 32/16

)()()]([)()(

2

2222

xx

xxPxPxXEXEXV

Page 24: Statistik – Lektion 2

Chebyshevs Sætning For en stokastisk variabel X med middelværdi μ

og varians σ2 og ethvert tal k>1 gælder:

Ex: k=2:

Dvs. at med mindst 75% sandsynligheden er X mindre end to standardafvigelser fra μ.

211)|(| kkXP

43)2|(| XP

Page 25: Statistik – Lektion 2

Regneregler for middelværdi og varians

)()(

)()(2 xVabaXV

bXaEbaXE

Regneregler for en lineær funktion af X:

x

xPxhXhE )()())((

Hvis X er en diskret stokastisk variabel, da er middelværdien for en funktion h(X) givet ved

Page 26: Statistik – Lektion 2

Regneregler for middelværdi og varians

)()()()(

)()()()(

22112211

2121

kkkk

kk

XEaXEaXEaXaXaXaE

XEXEXEXXXE

Middelværdien af en linearkombination af stokastiske variable X1,X2,…,Xk.

)()()()(

)()()()(2

2221

212211

2121

kkkk

kk

XVaXVaXVaXaXaXaV

XVXVXVXXXV

Hvis X1,X2,…,Xk er indbyrdes uafhængige, så: