Statistik – Lektion 2
Embed Size (px)
description
Transcript of Statistik – Lektion 2

Statistik – Lektion 2
Uafhængighed
Stokastiske Variable
Sandsynlighedsfordeling
Middelværdi og Varians for Stok. Var.

Repetition
StikprøveStikprøvestørrelse nStikprøvemiddelværdi Stikprøvevarians s2
PopulationPopulationsstørrelse NPopulationsmiddelværdi μPopulationsvarians σ2
Sandsynligheder
x
Hændelser
SA
SA
S
Hændelse
hændelse Simpel
Udfaldsrum
)(/)()|()()()()(
)(1)(
1)(1)(0
BPBAPBAPBAPBPAPBAP
APAP
SPAP

Simultan og marginal sandsynlighed
Fælles fond bedst B1
Fælles fond dårligst B1
Total
God skole A1 P(A1∩B1) =0.11 0.29 P(A1) = 0.40
Dårlig skole A2 0.06 0.54 0.60
Total 0.17 0.83 P(A)=P(B)=1.00
Simultan sandsynlighed er sandsynligheden for at en eller flere hændelser indtræffer simultant, fx P(A1∩B1)Marginale sandsynligheder beregnes ved at summere over rækker og søjler Holdning til fælles fond B
Sko
le B

Uafhængighed To hændelser er uafhængige hvis:
Lige meget hvilken kombination af hændelser vi vælger, skal uafhængigheden gælde. Hvis bare en kombination viser afhængighed, er hændelserne afhængige.
P(A)P(B)B) P(ALigeledes
P(B)A)|P(Bog
P(A)B)|P(A

Uafhængighed Eksempel: Er der uafhængighed mellem om en fælles
fond er god eller dårlig og om manageren kom fra en god eller dårlig skole?
Fælles fond bedst B1
Fælles fond dårligst B2
Total
God skole A1 0.11 0.29 0.40
Dårlig skole A2 0.06 0.54 0.60
Total 0.17 0.83 1.00
Holdning til fælles fond B
Sko
le B
Check fx om P(B1|A1) = P(B1) el. P(A2∩B2)= P(A2)P(B2)

Lov om Total Sandsynlighed Lov om total sandsynlighed:
I ord: Sandsynligheden for A er lig sandsynligheden for A og B plus sandsynligheden for A og B’s kompliment.
)BP(AB)P(AP(A)
AB
_B

Eksempel – Lov om Totalsandsynlighed Kortspil – find sandsynligheden for at trække et billedkort, A: Det må være sandsynligheden for at trække en billedkort i Hjerter
(H), Spar (S), Ruder (R) eller Klør (K): P(A)=P(A∩H) + P(A∩S) + P(A∩R) + P(A∩K)
= 3/52 + 3/52 + 3/52 + 3/52 = 12/52
Hjerter Spar Ruder Klør
A
A∩H A∩S A∩R A∩K

Bayes’ sætning
P B AP A B
P A
P A B
P A B P A B
P AB P B
P AB P B P AB P B
( )( )
( )
( )
( ) ( )
( ) ( )
( ) ( ) ( ) ( )
Bemærk: Vi har ”vendt” de betingede sandsynligheder!

Bayes’ sætning – Eksempel 2-10 En test for en sjælden sygdom, der rammer 0,1% af
befolkningen (P(I)=0,001), er upræcis. Lad i det følgende:
Sandsynligheden for at testen er positiv når man er syg:
Sandsynligheden for at testen er positiv, når man er rask:
Hvad er så sandsynligheden for at man er syg, givet at testen var positiv?
92.)( IZP
test negativ og test positiv
syg ikke og syg
ZZ
II
04.0)( IZP
)( ZIP

Betragt de forskellig mulige ordninger af drenge (B) og piger (G) i fire fødsler. Der er 2*2*2*2=24 = 16 muligheder og udfaldsrummet er:
BBBB BGBB GBBB GGBB BBBG BGBG GBBG GGBGBBGB BGGB GBGB GGGBBBGG BGGG GBGG GGGG
Hvis pige og dreng er lige sandsynlige, [P(G) = P(B) = 1/2], og kønnet af hvert barn er uafhængig af kønnet på det foregående barn, så er sandsynligheden for hver af disse 16 muligheder:(1/2)(1/2)(1/2)(1/2) = 1/16.
Stokastisk Variabel: Et eksempel

Tæl antallet af piger i hver af de fire fødsler:
BBBB (0) BGBB (1) GBBB (1) GGBB (2)BBBG (1) BGBG (2) GBBG (2) GGBG (3)BBGB (1) BGGB (2) GBGB (2) GGGB (3)BBGG (2) BGGG (3) GBGG (3) GGGG (4)
Bemærk at:• hvert mulig udfald tildeles en enkelt værdi• værdierne, der tildeles varierer over de forskellige udfald
Antallet af piger er en stokastisk variabel:
En stokastisk variabel , X, er en funktion, der tildeler en enkelt, men variabel værdi til hvert element i udfaldsrummet.
Eksempel - fortsat

Eksempel - fortsat
BBBB BGBB GBBB
BBBG BBGB
GGBB GBBG BGBG
BGGB GBGB BBGG BGGG GBGG
GGGB GGBG
GGGG
0
1
2
3
4
XX
Udfalds rumPunkter på den reelle linie

Stokastisk variabel En stokastisk variabel X er en funktion defineret på S
(udfaldsrummet), der antager værdier på R (reelle tal)
I eksperimenter knyttes en talværdi til hvert udfald:
Stokastiske variable kan enten være diskrete eller kontinuerte. Diskrete: Antager et endeligt antal værdier Kontinuerte: Antager værdier i en mængde af reelle tal
X: S R
S
oi
RX(oi)
X
0

Eksempler på diskrete og kontinuerte variable
EksperimentEksperiment Stokastisk variabelStokastisk variabel TypeType
Kast med terning Antal øjne Diskret
Kast med 2 terninger Sum af antal øjne Diskret
Familie i Danmark Antal børn Diskret
Familie i Danmark Indkomst Kontinuert
Kvinder i Danmark Højde Kontinuert
Baby Fødselsvægt Kontinuert
Resten af denne forelæsning ser vi på diskrete stokastiske variable

Eksempel: Den stokastisk variabel X = 3 når de følgende fire hændelser BGGG, GBGG, GGBG, eller GGGB forekommer,
P(X = 3) = P(BGGG) + P(GBGG) + P(GGBG) + P(GGGB) = 4/16
Sandsynligheds fordelingen af en stokastisk variabel er en tabel, der opskriver alle de mulige værdier af en stokastisk variabel og deres tilknyttede sandsynligheder.
x P(x)For eksemplet: 0 1/16
1 4/162 6/163 4/164 1/16
16/16=1
Eksempel - fortsat

Eksempel - fortsat
Number of Girls, X
Pro
bability
, P(X
)
43210
0.4
0.3
0.2
0.1
0.0
1/ 16
4/ 16
6/ 16
4/ 16
1/ 16
Probability Distribution of the Number of Girls in Four Births
Number of Girls, X
Pro
bability
, P(X
)
43210
0.4
0.3
0.2
0.1
0.0
1/ 16
4/ 16
6/ 16
4/ 16
1/ 16
Probability Distribution of the Number of Girls in Four Births

Sandsynligheds fordeling
x.af værdier alle for 0)( .1 xP
Definition: Lad X:S→R være en diskret stokastisk variabel.
P(X=x) = P(x) er en sandsynligheds-fordeling (-funktion) for X, hvis:
1)( 2. xallexP

Kumulativ fordelingsfunktion
xi
iPxXPxF )( )()(
Den kumulative fordelingsfunktion, F(x), for en diskret stokastisk variabel X er:
x P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16
1.00
x P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16
1.0043210
1 .0
0 .9
0 .8
0 .7
0 .6
0 .5
0 .4
0 .3
0 .2
0 .1
0 .0
x
F(x
)
Kumulative fordelingsfunktions for antallet af piger ved 4 fødsler:
16
4

Eksempel - fortsat
16/1416/116150331
16111651112
16/1122
/)F()F()XP(
//)F()P(X
)F()P(Xx P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16
1.00
x P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16
1.00

Middelværdi Middelværdien af en diskret stokastisk variabel X er
givet ved:
Dvs. summen af værdien gange sandsynligheden for værdien – et vægtet gennemsnit.
Bemærk! Middelværdi kaldes også den forventede værdi.
x
xxPXE )()(

Middelværdi - Eksempelx P(x) xP(x)0 1/161 4/162 6/163 4/164 1/16
16/16=1
Eksempel: X er antal øjne ved terningkast. Dvs. P(X=1) = P(X=2) = … = P(X=6) =1/6.Middelværdien er da:
5,36
1654321
6
1)()(
6
1
6
1
xx
xxxPXE

Variansen er den vægtede gennemsnitlige kvadrerede afvigelse af værdierne af en stokastisk variabel fra gennemsnittet.
Standard afvigelsen er kvadratroden af variansen:
Varians
2
222
222
)()()]([)(
)()(])[()(
xx
x
xxPxPxXEXE
xPxXEXV
)()( XVXSD

Varians - eksempelx x2 P(x) x2P(x) xP(x)0 0 1/16 0 01 1 4/16 4/16 4/16 2 4 6/16 24/16 12/163 9 4/16 36/16 12/164 16 1/16 16/16 4/16
1 80/16 32/16
)()()]([)()(
2
2222
xx
xxPxPxXEXEXV

Chebyshevs Sætning For en stokastisk variabel X med middelværdi μ
og varians σ2 og ethvert tal k>1 gælder:
Ex: k=2:
Dvs. at med mindst 75% sandsynligheden er X mindre end to standardafvigelser fra μ.
211)|(| kkXP
43)2|(| XP

Regneregler for middelværdi og varians
)()(
)()(2 xVabaXV
bXaEbaXE
Regneregler for en lineær funktion af X:
x
xPxhXhE )()())((
Hvis X er en diskret stokastisk variabel, da er middelværdien for en funktion h(X) givet ved

Regneregler for middelværdi og varians
)()()()(
)()()()(
22112211
2121
kkkk
kk
XEaXEaXEaXaXaXaE
XEXEXEXXXE
Middelværdien af en linearkombination af stokastiske variable X1,X2,…,Xk.
)()()()(
)()()()(2
2221
212211
2121
kkkk
kk
XVaXVaXVaXaXaXaV
XVXVXVXXXV
Hvis X1,X2,…,Xk er indbyrdes uafhængige, så: