Hoofdstuk 10 - UGentmvdaele/files/statbio/studslides...Als α daalt, wordt AG groter, zodat β...
Embed Size (px)
Transcript of Hoofdstuk 10 - UGentmvdaele/files/statbio/studslides...Als α daalt, wordt AG groter, zodat β...

Hoofdstuk 10 :Het testen van hypothesen
Marnix Van [email protected]
Vakgroep Toegepaste Wiskunde en Informatica
Universiteit Gent
Het testen van hypothesen – p. 1/52

Een statistische testDoel : het testen van een hypothese omtrent de waarden van één
of meer populatieparameters.
Een statistische test wordt bepaald door 4 elementen :
• de nulhypotheseH0 : ω=ω0
proberen te weerleggen door een redenering uit het
ongerijmde
• de alternatieve hypotheseH1
wordt door de onderzoeker gesteund
• de teststatistiek
Een veranderlijke die berekend wordt uit de steekproef
• het verwerpingsgebiedAls de waarde van de teststatistiek
hierin valt verwerpen we de nulhypotheseHet testen van hypothesen – p. 2/52

Een statistische testDe beslissing om de nulhypothese te verwerpen of te aanvaarden
is gebaseerd op informatie uit eensteekproef, getrokken uit de
populatie waarover de hypothese is geformuleerd. De
steekproefwaarden worden gebruikt om één enkele waarde,
corresponderend met een punt op een lijn, van eenteststatistiek
te berekenen. Deze waarde zal de beslissing bepalen. Daartoe
worden alle waarden die de teststatistiek kan aannemen, verdeeld
in twee gebieden :
• het gebied van waarden dat de alternatieve hypothese
ondersteunt wordthet verwerpingsgebied (VG)genoemd,
• het gebied dat waarden bevat die de nulhypothese bijtreden
wordt het aanvaardingsgebied (AG)genoemd.
Het testen van hypothesen – p. 3/52

Een statistische testIndien de waarde van de teststatistiek ligt in het
verwerpingsgebied, dan wordt denulhypothese verworpenen de
alternatieve hypothese aanvaard.
Indien de waarde van de teststatistiek in hetaanvaardingsgebied
valt, dan doen zich twee mogelijkheden voor : ofwel wordt de
nulhypothese aanvaard, ofwel wordt beslist datde test geen
besluit toelaat.
“H 0 aanvaarden” betekent “H0 (nog) niet verwerpen”
Het testen van hypothesen – p. 4/52

Een- of tweezijdig testenStel : we willen H0 verwerpen zodra de waardey van de
teststatistiekY groter is danω0.
H0 : ω = ω0
H1 : ω > ω0
We verwerpen de nulhypothese alsy te groot wordt.
te groot : groter dan de zgn.kritische waardedie de grens
bepaalt tussen AG en VG
verwerpingsgebied =kritisch gebied
Het testen van hypothesen – p. 5/52

OpmerkingAls H1 : ω > ω0 , dan stellen we nietH0 : ω ≤ ω0 maar
H0 : ω = ω0.
Immers, de alternatieve hypothese drukt reeds uit dat we alleen
te grote waarden willen opsporen.
Als we reeds de hypotheseH0 : ω = ω0 verwerpen ten voordele
vanH1 : ω > ω0, dan verwerpen we zeker de hypothese
H0 : ω < ω0.
Het testen van hypothesen – p. 6/52

1- of 2-zijdig
yω0ωc1 ωc2
(a) ϕY (y/ω = ω0)
ω0
............................ ......................
.........................
......................
........................................................................................................................
...............................................................................................................................
.................................................................................................................................................................................................................................................................................. ...............................
..
..
.
..
..
.
..
..
..
..
..
..
..
..
..
.
..
..
..
.
..
..
..
.
..
..
..
.
..
..
..
..
..
..
..
..
.
..
..
.
..
..
..
......................... .........
........
........
........
........
........
........
.....
........
........
........
........
........
........
........
.....
tweezijdige test
H0 : ω = ω0
H1 : ω �= ω0
yωc
(b) ϕY (y/ω = ω0)
ω0
............................ ......................
.........................
......................
........................................................................................................................
..............................................................................................................................
................................................................................................................................................................................................................................................................................... ...............................
..
..
.
..
..
.
..
..
..
..
..
..
..
..
..
.
..
..
..
.
..
..
..
..
..
..
..
..
..
..
..
..
.
..
..
..
..
.
........
........
........
........
........
........
........
........
........
...
links-eenzijdige test
H0 : ω = ω0
H1 : ω < ω0
yωcω0
(c) ϕY (y/ω = ω0)
............................ ......................
.........................
......................
........................................................................................................................
..............................................................................................................................
...........................................................................................................................................................................................................................................................................................
..
..
..
..
.
..
..
..
..
..
..
..
..
..
..
..
.
..
..
..
.
..
..
..
..
..
..
..
..
.
..
..
.
..
..
..
......................... .........
........
........
........
........
........
........
........
........
...
rechts-eenzijdige test
H0 : ω = ω0
H1 : ω > ω0
Het testen van hypothesen – p. 7/52

Fout van eerste en tweede soortEenfout van de eerste soortin een statistische test treedt op
indien een ware nulhypothese wordt verworpen (omdat de
waarde van de teststatistiek in het verwerpingsgebied ligt).
α =P(H0 verwerpen|H0waar)
Eenfout van de tweede soortin een statistische test treedt op
indien een valse nulhypothese wordt aanvaard (omdat de waarde
van de teststatistiek in het aanvaardingsgebied valt) terwijl een
alternatieve hypothese waar is.
β =P(H0 aanvaarden|H0vals)
Het testen van hypothesen – p. 8/52

Fout van eerste en tweede soort
Nulhypothese
Besluit Waar Vals
Verwerp P(verwerp H0 | H0 waar)= α P(verwerp H0 | H0 vals)= 1 − β
H0 Fout van eerste soort Correct besluit
Aanvaard P(aanvaard H0 | H0 waar)= 1 − α P(aanvaard H0 | H0 vals)= β
H0 Correct besluit Fout van tweede soort
Het testen van hypothesen – p. 9/52

Voorbeeld
xµ0
............................. .................................................................................................................................................
..........................................................................................................................................................................
......................................................................................................................................................................................................................................................................................................................................... . .......... ...
....... . .........
........
....
........
........
....
α/2................................................
.............
......................
α/2....................................................
...............................
.............
.............
.............
.............
.............
.............
.............
....
.............
.............
.............
.............
.............
.............
.............
.............
.............
..........
.............
....
.................................................................................................................................................................................................................................................................................................................... ............................. ......................
AG
ϕX(x/µX = µ0)...........................................................................
......................
xµ1
............................. .....................................................................................
.............................................................................................................................................................................
............................................................................................................................................................................................................................................................................................................................................
..
..
..
..
..
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
.
..
..
..
..
..
.
..
..
..
..
..
.
..
..
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
..
..
..
..
.
..
..
..
.
..
..
..
..
..
..
..
..
.
..
..
.
..
..
..
........................ .........
........
........
........
........
........
........
........
........
........
......
..
β
................................................... ............................. .......................................................................................................................................................................................................................................................................................
AG
ϕX(x/µX = µ1)...........................................................................
......................
Als α daalt, wordt AG groter, zodatβ stijgt.
Besluit :α enβ kunnen, bij een gegevenn, niet tegelijkertijd
willekeurig klein gemaakt worden.Het testen van hypothesen – p. 10/52

Macht van een testH0 : ω = ω0 β = P(H0 aanvaarden|H0vals)
1 − β = P(H0 verwerpen|H0vals) = de macht van de test
1 − β hangt af van de echte waarde van de parameterω.
Hoe dichter de echte waarde vanω bij ω0 hoe moeilijker het
wordt om de valse hypothese te verwerpen.
ωω0
1 − β
α .......................... ......................
........
.............................
................................................................................................................................................................................................................................................................................................................................................................................................................................................................
.................................................
............. ............. ............. ............. ............. ............. ............. ...........
machtskromme van een tweezijdige test
Het testen van hypothesen – p. 11/52

Keuze α en β• Heeft men sterk vertrouwen in de nulhypothese, dan zal
men geneigd zijn de kans te beperken dat men de
nulhypothese verwerpt, m.a.w. men kiest dan een kleine
waarde voorα.
• morele en financiële overwegingen
Is het verkeerdelijk verwerpen van H0 kostelijk of kan het
ernstige gevolgen hebben, dan kiest menα klein.
Is het verkeerdelijk aanvaarden van H0 kostelijk of kan het
ernstige gevolgen hebben, dan kiest menβ klein.
Het testen van hypothesen – p. 12/52

VoorbeeldStel dat een medisch onderzoek heeft uitgewezen dat als het
gemiddelde nicotinegehalte van een sigaret 25 mg of meer
bedraagt de kans op longkanker groot is, terwijl de roker relatief
veilig is als het gemiddelde nicotinegehalte minder is dan 25 mg.
Stel dat je roker bent, dat (nog een hele tijd) wil blijven, maar een
merk wil kiezen dat “relatief veilig“ is. Hoe zou je de hypothesen
formuleren ? Waarop zul je testen? Hoe kies jeα enβ ?
Het testen van hypothesen – p. 13/52

VoorbeeldOplossing : is de teststatistiekX , dan is het mogelijk dat
- x > 25 zelfs al isµ < 25 (deze kans neemt vanzelfsprekend
toe naarmateµ groter wordt),
- x < 25 zelfs al isµ > 25 (deze kans neemt toe naarmateµ
kleiner wordt).
H0 : µ = 25 H1 : µ < 25
xK 25.............................. ..............................................................................................................................................
..........................................
...........................................................................................................................
.................................................................................................................................................................................................................................................................................................................................................................. . ...........
........
α........................................................... ....................
..
............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................AG
ϕX(x/µX = 25)..........................................................................
......................
P(X < K |µ = 25
)= α β = P
(X > K |µ < 25
)Het testen van hypothesen – p. 14/52

Het testen van 1 µ0
nulhypothese ? H0 : µ = µ0
alternatieve hypothese ?
• H1 : µ �= µ0 : tweezijdige test
• H1 : µ < µ0 : links-eenzijdige test
• H1 : µ > µ0 : rechts-eenzijdige test
teststatistiekY ?
• is X : N(µ, σ), danY = T =X − µ0
S/√
n − 1: T(n − 1)
de T-test voor 1 gemiddelde waarde
• is n groot genoeg, danY = Z =X − µ0
σ/√
n: ∼ N(0, 1)
de Z-test voor 1 gemiddelde waarde
Het testen van hypothesen – p. 15/52

De tweezijdige T-test voor 1 µVoorwaarde :X : N(µ, σ)
H0 : µ = µ0 H1 : µ �= µ0
Als H0 waar is, dan isT =X − µ0
S/√
n − 1: T(n − 1)
P(|T | > Tp(n − 1)) =p
100= α
−Tp(n − 1) 0 Tp(n − 1) t
ϕT (t/µ = µ0)
........................... ......................
..........................
......................
................................................................................................................................
......................................................................................................................................................................................................................................................................................................................................................................................................................................................................
........ .. .....
....
........
........
........
........
........
........p2%p
2%
Besluit : bereken
t =x − µ0
s/√
n − 1
• Is |t| > Tp(n − 1) dan wordt H0 verworpen
• Is |t| < Tp(n − 1) dan wordt H0 aanvaard Het testen van hypothesen – p. 16/52

Links-eenzijdige T-test voor 1 µVoorwaarde :X : N(µ, σ)
H0 : µ = µ0 H1 : µ < µ0
Als H0 waar is, dan isT =X − µ0
S/√
n − 1: T(n − 1)
P(T < −T2 p(n − 1)) =p
100= α
−T2p(n − 1) 0 t
ϕT (t/µ = µ0)
........................... ......................
..........................
......................
................................................................................................................................
...................................................................................................................................................................................................................................................................................................................................................................................................................................................................... .....
............
.
.
.
.
.
.
.
.
........
........
........
........
........
.....
p%
Besluit : bereken
t =x − µ0
s/√
n − 1
• Is t < −T2 p(n − 1) dan wordt H0 verworpen
• Is t > −T2 p(n − 1) dan wordt H0 aanvaard Het testen van hypothesen – p. 17/52

Rechts-eenzijdige T-test voor 1 µVoorwaarde :X : N(µ, σ)
H0 : µ = µ0 H1 : µ > µ0
Als H0 waar is, dan isT =X − µ0
S/√
n − 1: T(n − 1)
P(T > T2 p(n − 1)) =p
100= α
0 T2p(n − 1) t
ϕT (t/µ = µ0)
........................... ......................
..........................
......................
................................................................................................................................
.....................................................................................................................................................................................................................................................................................................................................................................................................................................................................
.
.
.
.
.
.
.
.
.
.
.
.
.
............ .........
........
........
........
........
.....
p%
Besluit : bereken
t =x − µ0
s/√
n − 1
• Is t > T2 p(n − 1) dan wordt H0 verworpen
• Is t < T2 p(n − 1) dan wordt H0 aanvaard Het testen van hypothesen – p. 18/52

Samenvatting i.v.m. T-test
Doel Test op de gemiddelde waardeµ van 1 populatie
aan de hand van 1 steekproef
vann onafhankelijke steekproefwaarden
Voorwaarde De populatie is normaal verdeeld
Type test Tweezijdig Eenzijdig
links rechts
H0 µ = µ0 µ = µ0 µ = µ0
H1 µ �= µ0 µ < µ0 µ > µ0
Verwerpingsgebied |t| > Tp(n − 1) t < −T2p(n − 1) t > T2p(n − 1)
Teststatistiek T =X − µ0
S/√
n − 1: T(n − 1)
Het testen van hypothesen – p. 19/52

De tweezijdige Z-test voor 1 µVoorwaarde :n voldoende groot
H0 : µ = µ0 H1 : µ �= µ0
Als H0 waar is, dan isZ =X − µ0
σ/√
n≈ X − µ0
S/√
n − 1:∼ N(0, 1)
P(|Z| > λp) =p
100= α
−λp 0 λp z
φZ(z)
........................... ......................
..........................
......................
..........................................................................................
..............................................................................................................................................................................................................................................................................................................................................................................................................................................
........
..
..........................................
........
........
....p2%p
2%
Besluit : bereken
z =x − µ0
σ/√
n≈
x − µ0
s/√
n − 1
• Is |z| > λp, dan wordt H0 verworpen
• Is |z| < λp, dan wordt H0 aanvaard Het testen van hypothesen – p. 20/52

Samenvatting i.v.m. Z-test
Doel Test op de gemiddelde waardeµ van 1 populatie
aan de hand van 1 steekproef
vann onafhankelijke steekproefwaarden
Voorwaarde De populatie is willekeurig verdeeld
n is voldoende groot
Type test Tweezijdig Eenzijdig
links rechts
H0 µ = µ0 µ = µ0 µ = µ0
H1 µ �= µ0 µ < µ0 µ > µ0
Verwerpingsgebied |z| > λp z < −λ2p z > λ2p
Teststatistiek Z =X − µ0
S/√
n − 1: ∼ N(0, 1)
Het testen van hypothesen – p. 21/52

Het testen van µX − µY
nulhypothese ? H0 : µX − µY = ∆
alternatieve hypothese ?
• H1 : µX − µY �= ∆ : tweezijdige test
• H1 : µX − µY < ∆ : links-eenzijdige test
• H1 : µX − µY > ∆ : rechts-eenzijdige test
teststatistiekY ?
• zijn X : N(µX , σ) enY : N(µY , σ) onafhankelijk ?
T-test voor het verschil van twee gemiddelde waarden
• zijn nX ennY groot genoeg ?
Z-test voor het verschil van twee gemiddelde waarden
Het testen van hypothesen – p. 22/52

Tweezijdige T-test voor µX − µY
Voorwaarden :X : N(µX , σ) enY : N(µY , σ) zijn
onafhankelijk
ϕX(x)ϕY (y)
x, yµX µY
......................... ......................
..........................
......................
..............................................................................................................
....................................................................................................................................................................
.........................................................................................................................................................................................................................................................................................................................................................................................................................
....................................................................................................................................................................
...........................................................................................................................................................................................................................................................................................................
........................................................................................................................................................................................................
.............
...........
.............
...........
∆........................................................... ................................................... ......................
N(µX , σ) N(µY , σ)
........
.....
........
.....
........
.....
........
.....
........
.....
........
.....
........
.....
........
.....
........
.....
........
.....
........
.....
........
.....
H0 : µX − µY = ∆ H1 : µX − µY �= ∆
Het testen van hypothesen – p. 23/52

Tweezijdige T-test voor µX − µY
Voorwaarden :X : N(µX , σ) enY : N(µY , σ) zijn onafhank.
H0 : µX − µY = ∆ H1 : µX − µY �= ∆
X : N
(µX ,
σ√nX
)nX S2
X
σ2: χ2(nX − 1)
Y : N
(µY ,
σ√nY
)nY S2
Y
σ2: χ2(nY − 1)
X − Y : N(µX − µY ,
√σ2
nX+ σ2
nY
)nXS2
X+nY S2Y
σ2 : χ2(nX + nY − 2)
Als H0 waar isX − Y : N
(∆, σ
√1
nX+
1
nY
)
T =
(X − Y ) − ∆
σ
√1
nX
+1
nY√nXS2
X + nY S2Y
σ2 (nX + nY −2)
=
(X − Y ) − ∆√1
nX
+1
nY√nXS2
X + nY S2Y
nX + nY − 2
: T(nX+nY −2)
Het testen van hypothesen – p. 24/52

Tweezijdige T-test voor µX − µY
H0 : µX − µY = ∆ H1 : µX − µY �= ∆
Als H0 waar is, isT =
(X − Y ) − ∆√1
nX
+1
nY√nXS2
X + nY S2Y
nX + nY − 2
: T(nX + nY − 2)
Besluit :
berekent = ((x − y) − ∆)
√nXnY (nX + nY − 2)
(nXs2X + nY s2
Y )(nX + nY )
• Is |t| > Tp(nX + nY − 2), dan wordt H0 verworpen
• Is |t| < Tp(nX + nY − 2), dan wordt H0 aanvaard
Het testen van hypothesen – p. 25/52

Tweezijdige Z-test voor µX − µY
Voorwaarden : 2 grote steekproeven uit onafhankelijke
populaties
ϕY (y)ϕX(x)
µX µY x, y......................... ......................
.............................
......................
.................................................................................................................................................................
......................................
....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
.........................................................................................................................................................................................................................................................................................................................................
.............
........
........
.....
........
.....
........
.....
........
.....
........
.....
........
.....
........
.....
.............
..............................................................................................
∆......................................................................... ................................................... ......................
H0 : µX − µY = ∆ H1 : µX − µY �= ∆
Het testen van hypothesen – p. 26/52

Tweezijdige Z-test voor µX − µY
Voorwaarden : 2 grote steekproeven uit onafhankelijke populaties
H0 : µX − µY = ∆ H1 : µX − µY �= ∆
X :∼ N
(µX ,
σX√nX
)≈ N
(µX ,
SX√nX − 1
)
Y :∼ N
(µY ,
σ√nY
)≈ N
(µY ,
SY√nY − 1
)
X − Y :∼ N
(µX − µY ,
√S2
XnX−1 + S2
YnY −1
)
Als H0 waar isX − Y :∼ N
∆,
√S2
X
nX − 1+
S2Y
nY − 1
Besluit : berekenz =x − y − ∆√S2
XnX−1 + S2
YnY −1
• Is |z| > λp, dan wordt H0 verworpen
• Is |z| < λp, dan wordt H0 aanvaard Het testen van hypothesen – p. 27/52

Voorbeeld : slijtage van 2 types bandenAuto Band A Band B
1 10.6 10.22 9.8 9.43 12.3 11.84 9.7 9.15 8.8 8.3
xA = 10.24 xB = 9.76
s2A = 1.39 s2
B = 1.41H0 : ∆ = 0 H1 : ∆ �= 0
t = (xA − xB)
√nA nB (nA + nB − 2)
(nAs2A + nBs2
B)(nA + nB)= 0.57 < T5(8)
H0 wordt aanvaard
95%B.I. : µA − µB = 0.48 ± 1.93 = [−1.45, 2.41]Klopt dit wel ?
Het testen van hypothesen – p. 28/52

Voorbeeld : slijtage van 2 types bandenAuto Band A Band B
1 10.6 10.22 9.8 9.43 12.3 11.84 9.7 9.15 8.8 8.3
teken A-B
+++++
H0 : ∆ = 0 H1 : ∆ �= 0
als H0 waar is, dan is P(A ≥ B) = P(A ≤ B) = 12
P(5 keer+) = P(5 keer−) =
(1
2
)5
≈ 0.03
Op basis van dezetekentestzou men eerder geneigd zijn H0 te
verwerpen, want het significantieniveau is ongeveer 0.06
Probleem bij T-test ?paarsgewijze onafhankelijkheidHet testen van hypothesen – p. 29/52

Tweezijdige gepaarde T-testVoorwaarde : 2 paarsgewijs afhankelijke steekproeven uit
X : N(µX , σ) enY : N(µY , σ)
H0 : µX − µY = ∆ H1 : µX − µY �= ∆
D = X−Y =⇒ D : N
(µX − µY ,
σD√n
)nS2
D
σ2D
: χ2(n−1)
T =
D − (µX − µY )σD/
√n√√√√ nS2
D
σ2D (n − 1)
=D − (µX − µY )
SD/√
n − 1: T(n − 1)
Als H0 waar is, dan isT = D − ∆SD/
√n − 1
: T(n − 1). . .
Besluit : berekent = d − ∆sD/
√n − 1
• Is |t| > Tp(n − 1) dan wordt H0 verworpen
• Is |t| < Tp(n − 1) dan wordt H0 aanvaard Het testen van hypothesen – p. 30/52

Voorbeeld : slijtage van 2 types bandenAuto Band A Band B
1 10.6 10.22 9.8 9.43 12.3 11.84 9.7 9.15 8.8 8.3
xA = 10.24 xB = 9.76
D
0.40.40.50.60.5
d = 0.48
sD = 0.0748H0 : ∆ = 0 H1 : ∆ �= 0
t =d − ∆
sD/√
n − 1= 12.83 > T5(4) = 2.776
Dit is eenzeer significanttestresultaat : H0 wordt verworpen
Het significantieniveau bedraagt zelfs minder dan 0.5 want
T0.5(4) = 5.59 < 12.83Het testen van hypothesen – p. 31/52

Samenvatting gepaarde T-test
Doel Test op het verschil van 2 gemiddelde waarden
aan de hand van 2 steekproeven van grootten
met paarsgewijs afhankelijke steekproefwaarden
Voorwaarde Beide populaties zijn normaal verdeeld en hebben dezelfdeσ
De enige afhankelijkheid is paarsgewijs
Type test Tweezijdig Eenzijdig
links rechts
H0 µX − µY = ∆ µX − µY = ∆ µX − µY = ∆
H1 µX − µY �= ∆ µX − µY < ∆ µX − µY > ∆
Verwerp. geb. |t| > Tp(n − 1) t < −T2p(n − 1) t > T2p(n − 1)
Teststatistiek T = X − Y − ∆SX−Y√n − 1
: T(n − 1)
Het testen van hypothesen – p. 32/52

De tweezijdige χ2-test voor 1 σVoorwaarde :X : N(µ, σ)
H0 : σ = σ0 H1 : σ �= σ0
Als H0 waar is, dan isχ2 =nS2
σ20
: χ2(n − 1)
P(χ2
p1(n − 1) < χ2 < χ2
p2(n − 1)
)=
p1 − p2
100= 1 − α
ϕn S2
σ20
(t)
tχ2p2
(n − 1) χ2p1
(n − 1)......................... ......................
..............................
......................
.........
........
........
........
.......................................................................................................................................................................................................................................................................................................................................................................................................................................................
........
........
........
........
........
........
........
........
.
.
.
.
.
.
.
.
.
.
. . ........
.
Besluit : bereken
χ2 = n s2
σ20
• Is χ2 �∈ [χ2p1
(n − 1), χ2p2
(n − 1)] dan wordt H0 verworpen
• Is χ2 ∈ [χ2p1
(n − 1), χ2p2
(n − 1)] dan wordt H0 aanvaardHet testen van hypothesen – p. 33/52

De links-eenz. χ2-test voor 1 σVoorwaarde :X : N(µ, σ) H0 : σ = σ0 H1 : σ < σ0
Als H0 waar is, dan isχ2 =nS2
σ20
: χ2(n − 1)
Is σ = σ1 < σ0, dan is E[χ2] =σ2
1
σ20
E[nS2
σ21
] < n − 1
P(χ2
100−p(n − 1) < χ2)
=100 − p
100= 1 − α
ϕn S2
σ20
(t)
tχ2100−p(n − 1)
......................... ......................
..............................
......................
.........
........
........
........
........
...............................................................................................................................................................................................................................................................................................................................................................................................................................................
........
........
........
........
........
........
........
........
........
........
....
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. Besluit : bereken
χ2 = n s2
σ20
• Is χ2 < χ2100−p(n − 1) dan wordt H0 verworpen
• Is χ2 > χ2100−p(n − 1) dan wordt H0 aanvaard
Het testen van hypothesen – p. 34/52

Samenvatting χ2 test voor 1 σ
Doel Test op de variantieσ2 van 1 populatie
aan de hand van 1 steekproef
vann onafhankelijke steekproefwaarden
Voorwaarde De populatie is normaal verdeeld
Type test Tweezijdig Eenzijdig
links rechts
H0 σ2 = σ20 σ2 = σ2
0 σ2 = σ20
H1 σ2 �= σ20 σ2 < σ2
0 σ2 > σ20
Verwerpingsgebied χ2 > χ2p/2 enχ2 < χ2
100−p/2 χ2 < χ2100−p χ2 > χ2
p
Teststatistiek χ2 =nS2
σ20
: χ2(n − 1)
Het testen van hypothesen – p. 35/52

De F-test voor de verhouding van 2 σ’s
Voorwaarden :X : N(µX , σX) enY : N(µY , σY ) onafh.
noemX de populatie met de grootsteS′2
H0 : σ2X = σ2
Y H1 : σ2X �= σ2
Y
nX S2X
σ2X
: χ2(nX − 1)nY S2
Y
σ2Y
: χ2(nY − 1)
FX, Y =
nXS2X
(nX − 1) σ2X
nY S2Y
(nY − 1) σ2Y
=S′2
X
S′2Y
σ2Y
σ2X
: F(nX − 1, nY − 1)
Als H0 waar is, dan isFX, Y =S′2
X
S′2Y
: F(nX − 1, nY − 1)
Het testen van hypothesen – p. 36/52

De F-test voor de verhouding van 2 σ’s
Voorwaarden :X : N(µX , σX) enY : N(µY , σY ) onafh.
noemX de populatie met de grootsteS′2
H0 : σ2X = σ2
Y H1 : σ2X �= σ2
Y
Als H0 waar is, dan isFX, Y =S′2
X
S′2Y
: F(nX − 1, nY − 1)
ϕFX, Y(t)
0 Fp/2(nX − 1, nY − 1).............................. ......................
........................
......................
..................................................................................................................................................................................................................................................................................................................................................................................................................................
α/2 = p/2%
Besluit : bereken
f =s′2Xs′2Y
• Is f > Fp2(nX − 1, nY − 1), dan wordt H0 verworpen
• Is f < Fp2(nX − 1, nY − 1), dan wordt H0 aanvaard
Het testen van hypothesen – p. 37/52

Samenvatting i.v.m. F-test
Doel Test op de gelijkheid van 2 varianties
aan de hand van 2 onafhankelijke steekproeven
vannX ennY steekproefwaarden
Voorwaarde De twee steekproeven zijn onafhankelijk
De populaties zijn normaal verdeeld
Type test Tweezijdig Eenzijdig
H0 σ2X = σ2
Y σ2X = σ2
Y
H1 σ2X �= σ2
Y σ2X > σ2
Y
Verwerp.geb. FX, Y > Fp/2(nX − 1, nY − 1) FX, Y > Fp(nX − 1, nY − 1)
Teststatistiek FX, Y =
nXS2X
nX − 1nY S2
Y
nY − 1
: F(nX − 1, nY − 1)
Het testen van hypothesen – p. 38/52

De χ2-test van PearsonEen medisch tijdschrift publiceert statistieken die aantonen dat
vier belangrijke ziekten - noem ze A, B, C, en D - respectievelijk
verantwoordelijk zijn voor 15, 21, 18 en 14 % van alle
sterftegevallen die niet te wijten zijn aan ongelukken. Een studie
van de doodsoorzaken in een ziekenhuis toonde aan dat van 308
niet-accidentele sterftegevallen respectievelijk 43, 76, 85, 21 te
wijten waren aan de ziektes A, B, C en D. Is er reden om aan te
nemen dat de verhoudingen die in het hospitaal worden
opgemeten verschillen van de cijfers die in het medisch vakblad
werden bekendgemaakt?
Het testen van hypothesen – p. 39/52

De χ2-test van PearsonAlgemene formulering : Stel dat men beschikt over een
steekproefx1, x2, . . ., xn uit een bepaalde populatie waarvan
verondersteld wordt dat de distributie gegeven wordt door de
functieΦX(x; p1, . . . , pl), waarbijp1, p2, . . . ,pl
parameterwaarden voorstellen die uit de steekproef geschat
worden.
Men vraagt zich af of de steekproefwaarnemingen deze
veronderstelling bevestigen, m.a.w. men vraagt zich af of de
populatie in kwestie inderdaad deze distributiewetΦX bezit.
goodness of fit test
H0 : De populatie bezit de distributiewetΦX(x; p1, . . . , pl) .
H1 : De populatie bezit de distributiewetΦX(x; p1, . . . , pl) niet.Het testen van hypothesen – p. 40/52

De χ2-test van PearsonAlgemene probleemstelling : Er zijnk klassen metn1, n2, . . . ,
nk waarnemingen metn1 + n2 + . . . + nk = n.
ElkeNi is binomiaal verdeeld :
µNi = n θi en σ2Ni
= n θi (1 − θi)
Is n voldoende groot (enθi niet te klein of te groot)
Zi =Ni − n θi√
n θi
∼ N(0,√
1 − θi) ∼ N(0, 1)
Z =k∑
i=1
Z2i =
k∑i=1
(Ni − n θi√
n θi
)2
:∼ χ2(k − l − 1)
Als H0 waar is, dan zalz klein zijn
Besluit : berekenz en verwerp H0 alsz ≥ χ2p(k − l − 1).
Het testen van hypothesen – p. 41/52

De χ2-test van PearsonA B C D Andere
θi 15 % 21 % 18 % 14 % 32 %
n θi 46.2 64.48 55.44 43.12 98.56
ni 43 76 85 21 85
z2i 0.22 1.98 15.76 11.35 2.46 31.77
z =k∑
i=1
z2i =
k∑i=1
(ni − n θi)2
n θi
= 31.77 > χ25(4) = 9.49
Hetgeen in dat particuliere hospitaal wordt geconstateerd
wijkt significant afvan de gepubliceerde gegevens,
m.a.w. H0 wordt verworpen.
Het testen van hypothesen – p. 42/52

Contingentietabellen – kruistabellen
In een productieproces worden fouten geconstateerd. Deze
fouten kunnen geklassicificeerd worden volgens het type defect
en anderzijds ook volgens de productieploeg die ze heeft
vervaardigd. De vraag die men zich nu hierbij stelt is : hangt de
aard van de productiefout af van ploeg tot ploeg ?
Type Defect
Shift A B C D Totaal
1 15 21 45 13 94
2 26 31 34 5 96
3 33 17 49 20 119
Totaal 74 69 128 38 309
Het testen van hypothesen – p. 43/52

Contingentietabellen – kruistabellen
H0 : de classificaties zijn onafhankelijk
H1 : de classificaties zijn afhankelijk
Neem als voorbeeld de cel (1, A).
De absolute frequentieN1A van cel (1, A) is binomiaal verdeeld.
θ1A = P(een defect door shift 1 van type A)
Als H0 waar is, dan is
P(defect door shift 1 van type A)
= P(defect door shift 1) · P(defect van type A)
⇐⇒ θ1A = θ1 · θA
Vraag : wat zijnθ1 enθA ?
θ1 enθA moetengeschatworden
Het testen van hypothesen – p. 44/52

Contingentietabellen – kruistabellen
Type Defect
Shift A B C D Totaal
1 15(22.51)21 (20.99)45 (38.94)13 (11.56) 94 θ̂1 = 94309
2 26(22.99)31 (21.44)34 (39.77) 5 (11.81) 96 θ̂2 = 96309
3 33(28.50)17 (26.57)49 (49.29)20 (14.63) 119 θ̂3 = 119309
Totaal 74 69 128 38 309
θ̂A = 74309
θ̂B = 69309
θ̂C = 128309
θ̂D = 38309
µ1A ≈ n̂1A = n θ1A = n θ1 θA = 30974
309
94
309
χ2 =r∑
i=1
c∑j=1
(Nij − n̂ij)2
n̂ij
: χ2(k − l − 1)
χ2 =(15 − 22.51)2
22.51+
(26 − 22.99)2
22.99+. . .+
(20 − 14.63)2
14.63= 19.18
Het testen van hypothesen – p. 45/52

Contingentietabellen – kruistabellen
H0 : de classificaties zijn onafhankelijk
H1 : de classificaties zijn afhankelijk
χ2 =r∑
i=1
c∑j=1
(Nij − n̂ij)2
n̂ij
= 19.18 : χ2(k − l − 1)
k = r c l = (r− 1) + (c− 1) k − l− 1 = (r− 1) (c− 1)
19.18 > χ25(6) = 12.5916
Voor α = 0.05 wordt H0 verworpen, m.a.w. de classificaties zijn
afhankelijk.
Het testen van hypothesen – p. 46/52

ProbabiliteitsplotIs een gegeven steekproef afkomstig uit een populatie met een
gegeven distributiewet ?
Deze vraag kan beantwoord worden m.b.v. eenprobabiliteitsplot.
• Q-Q plot: kwantielen van de gegeven steekproef worden
uitgezet t.o.v. de kwantielen van de distributie
• P-P plot: cumulatieve proporties van de gegeven
steekproef worden uitgezet t.o.v. de cumulatieve proporties
van de distributie
• probitdiagram: kwantielen worden uitgezet t.o.v.
cumulatieve proporties
Indien de steekproef uit een populatie met de gegeven
distributiewet komt, liggen de uitgezette punten rond een rechte.Het testen van hypothesen – p. 47/52

ProbitdiagramDoel : langs grafische weg testen of een steekproef vann
onafhankelijke steekproefwaardenx1, x2, · · · , xn uit een
normaal verdeelde populatie komt.
X : N(µ, σ) =⇒ y(x) = ΦX(x) = Ψ
(x − µ
σ
)⇐⇒ z(x) = Ψ−1 (ΦX (x)) =
x − µ
σ
�
�
��
��
��
��
��
��
��
��
��
x
z(x)
µ − 2σµ − σ µ µ + σ µ + 2σ
−2
−1
0
+1
+2
�
�
�
�
�
2.275
15.866
50.000
84.134
97.725
y(x) (%)
Het testen van hypothesen – p. 48/52

Probitdiagram en T -verdelingen
ΦT (t)
−8 −6 −4 −2 0 2 4 6 8 t
99
959080706050403020105
1 ........................... ......................
........
........................
......................
n = 1
n = 4n = 10n = 100
................................................................................................................
...........................................................................
......................................................
.......................................
.................................
...............................................................................................................................................................................................................................................
.....................................
..............................................
...................................................................
................................................................................................
...............................................
..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................. ...............................................................................................................................................................................................................................................................................................................................................................................................................................................
....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............
............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............
............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............
............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............
............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............
............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............
............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............
............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
......
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
......
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
......
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
......
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
......
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
......
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
......
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
......
Het testen van hypothesen – p. 49/52

P-P plotgewicht van de mannen
Normal P-P Plot of GEWICHT
Observed Cum Prob
1.00.75.50.250.00
Exp
ecte
d C
um P
rob
1.00
.75
.50
.25
0.00
Het testen van hypothesen – p. 50/52

Q-Q plotgewicht van de mannen
Normal Q-Q Plot of GEWICHT
Observed Value
100908070605040
Exp
ecte
d N
orm
al V
alue
100
90
80
70
60
50
40
Het testen van hypothesen – p. 51/52

ProbitdiagramDit is eennormaliteitstest.
H0 : X : N(µ, σ) en H1 : X : niet N(µ, σ)
H0 wordt aanvaard als alle punten binnen een beperkt gebied
rond een rechte liggen.
α : omwille van het niet op een rechte liggen van de punten in
het probitdiagram weigeren te erkennen dat de steekproef uit een
N(µ, σ) populatie komt als dat wel zo is.
β : toegeven dat de steekproef uit een N(µ, σ) populatie komt
(omdat de bepaalde punten lijken op een rechte te liggen) als dat
niet zo is.
Het testen van hypothesen – p. 52/52