Download - Hoofdstuk 10 - users.ugent.beusers.ugent.be/~mvdaele/files/statbio/studslidesh10.pdf · 1−β = P(H0 verwerpen|H0vals)=de macht van de test 1 ...

Transcript

Hoofdstuk 10 :Het testen van hypothesen

Marnix Van [email protected]

Vakgroep Toegepaste Wiskunde en Informatica

Universiteit Gent

Het testen van hypothesen – p. 1/52

Een statistische testDoel : het testen van een hypothese omtrent de waarden van één

of meer populatieparameters.

Een statistische test wordt bepaald door 4 elementen :

• de nulhypotheseH0 : ω=ω0

proberen te weerleggen door een redenering uit het

ongerijmde

• de alternatieve hypotheseH1

wordt door de onderzoeker gesteund

• de teststatistiek

Een veranderlijke die berekend wordt uit de steekproef

• het verwerpingsgebiedAls de waarde van de teststatistiek

hierin valt verwerpen we de nulhypotheseHet testen van hypothesen – p. 2/52

Een statistische testDe beslissing om de nulhypothese te verwerpen of te aanvaarden

is gebaseerd op informatie uit eensteekproef, getrokken uit de

populatie waarover de hypothese is geformuleerd. De

steekproefwaarden worden gebruikt om één enkele waarde,

corresponderend met een punt op een lijn, van eenteststatistiek

te berekenen. Deze waarde zal de beslissing bepalen. Daartoe

worden alle waarden die de teststatistiek kan aannemen, verdeeld

in twee gebieden :

• het gebied van waarden dat de alternatieve hypothese

ondersteunt wordthet verwerpingsgebied (VG)genoemd,

• het gebied dat waarden bevat die de nulhypothese bijtreden

wordt het aanvaardingsgebied (AG)genoemd.

Het testen van hypothesen – p. 3/52

Een statistische testIndien de waarde van de teststatistiek ligt in het

verwerpingsgebied, dan wordt denulhypothese verworpenen de

alternatieve hypothese aanvaard.

Indien de waarde van de teststatistiek in hetaanvaardingsgebied

valt, dan doen zich twee mogelijkheden voor : ofwel wordt de

nulhypothese aanvaard, ofwel wordt beslist datde test geen

besluit toelaat.

“H 0 aanvaarden” betekent “H0 (nog) niet verwerpen”

Het testen van hypothesen – p. 4/52

Een- of tweezijdig testenStel : we willen H0 verwerpen zodra de waardey van de

teststatistiekY groter is danω0.

H0 : ω = ω0

H1 : ω > ω0

We verwerpen de nulhypothese alsy te groot wordt.

te groot : groter dan de zgn.kritische waardedie de grens

bepaalt tussen AG en VG

verwerpingsgebied =kritisch gebied

Het testen van hypothesen – p. 5/52

OpmerkingAls H1 : ω > ω0 , dan stellen we nietH0 : ω ≤ ω0 maar

H0 : ω = ω0.

Immers, de alternatieve hypothese drukt reeds uit dat we alleen

te grote waarden willen opsporen.

Als we reeds de hypotheseH0 : ω = ω0 verwerpen ten voordele

vanH1 : ω > ω0, dan verwerpen we zeker de hypothese

H0 : ω < ω0.

Het testen van hypothesen – p. 6/52

1- of 2-zijdig

yω0ωc1 ωc2

(a) ϕY (y/ω = ω0)

ω0

............................ ......................

.........................

......................

........................................................................................................................

...............................................................................................................................

.................................................................................................................................................................................................................................................................................. ...............................

..

..

.

..

..

.

..

..

..

..

..

..

..

..

..

.

..

..

..

.

..

..

..

.

..

..

..

.

..

..

..

..

..

..

..

..

.

..

..

.

..

..

..

......................... .........

........

........

........

........

........

........

.....

........

........

........

........

........

........

........

.....

tweezijdige test

H0 : ω = ω0

H1 : ω �= ω0

yωc

(b) ϕY (y/ω = ω0)

ω0

............................ ......................

.........................

......................

........................................................................................................................

..............................................................................................................................

................................................................................................................................................................................................................................................................................... ...............................

..

..

.

..

..

.

..

..

..

..

..

..

..

..

..

.

..

..

..

.

..

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

..

.

........

........

........

........

........

........

........

........

........

...

links-eenzijdige test

H0 : ω = ω0

H1 : ω < ω0

yωcω0

(c) ϕY (y/ω = ω0)

............................ ......................

.........................

......................

........................................................................................................................

..............................................................................................................................

...........................................................................................................................................................................................................................................................................................

..

..

..

..

.

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

.

..

..

..

..

..

..

..

..

.

..

..

.

..

..

..

......................... .........

........

........

........

........

........

........

........

........

...

rechts-eenzijdige test

H0 : ω = ω0

H1 : ω > ω0

Het testen van hypothesen – p. 7/52

Fout van eerste en tweede soortEenfout van de eerste soortin een statistische test treedt op

indien een ware nulhypothese wordt verworpen (omdat de

waarde van de teststatistiek in het verwerpingsgebied ligt).

α =P(H0 verwerpen|H0waar)

Eenfout van de tweede soortin een statistische test treedt op

indien een valse nulhypothese wordt aanvaard (omdat de waarde

van de teststatistiek in het aanvaardingsgebied valt) terwijl een

alternatieve hypothese waar is.

β =P(H0 aanvaarden|H0vals)

Het testen van hypothesen – p. 8/52

Fout van eerste en tweede soort

Nulhypothese

Besluit Waar Vals

Verwerp P(verwerp H0 | H0 waar)= α P(verwerp H0 | H0 vals)= 1 − β

H0 Fout van eerste soort Correct besluit

Aanvaard P(aanvaard H0 | H0 waar)= 1 − α P(aanvaard H0 | H0 vals)= β

H0 Correct besluit Fout van tweede soort

Het testen van hypothesen – p. 9/52

Voorbeeld

xµ0

............................. .................................................................................................................................................

..........................................................................................................................................................................

......................................................................................................................................................................................................................................................................................................................................... . .......... ...

....... . .........

........

....

........

........

....

α/2................................................

.............

......................

α/2....................................................

...............................

.............

.............

.............

.............

.............

.............

.............

....

.............

.............

.............

.............

.............

.............

.............

.............

.............

..........

.............

....

.................................................................................................................................................................................................................................................................................................................... ............................. ......................

AG

ϕX(x/µX = µ0)...........................................................................

......................

xµ1

............................. .....................................................................................

.............................................................................................................................................................................

............................................................................................................................................................................................................................................................................................................................................

..

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

..

..

.

..

..

..

..

..

.

..

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

.

..

..

..

..

..

..

..

..

.

..

..

.

..

..

..

........................ .........

........

........

........

........

........

........

........

........

........

......

..

β

................................................... ............................. .......................................................................................................................................................................................................................................................................................

AG

ϕX(x/µX = µ1)...........................................................................

......................

Als α daalt, wordt AG groter, zodatβ stijgt.

Besluit :α enβ kunnen, bij een gegevenn, niet tegelijkertijd

willekeurig klein gemaakt worden.Het testen van hypothesen – p. 10/52

Macht van een testH0 : ω = ω0 β = P(H0 aanvaarden|H0vals)

1 − β = P(H0 verwerpen|H0vals) = de macht van de test

1 − β hangt af van de echte waarde van de parameterω.

Hoe dichter de echte waarde vanω bij ω0 hoe moeilijker het

wordt om de valse hypothese te verwerpen.

ωω0

1 − β

α .......................... ......................

........

.............................

................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.................................................

............. ............. ............. ............. ............. ............. ............. ...........

machtskromme van een tweezijdige test

Het testen van hypothesen – p. 11/52

Keuze α en β• Heeft men sterk vertrouwen in de nulhypothese, dan zal

men geneigd zijn de kans te beperken dat men de

nulhypothese verwerpt, m.a.w. men kiest dan een kleine

waarde voorα.

• morele en financiële overwegingen

Is het verkeerdelijk verwerpen van H0 kostelijk of kan het

ernstige gevolgen hebben, dan kiest menα klein.

Is het verkeerdelijk aanvaarden van H0 kostelijk of kan het

ernstige gevolgen hebben, dan kiest menβ klein.

Het testen van hypothesen – p. 12/52

VoorbeeldStel dat een medisch onderzoek heeft uitgewezen dat als het

gemiddelde nicotinegehalte van een sigaret 25 mg of meer

bedraagt de kans op longkanker groot is, terwijl de roker relatief

veilig is als het gemiddelde nicotinegehalte minder is dan 25 mg.

Stel dat je roker bent, dat (nog een hele tijd) wil blijven, maar een

merk wil kiezen dat “relatief veilig“ is. Hoe zou je de hypothesen

formuleren ? Waarop zul je testen? Hoe kies jeα enβ ?

Het testen van hypothesen – p. 13/52

VoorbeeldOplossing : is de teststatistiekX , dan is het mogelijk dat

- x > 25 zelfs al isµ < 25 (deze kans neemt vanzelfsprekend

toe naarmateµ groter wordt),

- x < 25 zelfs al isµ > 25 (deze kans neemt toe naarmateµ

kleiner wordt).

H0 : µ = 25 H1 : µ < 25

xK 25.............................. ..............................................................................................................................................

..........................................

...........................................................................................................................

.................................................................................................................................................................................................................................................................................................................................................................. . ...........

........

α........................................................... ....................

..

............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................AG

ϕX(x/µX = 25)..........................................................................

......................

P(X < K |µ = 25

)= α β = P

(X > K |µ < 25

)Het testen van hypothesen – p. 14/52

Het testen van 1 µ0

nulhypothese ? H0 : µ = µ0

alternatieve hypothese ?

• H1 : µ �= µ0 : tweezijdige test

• H1 : µ < µ0 : links-eenzijdige test

• H1 : µ > µ0 : rechts-eenzijdige test

teststatistiekY ?

• is X : N(µ, σ), danY = T =X − µ0

S/√

n − 1: T(n − 1)

de T-test voor 1 gemiddelde waarde

• is n groot genoeg, danY = Z =X − µ0

σ/√

n: ∼ N(0, 1)

de Z-test voor 1 gemiddelde waarde

Het testen van hypothesen – p. 15/52

De tweezijdige T-test voor 1 µVoorwaarde :X : N(µ, σ)

H0 : µ = µ0 H1 : µ �= µ0

Als H0 waar is, dan isT =X − µ0

S/√

n − 1: T(n − 1)

P(|T | > Tp(n − 1)) =p

100= α

−Tp(n − 1) 0 Tp(n − 1) t

ϕT (t/µ = µ0)

........................... ......................

..........................

......................

................................................................................................................................

......................................................................................................................................................................................................................................................................................................................................................................................................................................................................

........ .. .....

....

........

........

........

........

........

........p2%p

2%

Besluit : bereken

t =x − µ0

s/√

n − 1

• Is |t| > Tp(n − 1) dan wordt H0 verworpen

• Is |t| < Tp(n − 1) dan wordt H0 aanvaard Het testen van hypothesen – p. 16/52

Links-eenzijdige T-test voor 1 µVoorwaarde :X : N(µ, σ)

H0 : µ = µ0 H1 : µ < µ0

Als H0 waar is, dan isT =X − µ0

S/√

n − 1: T(n − 1)

P(T < −T2 p(n − 1)) =p

100= α

−T2p(n − 1) 0 t

ϕT (t/µ = µ0)

........................... ......................

..........................

......................

................................................................................................................................

...................................................................................................................................................................................................................................................................................................................................................................................................................................................................... .....

............

.

.

.

.

.

.

.

.

........

........

........

........

........

.....

p%

Besluit : bereken

t =x − µ0

s/√

n − 1

• Is t < −T2 p(n − 1) dan wordt H0 verworpen

• Is t > −T2 p(n − 1) dan wordt H0 aanvaard Het testen van hypothesen – p. 17/52

Rechts-eenzijdige T-test voor 1 µVoorwaarde :X : N(µ, σ)

H0 : µ = µ0 H1 : µ > µ0

Als H0 waar is, dan isT =X − µ0

S/√

n − 1: T(n − 1)

P(T > T2 p(n − 1)) =p

100= α

0 T2p(n − 1) t

ϕT (t/µ = µ0)

........................... ......................

..........................

......................

................................................................................................................................

.....................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.

.

.

.

.

.

.

.

.

.

.

.

.

............ .........

........

........

........

........

.....

p%

Besluit : bereken

t =x − µ0

s/√

n − 1

• Is t > T2 p(n − 1) dan wordt H0 verworpen

• Is t < T2 p(n − 1) dan wordt H0 aanvaard Het testen van hypothesen – p. 18/52

Samenvatting i.v.m. T-test

Doel Test op de gemiddelde waardeµ van 1 populatie

aan de hand van 1 steekproef

vann onafhankelijke steekproefwaarden

Voorwaarde De populatie is normaal verdeeld

Type test Tweezijdig Eenzijdig

links rechts

H0 µ = µ0 µ = µ0 µ = µ0

H1 µ �= µ0 µ < µ0 µ > µ0

Verwerpingsgebied |t| > Tp(n − 1) t < −T2p(n − 1) t > T2p(n − 1)

Teststatistiek T =X − µ0

S/√

n − 1: T(n − 1)

Het testen van hypothesen – p. 19/52

De tweezijdige Z-test voor 1 µVoorwaarde :n voldoende groot

H0 : µ = µ0 H1 : µ �= µ0

Als H0 waar is, dan isZ =X − µ0

σ/√

n≈ X − µ0

S/√

n − 1:∼ N(0, 1)

P(|Z| > λp) =p

100= α

−λp 0 λp z

φZ(z)

........................... ......................

..........................

......................

..........................................................................................

..............................................................................................................................................................................................................................................................................................................................................................................................................................................

........

..

..........................................

........

........

....p2%p

2%

Besluit : bereken

z =x − µ0

σ/√

n≈

x − µ0

s/√

n − 1

• Is |z| > λp, dan wordt H0 verworpen

• Is |z| < λp, dan wordt H0 aanvaard Het testen van hypothesen – p. 20/52

Samenvatting i.v.m. Z-test

Doel Test op de gemiddelde waardeµ van 1 populatie

aan de hand van 1 steekproef

vann onafhankelijke steekproefwaarden

Voorwaarde De populatie is willekeurig verdeeld

n is voldoende groot

Type test Tweezijdig Eenzijdig

links rechts

H0 µ = µ0 µ = µ0 µ = µ0

H1 µ �= µ0 µ < µ0 µ > µ0

Verwerpingsgebied |z| > λp z < −λ2p z > λ2p

Teststatistiek Z =X − µ0

S/√

n − 1: ∼ N(0, 1)

Het testen van hypothesen – p. 21/52

Het testen van µX − µY

nulhypothese ? H0 : µX − µY = ∆

alternatieve hypothese ?

• H1 : µX − µY �= ∆ : tweezijdige test

• H1 : µX − µY < ∆ : links-eenzijdige test

• H1 : µX − µY > ∆ : rechts-eenzijdige test

teststatistiekY ?

• zijn X : N(µX , σ) enY : N(µY , σ) onafhankelijk ?

T-test voor het verschil van twee gemiddelde waarden

• zijn nX ennY groot genoeg ?

Z-test voor het verschil van twee gemiddelde waarden

Het testen van hypothesen – p. 22/52

Tweezijdige T-test voor µX − µY

Voorwaarden :X : N(µX , σ) enY : N(µY , σ) zijn

onafhankelijk

ϕX(x)ϕY (y)

x, yµX µY

......................... ......................

..........................

......................

..............................................................................................................

....................................................................................................................................................................

.........................................................................................................................................................................................................................................................................................................................................................................................................................

....................................................................................................................................................................

...........................................................................................................................................................................................................................................................................................................

........................................................................................................................................................................................................

.............

...........

.............

...........

∆........................................................... ................................................... ......................

N(µX , σ) N(µY , σ)

........

.....

........

.....

........

.....

........

.....

........

.....

........

.....

........

.....

........

.....

........

.....

........

.....

........

.....

........

.....

H0 : µX − µY = ∆ H1 : µX − µY �= ∆

Het testen van hypothesen – p. 23/52

Tweezijdige T-test voor µX − µY

Voorwaarden :X : N(µX , σ) enY : N(µY , σ) zijn onafhank.

H0 : µX − µY = ∆ H1 : µX − µY �= ∆

X : N

(µX ,

σ√nX

)nX S2

X

σ2: χ2(nX − 1)

Y : N

(µY ,

σ√nY

)nY S2

Y

σ2: χ2(nY − 1)

X − Y : N(µX − µY ,

√σ2

nX+ σ2

nY

)nXS2

X+nY S2Y

σ2 : χ2(nX + nY − 2)

Als H0 waar isX − Y : N

(∆, σ

√1

nX+

1

nY

)

T =

(X − Y ) − ∆

σ

√1

nX

+1

nY√nXS2

X + nY S2Y

σ2 (nX + nY −2)

=

(X − Y ) − ∆√1

nX

+1

nY√nXS2

X + nY S2Y

nX + nY − 2

: T(nX+nY −2)

Het testen van hypothesen – p. 24/52

Tweezijdige T-test voor µX − µY

H0 : µX − µY = ∆ H1 : µX − µY �= ∆

Als H0 waar is, isT =

(X − Y ) − ∆√1

nX

+1

nY√nXS2

X + nY S2Y

nX + nY − 2

: T(nX + nY − 2)

Besluit :

berekent = ((x − y) − ∆)

√nXnY (nX + nY − 2)

(nXs2X + nY s2

Y )(nX + nY )

• Is |t| > Tp(nX + nY − 2), dan wordt H0 verworpen

• Is |t| < Tp(nX + nY − 2), dan wordt H0 aanvaard

Het testen van hypothesen – p. 25/52

Tweezijdige Z-test voor µX − µY

Voorwaarden : 2 grote steekproeven uit onafhankelijke

populaties

ϕY (y)ϕX(x)

µX µY x, y......................... ......................

.............................

......................

.................................................................................................................................................................

......................................

....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.........................................................................................................................................................................................................................................................................................................................................

.............

........

........

.....

........

.....

........

.....

........

.....

........

.....

........

.....

........

.....

.............

..............................................................................................

∆......................................................................... ................................................... ......................

H0 : µX − µY = ∆ H1 : µX − µY �= ∆

Het testen van hypothesen – p. 26/52

Tweezijdige Z-test voor µX − µY

Voorwaarden : 2 grote steekproeven uit onafhankelijke populaties

H0 : µX − µY = ∆ H1 : µX − µY �= ∆

X :∼ N

(µX ,

σX√nX

)≈ N

(µX ,

SX√nX − 1

)

Y :∼ N

(µY ,

σ√nY

)≈ N

(µY ,

SY√nY − 1

)

X − Y :∼ N

(µX − µY ,

√S2

XnX−1 + S2

YnY −1

)

Als H0 waar isX − Y :∼ N

∆,

√S2

X

nX − 1+

S2Y

nY − 1

Besluit : berekenz =x − y − ∆√S2

XnX−1 + S2

YnY −1

• Is |z| > λp, dan wordt H0 verworpen

• Is |z| < λp, dan wordt H0 aanvaard Het testen van hypothesen – p. 27/52

Voorbeeld : slijtage van 2 types bandenAuto Band A Band B

1 10.6 10.22 9.8 9.43 12.3 11.84 9.7 9.15 8.8 8.3

xA = 10.24 xB = 9.76

s2A = 1.39 s2

B = 1.41H0 : ∆ = 0 H1 : ∆ �= 0

t = (xA − xB)

√nA nB (nA + nB − 2)

(nAs2A + nBs2

B)(nA + nB)= 0.57 < T5(8)

H0 wordt aanvaard

95%B.I. : µA − µB = 0.48 ± 1.93 = [−1.45, 2.41]Klopt dit wel ?

Het testen van hypothesen – p. 28/52

Voorbeeld : slijtage van 2 types bandenAuto Band A Band B

1 10.6 10.22 9.8 9.43 12.3 11.84 9.7 9.15 8.8 8.3

teken A-B

+++++

H0 : ∆ = 0 H1 : ∆ �= 0

als H0 waar is, dan is P(A ≥ B) = P(A ≤ B) = 12

P(5 keer+) = P(5 keer−) =

(1

2

)5

≈ 0.03

Op basis van dezetekentestzou men eerder geneigd zijn H0 te

verwerpen, want het significantieniveau is ongeveer 0.06

Probleem bij T-test ?paarsgewijze onafhankelijkheidHet testen van hypothesen – p. 29/52

Tweezijdige gepaarde T-testVoorwaarde : 2 paarsgewijs afhankelijke steekproeven uit

X : N(µX , σ) enY : N(µY , σ)

H0 : µX − µY = ∆ H1 : µX − µY �= ∆

D = X−Y =⇒ D : N

(µX − µY ,

σD√n

)nS2

D

σ2D

: χ2(n−1)

T =

D − (µX − µY )σD/

√n√√√√ nS2

D

σ2D (n − 1)

=D − (µX − µY )

SD/√

n − 1: T(n − 1)

Als H0 waar is, dan isT = D − ∆SD/

√n − 1

: T(n − 1). . .

Besluit : berekent = d − ∆sD/

√n − 1

• Is |t| > Tp(n − 1) dan wordt H0 verworpen

• Is |t| < Tp(n − 1) dan wordt H0 aanvaard Het testen van hypothesen – p. 30/52

Voorbeeld : slijtage van 2 types bandenAuto Band A Band B

1 10.6 10.22 9.8 9.43 12.3 11.84 9.7 9.15 8.8 8.3

xA = 10.24 xB = 9.76

D

0.40.40.50.60.5

d = 0.48

sD = 0.0748H0 : ∆ = 0 H1 : ∆ �= 0

t =d − ∆

sD/√

n − 1= 12.83 > T5(4) = 2.776

Dit is eenzeer significanttestresultaat : H0 wordt verworpen

Het significantieniveau bedraagt zelfs minder dan 0.5 want

T0.5(4) = 5.59 < 12.83Het testen van hypothesen – p. 31/52

Samenvatting gepaarde T-test

Doel Test op het verschil van 2 gemiddelde waarden

aan de hand van 2 steekproeven van grootten

met paarsgewijs afhankelijke steekproefwaarden

Voorwaarde Beide populaties zijn normaal verdeeld en hebben dezelfdeσ

De enige afhankelijkheid is paarsgewijs

Type test Tweezijdig Eenzijdig

links rechts

H0 µX − µY = ∆ µX − µY = ∆ µX − µY = ∆

H1 µX − µY �= ∆ µX − µY < ∆ µX − µY > ∆

Verwerp. geb. |t| > Tp(n − 1) t < −T2p(n − 1) t > T2p(n − 1)

Teststatistiek T = X − Y − ∆SX−Y√n − 1

: T(n − 1)

Het testen van hypothesen – p. 32/52

De tweezijdige χ2-test voor 1 σVoorwaarde :X : N(µ, σ)

H0 : σ = σ0 H1 : σ �= σ0

Als H0 waar is, dan isχ2 =nS2

σ20

: χ2(n − 1)

P(χ2

p1(n − 1) < χ2 < χ2

p2(n − 1)

)=

p1 − p2

100= 1 − α

ϕn S2

σ20

(t)

tχ2p2

(n − 1) χ2p1

(n − 1)......................... ......................

..............................

......................

.........

........

........

........

.......................................................................................................................................................................................................................................................................................................................................................................................................................................................

........

........

........

........

........

........

........

........

.

.

.

.

.

.

.

.

.

.

. . ........

.

Besluit : bereken

χ2 = n s2

σ20

• Is χ2 �∈ [χ2p1

(n − 1), χ2p2

(n − 1)] dan wordt H0 verworpen

• Is χ2 ∈ [χ2p1

(n − 1), χ2p2

(n − 1)] dan wordt H0 aanvaardHet testen van hypothesen – p. 33/52

De links-eenz. χ2-test voor 1 σVoorwaarde :X : N(µ, σ) H0 : σ = σ0 H1 : σ < σ0

Als H0 waar is, dan isχ2 =nS2

σ20

: χ2(n − 1)

Is σ = σ1 < σ0, dan is E[χ2] =σ2

1

σ20

E[nS2

σ21

] < n − 1

P(χ2

100−p(n − 1) < χ2)

=100 − p

100= 1 − α

ϕn S2

σ20

(t)

tχ2100−p(n − 1)

......................... ......................

..............................

......................

.........

........

........

........

........

...............................................................................................................................................................................................................................................................................................................................................................................................................................................

........

........

........

........

........

........

........

........

........

........

....

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

. Besluit : bereken

χ2 = n s2

σ20

• Is χ2 < χ2100−p(n − 1) dan wordt H0 verworpen

• Is χ2 > χ2100−p(n − 1) dan wordt H0 aanvaard

Het testen van hypothesen – p. 34/52

Samenvatting χ2 test voor 1 σ

Doel Test op de variantieσ2 van 1 populatie

aan de hand van 1 steekproef

vann onafhankelijke steekproefwaarden

Voorwaarde De populatie is normaal verdeeld

Type test Tweezijdig Eenzijdig

links rechts

H0 σ2 = σ20 σ2 = σ2

0 σ2 = σ20

H1 σ2 �= σ20 σ2 < σ2

0 σ2 > σ20

Verwerpingsgebied χ2 > χ2p/2 enχ2 < χ2

100−p/2 χ2 < χ2100−p χ2 > χ2

p

Teststatistiek χ2 =nS2

σ20

: χ2(n − 1)

Het testen van hypothesen – p. 35/52

De F-test voor de verhouding van 2 σ’s

Voorwaarden :X : N(µX , σX) enY : N(µY , σY ) onafh.

noemX de populatie met de grootsteS′2

H0 : σ2X = σ2

Y H1 : σ2X �= σ2

Y

nX S2X

σ2X

: χ2(nX − 1)nY S2

Y

σ2Y

: χ2(nY − 1)

FX, Y =

nXS2X

(nX − 1) σ2X

nY S2Y

(nY − 1) σ2Y

=S′2

X

S′2Y

σ2Y

σ2X

: F(nX − 1, nY − 1)

Als H0 waar is, dan isFX, Y =S′2

X

S′2Y

: F(nX − 1, nY − 1)

Het testen van hypothesen – p. 36/52

De F-test voor de verhouding van 2 σ’s

Voorwaarden :X : N(µX , σX) enY : N(µY , σY ) onafh.

noemX de populatie met de grootsteS′2

H0 : σ2X = σ2

Y H1 : σ2X �= σ2

Y

Als H0 waar is, dan isFX, Y =S′2

X

S′2Y

: F(nX − 1, nY − 1)

ϕFX, Y(t)

0 Fp/2(nX − 1, nY − 1).............................. ......................

........................

......................

..................................................................................................................................................................................................................................................................................................................................................................................................................................

α/2 = p/2%

Besluit : bereken

f =s′2Xs′2Y

• Is f > Fp2(nX − 1, nY − 1), dan wordt H0 verworpen

• Is f < Fp2(nX − 1, nY − 1), dan wordt H0 aanvaard

Het testen van hypothesen – p. 37/52

Samenvatting i.v.m. F-test

Doel Test op de gelijkheid van 2 varianties

aan de hand van 2 onafhankelijke steekproeven

vannX ennY steekproefwaarden

Voorwaarde De twee steekproeven zijn onafhankelijk

De populaties zijn normaal verdeeld

Type test Tweezijdig Eenzijdig

H0 σ2X = σ2

Y σ2X = σ2

Y

H1 σ2X �= σ2

Y σ2X > σ2

Y

Verwerp.geb. FX, Y > Fp/2(nX − 1, nY − 1) FX, Y > Fp(nX − 1, nY − 1)

Teststatistiek FX, Y =

nXS2X

nX − 1nY S2

Y

nY − 1

: F(nX − 1, nY − 1)

Het testen van hypothesen – p. 38/52

De χ2-test van PearsonEen medisch tijdschrift publiceert statistieken die aantonen dat

vier belangrijke ziekten - noem ze A, B, C, en D - respectievelijk

verantwoordelijk zijn voor 15, 21, 18 en 14 % van alle

sterftegevallen die niet te wijten zijn aan ongelukken. Een studie

van de doodsoorzaken in een ziekenhuis toonde aan dat van 308

niet-accidentele sterftegevallen respectievelijk 43, 76, 85, 21 te

wijten waren aan de ziektes A, B, C en D. Is er reden om aan te

nemen dat de verhoudingen die in het hospitaal worden

opgemeten verschillen van de cijfers die in het medisch vakblad

werden bekendgemaakt?

Het testen van hypothesen – p. 39/52

De χ2-test van PearsonAlgemene formulering : Stel dat men beschikt over een

steekproefx1, x2, . . ., xn uit een bepaalde populatie waarvan

verondersteld wordt dat de distributie gegeven wordt door de

functieΦX(x; p1, . . . , pl), waarbijp1, p2, . . . ,pl

parameterwaarden voorstellen die uit de steekproef geschat

worden.

Men vraagt zich af of de steekproefwaarnemingen deze

veronderstelling bevestigen, m.a.w. men vraagt zich af of de

populatie in kwestie inderdaad deze distributiewetΦX bezit.

goodness of fit test

H0 : De populatie bezit de distributiewetΦX(x; p1, . . . , pl) .

H1 : De populatie bezit de distributiewetΦX(x; p1, . . . , pl) niet.Het testen van hypothesen – p. 40/52

De χ2-test van PearsonAlgemene probleemstelling : Er zijnk klassen metn1, n2, . . . ,

nk waarnemingen metn1 + n2 + . . . + nk = n.

ElkeNi is binomiaal verdeeld :

µNi = n θi en σ2Ni

= n θi (1 − θi)

Is n voldoende groot (enθi niet te klein of te groot)

Zi =Ni − n θi√

n θi

∼ N(0,√

1 − θi) ∼ N(0, 1)

Z =k∑

i=1

Z2i =

k∑i=1

(Ni − n θi√

n θi

)2

:∼ χ2(k − l − 1)

Als H0 waar is, dan zalz klein zijn

Besluit : berekenz en verwerp H0 alsz ≥ χ2p(k − l − 1).

Het testen van hypothesen – p. 41/52

De χ2-test van PearsonA B C D Andere

θi 15 % 21 % 18 % 14 % 32 %

n θi 46.2 64.48 55.44 43.12 98.56

ni 43 76 85 21 85

z2i 0.22 1.98 15.76 11.35 2.46 31.77

z =k∑

i=1

z2i =

k∑i=1

(ni − n θi)2

n θi

= 31.77 > χ25(4) = 9.49

Hetgeen in dat particuliere hospitaal wordt geconstateerd

wijkt significant afvan de gepubliceerde gegevens,

m.a.w. H0 wordt verworpen.

Het testen van hypothesen – p. 42/52

Contingentietabellen – kruistabellen

In een productieproces worden fouten geconstateerd. Deze

fouten kunnen geklassicificeerd worden volgens het type defect

en anderzijds ook volgens de productieploeg die ze heeft

vervaardigd. De vraag die men zich nu hierbij stelt is : hangt de

aard van de productiefout af van ploeg tot ploeg ?

Type Defect

Shift A B C D Totaal

1 15 21 45 13 94

2 26 31 34 5 96

3 33 17 49 20 119

Totaal 74 69 128 38 309

Het testen van hypothesen – p. 43/52

Contingentietabellen – kruistabellen

H0 : de classificaties zijn onafhankelijk

H1 : de classificaties zijn afhankelijk

Neem als voorbeeld de cel (1, A).

De absolute frequentieN1A van cel (1, A) is binomiaal verdeeld.

θ1A = P(een defect door shift 1 van type A)

Als H0 waar is, dan is

P(defect door shift 1 van type A)

= P(defect door shift 1) · P(defect van type A)

⇐⇒ θ1A = θ1 · θA

Vraag : wat zijnθ1 enθA ?

θ1 enθA moetengeschatworden

Het testen van hypothesen – p. 44/52

Contingentietabellen – kruistabellen

Type Defect

Shift A B C D Totaal

1 15(22.51)21 (20.99)45 (38.94)13 (11.56) 94 θ̂1 = 94309

2 26(22.99)31 (21.44)34 (39.77) 5 (11.81) 96 θ̂2 = 96309

3 33(28.50)17 (26.57)49 (49.29)20 (14.63) 119 θ̂3 = 119309

Totaal 74 69 128 38 309

θ̂A = 74309

θ̂B = 69309

θ̂C = 128309

θ̂D = 38309

µ1A ≈ n̂1A = n θ1A = n θ1 θA = 30974

309

94

309

χ2 =r∑

i=1

c∑j=1

(Nij − n̂ij)2

n̂ij

: χ2(k − l − 1)

χ2 =(15 − 22.51)2

22.51+

(26 − 22.99)2

22.99+. . .+

(20 − 14.63)2

14.63= 19.18

Het testen van hypothesen – p. 45/52

Contingentietabellen – kruistabellen

H0 : de classificaties zijn onafhankelijk

H1 : de classificaties zijn afhankelijk

χ2 =r∑

i=1

c∑j=1

(Nij − n̂ij)2

n̂ij

= 19.18 : χ2(k − l − 1)

k = r c l = (r− 1) + (c− 1) k − l− 1 = (r− 1) (c− 1)

19.18 > χ25(6) = 12.5916

Voor α = 0.05 wordt H0 verworpen, m.a.w. de classificaties zijn

afhankelijk.

Het testen van hypothesen – p. 46/52

ProbabiliteitsplotIs een gegeven steekproef afkomstig uit een populatie met een

gegeven distributiewet ?

Deze vraag kan beantwoord worden m.b.v. eenprobabiliteitsplot.

• Q-Q plot: kwantielen van de gegeven steekproef worden

uitgezet t.o.v. de kwantielen van de distributie

• P-P plot: cumulatieve proporties van de gegeven

steekproef worden uitgezet t.o.v. de cumulatieve proporties

van de distributie

• probitdiagram: kwantielen worden uitgezet t.o.v.

cumulatieve proporties

Indien de steekproef uit een populatie met de gegeven

distributiewet komt, liggen de uitgezette punten rond een rechte.Het testen van hypothesen – p. 47/52

ProbitdiagramDoel : langs grafische weg testen of een steekproef vann

onafhankelijke steekproefwaardenx1, x2, · · · , xn uit een

normaal verdeelde populatie komt.

X : N(µ, σ) =⇒ y(x) = ΦX(x) = Ψ

(x − µ

σ

)⇐⇒ z(x) = Ψ−1 (ΦX (x)) =

x − µ

σ

��

��

��

��

��

��

��

��

��

x

z(x)

µ − 2σµ − σ µ µ + σ µ + 2σ

−2

−1

0

+1

+2

2.275

15.866

50.000

84.134

97.725

y(x) (%)

Het testen van hypothesen – p. 48/52

Probitdiagram en T -verdelingen

ΦT (t)

−8 −6 −4 −2 0 2 4 6 8 t

99

959080706050403020105

1 ........................... ......................

........

........................

......................

n = 1

n = 4n = 10n = 100

................................................................................................................

...........................................................................

......................................................

.......................................

.................................

...............................................................................................................................................................................................................................................

.....................................

..............................................

...................................................................

................................................................................................

...............................................

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................. ...............................................................................................................................................................................................................................................................................................................................................................................................................................................

....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............

............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............

............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............

............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............

............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............

............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............

............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............

............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. ............. .............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

......

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

......

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

......

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

......

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

......

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

......

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

......

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

......

Het testen van hypothesen – p. 49/52

P-P plotgewicht van de mannen

Normal P-P Plot of GEWICHT

Observed Cum Prob

1.00.75.50.250.00

Exp

ecte

d C

um P

rob

1.00

.75

.50

.25

0.00

Het testen van hypothesen – p. 50/52

Q-Q plotgewicht van de mannen

Normal Q-Q Plot of GEWICHT

Observed Value

100908070605040

Exp

ecte

d N

orm

al V

alue

100

90

80

70

60

50

40

Het testen van hypothesen – p. 51/52

ProbitdiagramDit is eennormaliteitstest.

H0 : X : N(µ, σ) en H1 : X : niet N(µ, σ)

H0 wordt aanvaard als alle punten binnen een beperkt gebied

rond een rechte liggen.

α : omwille van het niet op een rechte liggen van de punten in

het probitdiagram weigeren te erkennen dat de steekproef uit een

N(µ, σ) populatie komt als dat wel zo is.

β : toegeven dat de steekproef uit een N(µ, σ) populatie komt

(omdat de bepaalde punten lijken op een rechte te liggen) als dat

niet zo is.

Het testen van hypothesen – p. 52/52