Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk...

Post on 28-Feb-2018

253 views 7 download

Transcript of Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk...

Statistik – 7. gang 1

9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data

H0 : Nul hypotese Formuleres som en ”ligheds” hændelse

H1 eller HA: Alternativ hypotese, der må accepteres hvis H0 forkastes

Trin 2: Vælg statistisk model Test statistik og sampling fordeling fastsættes (vælges under hensyntagen til H0 og H1) Trin 3: Vælg signifikansniveau

Beslutning: H0 er sand H0 er ikke sand Accepter H0 Korrekt beslutning Forkert beslutning

Type II fejl Forkast H0 Forkert beslutning

Type I fejl Korrekt beslutning

Statistik – 7. gang 2

Beslutning: H0 er sand H0 er ikke sand Accepter H0 Korrekt beslutning Forkert beslutning

Type II fejl Forkast H0 Forkert beslutning

Type I fejl Korrekt beslutning

Type I og II fejl er ikke uafhængige Normalt tages der mest hensyn til type I fejl! Signifikansniveau: α sandsynlighed for type I fejl

β sandsynlighed for type II fejl Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Statistik – 7. gang 3

Trin 4: Indsaml data og beregn test statistik Udfra en stikprøve med n udfald beregnes test statistikken Trin 5: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes (område der er usandsynligt for test statistikken, hvis hypotesen er sand)

Statistik – 7. gang 4

Området afhænger af:

- Formuleringen af H1 - Fordelingsfunktionen for test statistikken - Signifikans-niveauet

Trin 6: Konklusion H0 accepteres hvis værdien af test statistikken ligger indenfor det acceptable område H0 forkastes og derved accept af H1 hvis værdien af test statistikken ligger udenfor det acceptable område

Statistik – 7. gang 5

9.3.1 HYPOTESETEST AF MIDDELVÆRDIER – KENDT SPREDNING Eks: Test af stål trækstyrke: kan det konkluderes at forventningsværdien af trækstyrken er mindst 325 MPa ? - spredningen er kendt: 16=σ MPa 1. trin: Hypotese:

H0 : 3250 == μμ MPa H1 : 3250 =< μμ MPa

(eller H1 : 0μμ > ) (eller H1 : 0μμ ≠ )

Statistik – 7. gang 6

I dette tilfælde udføres en enkeltsidet test, små styrker betragtes som ”kritiske”: H0 accepteres hvis αZZ −> Hvis H0 accepteres kan det ikke afvises, at middeltrækstyrken er 325 MPa eller større. 2. trin: statistisk model

Fordeling af ),(N:n

X σμ

Test statistik: )1,0(N:/ n

XZσ

μ−=

Statistik – 7. gang 7

3. trin: Signifikansniveau α = 0.01 (1 % sandsynlighed for type I fejl, dvs. at H0 forkastes selvom den er sand) 4. trin:

Udfra n = 100 og 31911

=∑==

n

iix

nX :

75.3100/16325319

/−=

−=

−=

nXZσ

μ

Statistik – 7. gang 8

5. trin: Der benyttes en enkeltsidet test, idet kun små værdier af Z er kritiske!

75.3−=Z

326.2)99.0()1( 11 =Φ=−Φ= −− ααZ ⇒ 326.2−=− αZ 6. trin: H0 forkastes, dvs. styrken er ikke acceptabel

Statistik – 7. gang 9

EKSEMPEL 1

Er forventningsværdien af indholdet i en flaske = ¾ liter? 1. trin:

H0 : 4/30 == μμ liter H1 : 4/30 =≠ μμ liter

2. trin: Hvis σ antages kendt fås: (husk sidste gang)

),(N:n

X σμ

Derved introduceres test statistikken:

)1,0(N:/ n

XZσ

μ−=

Statistik – 7. gang 10

3. trin: Signifikansniveau α = 0.01 (1 % sandsynlighed for type I fejl, dvs. at H0 forkastes selvom den er sand) 4. trin:

Forsøgsresultater: n = 30 79.011

=∑==

n

iix

nX

Med 75.0=μ og 05.0=σ fås:

15.030/05.075.079.0

/=

−=

−=

nXZσ

μ

Statistik – 7. gang 11

5. trin: Der vælges en dobbeltsidet test, idet både små og store værdier af Z er kritiske!

15.0=Z

58.2)995.0()2/1( 112/ =Φ=−Φ= −− ααZ

6. trin: H0 accepteres, idet:

58.215.058.2

2/2/

<<−⇓

<<− αα ZZZ

Statistik – 7. gang 12

9.3.2 HYPOTESETEST AF MIDDELVÆRDIER – UKENDT SPREDNING 1. trin: Hypotese: H0 og H1 : formuleres som før 2. trin: statistisk model Middelværdi X og spredning S : stokastiske variabler ⇓

Test statistik: 1:/ −−

= ntnSXt μ (t-fordeling med n-1 frihedsgrader)

3. trin: Signifikansniveau: som før, typisk α = 0.01 4. trin: Indsaml data og beregn test statistik t

Statistik – 7. gang 13

5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes (område der er usandsynligt for test statistikken, hvis hypotesen er sand)

6. trin: Konklusion accept område: H1 : 0μμ < forkast hvis )1(, −−< ntt α H1 : 0μμ > forkast hvis )1(, −> ntt α H1 : 0μμ ≠ forkast hvis )1(,2/ −−< ntt α eller )1(,2/ −> ntt α

Statistik – 7. gang 14

Statistik – 7. gang 15

EKSEMPEL 9.3 Koncentration af ilt: Er forventningsværdien af koncentrationen af ilt over grænseværdien på 3 per million ? 1. trin: Hypotese:

H0 : 30 == μμ per million H1 : 30 =< μμ per million

2. trin:

Test statistik: 1:/ −−

= ntnSXt μ (t-fordeling med n-1 frihedsgrader)

3. trin: Signifikansniveau: typisk α = 0.05 4. trin: Givet: n = 5 X =2.8 S =0.32 ⇒

398.15/32.0

38.2/

−=−

=−

=nS

Xt μ

Statistik – 7. gang 16

5. trin: Enkeltsidet test

398.1−=t

132.2)15(, −=− −αt (tabel A-2) 6. trin: H0 accepteres, idet: -1.398 > -2.132

Statistik – 7. gang 17

9.3.3 HYPOTESETEST AF 2 MIDDELVÆRDIER – UKENDT SPREDNING Population 1: 1X : N( 1μ , 1σ ): 1n samples med middelværdi 1X og spredning 1S Population 2: 2X : N( 2μ , 2σ ): 2n samples med middelværdi 2X og spredning 2S 1. trin: Hypotese: H0: middelværdier af de 2 populationer er ens: 1μ = 2μ

H1: 1μ < 2μ eller H1: 1μ > 2μ eller H1: 1μ ≠ 2μ 2. trin: Test statistik:

2121

222

211

21

112

)1()1(nnnn

SnSnXXt

+−+

−+−−

= (t-fordeling med 1n + 2n -2 frihedsgrader)

3. trin: Signifikansniveau: som før, typisk α = 0.01

Statistik – 7. gang 18

4. trin: Indsaml data og beregn test statistik t 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes

6. trin: Konklusion accept område: H1 : 21 μμ < forkast hvis αtt −< H1 : 21 μμ > forkast hvis αtt > H1 : 21 μμ ≠ forkast hvis 2/αtt −< eller 2/αtt >

Statistik – 7. gang 19

EKSEMPEL 9-4 Udvikling af kvælstofindhold i én bæk - indhold før byudvikling: fμ - indhold efter byudvikling: eμ Er der sket en ændring? 1. trin: Hypotese: H0: middelværdier af de 2 populationer er ens: fμ = eμ

H1: fμ < eμ 2. trin: Test statistik:

2121

222

211

21

112

)1()1(nnnn

SnSnXXt

+−+

−+−−

= (t-fordeling med 1n + 2n -2 frihedsgrader)

3. trin: Signifikansniveau: α = 0.05

Statistik – 7. gang 20

4. trin: Data: Før: 1n = 11 1X =0.78 1S =0.36 Efter: 2n = 14 2X =1.37 2S =0.87 ⇒

141

111

2141187.0)114(36.0)111(

37.178.022

+−+

−+−−

=t = -2.104

5. trin: Definer forkastelsesområdet Enkeltsidet test

104.2−=t 714.1)21411(, −=− −+αt (tabel A-2) 6. trin: Konklusion Da -2.104 < -1.714 forkastes H0 ⇒ H1 accepteres

Dvs. kvælstodindholdet forøges efter byudvikling

Statistik – 7. gang 21

Alternativt: 3. trin: Signifikansniveau: α = 0.01

104.2−=t ⇒

)21411(, −+− αt =-2.500 (tabel A-2) ⇒ H0 accepteres ⇒ Dvs. kvælstodindholdet forøges ikke efter byudvikling med et signifikansniveau på 1% OBS: ( )sander selvom forkast 00 HHP=α dvs. α større ⇒ sværere at få hypotese accepteret

(lettere at få hypotese forkastet)

Statistik – 7. gang 22

9.4 HYPOTESETEST AF VARIANSER 1. trin: Hypotese: H0: ingen signifikant forskel mellem populationens varians 2σ

og en forud valgt værdi af variansen 20σ :

2σ = 20σ

H1: 2σ < 2

0σ eller H1: 2σ > 2

0σ eller H1: 2σ ≠ 2

0σ 2. trin: Test statistik: samplevarians: 2S : 2χ (chi-fordelt – tabel A-3)

test statistik: 20

22 )1(

σχ Sn −

= 2χ -fordelt med (n-1) frihedsgrader

3. trin: Signifikansniveau: som før, typisk α = 0.01

Statistik – 7. gang 23

4. trin: Indsaml data og beregn test statistik 2χ 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes

Statistik – 7. gang 24

6. trin: Konklusion accept område: H1 : 2σ < 2

0σ forkast hvis 2

)1(,12

−−< nαχχ H1 : 2σ > 2

0σ forkast hvis 2

)1(,2

−> nαχχ H1 : 2σ ≠ 2

0σ forkast hvis 2

)1(,2/12

−−< nαχχ eller 2)1(,2/

2−> nαχχ

Statistik – 7. gang 25

Statistik – 7. gang 26

EKSEMPEL 9-5 Variansen af betons trykstyrke bør ikke være for stor 1. trin: Hypotese: H0: varians = 2

0σ = 275.0 H1: 2σ > 2

3. trin: Signifikansniveau: α = 0.05 4. trin: Data:

n= 5 S =1.238 ⇒ 20

22 )1(

σχ Sn −

= = 84.1075.0

238.1)15(2

2

=−

5. trin: Definer forkastelsesområdet H1 : 2σ > 2

0σ forkast hvis 2)1(,

2−> nαχχ

2)1(, −nαχ =9.492 (tabel A-3)

6. trin: Konklusion Da 2

)1(,2

−> nαχχ forkastes hypotesen

Statistik – 7. gang 27

9.4.2 HYPOTESETEST AF 2 POPULATIONERS VARIANSER Varians af de 2 populationer: 2

1S og 22S ( 2

1S > 22S )

1. trin: Hypotese: H0: ingen signifikant forskel mellem populationernes varianser

21σ = 2

2σ H1: 2

1σ ≠ 22σ

2. trin:

test statistik: 22

21

SSF = F - fordelt med ( 1n -1) frihedsgrader i tæller

( 2n -1) frihedsgrader i nævner 3. trin: Signifikansniveau: typisk α = 0.01 4. trin: Indsaml data og beregn test statistik F 5. trin: Definer forkastelsesområdet H0 accepteres på signifikansniveau α hvis F < 1,1,2/ 21 −− nnFα 6. trin: Konklusion

Statistik – 7. gang 28

Statistik – 7. gang 29

EKSEMPEL 9-6 1. trin: Hypotese: H0: 2

1σ = 22σ

H1: 21σ ≠ 2

2σ 2. trin:

test statistik: 22

21

SSF =

3. trin: Signifikansniveau: typisk α = 0.05 4. trin: Indsaml data og beregn test statistik F

1n =5 21S =3.807 2n =5 2

2S =6.423

test statistik: 22

21

SSF =

807.3423.6

= =1.687

5. trin: Definer forkastelsesområdet

1,1,2/ 21 −− nnFα =6.39 (tabel A-4) 6. trin: Konklusion Da F < 1,1,2/ 21 −− nnFα accepteres H0 på signifikansniveau α =5%

Statistik – 7. gang 30