6. i 7. jTestiranje Hipoteze Razlike Dva Parametra Populacije

1Testiranje hipoteze razlike dvaparametra populacija

Prof. dr. Mugdim Paid

Dvije populacije

Testiranje hipotezerazlike dva parametra populacija

Testiranje hipoteze razlike 1 i 2 dvije

odnosne populacije

Testiranje hipoteze razlike proporcija,

p1 i p2, dvije populacije


nezavisne populacije

Standardne devijacije populacija 1 i 2 poznate,

popul. nor. dist. ili n1 i n2 30

Standardne devijacije populacija 1 i 2 nepoznate,

n1 i n2 30


n1 ili n2 < 30

2

Dvije populacije



odnosne populacije








n1 i n2 30


n1 ili n2 < 30

3

Testiranje hipoteze razlike 1 i 2 dvije nezavisne populacije

Standardne devijacije populacija 1 i 2

nepoznate, n1 ili n2 < 30


nepoznate, n1 i n2 30


poznate, popul. nor. dist. ili n1 i n2 30

Koristiti z test

Koristiti standardnedevijacije uzoraka (s1 i s2)

za procjenu 1 i 2

Koristiti z test

Varijanse jednake: koristiti sp; Varijanse nisu

jednake: koristiti standardne devijacije

uzoraka (s1 i s2)

Koristiti t test

4

z vrijednost

z statistiko se rauna po sljededoj formuli:

2

2

2

1

2

1

2121

n

n

xxz

5

1 i 2 poznate, n1 i n2 30Primjer

Jedna kompanija proizvodi remene za motore. Kompanija ima dvije maine za proizvodnju remena. Standardna devijacija duine remena na prvoj maini je 0,025 cm, dok je st. dev. na drugoj maini 0,034 cm. Menader kvaliteta eli da testira da li su remeni proizvedeni na maini 2 dui, te je stoga uzeo uzorke od po 100 remena proizvedenih na dvije maine.

Izabrao je nivo signifikantnosti =0,05. cm 509,0 i cm 501,0 21 xx

6


U ovom primjeru de se koristiti lower tail test jer elimo da provjerimo da li je duina remena proizvedenih na maini 2 veda od onih proizvedenih na maini 1:

Lower tail test:

H0: 1 2 0

H1: 1 2 < 0

7


Za = 0,05 iz tabele (z ima - predznak jer je lower tail test)

Ako je zstat < -1,645 Odbaciti nultu hipotezu U suprotnom Ne odbaciti nultu hipotezu

645,1z0,05

= 0,05Podruje odbacivanja

0Z crit = -1,645

0,45

8

Poto je = 0,05Traimo povrinu: 0,5 = 0,45

Interpolacijom se dobije z=-1,645

Standard Normal Curve Probability Distribution

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

99


Statistiki z test

Poto je zstat = -1,90

3Standardne devijacije populacija 1 i 2






Koristiti z test


za procjenu 1 i 2

Koristiti z test



uzoraka (s1 i s2)

Koristiti t test


13

z vrijednost

z statistiko se rauna po sljededoj formuli:

2

2

2

1

2

1

2121

n

s

n

s

xxz

14

1 i 2 nepoznate, n1 i n2 30Primjer

Operacioni menader ABC Telecom eli da utvrdi da li postoji razlika u platama enskih i mukih klijenata korisnika mobilnih telefona. Uzeli su uzorke i to 200 mukaraca i 100 ena.

Podaci za aritmetike sredine i standardne devijacije uzoraka su kako slijedi (1=m 2=):

s1=7.300 KM i s2 = 8.200 KM

Izabrao je nivo signifikantnosti =0,05.

400.42 i 390.43 21 KMxKMx

15

1 i 2 nepoznate, n1 i n2 30Primjer (nastavak)

U ovom primjeru de se koristiti two tail test jer elimo da provjerimo da li se prosjene plate mukaraca i ena razlikuju:

Two tail test:

H0: 1 2 = 0

HA: 1 2 0

16

1 i 2 poznate, n1 i n2 30Primjer (nastavak)

(Iz tabele)

Ako je zstat < -1,96 ili zstat > 1,96 Odbaciti H0 U suprotnom Ne odbaciti H0

96,1zz- i 96,1zz 0,025/20,025/2

/2= 0,025Podruje odbacivanja

0Z crit = -1,96

/2 = 0,025Podruje odbacivanja

Z crit = 1,96

0,475 0,475

0,95

17

Poto je = 0,05Traimo z za povrinu: 0,5 /2 = 0,475

z=1,96

Standard Normal Curve Probability Distribution

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

18


Statistiki z test

Poto je zstat = 1,022 < zcrit = 1,96 Ne odbaciti nultu hipotezu

H0: 1 2 = 0 Ne postoji statistiki dokaz da se zakljui da su

prosjena primanja ena i mukaraca razliita.

2

2

2

1

2

1

2121

n

s

n

s

xxz

022,1

100

8.200

200

7.300

0400.24390.34z

22

19


zcrit = - 1,96

0,4750,475

0,950,025

Podruje odbacivanja

zcrit = 1,96

Podruje odbacivanja

Podruje neodbacivanja

Z = 1,022

0,025

z statistiko

20

1 i 2 nepoznate, n1 i n2 30p-vrijednost pristup, Primjer (nastavak)

Treba pronadi povrinu (vjerovatnodu) desno od z=1,022 i lijevo od z=-1,022.

Ta vjerovatnoda je p=2(0,15339)= 0,306781

21


p-vrijednost za ovaj two-tail test je vjerovatnoda da de z vrijednost biti

> od zstat = 1,022 i < od ztat = -1,022 Standard Normal Curve Probability Distribution

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

Interpolacijom se dobije vjerovatnoda 0,5 - 0,34661= 0,15339

Ne odbacitiH0

Odbaciti H0Odbaciti H0

/2 = 0,025

0

z = -1,022

Izraunati p-value i uporediti sa . Ako je p-vrijednost > Ne odbaciti H0

Treba pronadi povrinu (vjerovatnodu) iznad z=1,022 i ispod z=-1,022.

0,3067810,15339

)P(z)P(z

)(2

022,1022,1

p-vrijednost = 0,306781


p-vrijednost = 0,306781 > = 0,05 Ne odbaciti H0

z = 1,022

zcrit = - 1,96

/2 = 0,025

0,15339

1 = 0,95

Ne postoji statistiki dokaz da se zakljui da su prosjena primanja ena i mukaraca razliita.

0,15339

zcrit =1,96

23

Z Test for Differences in Two Means

DataHypothesized Difference 0Level of Significance 0,05

Population 1 SampleSample Size 200

Sample Mean 43390Population Standard Deviation 7300

Population 2 SampleSample Size 100

Sample Mean 42400

Population Standard Deviation 8200

Intermediate Calculations

Difference in Sample Means 990Standard Error of the Difference in Means 968,9427

Z-Test Statistic 1,021732

Two-Tail Test

Lower Critical Value -1,95996

Upper Critical Value 1,959964p-Value 0,306908

Do not reject the null hypothesis

24

5Testiranje hipoteze razlike dvije aritmetike sredine nezavisnih populacija, (1 2),

Two tailed test

Two-tailed test:H0: 1 = 2H1: 1 2

odnosno,H0: 1 2 = 0H1: 1 2 0

Nulta hipoteza: Tvrdnja da su dvije aritmetike sredine jednakeIstraivaka (alternativna) hipoteza: Tvrdnja koju elimo dokazati -da su dvije aritmetike sredine razliite

/2 /2

-zcrit

Odbaciti H0 ako jez < - zcrit ili z > zcrit

Zcrit

25

Testiranje hipoteze razlike dvije aritmetike sredine nezavisnih populacija, (1 2),

direkcioni testLower tail test:

H0: 1 2H1: 1 < 2odnosno,

H0: 1 2 0H1: 1 2 < 0

Upper tail test:H0: 1 2H1: 1 > 2odnosno,

H0: 1 2 0H1: 1 2 > 0

-zcritOdbaciti H0 ako je z < - zcrit

Odbaciti H0 ako je z > zcrit

zcrit

26







Koristiti z test


za procjenu 1 i 2

Koristiti z test



uzoraka (s1 i s2)

Koristiti t test


27

1 i 2 nepoznate, n1 i n2 < 30varijanse populacija su jednake

Pretpostvake:

Obje populacije su normalno distribuirane

Moe se koristiti goodness-of-fit test da se provjeri da li podaci u uzorku dolaze iz populacije koja je normalno distribuirana

Varijanse populacija su jednake

Uzorci su nezavisni

28

1 i 2 nepoznate, n1 i n2 < 30varijanse populacija su jednake

21

2121

11

nns

xxt

p

t ima (n1 + n2 2) stepeni slobode

2

11

21

2

22

2

11

nn

snsnsp

sp je zajednika standardna devijacija (pooled standard deviation)

29

Primjer

Napravljeno je istraivanje da se utvrdi da li se sa brand name ink printer cartridge (BNIPC) moe otprintati vie stranica nego sa no name ink printer cartridge (NNIPC). Sluajni uzorak od 10 korisnika je odabran i dat im je BNIPC. Drugi uzorak od 8 korisnika je dobio NNIPC. Obje grupe su koristile svoje printere dok nije nestalo tinte u cartridgeima.

s1=48,3 stranice i s2 = 53,3 stranice Izabrani nivo signifikantnosti =0,05. Pretpostaviti iste

varijanse populacija.

stranicax NNIPC i stranicax BNIPC 3,2985,322 21

30

6Primjer (nastavak)

U ovom primjeru de se koristiti upper tail test jer elimo da provjerimo da li je 1 , broj stranica otprintanih sa BNIPC vedi od 2, broja stranica otprintanih sa NNIPC:

Upper tail test:

H0: 1 2 0

H1: 1 2 > 0

31

Primjer (nastavak)

Broj stepeni slobode = n1 + n2 2= 10+8-2=16

Iz tabele za d.f.=16 area in one tail t0,05=1,746

Ako je t > 1,746 Odbaciti nultu hipotezu

U suprotnom, ne odbaciti nultu hipotezu32

Primjer (nastavak)

0

Region odbacivanja H0

= 0,05

Odbaciti H0

t crit = 1,7459

0,5 0,45

Ne odbaciti H0

33

Primjer (nastavak) Statistiki t test

Poto je tstat (1,0093) < tcrit (1,746)

Ne odbaciti nultu hipotezu

Ne postoji dovoljno dokaza da se zakljui da je prosjeni broj stranica BNIPC > NNIPC

21

2121

11

nns

xxt

p

00931

8

1

10

15550

0032985322

11

21

2121 ,

,

,),,(

nns

xxt

p

5550

2810

35318348110

2

11 22

21

2

22

2

11 ,,)(,)(

nn

snsnsp

34

Primjer (nastavak)

0

Region odbacivanja H0

= 0,05

Odbaciti H0

t crit = 1,7459

0,5 0,45

Ne odbaciti H0

t stat = 1,0093 F/2

U suprotnom ne odbaciti H0

Izgled F tabele za =0,1

Excel

Excel

=FINV(probability, df1, df2)

Prilikom unosa probability voditi rauna da li se radi o two-tail testu ili one-tail testu

F-test odnosa dvije varijanse

Slino se vri testiranje hipoteze kada se eli utvrditi da li je jedna varijansa veda od druge varijanse.

F-test odnosa dvije varijanse

Jedna kompanija ima dvije maine za punjenje velikih konzervi ulja. Operacioni menader sumnja da je varijabilitet punjenja konzervi na prvoj maini vedi od varijabiliteta punjenja konzervi na drugoj maini. Sljededi podaci su dati za konzerve od 8 litara za mainu 1 i 2.

1 2

Da li postoji dokaz da je varijansa punjenja na maini 1 veda od varijanse punjenja na maini 2 na 0,05 nivou signifikantnosti. Pretpostaviti da su populacije koliine punjenja su normalno distribuirane

8,005; 7,997

0,0012 0,005

11 16

BSS1= n1-1=11-1=10

BSS2=n2-1=16-1=15

=0,05

Gornja kritina vrijednost Fcrit=2,54 (iz tabele ili Excel)

=1

2

22 =

0,0122

0,0052= 5,76

0: 12 2

2

1: 12 > 2

2

Poto je FSTAT >FCRIT Odbaciti nultu hipotezu

Na 0,05 nivou signifikantnosti postoji dokaz da je varijansa punjenja na maini 1 veda od varijanse punjenja na maini 2.

0: 12 2

2

1: 12 > 2

2

9Dvije populacije



odnosne populacije








n1 i n2 30


n1 ili n2 < 30

49

Testiranje hipoteze razlike 1 i 2 dvije odnosne populacije

Vrijednosti u jednom uzorku su uparene sa vrijednostima u drugom uzorku

Nazivaju se i zavisni uzorci

Koristi se razlika uparenih vrijednosti:

Pretpostavka: Obje populacije su normalno distribuirane ili su

uzorci veliki, n1 i n2 30

= 1 2

50


Broj stepeni slobode: d.f. = n-1

d = 1 - 2

Gdje je:

=

51


Gdje je (nastavak):

i-ta uparena razlika je:

Taka procjene za aritmetiku sredinu uparene razlike:

n je broj parova (uparenih vrijednosti) u uparenim uzorcima

Standardna devijacija za uparene uzorke

= 1 2

=

=1

= ( )2

==1

1

52

=

Primjer

Napravljeno je istraivanje da se utvrdi da li se sa brand name ink printer cartridge (BNIPC) moe otprintati vie stranica nego sa no name ink printer cartridge (NNIPC).

Odabrano je 6 korisnika da testiraju oba tipaprintera.

Oni su koristili printere dok nije nestalo tinte u cartridgeima.

Izabrani nivo signifikantnosti =0,01.

Podaci su dati u sljededoj tabeli:53

Primjer (nastavak)

Korisnik Brand No-name

1 306 300

2 256 260

3 402 357

4 299 286

5 306 290

6 257 260

54

10

Primjer (nastavak)

U ovom primjeru de se koristiti upper tail test jer elimo da provjerimo da li je 1 , broj stranica otprintanih sa BNIPC vedi od 2, broja stranica otprintanih sa NNIPC:

Upper tail test:H0: 1 2 0H1: 1 2 > 0

OdnosnoH0: d 0H1: d > 0

55

Primjer (nastavak)

Broj stepeni slobode = n -1= 6-1=5 Iz tabele za d.f.=5 area in one tail t0,01=3,365

Ako je t > 3,365 Odbaciti nultu hipotezu U suprotnom, ne odbaciti nultu hipotezu

56

Aritmetika sredina i standardna devijacija

Poto je tstat = 1,6543 < tcrit = 3,365

Ne odbaciti nultu hipotezu

Nema dovoljno dokaza da se zakljui da se sa brand name cartridges moe isprintati vie stranica nego sa no name cartridges.

Korisnik Brand No-name di dsr=suma(di)/n di-dsr (di-dsr)^2 stand. dev.

1 306 300 6 12,17 -6,17 38,02778 18,02

2 256 260 -4 -16,17 261,3611

3 402 357 45 32,83 1078,028

4 299 286 13 0,83 0,694444

5 306 290 16 3,83 14,69444

6 257 260 -3 -15,17 230,0278

suma (di) = 73 sum(di-dsr)^2 = 1622,83

= 1 2

=

=1

= ( )2

==1

1

=

=12,17 0,0

18,02

6

= 1,6543

57

Dvije populacije



odnosne populacije








n1 i n2 30


n1 ili n2 < 30

58

Testiranje hipoteze razlike proporcija, p1 i p2, dvije populacije

Statistiki test je baziran na sampling distribuciji

Kada je sampling distribucija proporcije uzorka je aproksimativno normalno distribuirana sa aritmetikom sredinom p i varijansom

Slino, kada imamo dva uzorka, sampling distribucija de aproksimativno biti normalna ako je:

5 (1 ) 5

1 2

(1 )

1 2

59


Sampling distribucija od p1 p2 imade aproksimativno normalnu distribuciju ako je:

n1p1 5 , n1(1-p1) 5

n2p2 5 , n2(1-p2) 5 Poto su p1 i p2 nepoznate koristi se p1 i p2

(proporcije uzoraka) da se utvrdi da li je uzorak dovoljno velik.

n1p1 5 , n1(1-p1) 5

n2p2 5 , n2(1-p2) 5

60

11


Aritmetika sredina sampling distribucije je jednaka razlici proporcija populacija p1 p2

Varijansa je jednaka sumi varijansi

Test se provodi pod pretpostavkom da je nulta hipoteza tana, dakle pretpostavlja se da je p1=p2=p

Zajednika procjena ukupne proporcije obje populacije zajedno, p, se rauna na sljededi nain:

Gdje je: x1, x2, brojevi iz uzorka 1 i 2 sa karakteristikama od interesa

1(1 1)

1+

2(1 2)

2

=1 1 + 2 2

1 + 2=

1 + 21 + 2

1 2

61


z test:

(p1 p2) = hipotezirana razlika proporcija populacija 1 i 2 respektivno

= razlika proporcija uzoraka uzetih iz populacija 1 i 2 respektivno

= Zajednika procjena ukupne proporcije obje populacije zajedno

= 1 2 (1 2)

1 (11

+12

)

1 2

62

Primjer

Jedno preduzede evaluira skenere za ulaznice od dva proizvoaa (skener 1 i skener 2). Preduzede eli kupiti skener za ulaznice iz razloga to se pojavljuje vedi broj falsificiranih ulaznica.

Preduzede eli da utvrdi ima li razlike u proporciji otkrivenih falsificiranih ulaznica koritenjem skenera dva proizvoaa.

Izabrani nivo signifikantnosti za ovaj test je =0,02.

Uzet je sluajni uzorak iz poznatih falsificiranih ulaznica veliine 200 ulaznica. Skener 1 je otkrio 186 falsifikata od 200, dok je skener 2 otkrio 168 falsifikata od 200.

63

Primjer (nastavak)

Koristide se two tail test jer preduzede hode da utvrdi da li ima razlike u proporciji otkrivenih falsificiranih karata

H0: p1 p2 = 0

H1: p1 p2 = 0

64

Primjer (nastavak)

/2 = 0,01

-zcrit Zcrit

0,49 0,49

/2 = 0,01

65

(

2

)=0,01= 2,33

(2

)=0,01= 2,33

66

12

z test:

Poto je zstat = 2,8211 > zcrit, (/2) = 2,33

Odbaciti nultu hipotezu

Postoji dovoljno dokaza da se zakljui da postoji razlika u proporciji otkrivenih falsificiranih ulaznica koritenjem dva skenera od proizvoaa 1 i 2.

1 =11

=186

200= 0,93 2 =

22

=168

200= 0,84

= 1 2 (1 2)

1 (11

+12

)

=1 1 + 2 2

1 + 2=

1 + 21 + 2

=200 0,93 + 200 0,84

200 + 200= 0,885

= 1 2 (1 2)

1 (11

+12

)

= 0,93 0,84 0

0,885 1 0,885 (1

200+

1200

)

= 2,8211

67

Excel

Izraunavanje z vrijednosti za dato: x, , :

=STANADARDIZE(x; mean; standard deviation)

Izraunavanje vjerovatnode (od - do z) za dato: z

=NORMSDIST(z)

Izraunavanje z vrijednosti za datu: vjerovatnodu

=NORMSINV(vjerovatnoda od - do z)

Izraunavanje vjerovatnode (od - do x) za dato: x, ,

=NORMDIST(x; mean; standard deviation;cumulative=TRUE)

Izraunavanje x vrijednosti za datu: vjerovatnodu (od - ), ,

=NORMINV(vjerovatnoda od od - , mean, standard deviation)

68

6. i 7. jTestiranje Hipoteze Razlike Dva Parametra Populacije

Documents

Transcript of 6. i 7. jTestiranje Hipoteze Razlike Dva Parametra Populacije