6. i 7. jTestiranje Hipoteze Razlike Dva Parametra Populacije
description
Transcript of 6. i 7. jTestiranje Hipoteze Razlike Dva Parametra Populacije
-
1Testiranje hipoteze razlike dvaparametra populacija
Prof. dr. Mugdim Paid
Dvije populacije
Testiranje hipotezerazlike dva parametra populacija
Testiranje hipoteze razlike 1 i 2 dvije
odnosne populacije
Testiranje hipoteze razlike proporcija,
p1 i p2, dvije populacije
Testiranje hipoteze razlike 1 i 2 dvije
nezavisne populacije
Standardne devijacije populacija 1 i 2 poznate,
popul. nor. dist. ili n1 i n2 30
Standardne devijacije populacija 1 i 2 nepoznate,
n1 i n2 30
Standardne devijacije populacija 1 i 2 nepoznate,
n1 ili n2 < 30
2
Dvije populacije
Testiranje hipotezerazlike dva parametra populacija
Testiranje hipoteze razlike 1 i 2 dvije
odnosne populacije
Testiranje hipoteze razlike proporcija,
p1 i p2, dvije populacije
Testiranje hipoteze razlike 1 i 2 dvije
nezavisne populacije
Standardne devijacije populacija 1 i 2 poznate,
popul. nor. dist. ili n1 i n2 30
Standardne devijacije populacija 1 i 2 nepoznate,
n1 i n2 30
Standardne devijacije populacija 1 i 2 nepoznate,
n1 ili n2 < 30
3
Testiranje hipoteze razlike 1 i 2 dvije nezavisne populacije
Standardne devijacije populacija 1 i 2
nepoznate, n1 ili n2 < 30
Standardne devijacije populacija 1 i 2
nepoznate, n1 i n2 30
Standardne devijacije populacija 1 i 2
poznate, popul. nor. dist. ili n1 i n2 30
Koristiti z test
Koristiti standardnedevijacije uzoraka (s1 i s2)
za procjenu 1 i 2
Koristiti z test
Varijanse jednake: koristiti sp; Varijanse nisu
jednake: koristiti standardne devijacije
uzoraka (s1 i s2)
Koristiti t test
4
z vrijednost
z statistiko se rauna po sljededoj formuli:
2
2
2
1
2
1
2121
n
n
xxz
5
1 i 2 poznate, n1 i n2 30Primjer
Jedna kompanija proizvodi remene za motore. Kompanija ima dvije maine za proizvodnju remena. Standardna devijacija duine remena na prvoj maini je 0,025 cm, dok je st. dev. na drugoj maini 0,034 cm. Menader kvaliteta eli da testira da li su remeni proizvedeni na maini 2 dui, te je stoga uzeo uzorke od po 100 remena proizvedenih na dvije maine.
Izabrao je nivo signifikantnosti =0,05. cm 509,0 i cm 501,0 21 xx
6
-
21 i 2 poznate, n1 i n2 30Primjer
U ovom primjeru de se koristiti lower tail test jer elimo da provjerimo da li je duina remena proizvedenih na maini 2 veda od onih proizvedenih na maini 1:
Lower tail test:
H0: 1 2 0
H1: 1 2 < 0
7
1 i 2 poznate, n1 i n2 30Primjer
Za = 0,05 iz tabele (z ima - predznak jer je lower tail test)
Ako je zstat < -1,645 Odbaciti nultu hipotezu U suprotnom Ne odbaciti nultu hipotezu
645,1z0,05
= 0,05Podruje odbacivanja
0Z crit = -1,645
0,45
8
Poto je = 0,05Traimo povrinu: 0,5 = 0,45
Interpolacijom se dobije z=-1,645
Standard Normal Curve Probability Distribution
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
99
1 i 2 poznate, n1 i n2 30Primjer
Statistiki z test
Poto je zstat = -1,90
-
3Standardne devijacije populacija 1 i 2
nepoznate, n1 ili n2 < 30
Standardne devijacije populacija 1 i 2
nepoznate, n1 i n2 30
Standardne devijacije populacija 1 i 2
poznate, popul. nor. dist. ili n1 i n2 30
Koristiti z test
Koristiti standardnedevijacije uzoraka (s1 i s2)
za procjenu 1 i 2
Koristiti z test
Varijanse jednake: koristiti sp; Varijanse nisu
jednake: koristiti standardne devijacije
uzoraka (s1 i s2)
Koristiti t test
Testiranje hipoteze razlike 1 i 2 dvije nezavisne populacije
13
z vrijednost
z statistiko se rauna po sljededoj formuli:
2
2
2
1
2
1
2121
n
s
n
s
xxz
14
1 i 2 nepoznate, n1 i n2 30Primjer
Operacioni menader ABC Telecom eli da utvrdi da li postoji razlika u platama enskih i mukih klijenata korisnika mobilnih telefona. Uzeli su uzorke i to 200 mukaraca i 100 ena.
Podaci za aritmetike sredine i standardne devijacije uzoraka su kako slijedi (1=m 2=):
s1=7.300 KM i s2 = 8.200 KM
Izabrao je nivo signifikantnosti =0,05.
400.42 i 390.43 21 KMxKMx
15
1 i 2 nepoznate, n1 i n2 30Primjer (nastavak)
U ovom primjeru de se koristiti two tail test jer elimo da provjerimo da li se prosjene plate mukaraca i ena razlikuju:
Two tail test:
H0: 1 2 = 0
HA: 1 2 0
16
1 i 2 poznate, n1 i n2 30Primjer (nastavak)
(Iz tabele)
Ako je zstat < -1,96 ili zstat > 1,96 Odbaciti H0 U suprotnom Ne odbaciti H0
96,1zz- i 96,1zz 0,025/20,025/2
/2= 0,025Podruje odbacivanja
0Z crit = -1,96
/2 = 0,025Podruje odbacivanja
Z crit = 1,96
0,475 0,475
0,95
17
Poto je = 0,05Traimo z za povrinu: 0,5 /2 = 0,475
z=1,96
Standard Normal Curve Probability Distribution
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
18
-
41 i 2 nepoznate, n1 i n2 30Primjer (nastavak)
Statistiki z test
Poto je zstat = 1,022 < zcrit = 1,96 Ne odbaciti nultu hipotezu
H0: 1 2 = 0 Ne postoji statistiki dokaz da se zakljui da su
prosjena primanja ena i mukaraca razliita.
2
2
2
1
2
1
2121
n
s
n
s
xxz
022,1
100
8.200
200
7.300
0400.24390.34z
22
19
1 i 2 nepoznate, n1 i n2 30Primjer (nastavak)
zcrit = - 1,96
0,4750,475
0,950,025
Podruje odbacivanja
zcrit = 1,96
Podruje odbacivanja
Podruje neodbacivanja
Z = 1,022
0,025
z statistiko
20
1 i 2 nepoznate, n1 i n2 30p-vrijednost pristup, Primjer (nastavak)
Treba pronadi povrinu (vjerovatnodu) desno od z=1,022 i lijevo od z=-1,022.
Ta vjerovatnoda je p=2(0,15339)= 0,306781
21
1 i 2 nepoznate, n1 i n2 30p-vrijednost pristup, Primjer (nastavak)
p-vrijednost za ovaj two-tail test je vjerovatnoda da de z vrijednost biti
> od zstat = 1,022 i < od ztat = -1,022 Standard Normal Curve Probability Distribution
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
Interpolacijom se dobije vjerovatnoda 0,5 - 0,34661= 0,15339
Ne odbacitiH0
Odbaciti H0Odbaciti H0
/2 = 0,025
0
z = -1,022
Izraunati p-value i uporediti sa . Ako je p-vrijednost > Ne odbaciti H0
Treba pronadi povrinu (vjerovatnodu) iznad z=1,022 i ispod z=-1,022.
0,3067810,15339
)P(z)P(z
)(2
022,1022,1
p-vrijednost = 0,306781
1 i 2 nepoznate, n1 i n2 30p-vrijednost pristup, Primjer (nastavak)
p-vrijednost = 0,306781 > = 0,05 Ne odbaciti H0
z = 1,022
zcrit = - 1,96
/2 = 0,025
0,15339
1 = 0,95
Ne postoji statistiki dokaz da se zakljui da su prosjena primanja ena i mukaraca razliita.
0,15339
zcrit =1,96
23
Z Test for Differences in Two Means
DataHypothesized Difference 0Level of Significance 0,05
Population 1 SampleSample Size 200
Sample Mean 43390Population Standard Deviation 7300
Population 2 SampleSample Size 100
Sample Mean 42400
Population Standard Deviation 8200
Intermediate Calculations
Difference in Sample Means 990Standard Error of the Difference in Means 968,9427
Z-Test Statistic 1,021732
Two-Tail Test
Lower Critical Value -1,95996
Upper Critical Value 1,959964p-Value 0,306908
Do not reject the null hypothesis
24
-
5Testiranje hipoteze razlike dvije aritmetike sredine nezavisnih populacija, (1 2),
Two tailed test
Two-tailed test:H0: 1 = 2H1: 1 2
odnosno,H0: 1 2 = 0H1: 1 2 0
Nulta hipoteza: Tvrdnja da su dvije aritmetike sredine jednakeIstraivaka (alternativna) hipoteza: Tvrdnja koju elimo dokazati -da su dvije aritmetike sredine razliite
/2 /2
-zcrit
Odbaciti H0 ako jez < - zcrit ili z > zcrit
Zcrit
25
Testiranje hipoteze razlike dvije aritmetike sredine nezavisnih populacija, (1 2),
direkcioni testLower tail test:
H0: 1 2H1: 1 < 2odnosno,
H0: 1 2 0H1: 1 2 < 0
Upper tail test:H0: 1 2H1: 1 > 2odnosno,
H0: 1 2 0H1: 1 2 > 0
-zcritOdbaciti H0 ako je z < - zcrit
Odbaciti H0 ako je z > zcrit
zcrit
26
Standardne devijacije populacija 1 i 2
nepoznate, n1 ili n2 < 30
Standardne devijacije populacija 1 i 2
nepoznate, n1 i n2 30
Standardne devijacije populacija 1 i 2
poznate, popul. nor. dist. ili n1 i n2 30
Koristiti z test
Koristiti standardnedevijacije uzoraka (s1 i s2)
za procjenu 1 i 2
Koristiti z test
Varijanse jednake: koristiti sp; Varijanse nisu
jednake: koristiti standardne devijacije
uzoraka (s1 i s2)
Koristiti t test
Testiranje hipoteze razlike 1 i 2 dvije nezavisne populacije
27
1 i 2 nepoznate, n1 i n2 < 30varijanse populacija su jednake
Pretpostvake:
Obje populacije su normalno distribuirane
Moe se koristiti goodness-of-fit test da se provjeri da li podaci u uzorku dolaze iz populacije koja je normalno distribuirana
Varijanse populacija su jednake
Uzorci su nezavisni
28
1 i 2 nepoznate, n1 i n2 < 30varijanse populacija su jednake
21
2121
11
nns
xxt
p
t ima (n1 + n2 2) stepeni slobode
2
11
21
2
22
2
11
nn
snsnsp
sp je zajednika standardna devijacija (pooled standard deviation)
29
Primjer
Napravljeno je istraivanje da se utvrdi da li se sa brand name ink printer cartridge (BNIPC) moe otprintati vie stranica nego sa no name ink printer cartridge (NNIPC). Sluajni uzorak od 10 korisnika je odabran i dat im je BNIPC. Drugi uzorak od 8 korisnika je dobio NNIPC. Obje grupe su koristile svoje printere dok nije nestalo tinte u cartridgeima.
s1=48,3 stranice i s2 = 53,3 stranice Izabrani nivo signifikantnosti =0,05. Pretpostaviti iste
varijanse populacija.
stranicax NNIPC i stranicax BNIPC 3,2985,322 21
30
-
6Primjer (nastavak)
U ovom primjeru de se koristiti upper tail test jer elimo da provjerimo da li je 1 , broj stranica otprintanih sa BNIPC vedi od 2, broja stranica otprintanih sa NNIPC:
Upper tail test:
H0: 1 2 0
H1: 1 2 > 0
31
Primjer (nastavak)
Broj stepeni slobode = n1 + n2 2= 10+8-2=16
Iz tabele za d.f.=16 area in one tail t0,05=1,746
Ako je t > 1,746 Odbaciti nultu hipotezu
U suprotnom, ne odbaciti nultu hipotezu32
Primjer (nastavak)
0
Region odbacivanja H0
= 0,05
Odbaciti H0
t crit = 1,7459
0,5 0,45
Ne odbaciti H0
33
Primjer (nastavak) Statistiki t test
Poto je tstat (1,0093) < tcrit (1,746)
Ne odbaciti nultu hipotezu
Ne postoji dovoljno dokaza da se zakljui da je prosjeni broj stranica BNIPC > NNIPC
21
2121
11
nns
xxt
p
00931
8
1
10
15550
0032985322
11
21
2121 ,
,
,),,(
nns
xxt
p
5550
2810
35318348110
2
11 22
21
2
22
2
11 ,,)(,)(
nn
snsnsp
34
Primjer (nastavak)
0
Region odbacivanja H0
= 0,05
Odbaciti H0
t crit = 1,7459
0,5 0,45
Ne odbaciti H0
t stat = 1,0093 F/2
U suprotnom ne odbaciti H0
Izgled F tabele za =0,1
Excel
Excel
=FINV(probability, df1, df2)
Prilikom unosa probability voditi rauna da li se radi o two-tail testu ili one-tail testu
F-test odnosa dvije varijanse
Slino se vri testiranje hipoteze kada se eli utvrditi da li je jedna varijansa veda od druge varijanse.
F-test odnosa dvije varijanse
Jedna kompanija ima dvije maine za punjenje velikih konzervi ulja. Operacioni menader sumnja da je varijabilitet punjenja konzervi na prvoj maini vedi od varijabiliteta punjenja konzervi na drugoj maini. Sljededi podaci su dati za konzerve od 8 litara za mainu 1 i 2.
1 2
Da li postoji dokaz da je varijansa punjenja na maini 1 veda od varijanse punjenja na maini 2 na 0,05 nivou signifikantnosti. Pretpostaviti da su populacije koliine punjenja su normalno distribuirane
8,005; 7,997
0,0012 0,005
11 16
BSS1= n1-1=11-1=10
BSS2=n2-1=16-1=15
=0,05
Gornja kritina vrijednost Fcrit=2,54 (iz tabele ili Excel)
=1
2
22 =
0,0122
0,0052= 5,76
0: 12 2
2
1: 12 > 2
2
Poto je FSTAT >FCRIT Odbaciti nultu hipotezu
Na 0,05 nivou signifikantnosti postoji dokaz da je varijansa punjenja na maini 1 veda od varijanse punjenja na maini 2.
0: 12 2
2
1: 12 > 2
2
-
9Dvije populacije
Testiranje hipotezerazlike dva parametra populacija
Testiranje hipoteze razlike 1 i 2 dvije
odnosne populacije
Testiranje hipoteze razlike proporcija,
p1 i p2, dvije populacije
Testiranje hipoteze razlike 1 i 2 dvije
nezavisne populacije
Standardne devijacije populacija 1 i 2 poznate,
popul. nor. dist. ili n1 i n2 30
Standardne devijacije populacija 1 i 2 nepoznate,
n1 i n2 30
Standardne devijacije populacija 1 i 2 nepoznate,
n1 ili n2 < 30
49
Testiranje hipoteze razlike 1 i 2 dvije odnosne populacije
Vrijednosti u jednom uzorku su uparene sa vrijednostima u drugom uzorku
Nazivaju se i zavisni uzorci
Koristi se razlika uparenih vrijednosti:
Pretpostavka: Obje populacije su normalno distribuirane ili su
uzorci veliki, n1 i n2 30
= 1 2
50
Testiranje hipoteze razlike 1 i 2 dvije odnosne populacije
Broj stepeni slobode: d.f. = n-1
d = 1 - 2
Gdje je:
=
51
Testiranje hipoteze razlike 1 i 2 dvije odnosne populacije
Gdje je (nastavak):
i-ta uparena razlika je:
Taka procjene za aritmetiku sredinu uparene razlike:
n je broj parova (uparenih vrijednosti) u uparenim uzorcima
Standardna devijacija za uparene uzorke
= 1 2
=
=1
= ( )2
==1
1
52
=
Primjer
Napravljeno je istraivanje da se utvrdi da li se sa brand name ink printer cartridge (BNIPC) moe otprintati vie stranica nego sa no name ink printer cartridge (NNIPC).
Odabrano je 6 korisnika da testiraju oba tipaprintera.
Oni su koristili printere dok nije nestalo tinte u cartridgeima.
Izabrani nivo signifikantnosti =0,01.
Podaci su dati u sljededoj tabeli:53
Primjer (nastavak)
Korisnik Brand No-name
1 306 300
2 256 260
3 402 357
4 299 286
5 306 290
6 257 260
54
-
10
Primjer (nastavak)
U ovom primjeru de se koristiti upper tail test jer elimo da provjerimo da li je 1 , broj stranica otprintanih sa BNIPC vedi od 2, broja stranica otprintanih sa NNIPC:
Upper tail test:H0: 1 2 0H1: 1 2 > 0
OdnosnoH0: d 0H1: d > 0
55
Primjer (nastavak)
Broj stepeni slobode = n -1= 6-1=5 Iz tabele za d.f.=5 area in one tail t0,01=3,365
Ako je t > 3,365 Odbaciti nultu hipotezu U suprotnom, ne odbaciti nultu hipotezu
56
Aritmetika sredina i standardna devijacija
Poto je tstat = 1,6543 < tcrit = 3,365
Ne odbaciti nultu hipotezu
Nema dovoljno dokaza da se zakljui da se sa brand name cartridges moe isprintati vie stranica nego sa no name cartridges.
Korisnik Brand No-name di dsr=suma(di)/n di-dsr (di-dsr)^2 stand. dev.
1 306 300 6 12,17 -6,17 38,02778 18,02
2 256 260 -4 -16,17 261,3611
3 402 357 45 32,83 1078,028
4 299 286 13 0,83 0,694444
5 306 290 16 3,83 14,69444
6 257 260 -3 -15,17 230,0278
suma (di) = 73 sum(di-dsr)^2 = 1622,83
= 1 2
=
=1
= ( )2
==1
1
=
=12,17 0,0
18,02
6
= 1,6543
57
Dvije populacije
Testiranje hipotezerazlike dva parametra populacija
Testiranje hipoteze razlike 1 i 2 dvije
odnosne populacije
Testiranje hipoteze razlike proporcija,
p1 i p2, dvije populacije
Testiranje hipoteze razlike 1 i 2 dvije
nezavisne populacije
Standardne devijacije populacija 1 i 2 poznate,
popul. nor. dist. ili n1 i n2 30
Standardne devijacije populacija 1 i 2 nepoznate,
n1 i n2 30
Standardne devijacije populacija 1 i 2 nepoznate,
n1 ili n2 < 30
58
Testiranje hipoteze razlike proporcija, p1 i p2, dvije populacije
Statistiki test je baziran na sampling distribuciji
Kada je sampling distribucija proporcije uzorka je aproksimativno normalno distribuirana sa aritmetikom sredinom p i varijansom
Slino, kada imamo dva uzorka, sampling distribucija de aproksimativno biti normalna ako je:
5 (1 ) 5
1 2
(1 )
1 2
59
Testiranje hipoteze razlike proporcija, p1 i p2, dvije populacije
Sampling distribucija od p1 p2 imade aproksimativno normalnu distribuciju ako je:
n1p1 5 , n1(1-p1) 5
n2p2 5 , n2(1-p2) 5 Poto su p1 i p2 nepoznate koristi se p1 i p2
(proporcije uzoraka) da se utvrdi da li je uzorak dovoljno velik.
n1p1 5 , n1(1-p1) 5
n2p2 5 , n2(1-p2) 5
60
-
11
Testiranje hipoteze razlike proporcija, p1 i p2, dvije populacije
Aritmetika sredina sampling distribucije je jednaka razlici proporcija populacija p1 p2
Varijansa je jednaka sumi varijansi
Test se provodi pod pretpostavkom da je nulta hipoteza tana, dakle pretpostavlja se da je p1=p2=p
Zajednika procjena ukupne proporcije obje populacije zajedno, p, se rauna na sljededi nain:
Gdje je: x1, x2, brojevi iz uzorka 1 i 2 sa karakteristikama od interesa
1(1 1)
1+
2(1 2)
2
=1 1 + 2 2
1 + 2=
1 + 21 + 2
1 2
61
Testiranje hipoteze razlike proporcija, p1 i p2, dvije populacije
z test:
(p1 p2) = hipotezirana razlika proporcija populacija 1 i 2 respektivno
= razlika proporcija uzoraka uzetih iz populacija 1 i 2 respektivno
= Zajednika procjena ukupne proporcije obje populacije zajedno
= 1 2 (1 2)
1 (11
+12
)
1 2
62
Primjer
Jedno preduzede evaluira skenere za ulaznice od dva proizvoaa (skener 1 i skener 2). Preduzede eli kupiti skener za ulaznice iz razloga to se pojavljuje vedi broj falsificiranih ulaznica.
Preduzede eli da utvrdi ima li razlike u proporciji otkrivenih falsificiranih ulaznica koritenjem skenera dva proizvoaa.
Izabrani nivo signifikantnosti za ovaj test je =0,02.
Uzet je sluajni uzorak iz poznatih falsificiranih ulaznica veliine 200 ulaznica. Skener 1 je otkrio 186 falsifikata od 200, dok je skener 2 otkrio 168 falsifikata od 200.
63
Primjer (nastavak)
Koristide se two tail test jer preduzede hode da utvrdi da li ima razlike u proporciji otkrivenih falsificiranih karata
H0: p1 p2 = 0
H1: p1 p2 = 0
64
Primjer (nastavak)
/2 = 0,01
-zcrit Zcrit
0,49 0,49
/2 = 0,01
65
(
2
)=0,01= 2,33
(2
)=0,01= 2,33
66
-
12
z test:
Poto je zstat = 2,8211 > zcrit, (/2) = 2,33
Odbaciti nultu hipotezu
Postoji dovoljno dokaza da se zakljui da postoji razlika u proporciji otkrivenih falsificiranih ulaznica koritenjem dva skenera od proizvoaa 1 i 2.
1 =11
=186
200= 0,93 2 =
22
=168
200= 0,84
= 1 2 (1 2)
1 (11
+12
)
=1 1 + 2 2
1 + 2=
1 + 21 + 2
=200 0,93 + 200 0,84
200 + 200= 0,885
= 1 2 (1 2)
1 (11
+12
)
= 0,93 0,84 0
0,885 1 0,885 (1
200+
1200
)
= 2,8211
67
Excel
Izraunavanje z vrijednosti za dato: x, , :
=STANADARDIZE(x; mean; standard deviation)
Izraunavanje vjerovatnode (od - do z) za dato: z
=NORMSDIST(z)
Izraunavanje z vrijednosti za datu: vjerovatnodu
=NORMSINV(vjerovatnoda od - do z)
Izraunavanje vjerovatnode (od - do x) za dato: x, ,
=NORMDIST(x; mean; standard deviation;cumulative=TRUE)
Izraunavanje x vrijednosti za datu: vjerovatnodu (od - ), ,
=NORMINV(vjerovatnoda od od - , mean, standard deviation)
68