PRIMJERI RJEŠENIH ZADATAKA IZ STATISTIKE
Transcript of PRIMJERI RJEŠENIH ZADATAKA IZ STATISTIKE
PRIMJERI RJEŠENIH ZADATAKA IZ STATISTIKE
Obuhvaćene cjeline su:
Srednje vrijednosti ( X , Me , Mo ) Mjere disperzije ( δ² , δ , Q1, Q3, Iq , Vq , V ) Standardizirano obilježje ( z ) Mjere asimetrije i zaobljenosti ( α3 i α4 ) Indeksi Linearni trend ( Yc = a+bx )
1.)
a) Izračunajte prosječan radni staž djelatnika. b) Izračunajte srednju pozicijsku i frekvencijsku vrijednost.
RJEŠENJE:
a) ∑∑∑∑
∑∑∑∑
====
========k
i
i
k
i
ii
f
Xf
X
1
1
1110 X = = 12,33 godine 90
AKO JE a =12,5
aXd
f
df
aX iik
i
i
k
i
ii
−−−−====++++====
∑∑∑∑
∑∑∑∑
====
====
1
1
-15 X = 12,5+ = 12,33 god. 90 TUMAČ: Prosječni radni staž zaposlenika je 12,33 godine
Radni staž ( u god ) Broj djelatnika 0-4 12 5-9 20
10-14 28 15-19 19 20-24 11 ∑ 90
PRAVE GRANICE
Xi fixi
0-5 2,5 30 5-10 7,5 150
10-15 12,5 350 15-20 17,5 332.5 20-25 22,5 247.5 ∑∑∑∑ 1110
di = xi-a fidi -10 -120 -5 -100 0 0 5 95
10 110 -15
SREDNJE VRIJEDNOSTI
AKO JE a = 12,5 I b = 5
b
aXd
f
df
baX ii
k
i
i
k
i
ii −−−−====++++====
∑∑∑∑
∑∑∑∑
====
==== '
1
1
'
-3 X = 12,5 + *5 = 12,33 god. 90 b)
if
fN
lMmed
i∑−+= 2
1
N/2 = 45 45 - 32 Me = 10 + * 5 = 12,32 god. 28 TUMAČ: 50% zaposlenika ima radni staž 12,32 godina i manje ,a ostalih 50% 12,32 godina radnog staža i više. c)
28-20 Mo = 10 + * 5 = 12,66 god. (28-20) + (28-19) TUMAČ: Najčešći radni staž je 12,66 godina
di = (xi-a)/b fidi -2 -24 -1 -20 0 0 1 19 2 22 -3
KN „manje od“ 12 32
60 (medijalni raz.) 79 90
i fi 5 12 5 20 a 5 28 b 5 19 c 5 11
( )( )
icbab
ablMo
)(1−+−
−+=
2. )
a) Izračunajte prosječan broj automobila po obitelji. b) Odredite srednje vrijednosti po poziciji i frekvenciji. RJEŠENJE: a)
∑∑∑∑
∑∑∑∑
====
========k
i
i
k
i
ii
f
Xf
X
1
1
735 X = = 1.19 615 TUMAČ: Prosječan broj automobila po obitelji je 1.19 b)
N/2 = 307.5 (drugi član KN ) Me = 1 Mo = 1
TUMAČ: 50% ili ( 307.5 ≈ 308 ) obitelji ima 1 automobil Ili niti jedan ,a ostalih 50% ima 1 automobil i više. Najčešći broj obitelji ima 1 automobil.
Broj automobila
Xi
Broj obitelji fi
0 180 1 220 2 130 3 85 ΣΣΣΣ 615
fixi 0
220 260 255 735
Broj automobila
Xi
Broj obitelji fi
0 180 Me, Mo =1 220
2 130 3 85 ΣΣΣΣ 615
KN 180
400 (medijalni i modalni razred )
530 615
1.) Izračunati raspon varijacije, interkvartil kao apsolutnu I koeficijent kvartilne devijacije ( Vq ) kao relativnu mjeru disperzije oko Me, prosječno kvadratno odstupanje radnog staža od prosječnog radnog staža djelatnika ( σ² ), prosječno odstupanje radnog staža od prosječnog radnog staža djelatnika (σ ) kao apsolutnu I koeficijent varijacije ( V ) kao relativnu mjeru disperzije oko X . RJEŠENJE
minmax XXRx −=
R = 25 - 0 = 25
donji kvartilni razred (N/4) gornji kvartilni razred (3N/4)
N/4 = 90/4 = 22.5
3N/4 = 270/4 = 67.5
Radni staž ( u god ) Broj djelatnika 0-4 12 5-9 20
10-14 28 15-19 19 20-24 11 ∑∑∑∑ 90
PRAVE GRANICE
0-5 5-10
10-15 15-20 20-25 ∑∑∑∑
PRAVE GRANICE Broj djelatnika KN 0-4 12 12 5-9 20 32
10-14 28 60 15-19 19 79 20-24 11 90 ∑∑∑∑ 90
MJERE DISPERZIJE
if
fN
lQQ
i
1
411
∑−+=
22.5 - 12 Q1 = 5 + * 5 = 7,62 god 20 TUMAČ: ¼ ili 25% djelatnika ima 7,62 godine radnog staža i manje ,a ostalih ¾ ili 75% 7,62 godine radnog staža i više.
if
fN
lQQ
i
3
4
3
13
∑−+=
67.5 - 60 Q3 = 15 + * 5 = 16,97 godina 19 TUMAČ : ¾ ili 75% djelatnika ima 16,97 godina radnog staža i manje ,a ostalih ¼ ili 25% ima 16,97 godina radnog staža i više
13 QQI Q −=
9,34
Iq = 16,97 – 7,62 = 9,34 godine Vq = = 0,37 godina 24,59
TUMAČ: Središnjih 50% djelatnika ima radni staž od 9,34 godine u apsolutnom iznosu i 37% u relativnom iznosu
∑
∑
=
=
=
−
==
=
k
i
i
k
i
ii
fN
N
Xxf
1
2
12
2
22
)(µσ
µσ
Q3 – Q1 Vq = Q3 + Q1
xi i fixi fixi² di=xi-a fidi fidi² 2,5 5 30 75 -10 -120 1200 7,5 5 150 1125 -5 -100 500
12,5 5 350 4375 0 0 0 17,5 5 332,5 5818,75 5 95 475 22,5 5 247,5 5568,75 10 110 1100
1110 16962,5 -15 3275 PRVI NAČIN 2
16962,5 1110 σ² = - = 36,361 godina 90 90 TUMAČ: Prosječno kvadratno odstupanje radnog staža od prosječnog radnog staža je 36,3 godina σ = = 6,03 godine TUMAČ: Prosječno odstupanje radnog staža od prosječnog radnog staža je 6,03 godine DRUGI NAČIN 2 3275 (-15) σ² = - = 36,361 godina 90 90 σ = = 6,03 godina
100
XV
σ=
6,03
V = * 100 = 48,90% 12,33 TUMAČ: Postotno odstupanje od prosjeka je 48,90%
PRVI NAČIN DRUGI NAČIN ( a=12,5 )
Promatraju se dvije distribucije: A) visina iznosa kupljene literature polaznika studija B) broj pročitanih knjiga studenata prve godine
Distribucija iznosa kupljene literature polaznika studija Distribucija pročitanih knjiga studenata prve godine
Broj pročitanih knjiga
Broj studenata
1 2
1 80 2 130 3 180 4 210 5 150 6 50 ΣΣΣΣ 800
Izračunajte: a) standardizirane vrijednosti numeričkog obilježja obiju distribucija b) odstupa li više od prosjeka polaznik koji je kupio literature u iznosu od 480 kuna, ili
više odstupa od prosjeka onaj student koji je pročitao pet knjiga c) grafički prikažite standardizirane vrijednosti obiju distribucija frekvencija a) Standardiziranje svih vrijednosti numeričkog obilježja obiju distribucija frekvencija kn % Xi
σ
Xxz ii
−= i i/σ pi/( i/σ) piXi piXi
2
1 2 3 4 5 6 7 8 9
50-150 0,25 100 -1,1905 100 0,6435 0,3885 25 2500 150-300 0,35 225 -0,3861 150 0,9653 0,3626 78,75 1718,75 300-450 0,20 375 0,5792 150 0,9653 0,2072 75 28125 450-550 0,15 500 1,3835 100 0,6435 0,2331 75 37500 550-700 0,05 625 2,1879 150 0,9653 0,0518 31,25 19531,25
Σ 1 - 285 105375
Izdvojeno kuna Struktura polaznika
1 2
50-150 0,25 150-300 0,35 300-450 0,20 450-550 0,15 550-700 0,05
ΣΣΣΣ 1
STANDARDIZIRANO OBILJEŽJE
2851
==∑=
k
i
ii XpX
24150
)285(105375
2
2
2
11
22
=
−=
−= ∑∑
==
σ
σk
i
ii
k
i
ii xpxp
Prosječno odstupanje od prosječne cijene izdvojene za kupovinu literature, dakle σ analizirane distribucije, je 155,40 kuna. Knjige Studenti
σ
Xxz ii
−= i pi i/σ pi/( i/σ) fiXi fiXi
2
1 2 3 4 5 6 7 8 9
1 80 -1,7755 1 0,1 0,7210 0,1387 80 80 2 130 -1,0545 1 0,163 0,7210 0,2261 260 520 3 180 -0,3335 1 0,225 0,7210 0,3121 540 1620 4 210 0,3876 1 0,263 0,7210 0,3648 840 3360 5 150 1,1086 1 0,188 0,7210 0,2601 750 3750 6 50 1,8296 1 0,063 0,7210 0,0873 300 1800 Σ 800 1 - 2770 11130
4625,3800
2770
1
1 ===
∑
∑
=
=
k
i
i
k
i
ii
f
Xf
X
3869,1
9236,1
)4625,3(9125,13
2
2
2
1
1
1
1
2
2
=
=
=−=
−=
∑
∑
∑
∑
=
=
=
=
σ
σ
σk
i
i
k
i
ii
k
i
i
k
i
ii
f
Xf
f
Xf
Prosječno odstupanje od prosječnog broja pročitanih knjiga (σ) je 1,3869 knjiga (≅1,5 knjige).
b) Odstupa li više od prosjeka polaznik koji je kupio literature u iznosu od 480 kuna, ili više odstupa od prosjeka onaj student koji je pročitao pet knjiga?
σσ
253,14,155
285480=
−=
−=
XXz i
i
σσ
109,13869,1
4625,35=
−=
−=
XXz i
i
Od prosjeka više odstupa polaznik koji je kupio literature u iznosu od 480 kuna. On od prosjeka odstupa za 1,253 standardnih devijacija.
c) Grafičko prikazivanje standardiziranih vrijednosti obiju distribucija frekvencija
σ
Xxz i
i
−=
pi/( i/σ)
σ
Xxz i
i
−=
pi/( i/σ)
-1,1905 0,3885 -1,7755 0,1387 -0,3861 0,3626 -1,0545 0,2254 0,5792 0,2072 -0,3335 0,3121 1,3835 0,2331 0,3876 0,3641 2,1879 0,0518 1,1086 0,2601
1,8296 0,0867
Standardizirano obilježje
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
Zi
kori
gir
ane
rela
tivn
e fr
ekve
nci
je
pci
-3 -2 -1 0 1 2 3
-- distribucija izdvojenih sredstava za
kupovinu literature
- distribucija pročitanih knjiga
studenata
prve godine
PRAVILO ČEBIŠEVA Chebyshev's theorem
Standardizirana varijabla može poprimiti i pozitivne i negativne vrijednosti. One će rijetko odstupati od aritmetičke sredine za više od +3σ. Dakle, u intervalu od +3σ će se naći gotovo sva odstupanja individualnih vrijednosti numeričkog niza od aritmetičke sredine. Pravilo Čebiševa: Najmanja proporcija članova bilo koje populacije u intervalu od X + kσ, k > 1 iznosi1:
−=
2
11
kp
11
1)(2
>−≥+<<− kk
kXXkXP σσ
Pojas od X +2σ obuhvaća najmanje 75% svih podataka, dok pojas od X +3σ sadrži najmanje 88.89% svih podataka. U navedenom intervalu je moguće očekivati najmanje pN podataka. Za zvonolike distribucije (posebice normalne distribucije):
- X +1σ približno 68% podataka, - X +2σ približno 95% podataka (najmanje 75% svih podataka), - X +3σ približno 99,7% podataka (najmanje 88,89% svih podataka).
Poznavanje pravila Čebiševa omogućuje jednostavnu procjenu moguće vrijednosti neke
varijable kao i raspona varijacija u kojemu se očekuje određeni dio skupa podataka.
1 K je broj standardnih devijacija.
Xσσσσ 2σσσσ 3σσσσ -σσσσ -2σσσσ -3σσσσ
Pet poduzeća upošljava različiti broj djelatnika. Prvo poduzeće upošljava 3 djelatnika,
drugo 6 djelatnika, treće 9 djelatnika, četvrto 12 djelatnika, a peto 15 djelatnika.
Poduzeća koja upošljavaju 15 djelatnika mogu dobiti poduzetnički kredit pod vrlo
povoljnim uvjetima.
Za zadani niz izračunajte:
1) momente oko sredine (µ1, µ2, µ3, µ4) 2) sve pomoćne momente oko nule (1-4), oko a 3) preko pomoćnih momenata provjerite točnost izračunatih momenata oko
sredine!
Poduzeća s obzirom na broj
djelatnika 3 6 9 12 15
Σ 45 1. Centralni momenti (momenti oko sredine)
koje sredine? • aritmetičke sredine
Xi (Xi-9) (Xi-9)2 (Xi-9)3 (Xi-9)4
1 2 3 4 5
3 -6 36 -216 1296 6 -3 9 -27 81 9 0 0 0 0
12 3 9 27 81 15 6 36 216 1296 45 0 90 0 2754
.05
0
5
)9()(5
1
1
1
1
1 const
x
N
Xxi
i
N
i
i
===
−
=
−
=∑∑
==µ
MOMENTI DISTRIBUCIJE FREKVENCIJA
2. Pomoćni momenti 2.1. oko nule
Xi (Xi-0) Xi2 Xi
3 Xi4
1 6=1 7 8 9
3 3 9 27 81 6 6 36 216 1296 9 9 81 729 6561
12 12 144 1728 20736 15 15 225 3375 50625 45 45 495 6075 79299
X
xx
m i
i
i
i
====
−
=∑∑
== 95
45
55
)0(5
1
15
1
1
1
995
495
55
)0(5
1
25
1
2
2 ===
−
=∑∑
== i
i
i
i xx
m
12155
6075
55
)0(5
1
35
1
3
3 ===
−
=∑∑
== i
i
i
i xx
m
2.2. oko a Xi (Xi-15) (Xi-15)2 (Xi-15)3 (Xi-15)4
1 10 11 12 13
3 -12 144 -1728 20736 6 -9 81 -729 6561 9 -6 36 -216 1296
12 -3 9 -27 81 15 0 0 0 0 45 -30 270 -2700 28674
65
30
55
)(
'
5
1
15
1
1
1 −=−
==
−
=∑∑
== i
i
i
i dax
m
545
270
55
)(
'
5
1
25
1
2
2 ===
−
=∑∑
== i
i
i
i dax
m
5405
2700
55
)('
5
1
35
1
3
3 −=−
==
−
=∑∑
== i
i
i
i dax
m
Izračunavanje α3 za distribuciju frekvencija kontinuiranog numeričkog obilježja
Popijene litre Xi
Broj obitelji fi
Sredine razreda Xi
Brojnik µ2 fi(Xi- X )2
Brojnik µ3 fi(Xi- X )3
Brojnik µ4 fi(Xi- X )4
1 2 3 4 5 6
2-4 30 3 325,51 -1072,24 3531,96 4-6 56 5 93,77 -121,34 157,01 6-8 42 7 20,93 14,78 10,43
8-10 28 9 205,03 554,81 1501,31 10-12 14 11 310,05 1459,10 6866,50
Σ 170 - 955,29 835,11 12067,21 (µ1 = 0) ΣfiXi = 1070
a) Izračunavanje αααα3 preko trećeg momenta oko sredine
� aritmetička sredina (prvi moment oko nule):
litara
f
xf
Xk
i
i
k
i
ii
294,6170
1070
1
1 ===
∑
∑
=
=
� varijanca (drugi moment oko sredine):
litara
f
Xxf
k
i
i
k
i
ii
619,5170
29,955)(
1
1
2
22 ==
−
==
∑
∑
=
=σµ
litara370,262,52 ±===± σσ
� Treći moment oko sredine (brojnik koeficijenta
asimetrije alfa 3):
litara
f
Xxf
k
i
i
k
i
ii
912,4170
11,835)(
1
1
3
3 ==
−
=
∑
∑
=
=µ
MJERE ASIMETRIJE I ZAOBLJENOSTI
� Koeficijent asimetrije αααα3:
369,031,13
912,4
370,2
912,433
33 ====
σ
µα
Za analiziranu distribuciju obitelji prema popijenim litrama pića, potrebno je izračunati koeficijent zaobljenosti.
Popijene litre Xi
Broj obitelji fi
Sredine razreda Xi
Brojnik µ2 fi(Xi- X )2
Brojnik µ3 fi(Xi- X )3
Brojnik µ4 fi(Xi- X )4
1 2 3 4 5 6
2-4 30 3 325,51 -1072,24 3531,96 4-6 56 5 93,77 -121,34 157,01 6-8 42 7 20,93 14,78 10,43
8-10 28 9 205,03 554,81 1501,31 10-12 14 11 310,05 1459,10 6866,50
Σ 170 - 955,29 835,11 12067,21 (µ1 = 0) ΣfiXi = 1070
litaralitara
litaraX
37,2;619,5
;294,62 ±==
=
σσ
litara
fi
XXifi
k
i
k
i 98,70170
21,12067)(
1
1
4
4 =
−
=
∑
∑
=
=µ
Koeficijent zaobljenosti α4:
25,258,31
98,70
37,2
98,7044
44 ====
σ
µα
2,25 = α4
α4<3 TUMAČ: Kako je izračunata mjera manja od 3, moguće je zaključiti kako je s obzirom na tjeme krivulje, pljosnatija od normalne.
Godina Kaznene prijave
It Vt Optužbe Vt
1993. 69 244 100 - 26 296 - 1994. 53 289 76,96 76,96 25 561 97,20 1995. 46 451 67,08 87,17 21 118 82,62 1996. 47 399 68,45 102,04 23 965 113,48 1997. 43 203 62,39 91,15 22 777 95,04
Yz It Vt = * 100 = * 100 Y z-1 I t-1 53 289 76,96 V94 = * 100 = * 100 = 76,96 69 244 100 46 451 67,08 V95 = * 100 = * 100 = 87,17 53289 76,96
PRERAČUNAVANJE INDEKSA NA STALNOJ BAZI U VERIŽNE
Godina Pojava It Vt
1990. 5 800 100 - 1991. 8 526 147 147 1992. 10 904 188 128 1993. 12 006 207 110 1994. 13 224 228 110 1995. 14 558 251 110 1996. 15 022 259 103
INDEKSI
147 8 526 V91 = * 100 = * 100 = 147 100 5 800 188 10 904 V92 = * 100 = * 100 = 128
147 8 526 PRERAČUNAVANJE VERIŽNIH INDEKSA U INDEKSE NA STALNOJ
BAZI
I t V t = * 100 t=1,2,3 ... N I t-1
V t * I t-1 I t = 100
Godina Pojava Vt It
1992.=100 1992. 1448 - 100 1993. 1425 98.41 98.41 1994. 1797 126.10 124.08 1995. 1721 95.77 118.81 1996. 1615 93.84 111.51 1997. 1494 92.51 103.16 1998. 1539 103.01 106.27 1999. 1576 102.40 108.82 2000. 1742 110.53 120.28 2001. 1780 102.18 122.90
It-1 * Vt It = ———— 100
Godina Vt It
2001. = 100 1992. - 81.37 1993. 98.14 80.07 1994. 126.10 100.96 1995. 95.77 96.69 1996. 93.84 90.74 1997. 92.51 83.94 1998. 103.01 86.00 1999. 102.40 88.54 2000. 110.53 97.87 2001. 102.18 100.00
It It-1 = —— * 100 Vt
Godina Vt It
1997. = 100 1992. - 96.94 1993. 98.41 95.38 1994. 126.10 120.28 1995. 95.77 115.19 1996. 93.84 108.10 1997. 92.51 100.00 1998. 103.01 103.01 1999. 102.40 105.48 2000. 110.53 116.59 2001. 102.18 119.13
It —— * 100 Vt It = 100
It-1 * Vt ———— 100
TREND S ISHODIŠTEM U POČETKU RAZDOBLJA
Vremenski intervalni niz
Godina X
Proizvodnja Y
X XY X² Yc
1992. 1834 0 0 0 1850,2+412,5 *0 = 1850,2
1993. 2269 1 2269 1 1850,2+412,5 *1 = 2262,7
1994. 2686 2 5372 4 1850,2+412,5 *2 = 2675,2
1995. 3112 3 9336 9 1850,2+412,5 *3 = 3087,7
1996. 3475 4 13900 16 1850,2+412,5 *4 = 3500,2
ΣΣΣΣ 13376 10 30877 30 13376
ΣΧ 10 a) nacrtati grafikon ; X = = = 2 Ν 5 ΣΧΥ - ΧΣΥ 30877 – 2*13376 b = = = 412,5 ΣX² - XΣΧ 30 – 2*10 ΣΥ 13376 Υ = = = 2675,2 Ν 5 a = Υ - Χ b = 2675,2 – 2 * 412,5 = 1850,2
Yc = 1850,2 + 412,5 *X ishodište = 30.06.92 Y = proizvodnja X = 1 godina
LINEARNI TREND
Primjer za izračunavanje jednadžbe trenda s ishodištem u sredini vremenskog niza
~ NEPARAN BROJ RAZDOBLJA ~
Godina Proizvodnja X XY X² Yc=a+bx
1992. 1834 -2 -3668 4 1850,2 1993. 2269 -1 -2269 1 2262,7 1994. 2686 0 0 0 2675,2 1995. 3112 +1 3112 1 3087,0 1996. 3475 +2 6950 4 3500,0
ΣΣΣΣ 13376 0 4125 10 13376 ΣΧ ΣΧ = 0; Ν = 5; Χ= = 0 Ν ΣΧΥ - ΧΣΥ ΣΧΥ - 0∗ΣΥ ΣΧΥ b = = = ΣΧ² - ΧΣΧ ΣΧ² - 0∗ΣΧ ΣΧ² ΣΥ a = Υ - Χ * b = - 0 * b Ν ΣΥ 13376 a = a = = 2675,2 Ν 5 ΣΧΥ ΣΧΥ 4125 b = b = = = 412,5 ΣΧ² ΣΧ² 10 Υc = a + bΧ
ΥΥΥΥc = 2675,2 + 412,5 ishodište = 30.06.1994. Y = proizvodnja u tonama X = 1 godina
Primjer kod parnog broja razdoblja u nizu TRENUTAČNI VREMENSKI NIZ
Godina Promet u 000 kn. X XY X² Yc=a+bx
31.12.1994 1140 -5 -5700 25 1158 31.12.1995 1392 -3 -4176 9 1443 31.12.1996 1666 -1 -1666 1 1702 31.12.1997 2145 1 2145 1 1973 31.12.1998 2258 3 6776 9 2245 31.12.1999 2426 5 12130 25 2517
11027 9507 70 11027 30.6.97. 31.12. 31.12. 31.12. 31.12. 31.12. 31.12. 94. 95. 96. 97. 98. 99. ΣΥ 11027 Polugodišta a = Y = = = 1837,833 Ν 6 ΣΧΥ 9507 b = = = 135,814 ΣΧ² 70 Yc = a + bx Yc = 1837,833 + 135,814 X ishodište = 30.06.1997 Y = tisuću kuna prometa X = polugodište