Download - Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

Transcript
Page 1: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

8.4 χ2-preizkus

V pedagoških raziskavah imamo veliko pogosteje opravka z opisnimi spremenljivkami kot pa

s številskimi spremenljivkami. Do sedaj opisani preizkusi o aritmetičnih sredinah, o

standardnih odklonih in Pearsonovih korelacijskih koeficientih se nanašajo na številske

spremenljivke. Izjema je le preizkus ničelne hipoteze o strukturnih odstotkih, ki ga lahko

uporabimo tudi za opisne spremenljivke. Vendar je to premalo in na mnoga vprašanja ne

moremo odgovoriti z dosedanjimi postopki.

Preizkusi razlik med množicami pravzaprav odgovarjajo na vprašanja o povezanosti

spremenljivk, saj so razlike posledica vpliva enih pojavov na druge. Zato raziskovanje razlik v

resnici pomeni raziskovanje vplivov in povezanosti. Za številske spremenljivke imamo na

voljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane na Pearsonov

korelacijski koeficient in z-preizkuse. Statistične metode, ki smo jih doslej spoznali, niso niti

zadostne niti povsem ustrezne za ugotavljanje povezanosti med opisnimi spremenljivkami.

Opisali in spoznali bomo najbolj vsestransko statistično metodo, kar jih sploh je. Preizkus, ki

ga bomo spoznali v nadaljevanju odgovarja na mnoga vprašanja pri raziskovanju vzgojnih

pojavov. In predvsem – uporaben je za vse vrste opisnih spremenljivk. To je χ2-preizkus. Med

vsemi možnostmi njegove uporabe, nas bo najbolj zanimalo dvoje: preizkušanje hipoteze

enake verjetnosti in preizkušanje hipoteze neodvisnosti.

8.4.1 Preizkušanje hipoteze enake verjetnosti

Ta postopek odgovarja na raziskovalno vprašanje ali so v osnovni množici kategorije

spremenljivke enako zastopane. Npr. anketiranci so odgovarjali na neko anketno vprašanje.

Zanima nas, ali v osnovni množici prevladuje kateri od odgovorov na to vprašanje. Podatki za

vzorec so običajno takšni, da so frekvence odgovorov različne. Za neke odgovore se je

odločilo več anketirancev kot za druge. Skoraj vedno je tako; le izjemoma imajo vsi odgovori

enako frekvenco. Če bi nas zanimal vzorec, bi že na pogled iz tabele frekvenc lahko

odgovorili na naše vprašanje. Če so frekvence vseh kategorij enake, takrat noben odgovor ne

prevladuje in so torej vsi enako pogosti. Če so frekvence odgovorov različne, pomeni, da se

več ljudi strinja z enimi odgovori kot pa z drugimi. Te sklepe bi oprli neposredno na različne

frekvence in jih ne bi dodatno dokazovali. Ilustrirajmo to z dvema primeroma.

Tabela 80. Empirične frekvence

Študente drugega letnika smo vprašali, kam bi radi šli na študijsko prakso. Predloženi so

bili trije odgovori. Imamo frekvence za vzorec:

A. v vrtec 8

B. v osnovno šolo 23

C. v srednjo šolo 11

Vidimo, da največ študentov želi iti na prakso v osnovno šolo, najmanj pa v vrtec. To

dejstvo je neizpodbitno. Ni ga potrebno nikakor dokazovati.

Page 2: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

Če bi v vzorcu dobili takšne odgovore:

D. v vrtec 14

E. v osnovno šolo 14

F. v srednjo šolo 14

bi to neizpodbitno pomenilo, da so odgovori v vzorcu enakomerno porazdeljeni. Tudi

tega ne bi dodatno dokazovali.

Vendar nas vzorec pravzaprav ne zanima. Zanima nas osnovna množica, iz katere je ta vzorec

izbran. Zato zgolj na pogled iz vzorčnih frekvenc ne moremo dovolj zanesljivo sklepati,

kakšno je stanje v osnovni množici. Uporabili bomo χ2-preizkus.

Za izvedbo preizkusa moramo postaviti ničelno hipotezo. V tem primeru je to hipoteza enake

verjetnosti:

Vsi odgovori v osnovni množici so enako verjetni.

To je posebna oblika ničelne hipoteze, saj v bistvu trdi, da se pogostost odgovorov ne

razlikuje (razlika je enaka nič). Postavimo tudi nasprotno hipotezo, da vsi odgovori v osnovni

množici niso enako verjetni (in da torej nimajo vsi enake frekvence). Ta hipoteza se v bistvu

sklada z našo raziskovalno hipotezo.

Postavljeno hipotezo enake verjetnosti bomo preizkusili s χ2-preizkusom. V preizkusu jo

bomo, ali zavrnili ali pa ne (le prvi izid je ugoden). Opišimo potek preizkusa. Imamo podatke

za vzorec o odgovorih na neko anketno vprašanje. Te podatke vnesemo v frekvenčno tabelo.

Za prikaz preizkusa smo izbrali preprost primer spremenljivke s tremi kategorijami. Študente

drugega letnika smo vprašali, kam bi radi šli na študijsko prakso. Predloženi so bili trije

odgovori. Imamo frekvence za vzorec:

Tabela 81. Odgovori študentov

odgovori f

vrtec 8

osnovna šola 23

srednja šola 11

skupaj 42

Največ anketirancev je izbralo osnovno šolo, precej manj srednjo šolo in najmanj vrtec.

Vendar so to podatki za vzorec. Kakšni so odgovori v osnovni množici?

Frekvence, ki so v tabeli, smo pridobili na empirični način (npr. z anketnim vprašalnikom).

Imenujemo jih empirične ali stvarne frekvence in označimo z fE. Te frekvence odražajo

stvarno stanje med anketiranci.

Zamislili si bomo frekvence, ki bi jih pričakovali v tabeli, če bi veljala hipoteza enake

verjetnosti. Če bi hipoteza enake verjetnosti držala, bi pričakovali, da bodo v tabeli frekvence

vseh odgovorov enake – da se ne bodo razlikovale. Te frekvence bomo imenovali

pričakovane ali teoretične (fT). Dobimo jih tako, da delimo numerus s številom kategorij

(42:3=14). Prikažimo jih v frekvenčni tabeli.

Page 3: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

Tabela 82. Pričakovane frekvence

odgovori f

vrtec 14

osnovna šola 14

srednja šola 14

skupaj 42

Zaradi nazornosti bomo v isti tabeli prikazali stvarne in pričakovane frekvence. Za sam

preizkus to ni nujno potrebno.

Tabela 83. Stvarne in pričakovane frekvence

odgovori fE fT

vrtec 8 14

osnovna šola 23 14

srednja šola 11 14

Imamo torej na eni strani stvarne frekvence in na drugi strani pričakovane frekvence. Stvarne

in pričakovane frekvence se ne ujemajo. Zakaj se stvarno in zamišljeno stanje razlikujeta?

Prvi vzrok je lahko slučajnostni izbor enot v vzorec. Zaradi slučajnih vplivov bo stanje v

vzorcu vedno nekoliko drugačno kot v osnovni množici. Te razlike so majhne in kar je še

pomembneje – so matematično predvidljive.

Drugi vir razlik je lahko v tem, da stanje v osnovni množici ni takšno, kot trdi hipoteza enake

verjetnosti. Enostavno rečeno: frekvence odgovorov v vzorcu se razlikujejo zaradi tega, ker se

razlikujejo že v osnovni množici. To pomeni, da je stvarnost drugačna od ničelne hipoteze.

χ2-preizkus temelji na velikosti razhajanja med stvarnimi in pričakovanimi frekvencami. Če

bodo razlike med stvarnimi in pričakovanimi frekvencami majhne, bomo sklepali, da verjetno

temeljijo na slučaju. Če bodo razlike med temi frekvencami velike, bomo sklepali, da bolj

verjetno temeljijo na razliki v osnovni množici. Pri zadosti velikem razhajanju med

frekvencami bomo zavrnili hipotezo enake verjetnosti kot nepravilno. To bomo šteli kot

dokaz, da velja nasprotna hipoteza. Končna trditev bo: vsi odgovori v osnovni množici niso

enako pogosti (neki odgovori prevladujejo).

Za izvedbo preizkusa moramo izmeriti razhajanje med stvarnimi in pričakovanimi

frekvencami. Skupna stopnja razhajanja vseh frekvenc v tabeli je vrednost χ2. Za vsako

okence v tabeli izračunamo razhajanje stvarnih in pričakovanih frekvenc in seštejemo za vsa

okenca:

Ta vrednost se porazdeljuje v χ2 – porazdelitvi. Dobljeno vrednost χ

2 primerjamo s kritično

vrednostjo iz tabele. Poglejmo, kakšni so možni izidi χ2-preizkusa.

Page 4: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

1. χ2

< χ2 (α = 0,05)

Vrednost χ2 ni statistično pomembna. Hipoteze enake verjetnosti ne zavrnemo. O odgovorih v

osnovni množici ne moremo trditi ničesar.

To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi

frekvencami je premajhno in ne moremo ničesar trditi o osnovni množici (ne upamo zavrniti

hipoteze enake verjetnosti).

2. χ2 χ

2 (α = 0,05)

Vrednost χ2

je statistično pomembna na ravni α=0,05. Hipotezo enake verjetnosti zavrnemo s

tveganjem 5%. Sprejmemo nasprotno hipotezo. Dokazali smo, da vsi odgovori v osnovni

množici niso enako pogosti.

To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi

frekvencami je zadosti veliko in lahko trdimo, da stanje v osnovni množici ni takšno kot trdi

hipoteza enake verjetnosti.

3. χ2 χ

2 (α = 0,01)

Vrednost χ2

je statistično pomembna na ravni α=0,01. Hipotezo enake verjetnosti zavrnemo s

tveganjem 1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da vsi odgovori v osnovni

množici niso enako pogosti.

4. χ2 χ

2 (α = 0,001)

Vrednost χ2

je statistično pomembna na ravni α=0,001. Hipotezo enake verjetnosti zavrnemo s

tveganjem 0,1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da vsi odgovori v osnovni

množici niso enako pogosti.

Ob iskanju kritičnih vrednosti χ2 iz tabele se srečamo z novim pojavom. Krivulja normalne

porazdelitve je ena sama in je npr. kritična vrednost za 5% tveganja tudi ena sama (1,96).

Krivulj χ2

je več in ne ena sama, zato tudi ni »stalnih« kritičnih vrednosti. Oblika krivulje se

od primera do primera razlikuje; odvisna je od števila prostostnih stopinj. Ker se bomo v

vzorčni statistiki pogosto srečevali s prostostnimi stopinjami, bomo ta pojem razložili

podrobneje in splošneje. Pozneje se vrnemo k tabeli χ2-porazdelitve in k iskanju kritičnih

vrednosti.

8.4.1.1 Prostostne stopinje

Vzorčne vrednosti pojmujemo kot vrednosti slučajne spremenljivke (ker so enote v vzorec

izbrane z žrebanjem). V vzorcu imamo toliko vrednosti spremenljivke, kolikor je numerus

vzorca. To je prava velikost vzorca. Dokler o podatkih ničesar ne vemo, so vrednosti v

vzorcu lahko kakršnekoli. Pravimo, da vrednosti svobodno variirajo ali, da so vsi podatki

»prosti«. Če poznamo vsoto vrednosti v vzorcu, potem vse vrednosti niso več »proste«. Vse

razen ene lahko prosto variirajo, le ena je vezana na to vsoto. Poglejmo preprost primer.

Imamo vrednosti številske spremenljivke za vzorec z numerusom šest.

x 5 3 5 6 2 7

Če o vzorcu nič ne vemo, vsaka od vrednosti prosto (slučajno) variira. Namesto petke v

prvem oknu bi lahko bila štirica ali kaka druga vrednost, namesto trojke v drugem oknu bi

Page 5: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

lahko bila katerakoli druga vrednost itd. Če nam je znana vsota, pa vse vrednosti ne variirajo

več prosto.

x 5 3 5 6 2 ? Σ= 24

V tem primeru lahko pet vrednosti še vedno prosto variira (pri vzorčenju to pomeni, da so

lahko izžrebane enote s katerimikoli vrednostmi). Ena izmed vrednosti pa ne more biti

kakršnakoli, saj vsota mora biti 26. V navedenem primeru zadnja vrednost mora biti tri. Kakor

da slučajnostni vzorec nima več numerusa šest, temveč le pet. Velikost vzorca se je navidezno

zmanjšala. Število vrednosti, ki lahko prosto variirajo, imenujemo število prostostnih stopinj

(g). Zamislimo si ga lahko kot navidezno velikost vzorca.

Ko poznamo aritmetično sredino vzorca, je število prostostnih stopinj g = n-1. Če bi nam bila

znana tudi varianca, bi bilo število prostostnih stopinj g = n-2. Če nam je znan še korelacijski

koeficent, je g = n-3 itd. Nasploh lahko rečemo, da je število prostostnih stopinj nekega

številskega sistema enako številu podatkov, zmanjšanem za število zvez med podatki.

Pri nekaterih statističnih postopkih pa izhodišče ni numerus vzorca. Pri χ2-preizkusu ne

primerjamo posameznikov, temveč frekvence v okencih dveh tabel. Zato je izhodišče število

primerjanih frekvenc (ali še preprosteje: število okenc v tabeli). Število prostostnih stopinj je

enako številu okenc s prostimi frekvencami zmanjšanemu za število okenc z »neprostimi«

frekvencami. Število okenc v tabeli je odvisno od števila kategorij spremenljivke.

Pri preizkusu hipoteze enake verjetnosti imamo samo eno spremenljivko. Število prostostnih

stopinj določimo po obrazcu:

g = (a-1)

a-število kategorij spremenljivke

Pri preizkusu hipoteze neodvisnosti imamo dve spremenljivki in število prostostnih stopinj

določimo iz števila vrstic in stolpcev v tabeli. Pri štetju vrstic in stolpcev upoštevamo le tisti

del tabele, v katerem so osnovni podatki. Vrstic in stolpcev z vsotami ne štejemo (spodaj

skupaj in desno skupaj). Število prostostnih stopinj izračunamo po podobnem obrazcu:

g = (a-1) (b-1)

a-število kategorij prve spremenljivke (npr.število vrstic)

b-število kategorij druge spremenljivke (npr.število stolpcev)

S tem številom iščemo kritične vrednosti v χ2-tabeli. Izračunano vrednost χ

2 primerjamo s

kritičnimi vrednostmi, kot smo že prej pokazali.

Zakaj prostostnih stopenj nismo upoštevali pri prejšnjih preizkusih ničelnih hipotez? Kadar

raziskujemo z velikimi vzorci se navidezno zmanjšanje vzorca ne pozna veliko. Zato smo

lahko ta pojav zanemarili. Pri velikih vzorcih smo se opirali na zakonitosti normalne

porazdelitve, čeprav smo vedeli, da stvarne porazdelitve odstopajo od normalne. Odstopanje

je bilo zanemarljivo, koristi od poenostavljenih postopkov pa velike. Če bi želeli uporabljati

povsem natančne metode, bi morali to upoštevati že pri velikih vzorcih. Čim manjši so

numerusi vzorcev, tem večje so te napake in pod neko mejo niso več zanemarljive. To je

praktična meja med malimi in velikimi vzorci.

Sedaj pokažimo potek preizkusa na primeru anketnega vprašanja o študijski praksi.

Page 6: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane
Page 7: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

Tabela 84. Odgovori študentov

odgovori f

vrtec 8

osnovna šola 23

srednja šola 11

skupaj 42

Raziskovalno vprašanje je: ali se v osnovni množici frekvence odgovorov razlikujejo (ali

kateri od odgovorov prevladuje)?

Če bi držala hipoteza enake verjetnosti, bi bile pričakovane frekvence naslednje (v tabeli je

hkrati ves postopek računanja vrednosti χ2):

Tabela 85. Pričakovane frekvence

odgovori fT

vrtec 14

osnovna šola 14

srednja šola 14

skupaj 42

Primerjava stvarnih in pričakovanih frekvenc že na pogled kaže precejšnje razhajanje. Ali je

to dovolj za zavrnitev ničelne hipoteze bo pokazal preizkus:

Tabela 86. Preizkušanje hipoteze enake verjetnosti

odgovori fE fT fE– fT (fE– fT)2 (fE– fT)

2/ fT

vrtec 8 14 -6 36 2,57

osnovna šola 23 14 9 81 5,79

srednja šola 11 14 -3 9 0,64

skupaj 42 42 9,00

χ2 = 9,00 > χ

2 (α = 0,05; g = 2) = 5,991

Vrednost χ2

je statistično pomembna na ravni α=0,05. Hipotezo enake

verjetnosti zavrnemo s tveganjem 5%. Sprejmemo nasprotno hipotezo.

Dokazali smo, da vsi odgovori v osnovni množici niso enako pogosti.

Tudi v osnovni množici prevladuje želja po opravljanju študijske prakse v

osnovni šoli.

8.4.2 Preizkušanje hipoteze neodvisnosti Tukaj je predmet raziskovanja povezanost med dvema opisnima spremenljivkama. Konkretno

raziskovalno vprašanje zveni tako: ali sta spremenljivki v osnovni množici povezani. Nimamo

podatkov za celotno osnovno množico; imamo le vzorčne podatke. Podatki o dveh

spremenljivkah, urejeni v ustrezno tabelo, veliko povedo o povezanosti med njima. Če bi nas

zanimal samo vzorec, bi deloma lahko shajali s samimi strukturnimi odstotki. Vendar je v

središču našega raziskovanja cela osnovna množica. Zato nam tabela z vzorčnimi podatki ne

zadostuje. Potreben bo statistični preizkus.

Page 8: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

O stanju v osnovni množici postavimo hipotezo neodvisnosti:

Spremenljivki sta v osnovni množici neodvisni.

Tudi to je posebna oblika ničelne hipoteze, saj pravi, da ni povezanosti med spremenljivkama.

Nasprotna tej hipotezi je hipoteza, da sta spremenljivki v osnovni množici odvisni.

Najpogosteje nasprotne hipoteze izrecno niti ne postavimo, saj je praktično vedno enaka

raziskovalni hipotezi. Videli smo pri vseh dosedanjih preizkusih, da z ničelnimi hipotezami ne

mislimo povsem resno; potrebujemo jih le zaradi izvedbe preizkusa.

Postavljeno hipotezo neodvisnosti bomo tudi tokrat preizkusili s χ2-preizkusom. V preizkusu

jo bomo, ali zavrnili ali pa obdržali (le prvi izid je ugoden). Opišimo potek preizkusa. Imamo

vzorčne podatke o dveh spremenljivkah. Te podatke vnesemo v frekvenčno tabelo. Za prikaz

preizkusamo smo izbrali preprost in pogost primer s pedagoškega področja: povezanost med

spolom in stališčem. Njegova preprostost je v tem, da imata obe spremenljivki majhno število

kategorij. Spol je neodvisna spremenljivka in ima le dve kategoriji. Odvisna spremenljivka je

stališče in v našem primeru ima samo tri kategorije. Seveda bi tudi spremenljivka stališče

lahko imela samo dve kategoriji (npr. za in proti). Tabela bi bila še preprostejša (dve vrstici in

dva stolpca), za razumevanje bistva preizkusa pa bi to bila prevelika poenostavitev.

Tabela 87. Frekvenčna tabela po spolu in stališču

sem za vseeno sem proti skupaj

ženske 18 12 32 62

moški 42 19 29 90

skupaj 60 31 61 152

Lahko na kratko interpretiramo podatke. Vidi se, da moški bolj soglašajo s tistim, kar je bilo v

anketnem vprašanju. Ženske so bolj proti, pri sredinskem odgovoru pa so moški in ženske

približno izenačeni. Vendar so to podatki za vzorec. Kakšne so razlike med stališči v osnovni

množici?

Frekvence, ki so v tabeli, so empirične ali stvarne frekvence (fE). Te frekvence odražajo

stvarno stanje med anketiranci. Zaradi lažjega razumevanja razlage jih preračunamo v

strukturne odstotke. Za samo izvedbo preizkusa to ni potrebno; tabelo z odstotki bomo

potrebovali šele na koncu za interpretacijo. Ker iz tabele ne bomo ničesar več izračunavali,

smo odstotke zaokrožili na prvem mestu za decimalno vejico (to za interpretacijo povsem

zadostuje).

Tabela 88. Odstotne frekvence

sem za vseeno sem proti skupaj

ženske 29,0 19,3 51,6 100,0

moški 46,7 21,1 32,2 100,0

skupaj 39,5 20,4 40,1 100,0

Kakšne frekvence bi pričakovali v tabeli, če bi veljala hipoteza neodvisnosti? Te frekvence

bomo imenovali pričakovane ali teoretične (fT). Če sta spol in stališče neodvisna, potem se

odgovori žensk in moških v splošnem ne razlikujejo. Kakšne frekvence torej pričakujemo?

Poglejmo v prejšnji tabeli, npr. frekvenco v levem spodnjem vogalu. To je odstotek tistih, ki

so odgovorili »sem za« v celem vzorcu (39,5%). Če se odgovori moških in žensk ne

razlikujejo, potem mora biti odstotek tistih, ki sogašajo pri ženskah in pri moških enak (in

Page 9: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

sicer 39,5%). Tistih, ki jim je vseeno, mora biti pri obojih 20,4% in tistih, ki so proti pri

obojih 40,1%.

Pričakovane frekvence bodo torej takšne:

Tabela 89. Pričakovane frekvence

sem za vseeno sem proti skupaj

ženske 39,5 20,4 40,1 100,0

moški 39,5 20,4 40,1 100,0

skupaj 39,5 20,4 40,1 100,0

Pogled na obe tabeli nam pokaže, da se stvarne in pričakovane frekvence ne ujemajo. To

pomeni, da je stvarnost drugačna kot predvideva hipoteza. Zakaj se stvarno in zamišljeno

stanje razlikujeta?

Prvi vzrok je lahko slučajnostni izbor enot v vzorec. Zaradi slučajnih vplivov bo stanje v

vzorcu vedno nekoliko drugačno kot v osnovni množici. Te razlike so majhne in kar je še

pomembneje – so matematično predvidljive.

Drugi vir razlik je lahko v tem, da stanje v osnovni množici ni takšno, kot trdi hipoteza

neodvisnosti. Enostavno rečeno: stališča žensk in moških se v vzorcu razlikujejo zaradi tega,

ker se razlikujejo že v osnovni množici.

Na velikosti teh razlik (razhajanja) temelji χ2-preizkus. Pri zadosti velikem razhajanju med

frekvencami bomo zavrnili hipotezo neodvisnosti kot nepravilno. To dokazuje pravilnost

nasprotne hipoteze in lahko postavimo končno trditev, da je v osnovni množici stališče

odvisno od spola.

Za izvedbo preizkusa moramo izmeriti razhajanje med stvarnimi in pričakovanimi

frekvencami. Skupna stopnja razhajanja vseh frekvenc v tabelah je vrednost χ2. Za vsako

okence v tabeli izračunamo razhajanje stvarnih in pričakovanih frekvenc in seštejemo za vsa

okenca:

Ta vrednost se porazdeljuje v χ2 – porazdelitvi. Dobljeno vrednost χ

2 primerjamo s kritično

vrednostjo iz tabele. Poglejmo, kakšni so možni izidi χ2-preizkusa.

1. χ2

< χ2 (α = 0,05)

Vrednost χ2 ni statistično pomembna. Hipoteze neodvisnosti ne zavrnemo. O povezanosti med

spolom in stališčem v osnovni množici ne moremo trditi ničesar.

To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi

frekvencami je premajhno in ne moremo ničesar trditi o osnovni množici (ne upamo zavrniti

hipoteze neodvisnosti).

2. χ2 χ

2 (α = 0,05)

Vrednost χ2

je statistično pomembna na ravni α=0,05. Hipotezo neodvisnosti zavrnemo s

tveganjem 5%. Sprejmemo nasprotno hipotezo. Dokazali smo, da sta spol in stališče v

osnovni množici odvisna.

To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi

frekvencami je zadosti veliko in lahko trdimo, da stvarnost ni takšna kot trdi hipoteza

neodvisnosti.

Page 10: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

3. χ2 χ

2 (α = 0,01)

Vrednost χ2

je statistično pomembna na ravni α=0,01. Hipotezo neodvisnosti zavrnemo s

tveganjem 1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da sta spol in stališče v

osnovni množici odvisna.

4. χ2 χ

2 (α = 0,001)

Vrednost χ2

je statistično pomembna na ravni α=0,001. Hipotezo neodvisnosti zavrnemo s

tveganjem 0,1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da sta spol in stališče v

osnovni množici odvisna.

Število prostostnih stopinj določimo iz števila vrstic in stolpcev v tabeli. Pri štetju vrstic in

stolpcev upoštevamo le tisti del tabele, v katerem so osnovni podatki. Vrstic in stolpcev z

vsotami ne štejemo (spodaj skupaj in desno skupaj). Število prostostnih stopinj izračunamo po

obrazcu:

g = (a-1) (b-1)

a-število kategorij prve spremenljivke (npr.število vrstic)

b-število kategorij druge spremenljivke (npr.število stolpcev)

S tem številom iščemo kritične vrednosti v χ2-tabeli. Izračunano vrednost χ

2 primerjamo s

kritičnimi vrednostmi, kot smo že prej pokazali.

8.4.2.1 Pričakovane frekvence

V opisu postopka smo pokazali, kako določimo pričakovane frekvence v obliki odstotkov.

Računanje odstotnih frekvenc je nepotrebno delo, zato bomo pri izračunavanju vrednosti χ2

določili in uporabili običajne pričakovane frekvence (absolutne). Pričakovano frekvenco za

neko okence izračunamo tako, da zmnožek vsote na desnem koncu vrstice in vsote na dnu

stolpca delimo z numerusom. Tako dobljena vrednost je pričakovana frekvenca za to okence.

To naredimo za vsa okenca. Pokažimo postopek za vseh šest okenc tabele.

Tabela 90. Računanje pričakovanih frekvenc

izračun

prva vrstica, prvi stolpec 62x60:152 = 24,47

prva vrstica, drugi stolpec 62x31:152 = 12,64

prva vrstica, tretji stolpec 62x61:152 = 24,88

druga vrstica, prvi stolpec 90x60:152 = 35,53

druga vrstica, drugi stolpec 90x31:152 = 18,36

druga vrstica, tretji stolpec 90x61:152 = 36,12

Sedaj pričakovane frekvence vnesemo v tabelo in izračunamo vrednost χ2.

Page 11: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

Tabela 91. Pričakovane frekvence

sem za vseeno sem proti skupaj

ženske 24,47 12,64 24,88 62

moški 35,53 18,36 36,12 90

skupaj 60 31 61 152

število prostostnih stopinj je

g = (3-1) (2-1) = 2

χ2 = 6,39 > χ

2 (α = 0,05; g = 2) = 5,99

Dobljeni χ2

je statistično pomemben na ravni 0,05 in s tveganjem 5% zavrnemo hipotezo

neodvisnosti. Spremenljivki sta v osnovni množici odvisni.

8.4.2.2 Kratek način računanja vrednosti χ2

Izračunavanje vrednosti χ2 s pomočjo vseh pričakovanih frekvenc je nepotreben ovinek.

Potreben je pri spoznavanju postopka, saj kaže na kakšen način vrednost χ2

meri razhajanje

med pričakovanimi in stvarnimi frekvencami. Postopek izračunavanja lahko skrajšamo in

takoj dobimo vrednost χ2.

Potrebujemo le tabelo s stvarnimi frekvencami. V vsakem okencu kvadriramo stvarno

frekvenco ter kvadrat delimo z vsoto vrstice in z vsoto stolpca. Dobljeno vrednost shranimo v

spomin (takšen spomin ima vsak kalkulator - seštevalni spomin, M+). To naredimo za vsa

okenca, prikličemo vsoto vseh shranjenih členov, od te vsote odštejemo vrednost 1 in ostanek

pomnožimo z numerusom. Dobljena vrednost je χ2. Pokažimo za našo tabelo:

Tabela 92. Računanje vrednosti χ2

izračun

182:62:60= M+

122:62:31= M+

322:62:61= M+

422:90:60= M+

192:90:31= M+

292:90:61= M+

RM –1 x 152 = 6,39 = χ2

χ2 = 6,39 > χ

2 (α = 0,05; g = 2) = 5,99

Dobljeni χ2

je statistično pomemben na ravni 0,05 in s

tveganjem 5% zavrnemo hipotezo neodvisnosti. Spremenljivki

sta v osnovni množici odvisni.

Page 12: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

8.4.2.3 Poročanje o preizkusu pri računalniški obdelavi

Poročilo o izidu preizkusa mora vsebovati vse, kar bralec potrebuje za pravilno razumevanje

interpretacije. V novejšem času raziskovalci skoraj brez izjeme uporabljajo za obdelavo

podatkov računalniške programe. Ti programi prikazujejo izide nekoliko drugače, kot smo

videli pri razlagi preizkusa.

Računalnik za preizkus ničelne hipoteze ne potrebuje tabele, ampak uporablja kar enačbo χ2

porazdelitve. Namesto primerjave s kritičnimi vrednostmi dobimo natančno izračunano raven

statistične pomembnosti. Prikazali bomo nekaj primerov računalniških zapisov (iz obdelave

narejene s SPSS programom):

Tabela 93. Računalniški izpisi χ2-preizkusa

vrednost

χ2

prostostne stopinje

g

raven statistične pomembnosti

ali P

1 26,35 9 0,0020

2 25,73 12 0,0120

3 7,44 10 0,6832

4 32,00 4 0,0000

5 17,24 10 0,0691

6 2,67 2 0,2641

7 4,00 1 0,0462

8 7,67 5 0,1761

Prvi χ2 je statistično pomemben na ravni =0,0020 in s tveganjem 0,20% zavrnemo hipotezo

neodvisnosti. Drugi χ2 je statistično pomemben na ravni =0,0120 in s tveganjem 1,20%

zavrnemo hipotezo neodvisnosti. Tretji χ2 ni statistično pomemben; tveganje za zavrnitev

hipoteze bi znašalo več kot 68%, kar je seveda veliko preveč. Četrti χ2 je statistično

pomemben vsaj na ravni =0,0000 in je tveganje za zavrnitev hipoteze neodvisnosti manjše

celo od 0,00%. Peti χ2 ni statistično pomemben; tveganje za zavrnitev hipoteze neodvisnosti

bi znašalo 6,91%. Šesti χ2 tudi ni statistično pomemben; tveganje za zavrnitev hipoteze bi

znašalo 26,41%. Sedmi χ2 je statistično pomemben na ravni 0,0462 in s tveganjem 4,62%

zavrnemo hipotezo neodvisnosti. Osmi χ2 ni statistično pomemben; tveganje za zavrnitev

hipoteze bi znašalo več kot 17%. Običajno pri izpisih z večjim številom preizkusov v rubriki

»raven statistične pomembnosti« z rdečim svinčnikom zaokrožimo vse vrednosti 0,05 ali

manj. Tam, kjer je raven statistične pomembnosti 0,05 ali manj, zavrnemo hipotezo

neodvisnosti; tam, kjer je vrednost večja od 0,05, pa hipoteze neodvisnosti ne zavrnemo. V

končnem poročilu navedemo vse tri vrednosti: vrednost χ2, število prostostnih stopinj in raven

statistične pomembnosti. Tako poročamo tudi, kadar ne zavrnemo ničelne hipoteze. Ker χ2-

preizkus vedno spremlja tudi tabela s stvarnimi frekvencami, nam ni treba posebej navajati

numerusa vzorca. Če objavljamo rezultate raziskave v reviji in imamo na voljo omejeno

število strani, se pogosto odpovemo tabeli – takrat k naštetim rezultatom dodamo še numerus

vzorca. To še zlasti pride v poštev, ko so tabele res obsežne (npr. šest-sedem vrstic in tudi

toliko stolpcev).

Za raven statistične pomembnosti se uporabljata dva simbola: in P. V knjigi smo povsod

dali prednost simbolu . Pri nas označujemo število prostostnih stopinj s simbolom g, pri

Page 13: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

uporabi računalniških programov pa se v izpisih pojavlja angleška kratica df (degrees of

freedom).

8.4.3 Pogoj za uporabo χ2-preizkusa

Ta preizkus je eno najbolj univerzalnih statističnih orodij. Da bi ga lahko uporabili, ni

nobenih zahtev glede vrste spremenljivk. Ker v preizkusu lahko nastopajo same nominalne

spremenljivke, je uporaben tudi za vse ostale vrste spremenljivk. Res je, da ga redko

uporabljamo za številske spremenljivke, saj imamo zanje boljše metode. Pri opisnih

spremenljivkah pa je mnogokrat edina izbira. Skoraj bi lahko rekli, da je ta preizkus najbolj

vsestransko uporabna statistična metoda. Za njegovo uporabo mora biti izpolnjen samo en

pogoj. Pričakovane frekvence morajo biti pet ali več (ne smejo biti manjše od pet). Pogoj je

zelo zahteven in nam pogosto zapre pot v raziskovanju. Zato se v praksi uporablja milejši

pogoj: pričakovane frekvence so lahko manjše od pet, vendar takšnih frekvenc ne sme biti več

kot 20% in nobena med njimi ne sme biti manjša od ena. Pozor: pogoj se nanaša na

pričakovane frekvence in ne na stvarne. Stvarne v celicah tabele so lahko celo nič!

8.4.3.1 Ukrepi pri neizpolnjenih pogojih

Poglejmo najprej teoretično, kdaj pogoj sploh ne more biti izpolnjen. Če naj bo v vsakem

okencu pričakovana frekvenca pet, potem mora biti numerus vzorca pri tabeli 2x2 vsaj 20

(štiri okenca po najmanj pet), pri tabeli 2x3 mora biti vsaj 30 itd. Seveda to ne bo dovolj, saj

se frekvence ne razporedijo enakomerno po okencih tabele (glej tabelo št. XX). Lahko se celo

zgodi, da je numerus vzorca celo nekajkrat večji od teoretično minimalnega, pa so kljub temu

nekatere pričakovane frekvence premajhne. Zato v praksi pogosto moramo ukrepati in

uporabiti različne načine reševanja problema premajhnih frekvenc.

Prva dva ukrepa sta preventivne narave. Uporabimo ju še pred zbiranjem podatkov. Toda, ne

eden ne drugi, ne delujeta povsem zanesljivo. V večini primerov pa vendarle zaležeta.

Že pri načrtovanju zbiranja podatkov moramo razmisliti o poznejši obdelavi podatkov. Če na

vsak način želimo uporabiti χ2-preizkus, in vemo, da bomo imeli, npr. le petdeset

anketirancev, moramo skrbno načrtovati velikost tabel. Če bo imela neodvisna spremenljivka

tri kategorije (npr. stopnje izobrazbe), odvisna pa pet kategorij (npr. stališče), bo tabela imela

3x5=15 okenc. Petdeset ljudi se v petnajstih okencih ne more niti teoretično porazdeliti tako,

da bi bile pričakovane frekvence večje od pet. Povrhu se odgovori ne porazdeljujejo

enakomerno po okencih. Pri takšnem vzorcu bi oblikovali anketno vprašanje o stališču tako,

da bi imeli le tri kategorije. Namesto npr. željenih odgovorov: zelo se strinjam, strinjam se,

vseeno mi je, ne strinjam se ter nikakor se ne strinjam, bi dali le tri: strinjam se, mi je vseeno

in ne strinjam se. Bolje bi bilo imeti več kategorij, toda če ostanemo pri večjem številu

kategorij, na koncu ne bo možno uporabiti preizkusa. In včasih se moramo nečemu

odpovedati.

Drugi ukrep je boljši od prvega, a je bolj zahteven. Pred anketiranjem si zagotovimo zadosti

velik vzorec in s tem zmanjšamo možnosti nastopa premajhnih pričakovanih frekvenc.

Običajno računamo tako: število okenc, krat pet anketirancev in krat faktor tri do pet. Če

vemo, da bo tabela imela petnajst okenc, bi si poskušali zagotoviti 15x5x3=225 ali celo

15x5x5=375 anketirancev. Vendar niti to ne zaleže prav vedno. Nič nam ne pomaga velik

numerus vzorca (število anketirancev), če je neka kategorija zelo maloštevilna. Takrat bodo v

Page 14: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

celi kategoriji premajhne pričakovane frekvence. Pokažimo na preprostem primeru.

Raziskujemo obolevanje za otroškimi boleznimi (norice itd.). Lahko imamo tudi nekaj tisoč

anketirancev v vzorcu, a npr. odgovor norice sem prebolel v starosti nad 40 let obkroži samo

nekaj oseb (ker je to zares redkost). V vseh ostalih kategorijah lahko imamo veliko »preveč«

anketirancev, a to nič ne pomaga. Cela ta kategorija v tabeli bo imela premajhne frekvence.

Naslednji ukrepi pridejo v poštev, ko smo podatke že zbrali in sestavili tabelo. So vsebinsko

slabši od prejšnjih, a večinoma bolj učinkoviti.

Tretji ukrep pri premajhnih pričakovanih frekvencah je združevanje sorodnih kategorij. Če

imamo v tabeli šolske ucene učencev in v kategoriji odličnjakov nastopajo prenizke

frekvence, združimo kategoriji prav dobri in odlični. S tem se vse frekvence (stvarne in

pričakovane) povečajo. Ta ukrep zmanjšuje tabelo; manjša tabela pa pomeni manj informacij

in slabše izkoriščene podatke. Kategorij ne združujemo brez temeljitega premisleka:

združujemo najmanj kolikor je potrebno, da dosežemo zahtevane pogoje. Na tako zmanjšani

tabeli opravimo preizkus in interpretiramo rezultate.

Pri nominalnih spremenljivkah kategorije večinoma niso sorodne in jih ne moremo

združevati. Kadar je cela kategorija v tabeli (vrstica ali stolpec) maloštevilna, jo lahko v celoti

izpustimo iz tabele in opravimo preizkus na zmanjšani tabeli. Vendar to ni dober ukrep in ga

lahko uporabimo le v sili. Črtanje kategorije pomeni popolno izgubo tistih informacij, ki jih je

vsebovala črtana kategorija).

Pri združevanju kategorij (ali tudi pri črtanju) se lahko zgodi da dobimo najmanjšo možno

tabelo 2x2 a pogoji še vedno niso izpolnjeni. Takrat uporabimo preizkus z Yatesovim

popravkom (seveda tudi, če smo že od začetka imeli tabelo 2x2). Popravljeno vrednost χ2

izračunamo tako, da vsako razliko fE - fT pred kvadriranjem zmanjšamo v absolutnem znesku

za 0,5. Ves ostali del χ2-preizkusa ostane enak. S tem sicer ne odpravimo premajhnih

pričakovanih frekvenc. S tem se zmanjša končna vrednost χ2, kar poveča previdnost v

preizkusu. To hkrati pomeni manjšo možnost napačnih sklepov. To je edini ukrep pri katerem

χ2-preizkus uporabimo, čeprav pogoji niso izpolnjeni.

Če nobeden od opisanih ukrepov ne zaleže, lahko uporabimo kakšen nadomestni preizkus.

Vendar nadomestni preizkusi nimajo takšne statistične moči kot χ2-preizkus. Zato tudi ta

ukrep uporabljamo le, kadar ni druge možnosti. Eden od nadomestnih preizkusov je

Kullbackov preizkus (glej Sagadin 1987, str. 358-360).

8.5 Koeficienti kontingence

χ2

-preizkusa hipoteze neodvisnosti ne moremo primerjati z korelacijskimi koeficienti, saj ima

drugačno funkcijo. Funkcija je resda podobna, ni pa enaka. Obakrat gre za ugotavljanje

povezanosti. Vendar nam χ2

-preizkus pokaže samo ali sta spremenljivki v osnovni množici

odvisni. Iz preizkusa se ne vidi kako močna je njuna odvisnost. Potrebujemo mero, ki bo

kazala stopnjo povezanosti. Dobimo jo iz vrednosti χ2

. Vrednost χ2

temelji na stopnji

razhajanja med stvarnimi in pričakovanimi frekvencami. Čim bolj se te razhajajo, tem večja je

povezanost med spremenljivkama v vzorcu. Na posreden način je že vrednost χ2

kazala

stopnjo povezanosti. Koeficiente povezanosti med opisnimi spremenljivkami bomo imenovali

kontingenčni koeficienti. Preizkus χ2

bo kazal ali obstaja povezanost med spremenljivkama,

koeficienti kontingence pa kako močna je ta povezanost.

Vendar je med kontingenčnimi koeficienti in χ2 – preizkusom še ena velika razlika. Preizkus

χ2

se nanaša na povezanost spremenljivk v osnovni množici. Čeprav je izpeljan iz podatkov

vzorca, odgovarja samo na vprašanje o osnovni množici (kot sicer vsi preizkusi ničelnih

Page 15: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

hipotez). V raziskavi, ki ni vzorčna, uporaba χ2 – preizkusa nima nobenega smisla. Toda tudi

v takšni raziskavi lahko izračunamo vrednost χ2 , iz nje pa koeficient kontingence.

Kontingenčni koeficient se, namreč, nanaša na skupino, ki je v tabeli. To pomeni, da

kontingenčne koeficiente lahko uporabimo v vsaki raziskavi, χ2 – preizkus pa le v vzorčnih

raziskavah.

Če raziskava ni vzorčna in imamo v tabeli celo množico, bo kontingenčni koeficient veljal

zanjo. Če pa raziskavo opravljamo na vzorcu in so v tabeli vzorčni podatki, se bo

kontingenčni koeficient nanašal na ta vzorec! Če bi hoteli dobiti kontingenčni koeficient za

osnovno množico, bi ga morali oceniti na podlagi dobljenega (vzorčnega) iz tabele. Izračunati

bi morali interval zaupanja in šele ta bi se nanašal na osnovno množico. Prav tak postopek

smo videli v poglavju o ocenjevanju Pearsonovega korelacijskega koeficienta. Vendar pa

postopke ocenjevanja kontingenčnih koeficientov zares redko uporabljamo. Zadovoljimo se

kar z vrednostjo koeficienta za vzorec.

Vrednost χ2 lahko izračunamo kadarkoli, celoten χ

2 – preizkus pa je smiseln le, kadar

posplošujemo na osnovno množico. V raziskavi, ki ni vzorčna, uporaba χ2 – preizkusa nima

nikakršnega smisla.

8.5.1 Pearsonov kontingenčni koeficient Iz vrednosti χ

2 lahko izračunamo kontingenčni koeficiente, ki kažejo stopnjo povezanosti

podobno kot korelacijski keficienti. Koeficientov kontingence je več, najpogosteje

uporabljamo Pearsonov kontingenčni koeficient.

Vrednosti koeficienta so med 0 in 1 in jih interpretiramo podobno kot korelacijske

koeficiente. Pri opisnih spremenljivkah dobimo nasploh nižje stopnje povezanosti kot pri

številskih. Zato običajno že nižje vrednosti kontingenčnih koeficientov interpretiramo kot

opazno stopnjo povezanosti. Še zlasti to velja za Pearsonov kontingenčni koeficient.

Drugo razliko v interpretaciji povzroča dejstvo, da kontingenčni koeficienti nimajo

predznaka. Pri nominalnih spremenljivkah to ni težava, saj sploh ne obstaja pojem negativne

ali pozitivne smeri. Pri ordinalnih spremenljivkah pozitivna in negativna smer obstajata, a

koeficient smeri ne pokaže. Zato je treba pazljivo pregledati frekvence v tabeli in iz njih

presoditi o smeri. Za primer iz tabele št. XY (kjer smo preizkušali hipotezo o neodvisnosti

med spolom in stališčem), je vrednost Pearsonovega koeficienta C = 0,20. Pri korelacijskem

koeficientu bi takšno vrednost interpretirali kot zanemarljivo, pri kontingenčnem pa štejemo,

da vendarle kaže na opazno povezanost. Za interpretacijo smeri potrebujemo tabelo s

strukturnimi odstotki.

Tabela 94. Strukturni odstotki po stališču (posebej za vsak spol)

sem za vseeno sem proti skupaj

ženske 29,0 19,3 51,6 100,0

moški 46,7 21,1 32,2 100,0

skupaj 39,5 20,4 40,1 100,0

Page 16: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

Pri manjših tabelah že kratek pogled na tabelo zadosti dobro kaže smer. Moški veliko bolj

soglašajo kot ženske; hkrati je pri moških malo več takšnih, ki niso izrazito ne za ne proti.

Seveda potem zadnji stolpec kaže, da so ženske veliko bolj proti kot moški.

Pri večjih tabelah moramo pogosto primerjati cele stolpce (drugega za drugim). Tako bi

najprej primerjali vse odstotke v prvem stolpcu. V naši tabeli sta v prvem stolpcu samo dva:

29,0% in 46,7%. Skoraj polovica moških je izbrala odgovor »sem za«, pri ženskah pa komaj

nekaj več kot četrtina. Enako naredimo še za ostale stolpce; iz vseh stolpcev na koncu

ustvarimo celovito sliko smeri povezanosti. Tabele absolutnih frekvenc ne omogočajo dobre

interpretacije; interpretiramo predvsem odstotne frekvence.

Največjo težavo pri interpretaciji Pearsonovega kontingenčnega koeficienta predstavlja

njegova odvisnost od velikosti tabele. Tudi pri popolni povezanosti med spremenljivkama

koeficient ne doseže vrednosti ena. To doseže šele na neskončno veliki tabeli; to pomeni

takrat, ko je število kategorij spremenljivke neskončno.

Poglejmo to podrobneje. Za naš primer s spremenljivkama spol in stališče si zamislimo, da so

vse ženske izbrale odgovor sem proti, vsi moški pa odgovor sem za. Povezanost med

spremenljivkama je popolna (samo od spola je odvisno, kakšni so odgovori!). V tem primeru

bi imeli takšno tabelo stvarnih frekvenc:

Tabela 95. Frekvence po spolu in stališču

sem za vseeno sem proti skupaj

ženske 0 0 62 62

moški 90 0 0 90

skupaj 90 0 62 152

C=0,71

Čeprav je povezanost popolna, je kontingenčni koeficient »zgolj« C = 0,71. Če ne bi vedeli za

ta pojav, bi koeficient napačno interpretirali, češ: »povezanost je precej visoka«. V resnici je

povezanost najmočnejša možna (popolna).

O maksimalni vrednosti kontingenčnega koeficienta odloča manjše število kategorij v tabeli.

V vseh tabelah, kjer ima ena spremenljivka dve kategoriji, je maksimalna vrednost 0,707 (ne

glede na to, koliko kategorij ima druga spremenljivka).

Težave nastanejo takrat, ko primerjamo koeficiente iz različno velikih tabel. Najpogosteje se

tem primerjavam nikakor ne moremo odpovedati. Ko raziskujemo, npr. s čem so povezana

stališča, bomo imeli v eni tabeli neodvisno spremenljivko spol (dve kategoriji), v drugi

izkušnje (npr. tri kategorije), v tretji izobrazbo (npr. pet kategorij) in tako dalje. V

interpretaciji želimo primerjati dobljene kontingenčne koeficiente. Še večje težave bomo

imeli, kadar primerjamo svoje rezultate z rezultati iz neke druge raziskave. Podobni ali celo

isti pojavi so v različnih raziskavah merjeni z drugačnimi instrumenti, število kategorij pa je

lahko zelo različno.

Potrebujemo koeficient povezanosti, ki ne bo imel te pomanjkljivosti. Dobimo ga tako, da

delimo dobljeni Pearsonov kontingenčni koeficient z njegovo maksimalno vrednostjo.

Page 17: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

Tako dobimo korigirani Pearsonov kontingenčni koeficient CC. Korigirani koeficienti so

med seboj primerljivi. Vendar jih ne moremo primerjati z nekorigiranimi. Torej v praksi

uporabljamo ali prve, ali pa druge; obojih hkrati ne.

8.5.2 Cramérjev koeficient Kadar so nam pomembne primerjave med različnimi tabelami, lahko izberemo Cramérjev

koeficient. Postopek izračunavanja zagotavlja neodvisnost od velikosti tabele in s tem

primerljivost koeficientov iz različnih tabel.

Kljub temu, da Cramérjevi koeficienti lahko dosežejo vrednost 1, so večinoma njihove

vrednosti manjše od vrednosti C. Zato koeficienta nista primerljiva in ju ne moremo hkrati

uporabljati in interpretirati. Če se odločimo za uporabo Cramérjevih koeficientov, potem

uporabljamo samo te.

8.5.3 Koeficient Za tabelo 2x2 dobi obrazec za Cramérjev koeficient enostavnejšo končno obliko. Ta

koeficient ima posebno ime: -koeficient.

Ker je to v resnici Cramérjev koeficient, ga podobno tudi interpretiramo. Primerjave so

veljavne predvsem, če uporabljamo te dvoje koeficiente hkrati. S Pearsonovimi je tudi

koeficient slabo primerljiv.

8.6 Napake pri ocenjevanju parametrov in preizkušanju hipotez Vsi statistični postopki posploševanja z vzorcev na osnovne množice so povezani s

tveganjem. Brez tveganja ne gre. Zaradi tega lahko pride do napačnih sklepov. Vir teh napak

je tveganje. Čeprav so viri enaki, so napake in njihove posledice pri ocenjevanju parametrov

drugačne kot pri preizkušanju hipotez.

8.6.1 Ocenjevanje parametrov Pri ocenjevanju parametrov postavimo trditev, da je parameter osnovne množice v intervalu

zaupanja. Pri tem tvegamo, da to morda ne drži. Napaka, ki se nam lahko zgodi je, da

parameter osnovne množice res ni v intervalu zaupanja. Torej, naša ocena ne drži. Zakaj se to

lahko zgodi? Interval zaupanja smo oprli na verjetnost, da je izbrani vzorec eden od tistih

Page 18: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

(npr. 95%), katerih parameter odstopa od populacijskega za največ tpSE (pri velikih vzorcih

je na tem mestu namesto vrednosti tp vrednost z=1,96). Vendar vemo, da je med vsemi vzorci

tudi 5% takšnih, za katere to ne velja. Če smo naleteli pri izbiri vzorca na enega takšnih, bo

naša ocena nepravilna: parameter osnovne množice ne bo v intervalu zaupanja. Verjetnost

takšnega dogodka je torej majhna, toda zgodi se lahko! In če stalno ocenjujemo s petimi

odstotki tveganja, se nam bo to zares dogajalo v približno petih odstotkih primerov. Če nismo

pripravljeni sprejeti tega tveganja, se moramo odpovedati vzorcem in pojave raziskovati na

celih množicah.

8.6.2 Preizkusi ničelnih hipotez Pri preizkušanju hipotez se lahko zgodita dve napaki. Imenujemo jih napake I. vrste in napake

II. vrste (tudi alfa napake in beta napake). Pojasnili jih bomo na primeru hi-kvadrat preizkusa

hipoteze o neodvisnosti.

Napaka prve vrste se lahko zgodi pri zavrnitvi hipoteze neodvisnosti. Če ničelno hipotezo

zavrnemo, v resnici pa je pravilna, je to napaka I. vrste ali alfa napaka. Pravilnost hipoteze

neodvisnosti pomeni, da sta v osnovni množici spremenljivki neodvisni. Toda, tudi iz takšnih

množic lahko dobimo vzorec, pri katerem vrednost χ2

presega kritično vrednost za 5%

tveganja. Takšnih vzorcev je največ 5%, zato se napaka prve vrste ne zgodi pogosto; občasno

se pa vendarle zgodi. Te napake imenujemo alfa napake, ker je njihova verjetnost enaka

vrednosti α. Napake I. vrste imajo lahko zelo hude posledice, saj je v primeru, ko se nam to

zgodi, naša trditev popolnoma napačna. Zato je največje dopustno tveganje pri zavrnitvi

ničelne hipoteze 5% (to je tudi največja verjetnost, da pride do napake I. vrste).

Napaka druge vrste se lahko zgodi, ko hipoteze neodvisnosti ne zavrnemo. Če je ne

zavrnemo, a je v resnici nepravilna, je to napaka II. vrste ali beta napaka. Torej sta v osnovni

množici spremenljivki odvisni, mi pa nismo zavrnili hipoteze neodvisnosti. Verjetnost te

napake je 95% ali še več. Tako velika verjetnost za napake II. vrste je možna, ker te napake

nimajo skoraj nobenih praktičnih posledic. Ko hipoteze neodvisnosti ne zavrnemo, ne trdimo

o osnovni množici nič. In če nič ne trdimo, tudi kakšne vsebinske napake ne moremo

zagrešiti. Če se že zgodi napaka II. vrste, nam je lahko žal, da nismo zavrnili hipoteze

neodvisnosti (saj bi jo lahko v resnici zavrnili) in da o osnovni množici nismo ničesar

ugotovili. To je škoda, ni pa to stvarna napaka.

Povezanost alfa in beta napak

Zmanjševanje verjetnosti za napake I. vrste povečuje verjetnost nastopa napak II. vrste in

obratno. Poglejmo podrobneje:

Običajno zavračamo hipoteze pri kritičnem pragu 0,05. Verjetnost nastopa napake I. vrste

je 5% in verjetnost nastopa napake II. vrste je 95%.

Če bi se odločili, da bomo zavračali hipoteze šele ko vrednost χ2

preseže kritično vrednost

za =0,01, bi zmanjšali možnost napak I. vrste na 1%, a hkrati povečali možnost napak II.

vrste na 99%.

Če bi se odločili, da bomo zavračali ničelne hipoteze šele ko vrednost χ2

preseže kritično

vrednost za =0,001, bi zmanjšali možnost napak I. vrste na 0,1%, a hkrati povečali

možnost napak II. vrste na 99,9%.

Zato večinoma ostajamo pri kritični vrednosti α=0,05. To je kompromis med verjetnostjo

nastopanja obojih napak.

Page 19: Preizkušanje hipoteze enake verjetnostiboris.kozuh.net/uploads/1/0/0/6/10069617/hi_kvadrat_preizkus_pdf.pdfvoljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane

Premislek o povezanosti verjetnosti za alfa in beta napake morebiti vsiljuje naslednji sklep:

Torej vedno naredimo napako: če ne naredimo alfa napake, naredimo beta

napako in obratno!???

Vendar je ta sklep popolnoma napačen! Zakaj je napačen? Saj se zdi, da seštete verjetnosti za

napake vedno dajo 100%.

Napaka v premisleku je v tem, da razmišljamo o verjetnosti napak abstraktno, ko še nismo

naredili preizkusa (in sta še možna oba izida!). Vsak konkretni preizkus se na koncu konča

samo z enim izidom: ali ničelno hipotezo zavrnemo ali je ne zavrnemo. Zato verjetnosti ne

smemo seštevati. Pojasnimo to preprosto:

Če ničelno hipotezo zavrnemo, se lahko zgodi le alfa napaka

(ali pa se NE zgodi).

Če ničelne hipoteze ne zavrnemo, se lahko zgodi le beta napaka

(ali pa se NE zgodi).

Vidimo torej, da je možno tudi NE.