Preizkušanje hipoteze enake...

of 19/19
8.4 χ 2 -preizkus V pedagoških raziskavah imamo veliko pogosteje opravka z opisnimi spremenljivkami kot pa s številskimi spremenljivkami. Do sedaj opisani preizkusi o aritmetičnih sredinah, o standardnih odklonih in Pearsonovih korelacijskih koeficientih se nanašajo na številske spremenljivke. Izjema je le preizkus ničelne hipoteze o strukturnih odstotkih, ki ga lahko uporabimo tudi za opisne spremenljivke. Vendar je to premalo in na mnoga vprašanja ne moremo odgovoriti z dosedanjimi postopki. Preizkusi razlik med množicami pravzaprav odgovarjajo na vprašanja o povezanosti spremenljivk, saj so razlike posledica vpliva enih pojavov na druge. Zato raziskovanje razlik v resnici pomeni raziskovanje vplivov in povezanosti. Za številske spremenljivke imamo na voljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane na Pearsonov korelacijski koeficient in z-preizkuse. Statistične metode, ki smo jih doslej spoznali, niso niti zadostne niti povsem ustrezne za ugotavljanje povezanosti med opisnimi spremenljivkami. Opisali in spoznali bomo najbolj vsestransko statistično metodo, kar jih sploh je. Preizkus, ki ga bomo spoznali v nadaljevanju odgovarja na mnoga vprašanja pri raziskovanju vzgojnih pojavov. In predvsem uporaben je za vse vrste opisnih spremenljivk. To je χ 2 -preizkus. Med vsemi možnostmi njegove uporabe, nas bo najbolj zanimalo dvoje: preizkušanje hipoteze enake verjetnosti in preizkušanje hipoteze neodvisnosti. 8.4.1 Preizkušanje hipoteze enake verjetnosti Ta postopek odgovarja na raziskovalno vprašanje ali so v osnovni množici kategorije spremenljivke enako zastopane. Npr. anketiranci so odgovarjali na neko anketno vprašanje. Zanima nas, ali v osnovni množici prevladuje kateri od odgovorov na to vprašanje. Podatki za vzorec so običajno takšni, da so frekvence odgovorov različne. Za neke odgovore se je odločilo več anketirancev kot za druge. Skoraj vedno je tako; le izjemoma imajo vsi odgovori enako frekvenco. Če bi nas zanimal vzorec, bi že na pogled iz tabele frekvenc lahko odgovorili na naše vprašanje. Če so frekvence vseh kategorij enake, takrat noben odgovor ne prevladuje in so torej vsi enako pogosti. Če so frekvence odgovorov različne, pomeni, da se več ljudi strinja z enimi odgovori kot pa z drugimi. Te sklepe bi oprli neposredno na različne frekvence in jih ne bi dodatno dokazovali. Ilustrirajmo to z dvema primeroma. Tabela 80. Empirične frekvence Študente drugega letnika smo vprašali, kam bi radi šli na študijsko prakso. Predloženi so bili trije odgovori. Imamo frekvence za vzorec: A. v vrtec 8 B. v osnovno šolo 23 C. v srednjo šolo 11 Vidimo, da največ študentov želi iti na prakso v osnovno šolo, najmanj pa v vrtec. To dejstvo je neizpodbitno. Ni ga potrebno nikakor dokazovati.
  • date post

    04-Feb-2020
  • Category

    Documents

  • view

    1
  • download

    0

Embed Size (px)

Transcript of Preizkušanje hipoteze enake...

  • 8.4 χ2-preizkus

    V pedagoških raziskavah imamo veliko pogosteje opravka z opisnimi spremenljivkami kot pa

    s številskimi spremenljivkami. Do sedaj opisani preizkusi o aritmetičnih sredinah, o

    standardnih odklonih in Pearsonovih korelacijskih koeficientih se nanašajo na številske

    spremenljivke. Izjema je le preizkus ničelne hipoteze o strukturnih odstotkih, ki ga lahko

    uporabimo tudi za opisne spremenljivke. Vendar je to premalo in na mnoga vprašanja ne

    moremo odgovoriti z dosedanjimi postopki.

    Preizkusi razlik med množicami pravzaprav odgovarjajo na vprašanja o povezanosti

    spremenljivk, saj so razlike posledica vpliva enih pojavov na druge. Zato raziskovanje razlik v

    resnici pomeni raziskovanje vplivov in povezanosti. Za številske spremenljivke imamo na

    voljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane na Pearsonov

    korelacijski koeficient in z-preizkuse. Statistične metode, ki smo jih doslej spoznali, niso niti

    zadostne niti povsem ustrezne za ugotavljanje povezanosti med opisnimi spremenljivkami.

    Opisali in spoznali bomo najbolj vsestransko statistično metodo, kar jih sploh je. Preizkus, ki

    ga bomo spoznali v nadaljevanju odgovarja na mnoga vprašanja pri raziskovanju vzgojnih

    pojavov. In predvsem – uporaben je za vse vrste opisnih spremenljivk. To je χ2-preizkus. Med

    vsemi možnostmi njegove uporabe, nas bo najbolj zanimalo dvoje: preizkušanje hipoteze

    enake verjetnosti in preizkušanje hipoteze neodvisnosti.

    8.4.1 Preizkušanje hipoteze enake verjetnosti

    Ta postopek odgovarja na raziskovalno vprašanje ali so v osnovni množici kategorije

    spremenljivke enako zastopane. Npr. anketiranci so odgovarjali na neko anketno vprašanje.

    Zanima nas, ali v osnovni množici prevladuje kateri od odgovorov na to vprašanje. Podatki za

    vzorec so običajno takšni, da so frekvence odgovorov različne. Za neke odgovore se je

    odločilo več anketirancev kot za druge. Skoraj vedno je tako; le izjemoma imajo vsi odgovori

    enako frekvenco. Če bi nas zanimal vzorec, bi že na pogled iz tabele frekvenc lahko

    odgovorili na naše vprašanje. Če so frekvence vseh kategorij enake, takrat noben odgovor ne

    prevladuje in so torej vsi enako pogosti. Če so frekvence odgovorov različne, pomeni, da se

    več ljudi strinja z enimi odgovori kot pa z drugimi. Te sklepe bi oprli neposredno na različne

    frekvence in jih ne bi dodatno dokazovali. Ilustrirajmo to z dvema primeroma.

    Tabela 80. Empirične frekvence

    Študente drugega letnika smo vprašali, kam bi radi šli na študijsko prakso. Predloženi so

    bili trije odgovori. Imamo frekvence za vzorec:

    A. v vrtec 8

    B. v osnovno šolo 23

    C. v srednjo šolo 11

    Vidimo, da največ študentov želi iti na prakso v osnovno šolo, najmanj pa v vrtec. To

    dejstvo je neizpodbitno. Ni ga potrebno nikakor dokazovati.

  • Če bi v vzorcu dobili takšne odgovore:

    D. v vrtec 14

    E. v osnovno šolo 14

    F. v srednjo šolo 14

    bi to neizpodbitno pomenilo, da so odgovori v vzorcu enakomerno porazdeljeni. Tudi

    tega ne bi dodatno dokazovali.

    Vendar nas vzorec pravzaprav ne zanima. Zanima nas osnovna množica, iz katere je ta vzorec

    izbran. Zato zgolj na pogled iz vzorčnih frekvenc ne moremo dovolj zanesljivo sklepati,

    kakšno je stanje v osnovni množici. Uporabili bomo χ2-preizkus.

    Za izvedbo preizkusa moramo postaviti ničelno hipotezo. V tem primeru je to hipoteza enake

    verjetnosti:

    Vsi odgovori v osnovni množici so enako verjetni.

    To je posebna oblika ničelne hipoteze, saj v bistvu trdi, da se pogostost odgovorov ne

    razlikuje (razlika je enaka nič). Postavimo tudi nasprotno hipotezo, da vsi odgovori v osnovni

    množici niso enako verjetni (in da torej nimajo vsi enake frekvence). Ta hipoteza se v bistvu

    sklada z našo raziskovalno hipotezo.

    Postavljeno hipotezo enake verjetnosti bomo preizkusili s χ2-preizkusom. V preizkusu jo

    bomo, ali zavrnili ali pa ne (le prvi izid je ugoden). Opišimo potek preizkusa. Imamo podatke

    za vzorec o odgovorih na neko anketno vprašanje. Te podatke vnesemo v frekvenčno tabelo.

    Za prikaz preizkusa smo izbrali preprost primer spremenljivke s tremi kategorijami. Študente

    drugega letnika smo vprašali, kam bi radi šli na študijsko prakso. Predloženi so bili trije

    odgovori. Imamo frekvence za vzorec:

    Tabela 81. Odgovori študentov

    odgovori f

    vrtec 8

    osnovna šola 23

    srednja šola 11

    skupaj 42

    Največ anketirancev je izbralo osnovno šolo, precej manj srednjo šolo in najmanj vrtec.

    Vendar so to podatki za vzorec. Kakšni so odgovori v osnovni množici?

    Frekvence, ki so v tabeli, smo pridobili na empirični način (npr. z anketnim vprašalnikom).

    Imenujemo jih empirične ali stvarne frekvence in označimo z fE. Te frekvence odražajo

    stvarno stanje med anketiranci.

    Zamislili si bomo frekvence, ki bi jih pričakovali v tabeli, če bi veljala hipoteza enake

    verjetnosti. Če bi hipoteza enake verjetnosti držala, bi pričakovali, da bodo v tabeli frekvence

    vseh odgovorov enake – da se ne bodo razlikovale. Te frekvence bomo imenovali

    pričakovane ali teoretične (fT). Dobimo jih tako, da delimo numerus s številom kategorij

    (42:3=14). Prikažimo jih v frekvenčni tabeli.

  • Tabela 82. Pričakovane frekvence

    odgovori f

    vrtec 14

    osnovna šola 14

    srednja šola 14

    skupaj 42

    Zaradi nazornosti bomo v isti tabeli prikazali stvarne in pričakovane frekvence. Za sam

    preizkus to ni nujno potrebno.

    Tabela 83. Stvarne in pričakovane frekvence

    odgovori fE fT

    vrtec 8 14

    osnovna šola 23 14

    srednja šola 11 14

    Imamo torej na eni strani stvarne frekvence in na drugi strani pričakovane frekvence. Stvarne

    in pričakovane frekvence se ne ujemajo. Zakaj se stvarno in zamišljeno stanje razlikujeta?

    Prvi vzrok je lahko slučajnostni izbor enot v vzorec. Zaradi slučajnih vplivov bo stanje v

    vzorcu vedno nekoliko drugačno kot v osnovni množici. Te razlike so majhne in kar je še

    pomembneje – so matematično predvidljive.

    Drugi vir razlik je lahko v tem, da stanje v osnovni množici ni takšno, kot trdi hipoteza enake

    verjetnosti. Enostavno rečeno: frekvence odgovorov v vzorcu se razlikujejo zaradi tega, ker se

    razlikujejo že v osnovni množici. To pomeni, da je stvarnost drugačna od ničelne hipoteze.

    χ2-preizkus temelji na velikosti razhajanja med stvarnimi in pričakovanimi frekvencami. Če

    bodo razlike med stvarnimi in pričakovanimi frekvencami majhne, bomo sklepali, da verjetno

    temeljijo na slučaju. Če bodo razlike med temi frekvencami velike, bomo sklepali, da bolj

    verjetno temeljijo na razliki v osnovni množici. Pri zadosti velikem razhajanju med

    frekvencami bomo zavrnili hipotezo enake verjetnosti kot nepravilno. To bomo šteli kot

    dokaz, da velja nasprotna hipoteza. Končna trditev bo: vsi odgovori v osnovni množici niso

    enako pogosti (neki odgovori prevladujejo).

    Za izvedbo preizkusa moramo izmeriti razhajanje med stvarnimi in pričakovanimi

    frekvencami. Skupna stopnja razhajanja vseh frekvenc v tabeli je vrednost χ2. Za vsako

    okence v tabeli izračunamo razhajanje stvarnih in pričakovanih frekvenc in seštejemo za vsa

    okenca:

    Ta vrednost se porazdeljuje v χ2 – porazdelitvi. Dobljeno vrednost χ

    2 primerjamo s kritično

    vrednostjo iz tabele. Poglejmo, kakšni so možni izidi χ2-preizkusa.

  • 1. χ2

    < χ2 (α = 0,05)

    Vrednost χ2 ni statistično pomembna. Hipoteze enake verjetnosti ne zavrnemo. O odgovorih v

    osnovni množici ne moremo trditi ničesar.

    To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi

    frekvencami je premajhno in ne moremo ničesar trditi o osnovni množici (ne upamo zavrniti

    hipoteze enake verjetnosti).

    2. χ2 χ

    2 (α = 0,05)

    Vrednost χ2

    je statistično pomembna na ravni α=0,05. Hipotezo enake verjetnosti zavrnemo s

    tveganjem 5%. Sprejmemo nasprotno hipotezo. Dokazali smo, da vsi odgovori v osnovni

    množici niso enako pogosti.

    To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi

    frekvencami je zadosti veliko in lahko trdimo, da stanje v osnovni množici ni takšno kot trdi

    hipoteza enake verjetnosti.

    3. χ2 χ

    2 (α = 0,01)

    Vrednost χ2

    je statistično pomembna na ravni α=0,01. Hipotezo enake verjetnosti zavrnemo s

    tveganjem 1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da vsi odgovori v osnovni

    množici niso enako pogosti.

    4. χ2 χ

    2 (α = 0,001)

    Vrednost χ2

    je statistično pomembna na ravni α=0,001. Hipotezo enake verjetnosti zavrnemo s

    tveganjem 0,1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da vsi odgovori v osnovni

    množici niso enako pogosti.

    Ob iskanju kritičnih vrednosti χ2 iz tabele se srečamo z novim pojavom. Krivulja normalne

    porazdelitve je ena sama in je npr. kritična vrednost za 5% tveganja tudi ena sama (1,96).

    Krivulj χ2

    je več in ne ena sama, zato tudi ni »stalnih« kritičnih vrednosti. Oblika krivulje se

    od primera do primera razlikuje; odvisna je od števila prostostnih stopinj. Ker se bomo v

    vzorčni statistiki pogosto srečevali s prostostnimi stopinjami, bomo ta pojem razložili

    podrobneje in splošneje. Pozneje se vrnemo k tabeli χ2-porazdelitve in k iskanju kritičnih

    vrednosti.

    8.4.1.1 Prostostne stopinje

    Vzorčne vrednosti pojmujemo kot vrednosti slučajne spremenljivke (ker so enote v vzorec

    izbrane z žrebanjem). V vzorcu imamo toliko vrednosti spremenljivke, kolikor je numerus

    vzorca. To je prava velikost vzorca. Dokler o podatkih ničesar ne vemo, so vrednosti v

    vzorcu lahko kakršnekoli. Pravimo, da vrednosti svobodno variirajo ali, da so vsi podatki

    »prosti«. Če poznamo vsoto vrednosti v vzorcu, potem vse vrednosti niso več »proste«. Vse

    razen ene lahko prosto variirajo, le ena je vezana na to vsoto. Poglejmo preprost primer.

    Imamo vrednosti številske spremenljivke za vzorec z numerusom šest.

    x 5 3 5 6 2 7

    Če o vzorcu nič ne vemo, vsaka od vrednosti prosto (slučajno) variira. Namesto petke v

    prvem oknu bi lahko bila štirica ali kaka druga vrednost, namesto trojke v drugem oknu bi

  • lahko bila katerakoli druga vrednost itd. Če nam je znana vsota, pa vse vrednosti ne variirajo

    več prosto.

    x 5 3 5 6 2 ? Σ= 24

    V tem primeru lahko pet vrednosti še vedno prosto variira (pri vzorčenju to pomeni, da so

    lahko izžrebane enote s katerimikoli vrednostmi). Ena izmed vrednosti pa ne more biti

    kakršnakoli, saj vsota mora biti 26. V navedenem primeru zadnja vrednost mora biti tri. Kakor

    da slučajnostni vzorec nima več numerusa šest, temveč le pet. Velikost vzorca se je navidezno

    zmanjšala. Število vrednosti, ki lahko prosto variirajo, imenujemo število prostostnih stopinj

    (g). Zamislimo si ga lahko kot navidezno velikost vzorca.

    Ko poznamo aritmetično sredino vzorca, je število prostostnih stopinj g = n-1. Če bi nam bila

    znana tudi varianca, bi bilo število prostostnih stopinj g = n-2. Če nam je znan še korelacijski

    koeficent, je g = n-3 itd. Nasploh lahko rečemo, da je število prostostnih stopinj nekega

    številskega sistema enako številu podatkov, zmanjšanem za število zvez med podatki.

    Pri nekaterih statističnih postopkih pa izhodišče ni numerus vzorca. Pri χ2-preizkusu ne

    primerjamo posameznikov, temveč frekvence v okencih dveh tabel. Zato je izhodišče število

    primerjanih frekvenc (ali še preprosteje: število okenc v tabeli). Število prostostnih stopinj je

    enako številu okenc s prostimi frekvencami zmanjšanemu za število okenc z »neprostimi«

    frekvencami. Število okenc v tabeli je odvisno od števila kategorij spremenljivke.

    Pri preizkusu hipoteze enake verjetnosti imamo samo eno spremenljivko. Število prostostnih

    stopinj določimo po obrazcu:

    g = (a-1)

    a-število kategorij spremenljivke

    Pri preizkusu hipoteze neodvisnosti imamo dve spremenljivki in število prostostnih stopinj

    določimo iz števila vrstic in stolpcev v tabeli. Pri štetju vrstic in stolpcev upoštevamo le tisti

    del tabele, v katerem so osnovni podatki. Vrstic in stolpcev z vsotami ne štejemo (spodaj

    skupaj in desno skupaj). Število prostostnih stopinj izračunamo po podobnem obrazcu:

    g = (a-1) (b-1)

    a-število kategorij prve spremenljivke (npr.število vrstic)

    b-število kategorij druge spremenljivke (npr.število stolpcev)

    S tem številom iščemo kritične vrednosti v χ2-tabeli. Izračunano vrednost χ

    2 primerjamo s

    kritičnimi vrednostmi, kot smo že prej pokazali.

    Zakaj prostostnih stopenj nismo upoštevali pri prejšnjih preizkusih ničelnih hipotez? Kadar

    raziskujemo z velikimi vzorci se navidezno zmanjšanje vzorca ne pozna veliko. Zato smo

    lahko ta pojav zanemarili. Pri velikih vzorcih smo se opirali na zakonitosti normalne

    porazdelitve, čeprav smo vedeli, da stvarne porazdelitve odstopajo od normalne. Odstopanje

    je bilo zanemarljivo, koristi od poenostavljenih postopkov pa velike. Če bi želeli uporabljati

    povsem natančne metode, bi morali to upoštevati že pri velikih vzorcih. Čim manjši so

    numerusi vzorcev, tem večje so te napake in pod neko mejo niso več zanemarljive. To je

    praktična meja med malimi in velikimi vzorci.

    Sedaj pokažimo potek preizkusa na primeru anketnega vprašanja o študijski praksi.

  • Tabela 84. Odgovori študentov

    odgovori f

    vrtec 8

    osnovna šola 23

    srednja šola 11

    skupaj 42

    Raziskovalno vprašanje je: ali se v osnovni množici frekvence odgovorov razlikujejo (ali

    kateri od odgovorov prevladuje)?

    Če bi držala hipoteza enake verjetnosti, bi bile pričakovane frekvence naslednje (v tabeli je

    hkrati ves postopek računanja vrednosti χ2):

    Tabela 85. Pričakovane frekvence

    odgovori fT

    vrtec 14

    osnovna šola 14

    srednja šola 14

    skupaj 42

    Primerjava stvarnih in pričakovanih frekvenc že na pogled kaže precejšnje razhajanje. Ali je

    to dovolj za zavrnitev ničelne hipoteze bo pokazal preizkus:

    Tabela 86. Preizkušanje hipoteze enake verjetnosti

    odgovori fE fT fE– fT (fE– fT)2 (fE– fT)

    2/ fT

    vrtec 8 14 -6 36 2,57

    osnovna šola 23 14 9 81 5,79

    srednja šola 11 14 -3 9 0,64

    skupaj 42 42 9,00

    χ2 = 9,00 > χ

    2 (α = 0,05; g = 2) = 5,991

    Vrednost χ2

    je statistično pomembna na ravni α=0,05. Hipotezo enake

    verjetnosti zavrnemo s tveganjem 5%. Sprejmemo nasprotno hipotezo.

    Dokazali smo, da vsi odgovori v osnovni množici niso enako pogosti.

    Tudi v osnovni množici prevladuje želja po opravljanju študijske prakse v

    osnovni šoli.

    8.4.2 Preizkušanje hipoteze neodvisnosti Tukaj je predmet raziskovanja povezanost med dvema opisnima spremenljivkama. Konkretno

    raziskovalno vprašanje zveni tako: ali sta spremenljivki v osnovni množici povezani. Nimamo

    podatkov za celotno osnovno množico; imamo le vzorčne podatke. Podatki o dveh

    spremenljivkah, urejeni v ustrezno tabelo, veliko povedo o povezanosti med njima. Če bi nas

    zanimal samo vzorec, bi deloma lahko shajali s samimi strukturnimi odstotki. Vendar je v

    središču našega raziskovanja cela osnovna množica. Zato nam tabela z vzorčnimi podatki ne

    zadostuje. Potreben bo statistični preizkus.

  • O stanju v osnovni množici postavimo hipotezo neodvisnosti:

    Spremenljivki sta v osnovni množici neodvisni.

    Tudi to je posebna oblika ničelne hipoteze, saj pravi, da ni povezanosti med spremenljivkama.

    Nasprotna tej hipotezi je hipoteza, da sta spremenljivki v osnovni množici odvisni.

    Najpogosteje nasprotne hipoteze izrecno niti ne postavimo, saj je praktično vedno enaka

    raziskovalni hipotezi. Videli smo pri vseh dosedanjih preizkusih, da z ničelnimi hipotezami ne

    mislimo povsem resno; potrebujemo jih le zaradi izvedbe preizkusa.

    Postavljeno hipotezo neodvisnosti bomo tudi tokrat preizkusili s χ2-preizkusom. V preizkusu

    jo bomo, ali zavrnili ali pa obdržali (le prvi izid je ugoden). Opišimo potek preizkusa. Imamo

    vzorčne podatke o dveh spremenljivkah. Te podatke vnesemo v frekvenčno tabelo. Za prikaz

    preizkusamo smo izbrali preprost in pogost primer s pedagoškega področja: povezanost med

    spolom in stališčem. Njegova preprostost je v tem, da imata obe spremenljivki majhno število

    kategorij. Spol je neodvisna spremenljivka in ima le dve kategoriji. Odvisna spremenljivka je

    stališče in v našem primeru ima samo tri kategorije. Seveda bi tudi spremenljivka stališče

    lahko imela samo dve kategoriji (npr. za in proti). Tabela bi bila še preprostejša (dve vrstici in

    dva stolpca), za razumevanje bistva preizkusa pa bi to bila prevelika poenostavitev.

    Tabela 87. Frekvenčna tabela po spolu in stališču

    sem za vseeno sem proti skupaj

    ženske 18 12 32 62

    moški 42 19 29 90

    skupaj 60 31 61 152

    Lahko na kratko interpretiramo podatke. Vidi se, da moški bolj soglašajo s tistim, kar je bilo v

    anketnem vprašanju. Ženske so bolj proti, pri sredinskem odgovoru pa so moški in ženske

    približno izenačeni. Vendar so to podatki za vzorec. Kakšne so razlike med stališči v osnovni

    množici?

    Frekvence, ki so v tabeli, so empirične ali stvarne frekvence (fE). Te frekvence odražajo

    stvarno stanje med anketiranci. Zaradi lažjega razumevanja razlage jih preračunamo v

    strukturne odstotke. Za samo izvedbo preizkusa to ni potrebno; tabelo z odstotki bomo

    potrebovali šele na koncu za interpretacijo. Ker iz tabele ne bomo ničesar več izračunavali,

    smo odstotke zaokrožili na prvem mestu za decimalno vejico (to za interpretacijo povsem

    zadostuje).

    Tabela 88. Odstotne frekvence

    sem za vseeno sem proti skupaj

    ženske 29,0 19,3 51,6 100,0

    moški 46,7 21,1 32,2 100,0

    skupaj 39,5 20,4 40,1 100,0

    Kakšne frekvence bi pričakovali v tabeli, če bi veljala hipoteza neodvisnosti? Te frekvence

    bomo imenovali pričakovane ali teoretične (fT). Če sta spol in stališče neodvisna, potem se

    odgovori žensk in moških v splošnem ne razlikujejo. Kakšne frekvence torej pričakujemo?

    Poglejmo v prejšnji tabeli, npr. frekvenco v levem spodnjem vogalu. To je odstotek tistih, ki

    so odgovorili »sem za« v celem vzorcu (39,5%). Če se odgovori moških in žensk ne

    razlikujejo, potem mora biti odstotek tistih, ki sogašajo pri ženskah in pri moških enak (in

  • sicer 39,5%). Tistih, ki jim je vseeno, mora biti pri obojih 20,4% in tistih, ki so proti pri

    obojih 40,1%.

    Pričakovane frekvence bodo torej takšne:

    Tabela 89. Pričakovane frekvence

    sem za vseeno sem proti skupaj

    ženske 39,5 20,4 40,1 100,0

    moški 39,5 20,4 40,1 100,0

    skupaj 39,5 20,4 40,1 100,0

    Pogled na obe tabeli nam pokaže, da se stvarne in pričakovane frekvence ne ujemajo. To

    pomeni, da je stvarnost drugačna kot predvideva hipoteza. Zakaj se stvarno in zamišljeno

    stanje razlikujeta?

    Prvi vzrok je lahko slučajnostni izbor enot v vzorec. Zaradi slučajnih vplivov bo stanje v

    vzorcu vedno nekoliko drugačno kot v osnovni množici. Te razlike so majhne in kar je še

    pomembneje – so matematično predvidljive.

    Drugi vir razlik je lahko v tem, da stanje v osnovni množici ni takšno, kot trdi hipoteza

    neodvisnosti. Enostavno rečeno: stališča žensk in moških se v vzorcu razlikujejo zaradi tega,

    ker se razlikujejo že v osnovni množici.

    Na velikosti teh razlik (razhajanja) temelji χ2-preizkus. Pri zadosti velikem razhajanju med

    frekvencami bomo zavrnili hipotezo neodvisnosti kot nepravilno. To dokazuje pravilnost

    nasprotne hipoteze in lahko postavimo končno trditev, da je v osnovni množici stališče

    odvisno od spola.

    Za izvedbo preizkusa moramo izmeriti razhajanje med stvarnimi in pričakovanimi

    frekvencami. Skupna stopnja razhajanja vseh frekvenc v tabelah je vrednost χ2. Za vsako

    okence v tabeli izračunamo razhajanje stvarnih in pričakovanih frekvenc in seštejemo za vsa

    okenca:

    Ta vrednost se porazdeljuje v χ2 – porazdelitvi. Dobljeno vrednost χ

    2 primerjamo s kritično

    vrednostjo iz tabele. Poglejmo, kakšni so možni izidi χ2-preizkusa.

    1. χ2

    < χ2 (α = 0,05)

    Vrednost χ2 ni statistično pomembna. Hipoteze neodvisnosti ne zavrnemo. O povezanosti med

    spolom in stališčem v osnovni množici ne moremo trditi ničesar.

    To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi

    frekvencami je premajhno in ne moremo ničesar trditi o osnovni množici (ne upamo zavrniti

    hipoteze neodvisnosti).

    2. χ2 χ

    2 (α = 0,05)

    Vrednost χ2

    je statistično pomembna na ravni α=0,05. Hipotezo neodvisnosti zavrnemo s

    tveganjem 5%. Sprejmemo nasprotno hipotezo. Dokazali smo, da sta spol in stališče v

    osnovni množici odvisna.

    To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi

    frekvencami je zadosti veliko in lahko trdimo, da stvarnost ni takšna kot trdi hipoteza

    neodvisnosti.

  • 3. χ2 χ

    2 (α = 0,01)

    Vrednost χ2

    je statistično pomembna na ravni α=0,01. Hipotezo neodvisnosti zavrnemo s

    tveganjem 1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da sta spol in stališče v

    osnovni množici odvisna.

    4. χ2 χ

    2 (α = 0,001)

    Vrednost χ2

    je statistično pomembna na ravni α=0,001. Hipotezo neodvisnosti zavrnemo s

    tveganjem 0,1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da sta spol in stališče v

    osnovni množici odvisna.

    Število prostostnih stopinj določimo iz števila vrstic in stolpcev v tabeli. Pri štetju vrstic in

    stolpcev upoštevamo le tisti del tabele, v katerem so osnovni podatki. Vrstic in stolpcev z

    vsotami ne štejemo (spodaj skupaj in desno skupaj). Število prostostnih stopinj izračunamo po

    obrazcu:

    g = (a-1) (b-1)

    a-število kategorij prve spremenljivke (npr.število vrstic)

    b-število kategorij druge spremenljivke (npr.število stolpcev)

    S tem številom iščemo kritične vrednosti v χ2-tabeli. Izračunano vrednost χ

    2 primerjamo s

    kritičnimi vrednostmi, kot smo že prej pokazali.

    8.4.2.1 Pričakovane frekvence

    V opisu postopka smo pokazali, kako določimo pričakovane frekvence v obliki odstotkov.

    Računanje odstotnih frekvenc je nepotrebno delo, zato bomo pri izračunavanju vrednosti χ2

    določili in uporabili običajne pričakovane frekvence (absolutne). Pričakovano frekvenco za

    neko okence izračunamo tako, da zmnožek vsote na desnem koncu vrstice in vsote na dnu

    stolpca delimo z numerusom. Tako dobljena vrednost je pričakovana frekvenca za to okence.

    To naredimo za vsa okenca. Pokažimo postopek za vseh šest okenc tabele.

    Tabela 90. Računanje pričakovanih frekvenc

    izračun

    prva vrstica, prvi stolpec 62x60:152 = 24,47

    prva vrstica, drugi stolpec 62x31:152 = 12,64

    prva vrstica, tretji stolpec 62x61:152 = 24,88

    druga vrstica, prvi stolpec 90x60:152 = 35,53

    druga vrstica, drugi stolpec 90x31:152 = 18,36

    druga vrstica, tretji stolpec 90x61:152 = 36,12

    Sedaj pričakovane frekvence vnesemo v tabelo in izračunamo vrednost χ2.

  • Tabela 91. Pričakovane frekvence

    sem za vseeno sem proti skupaj

    ženske 24,47 12,64 24,88 62

    moški 35,53 18,36 36,12 90

    skupaj 60 31 61 152

    število prostostnih stopinj je

    g = (3-1) (2-1) = 2

    χ2 = 6,39 > χ

    2 (α = 0,05; g = 2) = 5,99

    Dobljeni χ2

    je statistično pomemben na ravni 0,05 in s tveganjem 5% zavrnemo hipotezo

    neodvisnosti. Spremenljivki sta v osnovni množici odvisni.

    8.4.2.2 Kratek način računanja vrednosti χ2

    Izračunavanje vrednosti χ2 s pomočjo vseh pričakovanih frekvenc je nepotreben ovinek.

    Potreben je pri spoznavanju postopka, saj kaže na kakšen način vrednost χ2

    meri razhajanje

    med pričakovanimi in stvarnimi frekvencami. Postopek izračunavanja lahko skrajšamo in

    takoj dobimo vrednost χ2.

    Potrebujemo le tabelo s stvarnimi frekvencami. V vsakem okencu kvadriramo stvarno

    frekvenco ter kvadrat delimo z vsoto vrstice in z vsoto stolpca. Dobljeno vrednost shranimo v

    spomin (takšen spomin ima vsak kalkulator - seštevalni spomin, M+). To naredimo za vsa

    okenca, prikličemo vsoto vseh shranjenih členov, od te vsote odštejemo vrednost 1 in ostanek

    pomnožimo z numerusom. Dobljena vrednost je χ2. Pokažimo za našo tabelo:

    Tabela 92. Računanje vrednosti χ2

    izračun

    182:62:60= M+

    122:62:31= M+

    322:62:61= M+

    422:90:60= M+

    192:90:31= M+

    292:90:61= M+

    RM –1 x 152 = 6,39 = χ2

    χ2 = 6,39 > χ

    2 (α = 0,05; g = 2) = 5,99

    Dobljeni χ2

    je statistično pomemben na ravni 0,05 in s

    tveganjem 5% zavrnemo hipotezo neodvisnosti. Spremenljivki

    sta v osnovni množici odvisni.

  • 8.4.2.3 Poročanje o preizkusu pri računalniški obdelavi

    Poročilo o izidu preizkusa mora vsebovati vse, kar bralec potrebuje za pravilno razumevanje

    interpretacije. V novejšem času raziskovalci skoraj brez izjeme uporabljajo za obdelavo

    podatkov računalniške programe. Ti programi prikazujejo izide nekoliko drugače, kot smo

    videli pri razlagi preizkusa.

    Računalnik za preizkus ničelne hipoteze ne potrebuje tabele, ampak uporablja kar enačbo χ2

    porazdelitve. Namesto primerjave s kritičnimi vrednostmi dobimo natančno izračunano raven

    statistične pomembnosti. Prikazali bomo nekaj primerov računalniških zapisov (iz obdelave

    narejene s SPSS programom):

    Tabela 93. Računalniški izpisi χ2-preizkusa

    vrednost

    χ2

    prostostne stopinje

    g

    raven statistične pomembnosti

    ali P

    1 26,35 9 0,0020

    2 25,73 12 0,0120

    3 7,44 10 0,6832

    4 32,00 4 0,0000

    5 17,24 10 0,0691

    6 2,67 2 0,2641

    7 4,00 1 0,0462

    8 7,67 5 0,1761

    Prvi χ2 je statistično pomemben na ravni =0,0020 in s tveganjem 0,20% zavrnemo hipotezo

    neodvisnosti. Drugi χ2 je statistično pomemben na ravni =0,0120 in s tveganjem 1,20%

    zavrnemo hipotezo neodvisnosti. Tretji χ2 ni statistično pomemben; tveganje za zavrnitev

    hipoteze bi znašalo več kot 68%, kar je seveda veliko preveč. Četrti χ2 je statistično

    pomemben vsaj na ravni =0,0000 in je tveganje za zavrnitev hipoteze neodvisnosti manjše

    celo od 0,00%. Peti χ2 ni statistično pomemben; tveganje za zavrnitev hipoteze neodvisnosti

    bi znašalo 6,91%. Šesti χ2 tudi ni statistično pomemben; tveganje za zavrnitev hipoteze bi

    znašalo 26,41%. Sedmi χ2 je statistično pomemben na ravni 0,0462 in s tveganjem 4,62%

    zavrnemo hipotezo neodvisnosti. Osmi χ2 ni statistično pomemben; tveganje za zavrnitev

    hipoteze bi znašalo več kot 17%. Običajno pri izpisih z večjim številom preizkusov v rubriki

    »raven statistične pomembnosti« z rdečim svinčnikom zaokrožimo vse vrednosti 0,05 ali

    manj. Tam, kjer je raven statistične pomembnosti 0,05 ali manj, zavrnemo hipotezo

    neodvisnosti; tam, kjer je vrednost večja od 0,05, pa hipoteze neodvisnosti ne zavrnemo. V

    končnem poročilu navedemo vse tri vrednosti: vrednost χ2, število prostostnih stopinj in raven

    statistične pomembnosti. Tako poročamo tudi, kadar ne zavrnemo ničelne hipoteze. Ker χ2-

    preizkus vedno spremlja tudi tabela s stvarnimi frekvencami, nam ni treba posebej navajati

    numerusa vzorca. Če objavljamo rezultate raziskave v reviji in imamo na voljo omejeno

    število strani, se pogosto odpovemo tabeli – takrat k naštetim rezultatom dodamo še numerus

    vzorca. To še zlasti pride v poštev, ko so tabele res obsežne (npr. šest-sedem vrstic in tudi

    toliko stolpcev).

    Za raven statistične pomembnosti se uporabljata dva simbola: in P. V knjigi smo povsod

    dali prednost simbolu . Pri nas označujemo število prostostnih stopinj s simbolom g, pri

  • uporabi računalniških programov pa se v izpisih pojavlja angleška kratica df (degrees of

    freedom).

    8.4.3 Pogoj za uporabo χ2-preizkusa

    Ta preizkus je eno najbolj univerzalnih statističnih orodij. Da bi ga lahko uporabili, ni

    nobenih zahtev glede vrste spremenljivk. Ker v preizkusu lahko nastopajo same nominalne

    spremenljivke, je uporaben tudi za vse ostale vrste spremenljivk. Res je, da ga redko

    uporabljamo za številske spremenljivke, saj imamo zanje boljše metode. Pri opisnih

    spremenljivkah pa je mnogokrat edina izbira. Skoraj bi lahko rekli, da je ta preizkus najbolj

    vsestransko uporabna statistična metoda. Za njegovo uporabo mora biti izpolnjen samo en

    pogoj. Pričakovane frekvence morajo biti pet ali več (ne smejo biti manjše od pet). Pogoj je

    zelo zahteven in nam pogosto zapre pot v raziskovanju. Zato se v praksi uporablja milejši

    pogoj: pričakovane frekvence so lahko manjše od pet, vendar takšnih frekvenc ne sme biti več

    kot 20% in nobena med njimi ne sme biti manjša od ena. Pozor: pogoj se nanaša na

    pričakovane frekvence in ne na stvarne. Stvarne v celicah tabele so lahko celo nič!

    8.4.3.1 Ukrepi pri neizpolnjenih pogojih

    Poglejmo najprej teoretično, kdaj pogoj sploh ne more biti izpolnjen. Če naj bo v vsakem

    okencu pričakovana frekvenca pet, potem mora biti numerus vzorca pri tabeli 2x2 vsaj 20

    (štiri okenca po najmanj pet), pri tabeli 2x3 mora biti vsaj 30 itd. Seveda to ne bo dovolj, saj

    se frekvence ne razporedijo enakomerno po okencih tabele (glej tabelo št. XX). Lahko se celo

    zgodi, da je numerus vzorca celo nekajkrat večji od teoretično minimalnega, pa so kljub temu

    nekatere pričakovane frekvence premajhne. Zato v praksi pogosto moramo ukrepati in

    uporabiti različne načine reševanja problema premajhnih frekvenc.

    Prva dva ukrepa sta preventivne narave. Uporabimo ju še pred zbiranjem podatkov. Toda, ne

    eden ne drugi, ne delujeta povsem zanesljivo. V večini primerov pa vendarle zaležeta.

    Že pri načrtovanju zbiranja podatkov moramo razmisliti o poznejši obdelavi podatkov. Če na

    vsak način želimo uporabiti χ2-preizkus, in vemo, da bomo imeli, npr. le petdeset

    anketirancev, moramo skrbno načrtovati velikost tabel. Če bo imela neodvisna spremenljivka

    tri kategorije (npr. stopnje izobrazbe), odvisna pa pet kategorij (npr. stališče), bo tabela imela

    3x5=15 okenc. Petdeset ljudi se v petnajstih okencih ne more niti teoretično porazdeliti tako,

    da bi bile pričakovane frekvence večje od pet. Povrhu se odgovori ne porazdeljujejo

    enakomerno po okencih. Pri takšnem vzorcu bi oblikovali anketno vprašanje o stališču tako,

    da bi imeli le tri kategorije. Namesto npr. željenih odgovorov: zelo se strinjam, strinjam se,

    vseeno mi je, ne strinjam se ter nikakor se ne strinjam, bi dali le tri: strinjam se, mi je vseeno

    in ne strinjam se. Bolje bi bilo imeti več kategorij, toda če ostanemo pri večjem številu

    kategorij, na koncu ne bo možno uporabiti preizkusa. In včasih se moramo nečemu

    odpovedati.

    Drugi ukrep je boljši od prvega, a je bolj zahteven. Pred anketiranjem si zagotovimo zadosti

    velik vzorec in s tem zmanjšamo možnosti nastopa premajhnih pričakovanih frekvenc.

    Običajno računamo tako: število okenc, krat pet anketirancev in krat faktor tri do pet. Če

    vemo, da bo tabela imela petnajst okenc, bi si poskušali zagotoviti 15x5x3=225 ali celo

    15x5x5=375 anketirancev. Vendar niti to ne zaleže prav vedno. Nič nam ne pomaga velik

    numerus vzorca (število anketirancev), če je neka kategorija zelo maloštevilna. Takrat bodo v

  • celi kategoriji premajhne pričakovane frekvence. Pokažimo na preprostem primeru.

    Raziskujemo obolevanje za otroškimi boleznimi (norice itd.). Lahko imamo tudi nekaj tisoč

    anketirancev v vzorcu, a npr. odgovor norice sem prebolel v starosti nad 40 let obkroži samo

    nekaj oseb (ker je to zares redkost). V vseh ostalih kategorijah lahko imamo veliko »preveč«

    anketirancev, a to nič ne pomaga. Cela ta kategorija v tabeli bo imela premajhne frekvence.

    Naslednji ukrepi pridejo v poštev, ko smo podatke že zbrali in sestavili tabelo. So vsebinsko

    slabši od prejšnjih, a večinoma bolj učinkoviti.

    Tretji ukrep pri premajhnih pričakovanih frekvencah je združevanje sorodnih kategorij. Če

    imamo v tabeli šolske ucene učencev in v kategoriji odličnjakov nastopajo prenizke

    frekvence, združimo kategoriji prav dobri in odlični. S tem se vse frekvence (stvarne in

    pričakovane) povečajo. Ta ukrep zmanjšuje tabelo; manjša tabela pa pomeni manj informacij

    in slabše izkoriščene podatke. Kategorij ne združujemo brez temeljitega premisleka:

    združujemo najmanj kolikor je potrebno, da dosežemo zahtevane pogoje. Na tako zmanjšani

    tabeli opravimo preizkus in interpretiramo rezultate.

    Pri nominalnih spremenljivkah kategorije večinoma niso sorodne in jih ne moremo

    združevati. Kadar je cela kategorija v tabeli (vrstica ali stolpec) maloštevilna, jo lahko v celoti

    izpustimo iz tabele in opravimo preizkus na zmanjšani tabeli. Vendar to ni dober ukrep in ga

    lahko uporabimo le v sili. Črtanje kategorije pomeni popolno izgubo tistih informacij, ki jih je

    vsebovala črtana kategorija).

    Pri združevanju kategorij (ali tudi pri črtanju) se lahko zgodi da dobimo najmanjšo možno

    tabelo 2x2 a pogoji še vedno niso izpolnjeni. Takrat uporabimo preizkus z Yatesovim

    popravkom (seveda tudi, če smo že od začetka imeli tabelo 2x2). Popravljeno vrednost χ2

    izračunamo tako, da vsako razliko fE - fT pred kvadriranjem zmanjšamo v absolutnem znesku

    za 0,5. Ves ostali del χ2-preizkusa ostane enak. S tem sicer ne odpravimo premajhnih

    pričakovanih frekvenc. S tem se zmanjša končna vrednost χ2, kar poveča previdnost v

    preizkusu. To hkrati pomeni manjšo možnost napačnih sklepov. To je edini ukrep pri katerem

    χ2-preizkus uporabimo, čeprav pogoji niso izpolnjeni.

    Če nobeden od opisanih ukrepov ne zaleže, lahko uporabimo kakšen nadomestni preizkus.

    Vendar nadomestni preizkusi nimajo takšne statistične moči kot χ2-preizkus. Zato tudi ta

    ukrep uporabljamo le, kadar ni druge možnosti. Eden od nadomestnih preizkusov je

    Kullbackov preizkus (glej Sagadin 1987, str. 358-360).

    8.5 Koeficienti kontingence

    χ2

    -preizkusa hipoteze neodvisnosti ne moremo primerjati z korelacijskimi koeficienti, saj ima

    drugačno funkcijo. Funkcija je resda podobna, ni pa enaka. Obakrat gre za ugotavljanje

    povezanosti. Vendar nam χ2

    -preizkus pokaže samo ali sta spremenljivki v osnovni množici

    odvisni. Iz preizkusa se ne vidi kako močna je njuna odvisnost. Potrebujemo mero, ki bo

    kazala stopnjo povezanosti. Dobimo jo iz vrednosti χ2

    . Vrednost χ2

    temelji na stopnji

    razhajanja med stvarnimi in pričakovanimi frekvencami. Čim bolj se te razhajajo, tem večja je

    povezanost med spremenljivkama v vzorcu. Na posreden način je že vrednost χ2

    kazala

    stopnjo povezanosti. Koeficiente povezanosti med opisnimi spremenljivkami bomo imenovali

    kontingenčni koeficienti. Preizkus χ2

    bo kazal ali obstaja povezanost med spremenljivkama,

    koeficienti kontingence pa kako močna je ta povezanost.

    Vendar je med kontingenčnimi koeficienti in χ2 – preizkusom še ena velika razlika. Preizkus

    χ2

    se nanaša na povezanost spremenljivk v osnovni množici. Čeprav je izpeljan iz podatkov

    vzorca, odgovarja samo na vprašanje o osnovni množici (kot sicer vsi preizkusi ničelnih

  • hipotez). V raziskavi, ki ni vzorčna, uporaba χ2 – preizkusa nima nobenega smisla. Toda tudi

    v takšni raziskavi lahko izračunamo vrednost χ2 , iz nje pa koeficient kontingence.

    Kontingenčni koeficient se, namreč, nanaša na skupino, ki je v tabeli. To pomeni, da

    kontingenčne koeficiente lahko uporabimo v vsaki raziskavi, χ2 – preizkus pa le v vzorčnih

    raziskavah.

    Če raziskava ni vzorčna in imamo v tabeli celo množico, bo kontingenčni koeficient veljal

    zanjo. Če pa raziskavo opravljamo na vzorcu in so v tabeli vzorčni podatki, se bo

    kontingenčni koeficient nanašal na ta vzorec! Če bi hoteli dobiti kontingenčni koeficient za

    osnovno množico, bi ga morali oceniti na podlagi dobljenega (vzorčnega) iz tabele. Izračunati

    bi morali interval zaupanja in šele ta bi se nanašal na osnovno množico. Prav tak postopek

    smo videli v poglavju o ocenjevanju Pearsonovega korelacijskega koeficienta. Vendar pa

    postopke ocenjevanja kontingenčnih koeficientov zares redko uporabljamo. Zadovoljimo se

    kar z vrednostjo koeficienta za vzorec.

    Vrednost χ2 lahko izračunamo kadarkoli, celoten χ

    2 – preizkus pa je smiseln le, kadar

    posplošujemo na osnovno množico. V raziskavi, ki ni vzorčna, uporaba χ2 – preizkusa nima

    nikakršnega smisla.

    8.5.1 Pearsonov kontingenčni koeficient Iz vrednosti χ

    2 lahko izračunamo kontingenčni koeficiente, ki kažejo stopnjo povezanosti

    podobno kot korelacijski keficienti. Koeficientov kontingence je več, najpogosteje

    uporabljamo Pearsonov kontingenčni koeficient.

    Vrednosti koeficienta so med 0 in 1 in jih interpretiramo podobno kot korelacijske

    koeficiente. Pri opisnih spremenljivkah dobimo nasploh nižje stopnje povezanosti kot pri

    številskih. Zato običajno že nižje vrednosti kontingenčnih koeficientov interpretiramo kot

    opazno stopnjo povezanosti. Še zlasti to velja za Pearsonov kontingenčni koeficient.

    Drugo razliko v interpretaciji povzroča dejstvo, da kontingenčni koeficienti nimajo

    predznaka. Pri nominalnih spremenljivkah to ni težava, saj sploh ne obstaja pojem negativne

    ali pozitivne smeri. Pri ordinalnih spremenljivkah pozitivna in negativna smer obstajata, a

    koeficient smeri ne pokaže. Zato je treba pazljivo pregledati frekvence v tabeli in iz njih

    presoditi o smeri. Za primer iz tabele št. XY (kjer smo preizkušali hipotezo o neodvisnosti

    med spolom in stališčem), je vrednost Pearsonovega koeficienta C = 0,20. Pri korelacijskem

    koeficientu bi takšno vrednost interpretirali kot zanemarljivo, pri kontingenčnem pa štejemo,

    da vendarle kaže na opazno povezanost. Za interpretacijo smeri potrebujemo tabelo s

    strukturnimi odstotki.

    Tabela 94. Strukturni odstotki po stališču (posebej za vsak spol)

    sem za vseeno sem proti skupaj

    ženske 29,0 19,3 51,6 100,0

    moški 46,7 21,1 32,2 100,0

    skupaj 39,5 20,4 40,1 100,0

  • Pri manjših tabelah že kratek pogled na tabelo zadosti dobro kaže smer. Moški veliko bolj

    soglašajo kot ženske; hkrati je pri moških malo več takšnih, ki niso izrazito ne za ne proti.

    Seveda potem zadnji stolpec kaže, da so ženske veliko bolj proti kot moški.

    Pri večjih tabelah moramo pogosto primerjati cele stolpce (drugega za drugim). Tako bi

    najprej primerjali vse odstotke v prvem stolpcu. V naši tabeli sta v prvem stolpcu samo dva:

    29,0% in 46,7%. Skoraj polovica moških je izbrala odgovor »sem za«, pri ženskah pa komaj

    nekaj več kot četrtina. Enako naredimo še za ostale stolpce; iz vseh stolpcev na koncu

    ustvarimo celovito sliko smeri povezanosti. Tabele absolutnih frekvenc ne omogočajo dobre

    interpretacije; interpretiramo predvsem odstotne frekvence.

    Največjo težavo pri interpretaciji Pearsonovega kontingenčnega koeficienta predstavlja

    njegova odvisnost od velikosti tabele. Tudi pri popolni povezanosti med spremenljivkama

    koeficient ne doseže vrednosti ena. To doseže šele na neskončno veliki tabeli; to pomeni

    takrat, ko je število kategorij spremenljivke neskončno.

    Poglejmo to podrobneje. Za naš primer s spremenljivkama spol in stališče si zamislimo, da so

    vse ženske izbrale odgovor sem proti, vsi moški pa odgovor sem za. Povezanost med

    spremenljivkama je popolna (samo od spola je odvisno, kakšni so odgovori!). V tem primeru

    bi imeli takšno tabelo stvarnih frekvenc:

    Tabela 95. Frekvence po spolu in stališču

    sem za vseeno sem proti skupaj

    ženske 0 0 62 62

    moški 90 0 0 90

    skupaj 90 0 62 152

    C=0,71

    Čeprav je povezanost popolna, je kontingenčni koeficient »zgolj« C = 0,71. Če ne bi vedeli za

    ta pojav, bi koeficient napačno interpretirali, češ: »povezanost je precej visoka«. V resnici je

    povezanost najmočnejša možna (popolna).

    O maksimalni vrednosti kontingenčnega koeficienta odloča manjše število kategorij v tabeli.

    V vseh tabelah, kjer ima ena spremenljivka dve kategoriji, je maksimalna vrednost 0,707 (ne

    glede na to, koliko kategorij ima druga spremenljivka).

    Težave nastanejo takrat, ko primerjamo koeficiente iz različno velikih tabel. Najpogosteje se

    tem primerjavam nikakor ne moremo odpovedati. Ko raziskujemo, npr. s čem so povezana

    stališča, bomo imeli v eni tabeli neodvisno spremenljivko spol (dve kategoriji), v drugi

    izkušnje (npr. tri kategorije), v tretji izobrazbo (npr. pet kategorij) in tako dalje. V

    interpretaciji želimo primerjati dobljene kontingenčne koeficiente. Še večje težave bomo

    imeli, kadar primerjamo svoje rezultate z rezultati iz neke druge raziskave. Podobni ali celo

    isti pojavi so v različnih raziskavah merjeni z drugačnimi instrumenti, število kategorij pa je

    lahko zelo različno.

    Potrebujemo koeficient povezanosti, ki ne bo imel te pomanjkljivosti. Dobimo ga tako, da

    delimo dobljeni Pearsonov kontingenčni koeficient z njegovo maksimalno vrednostjo.

  • Tako dobimo korigirani Pearsonov kontingenčni koeficient CC. Korigirani koeficienti so

    med seboj primerljivi. Vendar jih ne moremo primerjati z nekorigiranimi. Torej v praksi

    uporabljamo ali prve, ali pa druge; obojih hkrati ne.

    8.5.2 Cramérjev koeficient Kadar so nam pomembne primerjave med različnimi tabelami, lahko izberemo Cramérjev

    koeficient. Postopek izračunavanja zagotavlja neodvisnost od velikosti tabele in s tem

    primerljivost koeficientov iz različnih tabel.

    Kljub temu, da Cramérjevi koeficienti lahko dosežejo vrednost 1, so večinoma njihove

    vrednosti manjše od vrednosti C. Zato koeficienta nista primerljiva in ju ne moremo hkrati

    uporabljati in interpretirati. Če se odločimo za uporabo Cramérjevih koeficientov, potem

    uporabljamo samo te.

    8.5.3 Koeficient Za tabelo 2x2 dobi obrazec za Cramérjev koeficient enostavnejšo končno obliko. Ta

    koeficient ima posebno ime: -koeficient.

    Ker je to v resnici Cramérjev koeficient, ga podobno tudi interpretiramo. Primerjave so

    veljavne predvsem, če uporabljamo te dvoje koeficiente hkrati. S Pearsonovimi je tudi

    koeficient slabo primerljiv.

    8.6 Napake pri ocenjevanju parametrov in preizkušanju hipotez Vsi statistični postopki posploševanja z vzorcev na osnovne množice so povezani s

    tveganjem. Brez tveganja ne gre. Zaradi tega lahko pride do napačnih sklepov. Vir teh napak

    je tveganje. Čeprav so viri enaki, so napake in njihove posledice pri ocenjevanju parametrov

    drugačne kot pri preizkušanju hipotez.

    8.6.1 Ocenjevanje parametrov Pri ocenjevanju parametrov postavimo trditev, da je parameter osnovne množice v intervalu

    zaupanja. Pri tem tvegamo, da to morda ne drži. Napaka, ki se nam lahko zgodi je, da

    parameter osnovne množice res ni v intervalu zaupanja. Torej, naša ocena ne drži. Zakaj se to

    lahko zgodi? Interval zaupanja smo oprli na verjetnost, da je izbrani vzorec eden od tistih

  • (npr. 95%), katerih parameter odstopa od populacijskega za največ tpSE (pri velikih vzorcih

    je na tem mestu namesto vrednosti tp vrednost z=1,96). Vendar vemo, da je med vsemi vzorci

    tudi 5% takšnih, za katere to ne velja. Če smo naleteli pri izbiri vzorca na enega takšnih, bo

    naša ocena nepravilna: parameter osnovne množice ne bo v intervalu zaupanja. Verjetnost

    takšnega dogodka je torej majhna, toda zgodi se lahko! In če stalno ocenjujemo s petimi

    odstotki tveganja, se nam bo to zares dogajalo v približno petih odstotkih primerov. Če nismo

    pripravljeni sprejeti tega tveganja, se moramo odpovedati vzorcem in pojave raziskovati na

    celih množicah.

    8.6.2 Preizkusi ničelnih hipotez Pri preizkušanju hipotez se lahko zgodita dve napaki. Imenujemo jih napake I. vrste in napake

    II. vrste (tudi alfa napake in beta napake). Pojasnili jih bomo na primeru hi-kvadrat preizkusa

    hipoteze o neodvisnosti.

    Napaka prve vrste se lahko zgodi pri zavrnitvi hipoteze neodvisnosti. Če ničelno hipotezo

    zavrnemo, v resnici pa je pravilna, je to napaka I. vrste ali alfa napaka. Pravilnost hipoteze

    neodvisnosti pomeni, da sta v osnovni množici spremenljivki neodvisni. Toda, tudi iz takšnih

    množic lahko dobimo vzorec, pri katerem vrednost χ2

    presega kritično vrednost za 5%

    tveganja. Takšnih vzorcev je največ 5%, zato se napaka prve vrste ne zgodi pogosto; občasno

    se pa vendarle zgodi. Te napake imenujemo alfa napake, ker je njihova verjetnost enaka

    vrednosti α. Napake I. vrste imajo lahko zelo hude posledice, saj je v primeru, ko se nam to

    zgodi, naša trditev popolnoma napačna. Zato je največje dopustno tveganje pri zavrnitvi

    ničelne hipoteze 5% (to je tudi največja verjetnost, da pride do napake I. vrste).

    Napaka druge vrste se lahko zgodi, ko hipoteze neodvisnosti ne zavrnemo. Če je ne

    zavrnemo, a je v resnici nepravilna, je to napaka II. vrste ali beta napaka. Torej sta v osnovni

    množici spremenljivki odvisni, mi pa nismo zavrnili hipoteze neodvisnosti. Verjetnost te

    napake je 95% ali še več. Tako velika verjetnost za napake II. vrste je možna, ker te napake

    nimajo skoraj nobenih praktičnih posledic. Ko hipoteze neodvisnosti ne zavrnemo, ne trdimo

    o osnovni množici nič. In če nič ne trdimo, tudi kakšne vsebinske napake ne moremo

    zagrešiti. Če se že zgodi napaka II. vrste, nam je lahko žal, da nismo zavrnili hipoteze

    neodvisnosti (saj bi jo lahko v resnici zavrnili) in da o osnovni množici nismo ničesar

    ugotovili. To je škoda, ni pa to stvarna napaka.

    Povezanost alfa in beta napak

    Zmanjševanje verjetnosti za napake I. vrste povečuje verjetnost nastopa napak II. vrste in

    obratno. Poglejmo podrobneje:

    Običajno zavračamo hipoteze pri kritičnem pragu 0,05. Verjetnost nastopa napake I. vrste je 5% in verjetnost nastopa napake II. vrste je 95%.

    Če bi se odločili, da bomo zavračali hipoteze šele ko vrednost χ2 preseže kritično vrednost

    za =0,01, bi zmanjšali možnost napak I. vrste na 1%, a hkrati povečali možnost napak II.

    vrste na 99%.

    Če bi se odločili, da bomo zavračali ničelne hipoteze šele ko vrednost χ2 preseže kritično

    vrednost za =0,001, bi zmanjšali možnost napak I. vrste na 0,1%, a hkrati povečali

    možnost napak II. vrste na 99,9%.

    Zato večinoma ostajamo pri kritični vrednosti α=0,05. To je kompromis med verjetnostjo

    nastopanja obojih napak.

  • Premislek o povezanosti verjetnosti za alfa in beta napake morebiti vsiljuje naslednji sklep:

    Torej vedno naredimo napako: če ne naredimo alfa napake, naredimo beta

    napako in obratno!???

    Vendar je ta sklep popolnoma napačen! Zakaj je napačen? Saj se zdi, da seštete verjetnosti za

    napake vedno dajo 100%.

    Napaka v premisleku je v tem, da razmišljamo o verjetnosti napak abstraktno, ko še nismo

    naredili preizkusa (in sta še možna oba izida!). Vsak konkretni preizkus se na koncu konča

    samo z enim izidom: ali ničelno hipotezo zavrnemo ali je ne zavrnemo. Zato verjetnosti ne

    smemo seštevati. Pojasnimo to preprosto:

    Če ničelno hipotezo zavrnemo, se lahko zgodi le alfa napaka

    (ali pa se NE zgodi).

    Če ničelne hipoteze ne zavrnemo, se lahko zgodi le beta napaka

    (ali pa se NE zgodi).

    Vidimo torej, da je možno tudi NE.