CHI KUADRAT χ2 (REVISI).docx
Embed Size (px)
Transcript of CHI KUADRAT χ2 (REVISI).docx

2
h
ho
f)f(f
Σ
CHI KUADRAT ( χ2 )
A. DEFINISI CHI KUADRAT
Uji Chi Kuadrat merupakan pengujian hipotesis tentang
perbandingan antara frekuensi sampel yang benar-benar terjadi
(selanjutnya disebut frekuensi observasi, yang dilambangkan dengan fo )
dengan frekuensi harapan yang didasarkan atas hipotesis tertentu pada
setiap kasus atau data (selanjutnya disebut dengan frekuensi harapan,
dilambangkan dengan fh kemudian dirumuskan sebagai berikut:
Keterangan :
fo = frekuensi observasi atau pengamatan
fh = frekuensi harapan
χ2 = Chi Kuadrat
Dengan ketentuan fo adalah harga yang diamati, dan fh adalah harga
harapan, semakin besar sampel size maka semakin besar pula harga χ2
sehingga χ2
mempunyai tendensi meningkat dengan meningkatnya
sampel size. Jumlah kategori mempengaruhi besar DF (degrees of
freedom) yang juga akan mempengaruhi bentuk distribusi teoritis chi
kuadrat. Makin besar DF makin besar pula titik kritisnya pada tingkat
kepercayaan tertentu.
B. PRINSIP-PRINSIP CHI KUADRAT
1) Hanya dapat dipergunakan pada data kualitatif
2) Dapat dipergunakan pada sampel dari berbagai macam ukuran (sampel
size) selama tidak menyimpang dari ketentuan butir 9 dan 10. Juga dapat
dipergunakan pada berbagai macam katagori
3) Hitungan akhir selalu melibatkan angka sebenarnya (frekuensi) bukan
prosen atau proporsi
4) Bila ingin membandingkan dua atau lebih distribusi sampel maka uji yang
sesuai adalah r x c contingency chi square. Data disusun menurut r – baris
(r = 2,3,…x) dan menurut c-kolom (c = 2,3,…x) mempunyai db = (r-1)(c-
1). Nilai harapan diperoleh dari perkalian jumlah data pada kolom dengan
χ2=

jumlah data pada baris kemudian dibagi dengan jumlah total data. Rumus
untuk menghitung fh adalah sebagai berikut:
f h=nc x nr
nt
Dimana:
fh = frekuensi harapan
nc = jumlah kolom
nb = jumlah baris
nt = jumlah total data
5) Bila distribusi sampel berasal dari satu populasi maka uji yang sesuai
adalah chi kuadrat. Dalam hal ini nilai harapan diperoleh dari proporsi
distribusi populasi dan mempunyai db= r-1 atau c-1
6) Bila ingin mengetahui asosiasi atau korelasi diantara dua variabel dari data
kualitatif, maka lakukan uji chi kuadrat dulu. Jika dalam pengujian, ho
ditolak maka dapat dilanjutkan dengan menghitung koefisien kontingensi
dengan rumus:
Rumus 2:
C = √ χ 2
χ 2+N
Dimana: N = jumlah sampel (sampel size)
C = koefisien kontingensi dengan C selalu lebih dari nol.
7) Distribusi sampling chi kuadrat akan sesuai dengan distribusi teoritis chi
kuadrat bila: frekuensi harapan setiap sel tidak boleh kurang dari satu, dan
banyaknya sel yang mempunyai frekuensi harapan kurang dari 5 (fh < 5)
tidak boleh lebih dari atau sama dengan 20% dari jumlah sel seluruhnya.
8) Jika tidak sesuai dengan ketentuan diatas, kategori-kategori tertentu yang
sesuai digabung. Sehingga jumlah sel lebih sedikit dan frekuensi harapan
baru memenuhi syarat. Penggabungan ini menyebabkan sel dalam tabel
menjadi 2x2 dan bila masih tidak memenuhi syarat maka uji statistik yang
digunakan adalah fisher’s exact test.

9) Untuk db =1 diperlukan koreksi yang disebut koreksi yates. Besarnya
koreksi itu ialah 0,5 hingga rumus itu menjadi :
a. Rumus 3:
b.χ
c2=Σ
(|f o−f h|−0,5)2
f h
atau χ2=N (|ad-bc|− N
2)2
m1 .m2.n1 .n2
10) Pada umumnya chi kuadrat hanya dapat digunakan untuk uji independensi
antar faktor pada satu sampel dengan faktor yang bersifat bebas
(independent). Chi kuadrat tidak dapat dipergunakan pada sampel korelasi
atau correlated sample (misal rancangan penelitian sebelum-sesudah pada
data kualitatif) dan dalam hal ini harus menggunakan McNemar symetri
chi square test.
C. DERAJAD KEBEBASAN UNTUK CHI-KWADRAD
Derajat kebebasan atau d.b. untuk nilai-nilai x2 tidak tergantung kepada
jumlah individu dalam sampel. Derajad kebebasan itu diperoleh dari kenyataan
berapa banyaknya kebebasan yang kita miliki dalam menetapkan isi petak-petak
yang diharapkan dalam tabel kita. Untuk mengerti ini kita periksa tabel berikut:
Kategori fo fh
I
II
A m
B n
Jumlah (a+b) (m+n)
Sudah dinyatakan bahwa dalam mengerjakan chi-kwadrad kita terikat oleh
suatu syarat, yaitu jumlah frekwensi yang diperoleh harus sama dengan jumlah
frekwensi yang diharapkan. Atau dalam skema di atas (a+b) harus sama dengan
(m+n). Oleh sebab itu kita tidak mempunyai kebebasan lagi untuk menetapkan
jumlah frekwensi yang diharapkan, yaitu (m+n). Jadi derajat kebebasan yang kita
miliki dalam mengisi petak-petak fh tinggal lagi satu, yaitu kebebasan dalam
menetapkan m, atau dalam menetapkan n.
Dengan d.b =1 kita periksa table. Bilamana kita sudah menetapkan salah satu
taraf signifikasi, katakana 5%, maka ketentuannya yaitu jika x02 ≥ xh
2 5%, nilai

chi-kuadrat yang kita peroleh, atau x2 itu kita katakana signifikan, dan sebagai
konsekwensinya hipotesa (nihil) akan kita tolak. Sebaliknya jika x02 ¿ xh
2 5% nilai
x02 itu akan kita katakan nonsignifikan, dan sebagai konsekwensinya hipotesa
(nihil) akan kita terima (ketentuan semacam itu berlaku untuk semua pengetesan
hipotesa nihil; perhatikan betul-betul bahwa ketentuan itu berlaku juga untuk
pengetesan nilai-t dan nilai-r).
Nilai x02 = 4,50, sedang dengan taraf signifikansi 5% dengan d.b. = 1 nilai xh
2 =
3,841. Dengan demikian x02 itu signifikan, karena ia sudah melebihi xh
2 yang kita
pandang sebagai bilangan x2 maksimal sebagai akibat dari kesalahan sampling
atas dasar taraf signifikasi 5%. Konsekwensinya, jika kita yakin bahwa sarat
sampel random telah kita penuhi, maka kita tolak hipotesa nihil yang mengatakan
bahwa setengah dari populasi setuju koedukasi dan setengahnya lagi tidak setuju
adalah kurang mungkin jika kita memperoleh nilai x2 sebesar 4,50 dari
perbandingan pro dan kontra koedukasi sebesar 115:85 dari sampel yang kita
ambil secara random bila mana 50:50 dari populasi pro dan kontra. Dengan kata
lain, harapan bahwa setengah-setengah dari jumlah populasi akan pro dan kontra
koedukasi tidak dapat kita terima atas dasar bahan-bahan yang kita kumpulkan
dari random sampel.
Akan tetapi jika kita periksa kembali tabel diatas, ternyata bilamana kita
menggunakan taraf signifikansi 12
%, hipotesa nihil akan kita terima. Nilai x2 =
4,50 sedangkan nilai x021% = 6,635. Ini berarti bahwa nilai x2 sebesar atau lebih
besar dari 6,635 yang terjadi hanya 1% dari seluruh kejadianlah yang kita pandang
sebagai batas penerima nilai x2 yang kita peroleh karena kesalahan sampling. Oleh
karena itu hipotesa nihil yang ditetapkan semula, kita terima atas dasar taraf
signifikasi 1%. Dengan kata lain, kita mengharapkan bahwa jika dilakukan
pemungutan suara secara meluas, hasilnya akan 50% pro dan 50% kontra
koedukasi.
Contoh:
Suatu perusahaan penggorengan kopi ingin menetapkan apakah masyarakat
lebih senang kopi cap “anjing” (yang digoreng dengan suatu cara) atau cap
“kucing” (yang digoreng dengan cara lain) yang diproduksi oleh perusahaannya.

Perusahaan itu kemudian “menyewa” seorang penyelidik untuk member
laporannya tentang kesenangan masyarakat itu untuk menetapkan kopi cap apa
yang harus diproduksi secara besar-besaran tahun depan. Hasil penyelidikan
terhadap suatu sampel random yang terdiri dari 400 orang konsumen kopi
perusahaan itu terlihat dalam tabel sebagai berikut:
TABEL 2
FREKWENSI YANG DIPEROLEH DAN YANG DIHARAPKANDARI 400
ORANG PEMINUM KOPI PERUSAHAAN ALPHA
Pilihan fo fh
Cap anjing
Cap kucing
240
160
200
200
Total 400 400
Untuk mengadakan estimasi tentang keadaan populasi dipakai hipotesa bahwa
setengah dari konsumen minum kopi cap anjing, dan setengah dari konsumen
meminum kopi cap kucing. Bilamana bahan-bahan itu kita masukkan dalam tabel
kerja, maka hasilnya akan sebagai berikut:
Pilihan fo fh fo - fh (fo - fh)2( f o−f h)2
f h
Cap anjing
Cap kucing
240
160
200
200
+40
-40
1.600
1.600
8,00
8,00
Total 400 400 0 - 16,00
Jadi x2=∑ ( fo−f h ) 2f h t
= 16,00
Derajat kebebasan untuk ini adalah satu (diperoleh dengan cara seperti
tersebut dalam contoh pertama). Nilai x2 yang diharapkan sebagai batas kesalahan
sampling dengan taraf signifikasi 5% adalah 3, 841, dengan taraf signifikasi 1%
adalah 6,635. Ternyata bahwa nilai x2 yang kita peroleh dari random sampel itu
jauh di atas batas signifikansi 5% maupun 1%. Dengan demikian hipotesa nihil
ditolak: dapat diharapkan ada perbedaan yang signifikan dalam populasi antara

frekwensi peminum kopi cap anjing dengan frekwensi peminum kopi cap kucing.
Apa saran penyelidik itu kepada perusahaan kiranya sudah jelas : produksi lebih
banyak kopi cap anjing dari pada kopi cap kucing.
D. BENTUK DISTRIBUSI CHI KUADRAT (Χ²)
Nilai χ² adalah nilai kuadrat, karena itu nilai χ² selalu positif. Bentuk
distribusi χ² tergantung dari derajat bebas(db) atau degree of freedom.
Contoh :
1. Berapa nilai χ² untuk db = 5 dengan α = 0.010? (15.0863)
2. Berapa nilai χ² untuk db = 17 dengan α = 0.005? (35.7185)
Pengertian α pada Uji χ² sama dengan pengujian hipotesis yang lain, yaitu
luas daerah penolakan H0 atau taraf nyata pengujian
Perhatikan gambar berikut :
Pengunaan Uji χ²
Uji χ² dapat digunakan untuk :
a. Uji Kecocokan = Uji kebaikan-suai = Goodness of fit test
b. Uji Kebebasan
c. Uji beberapa proporsi

Dalam beberapa uji χ² diatas, prinsip pengerjaan uji kebebasan dan uji
beberapa proporsi bias dikatakan sama.
1. Uji Kecocokan (Goodness of fit test)
1.1. Penetapan Hipotesis Awal dan Hipotesis Alternatif
Dalam uji kecocokan kita mengenal istilah H0 dan H1. H0
merupakan frekuensi setiap kategori memenuhi suatu nilai atau
perbandingan, sedangkan H1 merupakan frekuensi dimana ada kategori
yang tidak memenuhi nilai/perbandingan tersebut.
Contoh 1 :
Pelemparan dadu 120 kali, kita akan menguji kesetimbangan dadu .
Dadu setimbang jika setiap sisi dadu akan muncul 20 kali.
H0 : setiap sisi akan muncul = 20 kali.
H1 : ada sisi yang muncul ≠20 kali.
Contoh 2 :
Sebuah mesin pencampur adonan es krim akan menghasilkan
perbandingan antara Coklat : Gula : Susu : Krim = 5 : 2 : 2 : 1
H0 : perbandingan Coklat : Gula : Susu : Krim = 5 : 2 : 2 : 1
H1 : perbandingan Coklat : Gula : Susu : Krim ≠ 5 : 2 : 2 : 1
1.2. Rumus χ²
Keterangan:
k : banyaknya kategori/sel, 1,2 ... k
o : frekuensi observasi untuk kategori ke-i i
e : frekuensi ekspektasi untuk kategori ke-i i
kaitkan dengan frekuensi ekspektasi dengan
nilai/perbandingan dalam H0
Derajat Bebas (db) = k – 1
1.3 Perhitungan χ²
Contoh 3 :

Pelemparan dadu sebanyak 120 kali menghasilkan data sebagai berikut :
Kategori Sisi-1 Sisi-2 Sisi-3 Sisi-4 Sisi-5 Sisi-6
Frekuensi
ekspetasi (e)
20
20
20
22
20
17
20
18
20
19
20
20
22
*) Nilai dalam kotak kecil adalah frekuensi ekspektasi
Apakah dadu itu dapat dikatakan setimbang?
Lakukan pengujian dengan taraf nyata = 5 %
Solusi :
1. H0 : Dadu setimbang → semua sisi akan muncul = 20 kali.
H1 : Dadu tidak setimbang → ada sisi yang muncul ≠20 kali.
2. Statistik Uji χ²
3. Nilai α = 5 % = 0.05
k = 6 ; db = k - 1 = 6-1 = 5
4. Nilai Tabel χ²
k = 6 ; db = k - 1 = 6-1 = 5
db = 5;α = 0.05 → χ² tabel = 11.0705
5. Wilayah Kritis = Penolakan H0 jika χ² hitung > χ² tabel (db; α)
χ² hitung > 11.0705
6. Perhitungan χ²
(catatan : Gunakan tabel seperti ini agar pengerjaan lebih
sistematik)
χ² hitung = 1.70

7. Kesimpulan :
χ² hitung = 1.70 < χ² tabel
Nilai χ² hitung ada di daerah penerimaan H0
H0 diterima; pernyataan dadu setimbang dapat diterima.
Contoh 4 :
Sebuah mesin pencampur adonan es krim akan menghasilkan
perbandingan antara Coklat : Gula : Susu : Krim = 5 : 2 : 2 : 1. Jika 500
kg adonan yang dihasilkan, diketahui mengandung 275 kg Coklat, 95 kg
Gula, 70 kg Susu dan 60 kg Krim, apakah mesin itu bekerja sesuai
dengan perbandingan yang telah ditentukan? Lakukan pengujian dengan
taraf nyata = 1 %.
Solusi :
1. H0 : perbandingan Coklat : Gula : Susu : Krim = 5 : 2 : 2 : 1
H1 : perbandingan Coklat : Gula : Susu : Krim ≠ 5 : 2 : 2 : 1
2. Statistik Uji χ²
3. Nilai α = 1 % = 0.01
4. Nilai Tabel χ²
k = 4; db =k -1 = 4-1= 3
db = 3; α = 0.01 → χ² tabel = 11.3449
5. Wilayah Kritis = Penolakan H0 jika χ² hitung > χ² tabel (db; α)
χ² hitung > 11.3449
6. Perhitungan χ²
*) Perbandingan Coklat : Gula : Susu : Krim = 5 : 2 : 2 :1
Dari 500 kg adonan → Nilai ekspektasi Coklat = 5/10 x 500 = 250 kg

Nilai ekspektasi Gula = 2/10 x 500 = 100 kg
Nilai ekspektasi Susu = 2/10 x 500 = 100 kg
Nilai ekspektasi Krim = 1/10 x 500 = 50 kg
χ² hitung = 13.75
7. Kesimpulan :
χ² hitung > χ² tabel ( 13.75 > 11.3449)
H0 ditolak, H1 diterima.
Perbandingan Coklat : Gula : Susu : Krim ≠ 5 : 2 : 2 :1
2. Uji Kebebasan dan Uji Beberapa Proporsi
Uji kebebasan antara 2 variabel memiliki prinsip pengerjaan yang sama
dengan pengujian beberapa proporsi.
(Berbeda hanya pada penetapan Hipotesis awal dan hipotesis alternatif)
2.1 Penetapan Hipotesis Awal dan Hipotesis Alternatif
A. Uji Kebebasan :
H0 : variabel-variabel saling bebas
H1 : variabel-variabel tidak saling bebas
B Uji Beberapa Proporsi :
H0 : setiap proporsi bernilai sama
H1 : ada proporsi yang bernilai tidak sama
2.2 Rumus Uji χ2
Data dalam pengujian ketergantungan dan beberapa proporsi disajikan
dalam bentuk Tabel Kontingensi.
Bentuk umum Tabel Kontingensi → berukuran r baris x k kolom
Frekuensi harapan ¿( totalkolol )(total baris)
total observasi
Keterangan:
derajat bebas = (r-1)(k-1)

r : banyak baris
k : banyak kolom
o: frekuensi observasi baris ke-i, kolom ke-j ij,
e : frekuensi ekspektasi baris ke-i, kolom ke-j
Perhitungan χ²
Contoh 5 :
Kita akan menguji kebebasan antara faktor gender (jenis kelamin) dengan
jam kerja di suatu pabrik. Tabel kontingensi dapat dibuat sebagai
berikut :
Pria wanita Total baris
Kurang dari 25
Jam/minggu
2,33
2
2,67
3 5
25 sampai 50
Jam/minggu
6,07
7
6,93
6 13
Lebih dari 50
Jam/minggu
5.60
5
6.40
7 12
Total Kolom
14 16
Total
Observasi =
30
*) Nilai dalam kotak kecil adalah frekuensi ekspektasi
Apakah ada kaitan antara gender dengan jam kerja?
Lakukan pengujian kebebasan variabel dengan taraf uji 5 %
Ukuran Tabel Kontingensi di atas = 3 x 2 ( 3 baris dan 2 kolom)
db = (3-1)(2-1) = 2 x 1 = 2
Solusi :
1. H0 : Gender dan Jam kerja saling bebas
H1 : Gender dan Jam kerja tidak saling bebas
2. Statistik Uji = χ²
3. Nilai α = 5 % = 0.05
4. Nilai Tabel χ² d.b = 2; α = 0.05 → χ² tabel = 5.99147

5. Wilayah Kritis : Penolakan H0 → χ² hitung > χ² tabel
χ² hitung > 5.99147
6. Perhitungan χ²
Frekuensi harapan ¿( totalkolol )(total baris)
total observasi
frekuensi harapan untuk :
pria, < 25 jam = 14 ×5
30 = 2,33 pria, 25-50 jam = 14 ×13
30 =
6,07
pria, > 50 jam = 14 x12
30 = 5,60
wanita, < 25 jam = 16 x5
30 = 2,67 . wanita, 25-50 jam =
16 x1330
= 6.93
wanita, > 50 jam = 16 x12
30 = 6,40
Selesaikan Tabel perhitungan χ² di bawah ini.
7. Kesimpulan
χ² hitung < χ² tabel (0.4755 < 5.99147)
χ² hitung ada di daerah penerimaan H0
H0 diterima, gender dan jam kerja saling bebas
Catatan : Kesimpulan hanya menyangkut kebebasan antar variabel dan
bukan hubungan sebab-akibat (hubungan kausal)
Contoh 6 :

Berikut adalah data proporsi penyiaran film(satuan pengukuran dalam
persentase (%) jam siaran TV) di 3 stasiun TV. Apakah proporsi
pemutaran Film India, Kungfu dan Latin di ketiga stasiun Tv tersebut
sama? Lakukan Pengujian proporsi dengan Taraf Nyata = 2.5 %
ATV(%) BTV(%) CTV(%) Total Baris (%)
Kurang dari 25
Jam/minggu
4,17
4,5
2,92
3,5 2,0
10
25 sampai 50
Jam/minggu
3,33
2,5
2,33
1,0
2,33
4,5
8
Lebih dari 50
Jam/minggu
2,50
3,0
1,75
2,5
1,75
0,5
6
Total Kolom
10 7 7
Total Observasi(%)=
24
*) Nilai dalam kotak kecil adalah frekuensi ekspektasi
Ukuran Tabel Kontingensi di atas = 3 x 3( 3 baris dan 3 kolom)
db = (3-1)(3-1) = 2 x 2 = 4
Solusi :
1. H0 : Proporsi pemutaran film India, Kungfu dan Latin di ketiga
stasiun
TV adalah sama.
H1 : Ada proporsi pemutaran film India, Kunfu dan Latin di ketiga
stasiun TV yang tidak sama.
2. Statistik Uji = χ²
3. Nilai α = 2.5 % = 0.025
4. Nilai Tabel χ² db = 4; α = 0.025 → χ² tabel = 11.1433
5. Wilayah Kritis : Penolakan H0 → χ² hitung > χ² tabel
χ² hitung > 11.1433
6. Perhitungan χ²

frekuensi harapan untuk
India, ATV = 10 x 10
24 = 4,17 Kungfu, ATV =
10 x 824
=
3,33
Latin, ATV = 10 x 6
24 = 2,50
India, BTV = 7 x10
24 = 2,92 Kungfu,BTV =
7 x824
= 2.33
Latin,BTV = 7 x624
= 1,75
India,CTV = 7 x10
24 = 2,92 Kungfu,CTV =
7 x824
= 2.33
Latin,CTV = 7 x624
= 1,75
Tabel perhitungan χ² berikut
7. Kesimpulan :
χ² hitung terletak di daerah penerimaan H0.

H0 diterima, proporsi pemutaran ketiga jenis film di ketiga s
stasiun TV adalah sama
CHI KWADRAD SEBAGAI ALAT UNTUK ESTIMASI
Dengan menggunakan chi kwadrat kita dapat menggunakan pernilaian
probabilitas perbedaan frekwensi dalam sampel dari frekwensi dalam populasi
sebagai akibat dari kesalahan sampling. Adapun frekwensi dalam populasi itu
dapat didasarkan atas informasi yang diperoleh dari suatu sumber, atau dpat juga
didasasrkan atas suatu hipotesa. Dalam contoh di atas, kalau tidak ada sumber-
sumber lain yang member ketentuan, kita mengjukan hipotesa bahwa dalam
populasi frekwensi dari mereka yang pro dan kontra koedukasi terbagi rata (50%
lawan 50%). Kita menanyakan, mengapa kita peroleh perbandingan 115 dengan
85 antara mereka yang pro dan yang kontra dari suatu sampel yang kita ambil
secara random? Apakah perbedaan itu hanya semata-mata disebabkan oleh
kesalahan sampling, ataukah memang dalam populasi terdapat perbedaan
semacam itu?
Kalau kita mengharapkan frekwensi dari mereka yang pro dan yang kontra
terbagi rata, maka frekwensi yang diharapkan adalah yang pro 100 orang dan
yang kontra 100 orang, dalam sampel yang jumlahnya 200 orang itu, frekwensi
yang diperoleh (disingkat fo) dan yang frekwensi yang diharapkan (disingkat fh)
dari mereka yang pro dan yang kontra dapat ditunjukkan dalam tabel sebagai
berikut.
Tabel 1
FREKWENSI YANG DIPEROLEH DAN YANG DIHARAPKAN DARI
SUATU SAMPEL YANG TERDIRI ATAS 200 ORANG PENDUDUK
Sikap terhadap ke-
edukasi
Frekwensi yang diperoleh (fo-
)
Frekwensi yang
diharapkan (fh)
Pro 115 100
Kontra 85 100
total 200 200
Dalam membuat tabel untuk mengerjakan chi-kwadrad kita terikat pada suatu
ketentuan yang harus kita perhatikan, yaitu bahwa jumlah fo harus sama dengan

jumlah fh. dalam tabel di atas ketentuan ini telah kita perhatikan yaitu masing-
masing fo=200 dan fh=200.
Untuk memeriksa tabel 1.1 kita dapat melihat bahwa ada perbedaan fo dengan
fh. makin besar perbedaan semacam itu makin kecil probabilitasnya
(kemungkinannya) bahwa perbedaan itu semata-mata disebabkan oleh kesalahan
sampling.
RUMUS BANGUN UNTUK CHI-KWADRAD
Rumus bangun yang umum untuk chi-kwadrad adalah sebagai berikut:
x2=∑ (fo−f h ) 2f h t
+ foft
χ2 = chi kwadrad
fo = frekwensi yang diperoleh dari (diobservasi dalam) sampel.
fh = frekwensi yang diharapkan dalam sampel sebagai pencerminan dari
frekwensi yang diharapkan dalam populasi.
Untuk member penjelassan tentang bagaimana menggunakan rumus itu,
marilah kita buat tabel persiapan perhitungan chi-kwadrad.
Sikap fo fh fo - fh (fo - fh)2( f o−f h)2
f h
Pro
Kontra
115
85
100
100
+15
-15
225
225
2,25
2,25
total 200 200 0 - 4,50
Dari perhitungan-perhitungan dalam tabel itu pada lajur yang terakhir kita
dapat dengan mudah mengisi rumusnya.
x2=∑ (fo−f h ) 2f h t
= 4,50
Jadi dengan hipotesa 50-50, yaitu 50% pro dan 50% kontra, kita memperoleh
nilai : x2 = 4,50
Apa artinya angka 4,50 ini?

Interpretasi tentang nilai x2 pada dasarnya tidak berbeda dengan interpretasi
tentang nilai-t. Disini kita ingin mengadakan estimasi tentang populasi dari
kenyataan yang kita peroleh dari sampel yang kita pilih secara random. Kita
mengajukan hipotesa bahwa populasi tidak berbeda dengan sampel dalam jumlah
frekwensi dalam dua kategori penyelidikan, yaitu kategori pro dan kontra
koedukasi atau dinyatakan dalam bentuk hipotesa nihil : “tidak ada perbedaab
frekwensi dari yang pro dan yang kontrakoedukasi antara sampel dan populasi.”
Kita menanyakan bagaimana probabiloitas x2 yang sebesar atau lebih besar dari
nilai yang kita peroleh itu disebabkan oleh kesalahan sampling kita? Bilamana
nilai x2 yang kita peroleh itu terjadinya hanya 5% atau 1% dari seluruh kejadian,
maka kita tolak hipotesa atas dasar taraf signifikasi 5% dan 1%.
Untuk menilai frekwensi yang diperoleh, kita memerlukan suatu tabel yang
memuat distribusi x2 yang diharapkan. Tabel semacam ini disediakan di bagian
belakang , yang disebut tabel chi-kwadrad. Tabel ini hanya memuat nilai-nilai chi-
kwadrad dengan derajad kebebasan dari 1 sampai dengan 30 dengan berbagai
taraf signifikan. Tidak seperti nilai r dan nilai t, nilai x2 selalu makin meningkat
bersamaan dengan meningkatnya derajad kebebasan.
TABEL DENGAN BANYAK SEL
Chi kuadrat tidak hanya terbatas untuk mengetes hipotesa perbedaan frekuensi
antaradua kelompok dengan dua kategori (tabel 2x2 atau tabel 4 petak), melainkan
juga dapat digunakan untuk mengetes hipotesa perbedaan frekuensi antara banyak
kelompok dengan beberapa kategori. Cara menghitungnya pada dasarnya sama.
Demikian juga dalam menetapkan derajat kebebasannya.
D.b. diperoleh dari rumus:
d.b. = (baris - 1) (kolom - 1)
Jadi, dengan tabel 3x2 (tiga baris dua kolom) d.b.nya ada (3-1) (2-1) = 2.
Demikian juga dalam tabel 2x3 . (dua baris tiga kolom) d.b. nya= 2. Dalam tabel
3x3 d.b. nya = (3-1) (3-1)= 4, dan dalam tabel 2x5 d.b.nya= 1x4= 4.
Berikut contoh-contoh penggunaan chi kuadrat pada pengetesan hipotesa terhadap
lebih dari dua sampel dan menyangkut lebih dari dua kategori. Suatu penyelidikan

tentang pendapat rakyat telah dilakukan dengan angket. Pertanyaannya adalah:
“Apakah pada waktu ini keluarga anda lebih makmur, sama saja, atau kurang
makmur dari pada dua tahun yang lalu?” Hasil penyelidikan tercantum dalam
tabel di halaman berikut. Yang diselidiki semuanya ada 5.000 keluarga dari
empat golongan kelas sosial ekonomi. Kelas A adalah kelas yang paling makmur,
sedang kelas D adalah kelas yang paling kurang makmur. Jawaban mereka
diklasifikasikan dalam empat golongan, yaitu”lebih”, “sama saja”, “kurang”, dan
“tidak dapat menentukan”.
Namun, dalam hal ini, rumus untuk menghitung χ2 dalam tabel 2x2 sperti
penjelasan di atas tidad dapat digunakan. Ada rumus lain yang lebih praktis
digunakan dalam kasus ini dan tidak menghabiskan banyak waktu. Namun, bila
tidak ada alat hitung yang cukup besar, rumus ini justru menjadi tidak praktis
sama sekali. Oleh karena itu, kita harus puas dengan menggunakan rumus aslinya,
yaitu:
χ2=Σ( f o−f h)
2
f h
Cara mengisi sel f h , yaitu pertama, jumlahkan tiap-tiap kategori. Kemudian,
jumlahkan frekuensi dalam tiap-tiap golongan subskrip sampel. Akhirnya setelah
diketahui N-nya, masukkan bilangan-bilangan itu ke dalam rumus sebagai berikut:
f h=(Jumlah kategori ) (Jumlah golongan )
Total Jendral
Atau dapat disingkat dengan:
f h=(nk ) (ng )
N
Untuk penyelesaian contoh soal di atas bisa dengan bantuan membuat tabel f o dan
tabelf hsecara terpisah lalu memasukkan semua hasil perhitungannyake dalam
tabel kerja yang sesungguhnya. Berikut tabel f o dan tabelf h.
Tabel 1.
f o Golongan (sub sampel) Jumlah
Kategori
Respon A B C D
Lebih 115 375 460 250 1.200

makmur
Sama saja 245 690 920 440 2.295
Kurang
makmur
125 375 540 270 1.310
Tidak
tentukan
25 60 80 40 195
Jumlah
golongan
500 1.500 2.000 1.000 5.00
Tabel 2
f h Golongan (subsampel) Jumlah
Kategorirespon A B C D
Lebih
makmur
120 1.200
Sama saja 668,5 2.295
Kurang
makmur
1.310
Tak
tentukan
78 39 195
Jumlah
golongan
500 1.500 2.000 1.000 5.000
Bilangan-bilangan seperti terdapat dalam tabel 2 di atas diperoleh dengan rumus
f h, yang cara mengerjakannya sebagai berikut:
Untuk kelas A kategori “lebih makmur” : (1.200 ) (500 )
5.000 = 120.
Untuk kelas B kategori “sama saja” : (2.295 ) (1.500 )
5.000 = 688,5.
Untuk kelas C kategori “tak tentukan” : (195 ) (2.000 )
5.000=78.
Untuk kelas D kategori “tak tentukan” : (195 ) (1.000 )
5.000=39.

Dengan cara yang sama sel-sel f h yang lainnya dapat diisi dan memasukkannya
dalam tabel kerja yang sesungguhnya (lihat tabel di bawah).
Tabel 3. Tabel Cerja untuk ContohMengerjakan Chi Kuadrat dari Banyak Sampel
(Bahan dari Tabel 1 dan 2)
Gol Sos-Ek.
Kategori
jawaban
f o f h f o−f h ( f ¿¿o−1h)2 ¿ ( f o−f h)
2
f h
Kelas A
Lebih
makmur
Sama saja
Kurang
makmur
Tak tentukan
115
245
125
15
120,0
229,5
131,0
19,5
-5,0
+15,5
-6,0
-4,5
25,00
240,25
36,00
20,25
0,208
1,047
0,275
1,038
Jumlah
Golongan:
500 500 0,0 - 2,568
Kelas B
Lebih
makmur
Sama saja
Kurang
makmur
Tak tentukan
375
690
375
60
360,0
688,5
393,0
58,5
+15,0
+1,5
-18,0
+1,5
225,00
2,25
324,00
2,25
0,625
0,003
0,824
0,038
Jumlah
Golongan:
1500 1500 0,0 - 1,490
Kelas C
Lebih
makmur
Sama saja
Kurang
makmur
Tak tentukan
460
920
540
80
480,0
918,0
524,0
78,0
-20
+ 2,0
+16,0
+2,0
400,00
4,00
256,00
4,00
0,833
0,004
0,489
0,051

Jumlah
Golongan:
2000 2000 0,0 - 1,377
Kelas D
Lebih
makmur
Sama saja
Kurang
makmur
Tak tentukan
150
440
270
40
240,0
459,0
262,0
39,0
+10,0
-19,0
+8,0
+1,0
100,00
361,00
64,00
1,00
0,417
0,786
0,244
0,026
Jumlah
Golongan:
1000 1000 0,0 - 1,473
Total Jendral: 5000 5000 0,0 χ2=6,908
Seperti terlihat dalam tabel 3 di atas, dalam kolom yang terakhir nilai χ2 yang
diperoleh adalah 6,908. Derajat kebebasan dari bahan itu dapat diperoleh dengan
mengingat banyaknya sampel (mewakili kolom dalam tabel kontingensi) dan
banyaknya kategori (mewakili baris dalam tabel kontingensi). Seperti yang
diketahui, sampel ada sebanyak empat sampel (sub-sampel), yitu sampel-ssampel
kelas A, B, C, dan D. Jadi jumlah kolomnya = 4. Kategori yang digunakan
jumlahnya juga 4. Jadi, ada 4 baris. Dengan demikian, d.b. dari tabel itu adalah (4-
1) (4-1) = (3) (3) = 9.
Dengan d.b. = 9 itu tabel tersebut menunjukkan bahwa nilai χ2 = 6,908 yang
diperoleh itu masih jauh berada di bawah batas kemungkinan kesalahan teoritik,
yaitu 16,919 pada taraf signifikansi 5% dan 21,666 pada taraf signfikansi 1%.
Dengan demikian, dapat disimpulkan bahwa keempat kelas sosial ekonomi itu
tidak menunjukkan perbedaan yang signifikan dalam frekuensi jawaban mereka
terhadap pertanyaan yang diajukan kepada mereka.
Contoh Soal:
Suatu penyelidikan hipotetik dilakukan terhadap anak-anak dari SMP, SMA, dan
mahasiswa-mahasiswa di Universitas tentang kesukaan mereka membaca buku-
buku. Pertanyaan yang diajukan adalah: “Buku bacaan apa yang paling disenangi:
petualangan, percintaan, keajaiban, atau buku-buku ilmiah?”. Jumlah orang yang

diselidiki adalah 350 orang. Hasil-hasil yang yang dikumpulkan disusun dalam
tabel berikut:
Tabel 4. Tabel Frekuensi yang Diperoleh
Sampel Buku kesenangan Total
Petualangan Percintaan Keajaiban Ilmiah
SMP 24 19 36 46 125
SMA 41 26 20 38 125
Universitas 35 22 23 20 100
Total 100 67 79 104 350
Frekuensi yang diharapkan dapat diperoleh dengan rumus:
f h=(nk ) (ng )
N
Dengan rumus itu, akan diperoleh frekuensi-frekuensi yang diharapkan seperti
berikut:
Tabel 5. Tabel Frekuensi yang Diharapkan
Sampel Buku kesenangan Total
Petualangan Percintaan Keajaiban Ilmiah
SMP 35,71 23,93 28,22 37,14 125
SMA 35,71 23,93 28,22 37,14 125
Universitas 35,71 19,14 22,56 29,72 100
Total 100,00 67,00 79,00 104,00 350
Dengan f o dan f h yang telah diperoleh, dapat dibuat tabel kerja seperti berikut:
Tabel 6. Tabel Kerja untuk Mencari Chi Kuadrat dari Bahan-bahan dalam Tabel 4
dan 5.
Sampel
Kategori
f o f h f o−f h ( f ¿¿o−1h)2 ¿ ( f o−f h)
2
f h
SMP
Petualangan
Percintaan
24
19
35,71
23,93
-11,71
-4,93
137,1241
24,3049
3,8399
1,0157

Keajaiban
Ilmiah
36
46
28,22
37,14
+7,78
+8,86
60,5284
78,4996
2,1449
2,1136
Jumlah
Golongan:
125 125,00 0,00 - 9,1141
SMA
Petualangan
Percintaan
Keajaiban
Ilmiah
41
26
20
38
35,71
23,93
28,22
37,14
+5,29
+2,07
-8,22
+0,86
27,9841
4,2849
67,5684
0,7396
0,7836
0,1791
2,3943
0,0199
Jumlah
Golongan:
125 125,00 0,0 - 3,3769
Universitas
Petualangan
Percintaan
Keajaiban
Ilmiah
35
22
23
20
28,58
19,14
22,56
29,72
+6,42
+2,86
+0,44
-9,72
41,2164
8,1796
0,1936
94,4784
1,4421
0,4274
0,0086
3,1790
Jumlah
Golongan:
100 100,00 0,0 - 5,0571
Total Jendral: 350 350,00 0,0 χ2=17,5481
Derajat kebebasan dari tabel itu adalah (3-1) (4-1) = 6. Ternyata nilai χ2 yang
diperoleh itu melewati nilai batas teoritik atas dasar taraf signifikansi 1%, yaitu
16,812. Kesimpulannya adalah: ketika kelompok itu berbeda secara signifikan
dalam pemilihan buku-buku bacaanseperti yang ditunjukkan oleh hasil angket itu.
CHI KWADRAD SEBAGAI ALAT MENGETES SIGNIFIKANSI
KORELASI
Teknik statistic digunakan untuk hal-hal sebagai berikut.
1) Chi kwadrad adalah alat untuk mengadakan estimasi. Sebagai alat estimasi
chi kwadrad digunakan untuk menaksir apakah ada perbedaan yang
signifikan ataukah tidak antara frekuensi yang diobservasi dalam sample
dengan frekuensi yang diharapkan dalam populasi. Frekuensi yang

diharapkan dalam populasi ini kadang-kadang disebut juga frekuensi
hipotetik, karena ia digunakan sebagai hipotesa yang akan diuji dengan
frekuensi yang diperoleh dari sample. Oleh karena itu dalam pengertian
yang longgar chi kwadwrad sebagai alat estimasi diberi kedudukan juga
sebagai alat pengetesan hipotesa.
2) Chi kwadrad sebagai alat mengetes hipotesa. Dalam pengertian yang
sempit tiap-tiap pengetesan hipotesa harus membandingkan sedikitnya dua
sample. Karena itu dalam kedudukannya sebagai alat pengetesan hipotesa
ini apa yang ingin dijawab olehnya adalah masalah apakah frekuensi yang
diperoleh dalam sample yang satu berbeda secara signifikan ataukah tidak
dengan sample lainnya dalam kategori-kategori tertentu, seandainya
penyelidikan dilakukan terus-menerus dengan sample-sampel yang sama.
Hipotesa nihil yang hendak dites di sini adalah bahwa tidak ada perbedaan
yang signifikan di antara frekuensi yang diperoleh atau fo dengan frekuensi
yang diharapkan atau fh
3) Kecuali sebagai alat mengetes hipotesa perbedaan frekuensi, chi kuadrad
juga merupakan alat untuk mengetes hipotesa tentang ada tidaknya
korelasi antara dua dibicarakan di atas, ketiga kelompok subjek yang
berbeda tingkatan pendidikannya, yaitu SMP, SMA, dan Universitas,
berbeda secara signifikan dalam pemilihan buku-buku bacaan. Sebenarnya
kesimpulan itu dapat dibyatakan dengan cara lain, yaitu bahwa ada
korelasi yang signifikan antara tingkatan pendidikan dengan pilihan buku-
buku bacaan.
Adanya korelasi itu menunjukkan bahwa tingkatan pendidikan tertentu
menunjukkan kecenderungan tertentu dalam memilih buku-buku bacaan.
Dari pembicaraan di atas dapat ditarik kesimpulan bahwa sebenarnya
hipotesa yang hendak dites dengan chi kwadrad dapat dinyatkan dalm dua bentuk.
Pertama, dalam bentuk perbedaan frekuensi. Hipotesa secara umum
berbunyi: frekuensi-frekuensi yang diperoleh dalam sample-sampel yang
diselidiki tidak berbeda secara signifikan dengan frekuensi-frekuensi yang
diharapkan dalam populasi dalam kategori-kategori tertentu.

Kedua, dalam bentuk korelasi. Hipotesanya berbunyi : tidak ada korelasi
antara kolom dan baris.
CHI KWADRAD DENGAN DERAJAT KEBEBASAN LEBIH DARI 30
Akhirnya perlu dilengkapkan pembicaraan ini dengan kemungkinan menghadapi
perhitungan chi kwadrad dengan derajat kebebasan yang lebih besar dari 30.
Rumus untuk menghitung nilai probabilitas nilai chi kwadrad yang diperoleh
dengan kurve normal adalah sebagai berikut.
xSD
=√2 x2−√2(db )−1
Dimana:
χ2 = nilai chi kwadrad yang kita peroleh.
db = derajat kebebasan dari table kontingensi kita.
jadi misalnya kalau kita memperoleh nilai χ2 sebesar 81,50 tabel kontingensi
26x3, maka
xSD
=√2(81 , 50)−√2(50 )−1
=√163 , 00−√99=12 , 7671−9 , 9499=2 ,8172 atau2 , 82
Dengan
xSD = 2,82 ini kita periksai table kurve normal. Kita lihat,
xSD
sebesar 2,82 itu meliputi 49,76% daerah sebelah kurve normal, atau
seluruhnya ada 2(49,76%)= 99,52%. Dengan demikian maka hipotesa yang
diajukan sebelum penyelidikan ditolak, baik atas dasar taraf signifikansi 1%,
apalagi 5 %.
Dalam beberapa situai nilai chi kuadrad yang kita perolehadalah
sedemikian kecilnya sehingga setelah disalin ke dalam
xSD menghasilkan nilai
negative. Dalam hal semacam ini, persentase daerah kurve normal yang sesuai

dengan nilai
xSD itu denaikkan dengan menambahnya 50%, dihitung dari
ujung distribusi. Jadi misalnya kita memperoleh nilai chi kuadrad =42,530 dari
table 25x3. diubah menjadi nilai z atau
xSD .
z=√2(42 , 530 )−√2(48 )−1=√85 , 06−√95=9 ,28−9 , 7468=−0 ,5240atau−0 ,52
Dengan nilai z sebesar -0,52 itu kita periksai table kurve normal. Dengan z
=-0,52 itu kita lihat daerah kurve dari mean sebesar 19,85%. Akan tetapi dalam
situasi kita sekarang, daerah sebesar itu tidak kita hitung dari mean, melainkan
kita tambahkan pada 50% daerah dari ekor distribusi. Dengan demikian kita
mengharapkan kemungkinan sebesar 69,85% dari seluruh kejadian kita akan
memperoleh nilai chi kwadrad sebesar atau lebih besar dari 42,530.
Yang dimaksud dengan petak kecil adalah petak yang frekuensinya kurang
dari 5. chi kuadarad kurang dapat memberikan gambaran yang memuaskan
bilamana ada petak kecil dalam table kontingensi yang dikerjakan. Kesimpulan
yang agak memuaskan baru dapat diperoleh bilamana diadakan suatu koreksi atau
penyesuaian sebagaimana diuslkan oleh YATES terhadap petak yang kecil itu
lebih dahulu sebelum perhitungan chi kuadrad dilakukan. Koreksi YATES itu
berupa menambah ½ terhadap petak yang paling kecil dan menyesuaikan
frekuensi-frekuensi lainnya sehingga jumlah kolom dan jumlah baris sebelum dan
sesudah koreksi masih tetap sama. Saying sekali, koreksi dan penyesuaian
YATES hanya berlaku untuk table 2x2.
Contoh tentang petak-petak kecil dapat dilihat dalam table 60 A. data itu
dimaksudkan untuk menyelidiki ada tidaknya korelasi antara kelulusan dan jenis
kelamin. Table 60B menunjukkan data sesudah dikoreksi dan disesuaikan.
TABEL 60
JENIS KELAMIN DAN KELULUSANNYA
A. Data yang diperoleh
Sekse L G Total
Pria
Wanita
16
8
4
2
20
10
Total 24 6 30

B. Data setelah disesuaikan
L = lulus
G = gagal.
Pengkoreksian dilakukan terhadap frekuensi yang terkecil, yaitu dengan
jalan menambahkan 0,5 terhadap frekuensi ini. Karena suatu ketentuan bahwa
jumlah tidak dapat diubah-ubah maka frekuensi-frekuensi lain kemudian
disesuaikan untuk mempertahankan ketentuan itu. Baru setelah pengkoreksian dan
penyesuaian itu chi kuadrad dihitung dengan cara yang biasa. Dengan memakai
rumus
χ2 =
N (ad−bc )2
(a+b)( c+d )(a+c )(b+d )
kita peroleh
χ2 =
30 {(16 , 5)(2,5 )−(3,5 )(7,5 )}2
(20)(10 )(24 )(6 )=
30( 41 ,25−26 ,25)2
28 ,800
=
30(15 )2
28 , 800=225
960=0 , 234
Dengan d.b =1 dan batas signifikansi 5%=6,635 kita menerima hipotesa
nihilnya dan menyimpulkan bahwa kelulusan bukan kecendrungan salah satu jenis
kelamin.
REALIBITAS SAMPEL KECIL
Sekse L G Total
Pria
Wanita
16,5
7,5
3,5
2,5
20,0
10,0
Total 24,0 6,0 30,0

Resiko kesalahan dalam penyelidikan dengan sample kecil selalu akan
lebih besar daripada resiko kesalahan dalam penyelidikan dengan sample besar.
Seorang karyawan research yang teliti kiranya akan ragu-ragu menarik
kesimpulan dari penyelidikan data seoerti tersebut dalam table 60 itu. Sebab
kiranya sample penyelidikan diperbesar lima atau sepuluh kali lipat, pada
umumnya hasil penyelidikannya akan berubah, dan perubahan hasil itu kadang-
kadang sedemikian diperbesar lima atau sepuluh kali lipat, pada umumnya hasil
penyelidikannya akan berubah, dan perubahan hasil itu kadang-kadang
sedemikian besarnya sehingga agak sukar untuk mempercayai hasil penyelidikan
dengan sample kecil yang semula.
Sebagai ilustrasi daripada apa yang dikemukakan itu dapat kita selidiki
dari contoh-contoh hipotetik seperti tersebut dalam table 61 dan table 62 di bawah
ini.
TABEL 61 A
DATA HIPOTETIK TENTANG SEKSE DAN KELULUSANNYA
TABEL 61 B
DATA TABEL 61 A SETELAH
DIKOREKSI DAN DISESUAIKAN
χ2 =
20 {(9,5 )(1,5)−(3,5 )(5,5 )}2
(13 )(7)(15 )(5)=
20(14 , 25−19 , 25 )2
6 , 825
20(-5 )2
6 ,825=500
6 , 825=0 , 073
TABEL 62
Sekse L G Total
Pria
Wanita
9
6
4
1
13
7
Total 15 5 20
Sekse L G Total
Pria
Wanita
9,5
5,5
3,5
1,5
13,0
7,0
Total 15,0 5,0 20,0

10 KALI DATA TABEL 61 A
χ2 =
200 {(90 )(10)−(40 )(60 )}2
(130 )(70 )(150 )(50 )=
200( 900−2400 )2
68 . 250. 000
200(-1500 )2
68 .250. 000=
200 (3)91
=6 ,593 .
Nampaklah dari contoh di atas bahwa perbedaan antara chi kuadrad yang sesuai
dengan chi kuadrad dengan sample besar sangat menyoloknya sehingga
mempersulit penarikan kesimpulannya. Dalam hal apapun penyelidik pasti selalu
lebih meyakini hasil penyelidikan dari sample yang lebih besar, karena pada
populasi-populasi yang tidak homogin besarnya sample selalu menjadi petunjuk
tentang representativitas sample. Pada umumnya memang sangat sulit untuk
mendemonstrasikan perbedaan atau korelasi yang signifikan dari sample kecil,
sungguhpun jika diadakan penyelidikan secara besar-besaran perbedaan atau
korelasi itu ada dalam kenyataannya. Seperti kita lihat dari contoh di atas, chi
kuadrad sebesar 0,073 adalah jauh sekali dari batas signifikansi 5%, yaitu hamper-
hampir mendekati bilangan batas signifikansi 5% itu.
CHI KUADRAT UNTUK MENGHITUNG PERBEDAAN PERSENTASE
Kecuali untuk menyelidiki signifikasi perbedaan frekuaensi yang biasa, chi
kuadrat dapat juga digunakan untuk menilai signifikasi perbedaan frekuensi yang
sudah diubah dalam presentase.
TABEL 63
DATA TENTANG SEKSE DAN KELULUSAN DALAM PER SEN
f 0 dalam % f h dalam %
Sekse Lulus Gagal Total Sekse Lulus Gagal Total
Pria 45 20 65 Pria 48,75 16,25 65,00
Sekse L G Total
Pria
Wanita
90
60
40
10
130
70
Total 150 50 200

Wanita 30 5 35 Wanita 26,25 8,75 35,00
Total 75 25 100 Total 75,00 25,00 100,00
X 2=(45−48 , 75)2
48 ,75+(20−16 , 25)2
16 ,25+(30−26 , 25)2
26 , 25+(5−8 , 75)2
8 ,75
¿(−3 , 75 )2
48 ,75+(+3 ,75 )2
16 , 25+(+3 , 75)2
26 , 25+(−3 ,75 )2
8 ,75
¿14 ,062548 ,75
+14 , 602516 , 25
+14 ,602526 ,25
+14 , 60258 , 75
¿0 , 288+0 ,865+0 ,536+1 ,60X 2=3 , 296
Dalam menggunakan chi kuadrat untuk menghitung perbedaan persentase, ada
dua catatan penting yang perlu diperhatikan:
(1) Terhadap petak yang kecil telah diadakan koreksi dan penyesuaian lebih
dahulu. Sebabnya ialah karena probabilitas signifikasi sesuatu kejadian
lebih tergantung kepada frekuensi yang nyata daripada frekuensi dalam
presentase. Kita mengetahui bahwa untuk suatu mata uang logam yang
dilemparkan 10 kali, munculnya 6:4 untuk kepala : ekornya tidak sama
signifikannya dengan munculnya 60:40 untuk perbandingan kepala dan
ekor jika mata uang itu dilemparkan 100 kali, sungguhpun perbandingan
munculnya kepala dan ekor itu jika dinyatakan dalam persentase sama-
sama 60% : 40%.
(2) Nilai chi kuadrat yang diperoleh dari perhitungan-perhitungan frekuensi
dalam persen harus diubah dahulu dalam nilai chi kuadrat dari
perhitungan-perhitungan dengan frekuensi yang nyata, sebelum pengetesan
signifikasi dilakukan. Pengubahan itu dilakukan dengan jalan mengalikan
nilai chi kuadrat dengan N/100. dalam contoh di atas oleh karena frekuensi
selanjutnya dijadikan dasar perhitungan adalah data dalam tabel 62 dengan
N=200, maka chi kuadrat dalam persen yang kita peroleh itu harus kita
kalikan dengan 200/100, atau sama dengan 3,296 x 2 = 6,592, suatu
bilangan yang sama dengan yang sudah kita peroleh lebih dahulu, yaitu
6,593. Dengan chi kuadrat sebesar 6,593 itu pada taraf signifikasi 5% kita

akan tetap menolak hipotesa bahwa perbedaan lulusan pria dan wanita
adalah signifikan. Atau dinyatakan dalam bentuk korelasi, kita menolak
hipotesa yang menyatakan bahwa antara jenis kelamin dan lulusan terdapat
korelasi yang signifikan. Catat, karena derajat kebebasan daripada chi
kuadrat tidak tergantung kepada N, melainkan kepada jumlah petak f h ,
maka baik dikerjakan dengan cara yang biasa, maupun dikerjakan melalui
persentase, pengetesan nilai chi kuadratnya menggunakan derajat
kebebasan yang sama.
BATAS PENGGUNAAN KOREKSI YATES
Perlu sekali lagi ditekankan bahwa korelasi YATES sayang sekali hanya dapat
dikenakan pada tabel 2x2. Untuk tabel-tabel lebih besar daripada 2x2 ada cara lain
untuk memperhitungkannya. Cara-cara ini akan dibicarakan dalam pasal dibawah
ini.
PETAK KECIL DALAM TABEL GANDA-PETAK
TABEL 64
DATA TENTANG PILIHAN FILM DAN JURUSAN
Jurusan Film kesukaanTotal
dalam fakultas Petualangan Sejarah Perang Roman Song
Perniagaan 15 8 10 6 1 40
Sejarah 5 32 5 11 7 60
Seni Rupa 3 10 7 22 8 50
Seni Suara 6 6 5 13 20 50
Alam Pasti 12 6 47 8 7 80
Adm. Perusah. 79 8 16 10 7 120
Total 120 70 90 70 50 400

(1) Membuang sama sekali data yang diperoleh dari jurusan perniagaan dan
jurusan seni rupa karena dari kedua jurusan itu terdapat frekuensi-
frekuensi kecil, yaitu 1 pada petak perniagaan-song dan 3 pada petak seni
rupa-petualangan.
(2) Mengkombinasikan jurusan-jurusan itu dengan jurusan-jurusan lain yang
”terdekat”, misalnya jurusan perniagaan dengan jurusan administrasi
perusahaan dan jurusan seni rupa dengan jurusan seni suara. Tentu saja
pengkombinasian semacam itu harus didasarkan atas alasan-alasan yang
dapat dipertanggungjawabkan.
Baik ditempuh langkah membuang maupun langkah mengkombinasikan,
penyelidik harus memperhatikan konsekuensinya dalam memperhitungkan
derajat kebebasan. Untuk mendapatkan derajat kebebasan ini rumus d.b.=(b-1)(k-
1) masih tetap berlaku. Jadi misalnya jika ditempuh langkah membuang data
jurusan-jurusan perniagaan dan seni rupa, maka d.b.nya = (4-1)(5-1) =12, sedang
jika ditempuh jalam mengkombinasikan kedua jurusan itu dengan jurusan-jurusan
lainnya d.b.nya akan =(4-1)(5-1) =12 juga.
Umumnya jika yang ditempuh adalah langkah mengkombinasi, maka jurusan-
jurusan yang dikombinasikan tetap kedua-duanya dicatat dalam melaporkan
hasilnya, misalnya jika jurusan perniagaann dikombinasikan dengan jurusan
administrasi perusahaan, kombinasinya menjadi jurusan perniagaan/administrasi
perusahaan. Demikian jika jurusan seni rupa digabungkan dengan jurusan seni
suara, maka kombinasinya akan menjadi seni rupa/seni suara atau seni rupa/suara.
Sebagai akibat dari pada langkah yang berbeda itu kadang-kadang diperoleh
hasil yang berbeda pula. Mungkin juga terjadi bahwa dengan langkah
pembuangan hasilnya hipotesa dapat diterima, tetapi dengan jalan
pengkombinasian hasilnya hipotesa harus ditolak. Dalam keadaan semacam ini
ada baiknya jika penyelidik melaporkan saja apa adanya. Artinya ia harus
menghitung chi kuadrat dengan kedua langkah itu dan menyajikan apapun
hasilnya dari kedua langkah yang berbeda itu.
CHI KUADRAT UNTUK MENGETES NORMALITAS

Sangat banyak teknik-teknik statistik yang berlandaskan kepada distribusi
normal. Jika dari penyelidikan-penyelidikan yang terdahulu belum pernah
dipastikan bahwa sesuatu gejala mengikuti ciri-ciri distribusi normal, mengetest
apakah gejala yang diahdapi merupakan distribusi yang normal atau tidak
merupakan keharusan yang mutlak.
Banyak cara yang dapat digunakan untuk mengetest normalitas suatu
distribusi, misalnya saja dengan menyelidiki kejulingan (skewness) dan
kurtosisnya. Chi kuadrat pun dapat digunakan untuk keperluan pengetesan
normalitas itu.
Dari kurva normal kita mengetahui bahwa:
Nilai-nilai yang terletak meliputi frekuensi sebesar: atau dibulatkan
dari -3SD sampai -2SD 2,15% 2%
dari -2SD tsampai -1SD 13,59% 14%
dari -1SD sampai Mean 34,13% 34%
dari Mean sampai +1SD 34,13% 34%
dari +1SD sampai +2SD 13,59% 14%
dari +2SD sampai +3SD 2,15% 2%
Total 99,74% 100%
Dari ciri-ciri distribusi normal teoritik itu kita dapat menguji apakah sesuatu
distribusi empirik mengikuti ciri-ciri itu ataukah tidak. Hipotesa (nihil) yang
hendak kita tes adalah bahwa f 0 dari distribusi gejala yang kita selidiki tidak
menyimpang secara signifikan dari f h dalam distribusi normal teoritik.
Tabel 65 menunjukkan distribusi empirik daripada intelegensi yang diperoleh
dengan THORNDIKE Intelligence Examination. Para ahli telah mengetahui
bahwa intelegensi adalah salah satu gejala psikologik yang dengan tertib
mengikuti ciri-ciri distribusi normal. Misalkan kita andaikan pengetahuan itu
belum ada pada kita, dan kita ingin menyelidiki buat pertama kalinya tentang
normal tidaknya distribusi intelegensi. Mean dari distribusi itu = 81,59, dengan

SD = 12,14. dari statistik-statistik itu kita dapat memperhitungkan interval nilai
sepanjang distribusi yang terbagi menjadi 6 SD, yaitu dari -3SD sampai +3SD.
Jika nilai-nilai diatas kita bulatkan dan distribusi itu kita golong-golongkan
kembali menjadi 6 golongan secara konvensional, maka akan kita jumpai
distribusi seperti tercantum dalam tabel kerja dibawah ini. Kolom f h diisi atas
dasar persentase kurva normal sebelumnya.
TABEL 65
DISTRIBUSI NILAI-NILAI THORNDIKE INTELLIGENCE
EXAMINATION DARI 206 MAHASISWA TINGKAT I
Nilai f 0
115-119 1
110-114 2 M = 31,9
105-109 4 SD = 12,14
100-104 10
99-94 13 Karena itu :
90-94 18 +2SD keatas = 105,87 keatas.
85-89 34 +1SD sampai +2SD = 93,43 – 105,87.
80-84 30 Mean sa,pai +1SD = 81,59 – 93, 43.
75-79 37 -1SD sampai Mean = 69,45 – 81,58.
70-74 27 -2SD sampai -1SD = 57,31 – 69,45.
65-69 15 -2SD kebawah = 57, 31 kebawah.
60-64 10
55-59 2
50-54 2
45-49 1

Total 206
Jika nilai-nilai di atas kita bulatkan dan distribusi itu kita golong-golongkan
kembali menjadi 6 golongan secara konvensional, maka akan kita jumpai
distribusi seperti yang tercantum pada tabel di bawah ini. Kolom f h diisi atas
dasar persentase kurva normal.
TABEL 66
TABEL KERJA UNTUK MENCARI PROBABILITAS NORMALITAS
DATA DALAM TABEL
Interval distandarisasi f 0 f hf 0 -f h ( f 0−f h )
2 ( f 0−f h )2
f h
106-119 6 4,12 +1,88 3,5344 0,8579
94-105 28 28,84 -0,84 0,7056 0,0245
82-93 66 70,04 -4,04 16,3216 0,2330
70-81 76 70,04 +5,96 35,5216 0,5072
58-69 26 28,84 -2,84 8,0656 0,2797
45-57 4 4,12 -0,12 0,0144 0,0035
Total 206 206,00 0,0 1,9058
Derajat kebebasan untuk tes signifikasi ini adalah jumlah sel f h dikurangi
satu, atau 6-1 =5. Dengan d.b.= 5 ini pada taraf signifikasi 5% batas penolakan
hipotesanya =11,070. Nilai chi kuadrat yang kita peroleh sebesar 1,9058 itu
ternyata jauh di bawah batas penolakan, sehingga dengan demikian hipotesa kita
diterima. Distribusi intelegensi yang diperoleh itu ternyata tidak menyimpang dari
distribusi normal.
Cara pengetesan normalitas seperti yang dicontohkan diatas berlaku juga
untuk semua penggolongan gejala yang kurang atau lebih dari enam golongan.
Jika gejala digolongkan hanya menjadi tiga golongan, maka harus digunkan 2SD
untuk tiap-tiap penggolongan. Sekiranya gejala diklasifikasi dalam 10 golongan,

masing-masing golongan akan berjarak kira-kira 0,6SD. Jarak penggolongan
dalam satuan SD ini didasarkan atas teori bahwa suatu distribusi normal teoritik
terdiri dari 6SD. Pegangan pokok yang perlu diperhatikan adalah bahwa dalam
usaha menggolong-golongkan gejala untuk keperluan pengetesan normalitas ini
dua macam. Statistika yang mutlak diperlukan adalah mean dan standard deviasi
dari pada skor gejala yang diselidiki.
SATU DUA CATATAN TENTANG BATAS-BATAS PENGGUNAAN CHI
KUADRAT
Chi kuadrat memang merupakan salah satu teknik statistik yang kerap kali
digunakan dalam penyelidikan-penyelidikan. Sungguhpun begitu, teknik ini
mengandung dalam dirinya batas-batas penggunaan tertentu.
(1) Chi kuadrat pada dasarnya hanya dapat digunakan untuk menganalisa data
yang berwujud frekuensi. Perlu diingatkan kembali frekuensi adalah
bilangan sebagai hasil daripada perhitungan atau counting.
(2) Untuk pengetesan korelasi chi kuadrat hanya dapat menunjukkan apakah
korelasi antara dua gejala (atau lebih) signifikan ataukah tidak. Dengan
chi kuadrat sama sekali tak dapat diungkapkan kenyataan tentang besar-
kecilnya korelasi yang diselidiki.
(3) Pada dasarnya chi kuadrat belum dapat menghasilkan kesimpulan yang
memuaskan untuk menyelidiki tabel-tabel kontingensi dengan petak-petak
kecil. Korelasi YATES pada umumnya hanya digunakan sekiranya jalan
lain tertutup untuk bekerja dengan sampel-sampel yang lebih besar. Jika
jumlah individu dan jumlah sampel cukup banyak, cara membuang atau
mengkombinasikan kategori-kategori yang mempunyai petak kecil
memberikan hasil yang lebih memuaskan.
(4) Chi kuadrat paling tepat digunakan pada data yang diperoleh dari sampel-
sampel dan ketegori-kategori yang terpisah (eksklusif) satu sama lain.
Data semacam ini disebut data kategorik, data diskrit, atau data nominal.

DAFTAR PUSTAKA
Cholil Munif, Muhammad. 1991. Chi Kuadrat Analisis Katagorik. Surabaya:Satgas Komputer Fakultas kedokteran Universitas Airlangga
Sudiana, I Ketut dan Maruli Simamora. 2004. Statistika Dasar. Singaraja: Jurusan Pendidikan Kimia, Fakultas MIPA, Institut Keguruan dan Ilmu Pendidikan Negeri Singaraja
Hadi, Sutrisno. 2000. Statistik. Yogyakarta: Penerbit Andi.