Distribusi Sampling Statistik
Embed Size (px)
Transcript of Distribusi Sampling Statistik
DISTRIBUSI SAMPLING
Populasi dan Sampel?? Populasi Keseluruhan pengamatan yang diteliti.
Ada 2 macam, populasi berhingga dan tak berhingga.
Ukuran populasi : banyaknya pengamatan (N) Karakteristik : ciri atau sifat dari populasi Parameter : hasil pengukuran karakteristik ( dan ) Sensus : cara mengumpulkan data Kelemahan Populasi : 1. Memerlukan biaya yang sangat mahal 2. Memerlukan waktu yang lama 3. Memerlukan tenaga dalam jumlah yang besar 4. Data yang diperoleh tidak akurat Sampel Mengambil sebagian anggota dari populasi Sampel ada 2, sampel besar dan sampel kecil
Fungsinya untuk menyimpulkan atau mengetahui karakteristik atau parameter dari populasi (potret /gambaran dari populasi)
Ukuran sampel : banyaknya pengamatan (n)
Statistik : hasil pengukuran karakteristik (X dan S)Page 1
Rahma Faelasofi
Sampling : cara mengumpulkan data
Sampling Populasi Populasi N Parameter
Sampel Sampel n StatistikX S
Berhingga/Tak berhingga
Besar/Kecil
Populasi dapat merupakan populasi berhingga ataupun tak-berhingga. Sebagai contoh, jika kita mengambil 10 bola secara berturut-turut dengan tidak mengembalikan lagi bola-bola yang terambil ke dalam kantong yang berisi 100 bola maka kita sebut melakukan sampling dari sebuah populasi berhingga. Sementara itu, jika kita melemparkan sekeping uang logam sebanyak 50 kali dan menghitung banyaknya tanda gambar yang muncul maka kita disebut melakukan sampling dari suatu populasi tak-berhingga.Rahma Faelasofi Page 2
Kemudian apakah ada perbedaan antara Statistik sampel Vs Parameter populasi??
Keuntungan Sampel : 1. Biaya lebih murah 2. Waktu yang lebih singkat 3. Tenaga yang diperlukan lebih sedikit 4. Data yang diperoleh lebih akurat Sampel harus representatif dengan ciri-ciri : 1. Mempunyai ukuran tertentu yang memakai syarat 2. Mempunyai kesalahan kecil 3. Dipilih dengan prosedur yang benar berdasarkan teknik atau cara sampling tertentuRahma Faelasofi Page 3
Kemudian adanya penarikan kesimpulan tentang parameter populasi berdasarkan data keterangan tidak lengkap yang diperoleh melalui pengambilan sampel dan penghitungan harga-harga statistik. Harga suatu statistik tergantung pada data-data yang diamati, sehingga harga statistik bervariasi dari satu sampel ke sampel lainnya. Hal tersebut seperti yang disajikan dalam gambar di bawah ini: Populasi (N)X1,X2,,XN
Parameter dan 2
sampel (n)X1,X2,,Xn
sampel (n)X1,X2,,Xn
sampel (n)X1,X2,,Xn
statistikX1 dan S12
statistikX2 dan S22
statistikXn dan Sn2
Cara
pengambilan
sampel
sedemikian
hingga
setiap elemen populasi mempunyai kemungkinan sama untuk terpilih sebagai anggota sampel disebut sampelRahma Faelasofi Page 4
random. Diketahui ada dua cara pengambilan sampel random, yaitu pengambilan sampel random dengan pengambilan dan tanpa pengembalian.
Jika populasi berukuran N diambil sampel berukuran n dengan pengembalian, maka adaNn
buah sampel
yang mungkin diambil. Dalam kasus pengembalian lagi, sampel tersebut bisa saja muncul kembali dalam pengambilan-pengambilan berikutnya. Sampling dimana masing-masing anggota populasi dapat dipilih lebih dari satu kali disebut sebagai sampling dengan pengembalian.
Jika populasi berukuran N diambil sampel berukuran n dengan tanpa pengembalian maka adaNn=N!N-n!n!
buah sampel yang mungkin diambil. Dalam kasus tanpa pengembalian lagi, sampel yang bersangkutan hanya muncul satu kali. Sampling dimana masingmasing anggotanya tidak dapat dipilih lebih dari satu kali disebut sebagai sampling tanpa pengembalian. Ex: Diberikan populasi dengan data 23, 23, 21, 22, 24, yang kemudian diambil sampel berukuran 2, ada berapa buah sampel semuanya jika diambil dengan pengembalian & tanpa pengembalian, kemudian berikan semua sampel yang mungkin?Rahma Faelasofi Page 5
Jawab: Dengan pengembalian:Nn=52=25 buah sampel
Sampel yang mungkin: (23,23),(23,23),(23,21),(23,22), (23,24),(23,23),(23,23),(23,21),(23,22), (23,24),(21,23),(21,23),(21,21),(21,22),(21,24),(22,23), (22,23),(22,21),(22,22),(22,24),(24,23), (24,23),(24,21), (24,22),(24,24) Tanpa pengembalian:Nn=N!N-n!n!=5!3!.2!=10 buah sampel
Sampel yang mungkin: (23,23),(23,21),(23,22),(23,24), (23,21), (23,22),(23,24),(21,22),(21,24),(22,24) BEBERAPA TEKNIK PENARIKAN SAMPEL : 1. Penarikan Sampel Acak Sederhana (Simple Randomized Sampling) Pengacakan dapat dilakukan dengan : undian, tabel bilangan acak, program komputer. 2. Penarikan Sampel Sistematik (Systematic Sampling) Tetapkan interval lalu pilih secara acak anggota pertama sampel Ex : Ditetapkan interval = 20 Secara acak terpilih : Anggota populasi ke-7 sebagai anggota ke-1 dalam sampel, maka : Anggota populasi ke-27 menjadi anggota ke-2 dalam sampel.Rahma Faelasofi Page 6
Anggota populasi ke-47 menjadi anggota ke-3 dalam sampel, dst. 3. Penarikan Sampel Acak Berlapis (Stratified Random Sampling) Populasi terdiri dari beberapa kelas/kelompok. Dari setiap kelas diambil sampel secara acak. Perlu diingat. Antar Kelas bersifat (cenderung) berbeda nyata (heterogen). Contoh : Dari 1500 penumpang KA (setiap kelas memiliki ukuran yang sama) akan diambil 150 orang sebagai sampel, dilakukan pendataan tentang tingkat kepuasan, maka sampel acak dapat diambil dari : Kelas Eksekutif : 50 orang Kelas Bisnis : 50 orang Kelas Ekonomi : 50 orang 4. Penarikan Sampel Gerombol/Kelompok (Cluster Sampling) Populasi juga terdiri dari beberapa kelas/kelompok Sampel yang diambil berupa kelompok bukan individu anggota. Anggota dalam suatu kelas akan (cenderung) sama (homogen).
Rahma Faelasofi
Page 7
Antar kelas bersifat (cenderung) sama (homogen). Anggota Contoh : Terdapat 40 kelas untuk tingkat II Jurusan Ekonomi-GD, setiap kelas terdiri dari 100 orang. Populasi mahasiswa kelas 2, EkonomiUGD = 40 100 = 4000. Jika suatu penelitian dilakukan pada populasi tersebut dan sampel yang diperlukan = 600 orang, dilakukan pendataan mengenai lama waktu belajar per hari maka sampel dapat diambil dari 6 kelas.... Dari 40 kelas, ambil secara acak 6 kelas. 5. Penarikan Sampel Area (Area Sampling) Prinsipnya sama dengan Cluster Sampling. Pengelompokan ditentukan oleh letak geografis atau administratif. Contoh : Pengambilan sampel di daerah JAWA BARAT, dapat dilakukan dengan memilih secara acak KOTAMADYA tempat pengambilan sampel, misalnya terpilih, Kodya Bogor, Sukabumi dan Bandung. Berdasarkan Ukurannya, maka sampel dibedakan menjadi : 1. Sampel Besar jika ukuran sampel (n) 30 2. Sampel Kecil jika ukuran sampel (n) < 30 dalam suatu kelas akan (cenderung) berbeda (heterogen).
Rahma Faelasofi
Page 8
Distribusi Sampling Oleh karena setiap statistik akan bervariasi dari satu sampel ke sampel lainnya, jadi statistik merupakan variabel random yang bergantung pada sampel yang diamati. Pandanglah semua kemungkinan sampel berukuran N yang dapat diambil dari suatu populasi yang diberikan (baik dengan ataupun tanpa pengembalian). Untuk setiap sampel ini, kita dapat menghitung statistik sampel atau statistik (seperti mean dan standar deviasi) yang akan bervariasi antara sampel yang satu dengan sampel yang lainnya. Dalam hal ini akan diperoleh sebuah distribusi dari statistik tersebut yang disebut distribusi sampling. Distribusi sampling suatu statistik tergantung pada ukuran populasi, ukuran sampel, dan cara pengambilan sampel, apabila ukuran populasi relatif jauh lebih besar dari ukuran sampel maka perbedaan cara pengambilan sampel dapat diabaikan. Dalam bab ini, akan dipelajari distribusi sampel : 1. Distribusi sampel rata-rata 2. Distribusi sampel proporsi 3. Distribusi sampel beda dua rata-rataRahma Faelasofi Page 9
sampling.
Ada
empat
macam
distribusi
4. Distribusi sampel beda dua proporsi Terdapat beberapa notasi yang relevan dalam distribusi sampling, yaitu:n X S
: ukuran sampel : rata-rata sampel : standar deviasi sampel
N
: ukuran populasi : rata-rata populasi : standar deviasi
X X
populasiX X
: rata-rata antar semua sampel : standar deviasi antar semua sampel = standard error = galat baku
Distribusi sampel rata-rata Bila populasi berhingga berukuran N dengan ratarataX
dan
simpangann30
bakuX,
X
diambil
sampel
berukuran n
dan rata-rata
maka sampel yang
diambil dengan pengembalian dapat diperoleh:1. 2.
Distribusi sampel rata-rata Simpangan baku :X=Xn
X=X
Dimana bila n30, maka distribusi sampelnya akan mendekati distribusi normal sehingga variabel random Z dapat dihitung dengan rumus :Z=X-XX=X-XX Rahma Faelasofi Page 10
Sedangkan
untuk
sampel
yang
diambil
tanpa
pengembalian dapat diperoleh:1.
Distribusi sampel rata-rataX=XnN-nN-1
X=X
2. Simpangan baku DimanaN-nN-1
disebut
faktor
koreksi
populasi
berhingga Bila n30, maka distribusi sampelnya akan mendekati distribusi normal sehingga variabel random Z dapat dihitung dengan rumus :Z=X-XX=X-XX
Faktor Koreksi (FK) akan menjadi penting jika sampel berukuran n diambil dari populasi berukuran N yang berhingga/ terbatas besarnya
Jika sampel berukuran n diambil dari populasi berukuran N yang sangat besar maka FK akan mendekati mengantar kita pada Teorema Limit Pusat:1N-nN-11,
hal ini
TEOREMA LIMIT PUSAT Jika terdapat suatu sampel berukuranX, n
yang memiliki rata-rata yaituX
dimana diambil dari suatu populasi yang berukuran N yang besar danX.
dengan distribusinya sembarang akan memiliki rata-rata : standar deviasi : Distribusi Normal dengan:X=X dan X=Xn dengan nilai Z=X-XXn Rahma Faelasofi
Maka, distribusi rata-rata akan mendekati
Page 11
Teorema Limit Pusat berlaku untuk : 1. penarikan sampel dari populasi yang sangat besar, 2. distribusi populasi tidak dipersoalkan
Dari beberapa sumber yang ada, menyatakan bahwa Populasi dianggap Besar jika ukuran sampel kurang dari 5% ukuran populasi atau nN255=PZ>1,67=0,5-0,4525=0,0475
Jadi, peluang rata-rata sampel akan berisi lebih dari 255ml adalah 0,0475 atau 4,75%. 1. Kecepatan maksimum 2000 mobil mempunyai ratarata 135,5 km/jam dengan simpangan baku 5,2 km/jam. Jika sampel sebesar 150 mobil dipilih secara acak tanpa pengembalian, hitung probabilitasPage 13
Rahma Faelasofi
kecepatan Jawab:
maksimum
rata-rata
dari
150
mobil
tersebut yang lebih besar dari 136,1 km/jam!X=XnN-nN-1=5,21502000-1502000-1=0,41 Z=X-XX=136,1-135,50,41=1,46
Jadi probabilitas kecepatan maksimum rata-rata mobil yang lebih besar dari 136,1 km/jam adalah P(X>136,1) = P(Z>1,46) = 0,4279.
Distribusi Sampel Proporsi Bila populasi berukuran probabilitas N mengandungXN.
jenis
p
sebanyak X, maka proporsi p adalah merupakan untuk
Dimana p suatu
terjadinya
peristiwa, sementara (q = 1-p) merupakan probabilitas untuk tidak terjadinya suatu peristiwa. Jika dari populasi tersebut diambil sampel berukuran n yang juga mengandung proporsi berulang maka distribusi mempunyai :1. 2. 3. xn
dan sampel diambil proporsinya
sampel
Rata-rata p=p=XN Simpangan baku p=p1-pn Variabel random Z=p-pp
Rahma Faelasofi
Page 14
Ex : Diketahui sebanyak 10% dari ibu-ibu rumah tangga di Bandung memakai detergen A untuk mencuci pakaiannya. Jika dari populasi tersebut diambil sampel berukuran 100 : a. A! b. Bila dari sampel tersebut ternyata terdapat paling sedikit 15 ibu rumah tangga yang memakai detergen A, tentukan probabilitasnya! Jawab: a. Rata-rata : 10% = 0 ,1p=p1-pn=0,10,9100=0,03 b.
Tentukan
rata-rata
dan
simpangan
baku
dari
populasi ibu-ibu rumah tangga yang memakai detergen
Proporsi yang memakai detergen A adalahZ=p-pp=0,15-0,10,03=1,67 PZ>1,67=0,5-0,4525=0,0475
15100=0,15
Distribusi Sampel Beda Dua Rata-rata Terdapat 2 populasi. Populasi 1 sebanyak mempunyai rata-rata Populasi 2 sebanyak simpangan baku acak sebanyakRahma Faelasofi n1 2. 1 N2 N1
dan1.
serta simpangan baku2
mempunyai rata-rata
serta
Dari populasi 1 diambil sampelX1
dengan rata-rata
dan dari populasiPage 15
2 sampel acak sebanyak Dari sampel dan
n2
dengan rata-rata
X2
dimana
kedua sampel tersebut dianggap saling bebas.X1 X2
dapat dibuat sampel baru yang
juga bersifat acak, yaitu sampel beda dua rata-rata. Rata-rata dan simpangan baku dari distribusi sampel beda dua rata-rata adalah : Rata-rata :X1-X2=1-2 X1-X2=12n1+22n2 Z=X1-X2-1-2X1-X2
Simpangan baku : Variabel Random : Ex:
Di suatu universitas diketahui rata-rata tinggi badan mahasiswa laki-laki adalah 164 cm dengan simpangan baku 5,3 cm. Sedangkan mahasiswa perempuan tinggi badannya rata-rata 153 cm dengan simpangan baku 5,1 cm. Dari dua populasi tersebut diambil sampel acak yang saling bebas masing-masing 150 orang, berapa probabilitas rata-rata tinggi mahasiswa laki-laki paling sedikit Jawab: Diketahui: Populasi 1 : Populasi 2 : Misal :X1 1=164 cm, 1=5,3 cm, dan sampel 1 : n1=150 orang 2=153 cm, 2=5,1 cm, dan sampel 2 : n2=150 orang
12
cm
lebihnya
daripada
rata-rata
tinggi
mahasiswa perempuan?
= rata-rata tinggi badan mahasiswa laki-laki
Rahma Faelasofi
Page 16
X2
=
rata-rata
tinggi
badan
mahasiswa
perempuan Rata-rata :X1-X2=1-2=164-153=11 cm X1-X2=12n1+22n2=5,32150+5,12150=0,6
Simpangan baku :
Z=X1-X2-1-2X1-X2=X1-X2-110,6
Karena rata-rata tinggi badan mahasiswa laki-laki paling sedikit 12 cm lebihnya daripada rata-rata tinggi badan mahasiswa perempuan, makaZ=12-110,6=1,67 0,4525=0,0475 X1-X212
sehinggaPZ1,67=0,5-
sehingga
probabilitasnya
Distribusi Sampel Beda Dua Proporsi Ada 2 populasi. Populasi 1 berukuran proporsiX1N1. N1
terdapat jenisN2
X1
denganX2
Populasi 2 berukuranX2N2.
terdapat jenis
dengan proporsi acak berukuran jenisx1
Bila populasi 1 diambil sampelx1n1.
n1
maka sampel ini akan mengandung Demikian juga dengann2
dengan proporsi
populasi 2 diambil sampel acak berukuran sampel ini akan mengandung jenisx2n2. x2
maka
dengan proporsi
Sampel 1 dan 2 dapat membentuk sampel acak
baru yaitu sampel beda dua proporsi. Distribusinya mempunyai : Rata-rata :p1-p2=p1-p2 p1-p2=p11-p1n1+p21-p2n2 Page 17
Simpangan baku :Rahma Faelasofi
Variabel Random : Ex:
Z=p1-p2-p1-p2p1-p2
5% barang di gudang timur cacat, sedangkan barang yang cacat di gudang barat sebanyak 10%. Bila diambil sampel acak sebanyak 200 barang dari gudang timur dan 300 barang dari gudang barat, tentukan probabilitas persentase barang yang cacat dalam gudang barat 2% lebih banyak dibanding gudang timur! Jawab: Gudang barat : Gudang timur :p1 n1=300 ; p1=0,1 n2=200 ; p2=0,05
= proporsi barang yang cacat di gudang barat dalam = proporsi barang yang cacat di gudang timur dalam
sampelp2
sampelp1-p2=p11-p1n1+p21-p2n2=0,10,9300+0,050,95200=0,023 Z=p1-p2-p1-p2p1-p2=p1-p2-0,1-0,050,023
Karena barang cacat di gudang barat 2% lebih banyak daripada di gudang timur maka diperoleh:Z=0,02-0,050,023=-1,3 p1-p2>0,02
sehingga
Jadi
probabilitasnya
adalah
Pp1-p2>0,02=PZ>-
1,3=0,5+0,4032=0,9032=90,23% Rahma Faelasofi Page 18
Distribusi Sampel Rata-rata untuk Sampel Kecil DISTRIBUSI - t Distribusi Sampling didekati dengan distribusi t (W.S. Gosset). Distribusi-t pada prinsipnya adalah pendekatan distribusi sampel kecil dengan distribusi normal. Dua hal yang perlu diperhatikan dalam Tabel t adalah 1. derajat bebas (db) 2. nilai
distribusi t Student =
Derajat bebas (db) = degree of freedom = v = n - 1. n : ukuran sampel.
Nilai adalah luas daerah kurva di kanan nilai t atau luas daerah kurva di kiri nilai t Nilai 0.1 (10%) ; 0.05 (5%) ; 0.025(2.5%) ; 0.01 (1%) ; 0.005(0.5%)
Nilai terbatas karena sesuai dengan db yang harus disusun! Distribusi-t akan digunakan dalam Pengujian Hipotesis.
Selanjutnya
Nilai ditentukan terlebih dahulu Lalu nilai t tabel ditentukan dengan menggunakan nilai dan db. Nilai t tabel menjadi batas selang pengujian Lakukan pembandingan nilai t tabel dengan nilai t hitung. Nilai t hitung untuk kasus distribusi rata-rata sampel kecil 19 Rahma Faelasofi Page didapat dengan menggunakan teori di bawah ini.
Distribusi Sampel dengan sampel kecil Jika terdapat sampel ukuran kecil dengan rata-rata : populasiX n2.306 = 2.5 % dan Peluang t < -2.306 = 2.5 % Coba cari nilai t tabel untuk beberapa nilai db dan yang lain!
Perbedaan Tabel Z dan Tabel t Tabel Z nilai Z menentukan nilai Tabel t nilai dan db menentukan nilai t
Dalam banyak kasus nilai simpangan baku populasi () tidak diketahui, karenanya nilai diduga dari nilai simpangan baku sampel (s)
Ex: Manajemen PT BETUL menyatakan bahwa 95% rokok produksinya rata-rata mengandung nikotin 1.80 mg, data tersebar normal.Rahma Faelasofi Page 21
Yayasan
Konsumen
melakukan
pengujian
nikotin
terhadap 9 batang rokok dan diketahui rata-rata sampel = 1.95 mg nikotin dengan standar deviasi = 0.24 mg. Apakah hasil penelitian Yayasan Konsumen mendukung pernyataan Manajemen PT BETUL? Jawab: 95 % berada dalam selang berarti 5 % berada di luar selang; 1.5 % di kiri t dan 2.5% di kanan t = 2.5 % = 0.025 n = 9 db = n - 1 = 8 t tabel (db, ) = t tabel (8; 0.025) = 2.306 Jadi 95 % berada dalam selang -2.306 < t < 2.306 Nilai t-hitung = ? = 1.80 ; n = 9 ; x= 1.95 ; s = 0.24t=X-Xsn=1,95-1,800,249=0,150,08=1,875
Nilai t hitung = 1.875 berada dalam selang -2.306 < t < 2.306 , jadi hasil penelitian Yayasan Konsumen masih sesuai dengan pernyataan manajemen PT BETUL.
LATIHAN1.
Pada suatu pengiriman barang yang terdiri dari 2000 tube elektronika telah diketahui terdapat 600 unit tube yang tidak memenuhi standar mutu. Jika
Rahma Faelasofi
Page 22
sampel acak sebanyak 500 unit dipilih dari populasi tersebut tanpa pengembalian, berapakah probabilitas sampel populasi yang tidak memenuhi standar mutu: a. akan kurang dari 150/500 b. antara 144/500 sampai dengan 145/500 c. lebih besar dari 164/500 2. Besi baja yang diproduksi perusahaan A mempunyai rata-rata daya regang sebesar 4500 lbs dan variansi sebesar 40000 lbs, sedangkan yang diproduksi perusahaan B mempunyai ratarata daya regang sebesar 4000 lbs dan variansi sebesar 90000 lbs. Misalkan sampel random sebanyak 50 diambil dari perusahaan A dan sampel random sebanyak 100 diambil dari perusahaan B, berapakah probabilitas rata-rata daya regang beda dua rata-rata dari dua sampel itu yang lebih besar dari 600 lbs? 3. Sebuah perusahaan menyatakan bahwa batere yang digunakan dalam alat-alat permainan elektroniknya akan mencapai umur rata-rata 30 jam. Untuk mempertahankan nilai rata-rata ini, 16 batere diuji setiap bulan. Bila nilai t yang diperolehnya jatuh antara-t0,025 dan t0,025,
maka perusahaan itu cukup
puas. Apa kesimpulan perusahaan itu bila dariRahma Faelasofi Page 23
sebuah sampel diperoleh bakus=5jam.
x=27,5
jam dan simpangan
Asumsikan bahwa sebaran umur batere
itu normal. 4. Sebuah sampel acak berukuran 25 diambil dari suatu populasi normal yang mempunyai nilai tengah 80 dan simpangan baku 5. Sampel acak kedua, yang berukuran 36, diambil dari populasi normal lain yang mempunyai nilai tengah 75 dan simpangan baku 3. Hitung peluang bahwa nilai tengah sampel pertama akan melampaui nilai tengah sampel kedua dengan sekurang-kurangnya 3,4 tetapi kurang dari 5,9?
Rahma Faelasofi
Page 24