REGRESI DAN KORELASI LINEAR...
Embed Size (px)
Transcript of REGRESI DAN KORELASI LINEAR...

Regresi Linear
REGRESI DAN KORELASI LINEAR SEDERHANA

Tujuan Pembelajaran
Regresi Linear
Menjelaskan regresi dan korelasi Menghitung dari persamaan regresi dan standard error dari
estimasi-estimasi untuk analisis regresi linier sederhana Menggunakan ukuran-ukuran yang diperoleh dari analisis
regresi dan korelasi untuk membuat dugaan-dugaan interval dari variabel-variabel terikat bagi keperluan peramalan (forecasting)
Menghitung dan menjelaskan makna dari koefisien-koefisien korelasi dan determinasi dalam menggunakan teknik-teknik analisa korelasi linier sederhana

Pendahuluan
Regresi Linear
Analisa regresi
digunakan untuk meramalkan atau memperkirakan nilai dari satu variabel dalam hubungannya dengan variabel lain atau mempelajari dan mengukur hubungan statistik yang terjadi antara dua atau lebih varibel.
Dalam regresi sederhana dikaji dua variabel, sedangkan dalam regresi majemuk dikaji lebih dari dua variabel.
Variabel Terikat (Dependent Variable / Response Variable) Variabel yang akan diestimasi nilainya
Variabel bebas (independent variable atau explanatory variable) Variabel yang diasumsikan memberikan pengaruh terhadap variasi variabel
terikat dan biasanya diplot pada sumbu datar (sumbu-x).
Dikembangkan pertama kali oleh seorang ahli
genetika : Francis Galton
Regresi : peramalan, penaksiran, atau pendugaan

Analisa regresi
Regresi Linear
Gagasannya adalah meminimalkan penyebaran total nilai y dari garis.
Regresi atau garis kuadrat terkecil Adalah garis dengan SSE yang terkecil
SSE besar SSE kecil
SSE = Sum of Squared Errors(Jumlah Kuadrat Kesalahan)

Gambar 2 Garis regresi linier pada diagram pencar
y (+)
y (+)
y (+)
y
(+)
y
(-)
y
(-)
y
(-)
y
(-)
y
(0)
y
(0)
a
y a bx
x
y
Regresi Linear
Analisis Regresi Linear
Garis regresi ditempatkan pada data dalam diagram sedemikian rupa sehingga penyimpangan keseluruhan titik terhadap garis lurus
adalah nol
Error / kesalahan

Analisis Regresi Linear
Regresi Linear
.
Persamaan Matematis: Ŷ = a + bx
Ŷ = penduga (bagi rata-rata Y untuk X tertentu)variabel terikat (variabel yang diduga)
x = Variabel bebas (variabel yang diketahui)a,b = Penduga parameter A dan B (koefisien regresi sampel)a = intersep (nilai Y, jika X = 0)b = slop (kemiringan garis regresi)

Regresi Linear
E(Y) = 15.6 + 1.09X
contoh hubungan POT dengan prestasi belajarsiswa. Kemiringan 1 = 1.09 menunjukkanbahwa kenaikan skore POT satu satuan akanmenaikkan rataan sebaran peluang bagi Ysebesar 1.09.
b adalah Kemiringan (slope) yang menunjukkan perubahan rataansebaran peluang bagi Y untuk setiap kenaikan X satu satuan.

Rumus:
2
2
2
i
i
i
i
i
ii
i
i
i
i
i
i
XXn
YXXXY
XbYa dan
i i
ii
i
i
i
i
i
ii
XXn
YXYXn
b2
2
Regresi Linear
Analisis Regresi Linear

Latihan
Regresi Linear
Dari suatu praktikum fisika dasar diperoleh data yang menghubungkan variabel bebas x dan variabel terikat y seperti ditunjukkan dalam tabel berikut.
Uji ke- x y
1 6 30
2 9 49
3 3 18
4 8 42
5 7 39
6 5 25
7 8 41
8 10 52
56 296
Tabel 1

Tabel perhitungan:
Uji ke- x y xy x2 y2
1 6 30 180 36 900
2 9 49 441 81 2401
3 3 18 54 9 324
4 8 42 336 64 1764
5 7 39 273 49 1521
6 5 25 125 25 625
7 8 41 328 64 1681
8 10 52 520 100 2704
56 296 2257 428 12920
56 296
7 37 8 8
x yx y
n n
Regresi Linear
Analisis Regresi Linear
Tabel 2

Kolom y2 ditambahkan pada tabel meskipun belum digunakan untuk perhitungan persamaan garis regresi. Nilai tersebut akan digunakan kemudian. Jadi dengan menggunakan hasil pada tabel, nilai dari konstanta a dan b dapat ditentukan:
2 22
8(2257) (56)(296) 14805,1389
2888(428) (56)
n xy x yb
n x x
37 (5,1389)(7) 1,0277a y bx
Jadi persamaan garis regresi linier yang menggambarkan hubungan antara variabel x dan y dari data sampel pada percobaan/praktikum di atas adalah:
ˆ 1,0277 5,1389y a bx x
Dengan menggunakan persamaan garis regresi yang diperoleh, maka dapat diperkirakan hasil yang akan diperoleh (nilai y) untuk suatu nilai x tertentu. Misalnya untuk x = 4 maka dapat diperkirakan bahwa y akan bernilai: ˆ 1,0277 5,1389y a bx x =1,0277 + 5,1389(4) = 21,583
Regresi Linear
Analisis Regresi Linear

y = 5.1389x + 1.0278
0
10
20
30
40
50
60
0 2 4 6 8 10 12
x
y
Gambar. Garis regresi untuk contoh soal 1
Regresi Linear
Analisis Regresi Linear

Latihan 2
Regresi Linear
X (%) Y (%)
1 2
2 4
4 5
5 7
7 8
9 10
10 12
Misalnya X adalah persentase kenaikan biaya periklanan dan Y adalahpersentase kenaikan hasil penjualan. Berapakah besarnya ramalan persenkenaikan penjualan jika biaya iklan dinaikkan menjadi 15%?
Tabel 3

Standard Error of Estimate
Regresi Linear
Standard Error Regresi & Koefisien Regresi Sederhana
Standard error merupakan indeks yang digunakanUntuk mengukur tingkat ketepatan regresi (pendugaan) dan koefisien regresi (penduga)atau mengukur variasi titik-titik observasi di sekitar garis regresi.
Dengan menggunakan data dan tabel perhitungan pada latihan1, maka standard error estimasi dari garis regresi yang diperoleh adalah:
2
,2
(11,920) 1,0277(296) 5,1389(2,257) 1,698
8 2
y x
y a y b xys
n

Regresi Linear
Dengan standard error, batasan seberapa jauh melesetnya perkiraan kita dalam meramal data dapat diketahui.
Bila semua titik observasi berada tepat di garis regresi maka kesalahan baku akan bernilai sama dengan nol.
Berarti perkiraan yang dibuat sesuai dengan data sebenarnya.

Koefisien regresi a dan b (penduga a dan b)
Regresi Linear
Koefisien regresi a (penduga a), kesalahan bakunya dirumuskan:
Koefisien regresi b`(Penduga b)
,
2 2
2
1,698 1,6980,283
656428
8
y x
b
ss
xx
n

Pendugaan Interval KoefisienRegresi (Parameter A dan B)
Pendugaan Parameter Regresi
Dari nilai atau derajat kepercayaan (1 - ) yang telah ditentukan, interval
pendugaan parameter A dan B dapat ditentukan, yang diberikan masing-masing oleh:
bb stbBstb22
dan
aa staAsta22
dengan derajat kebebasan (n-2)
Regresi Linear
Pendugaan interval parameter A
Pendugaan interval parameter B
Artinya, dengan interval keyakinan 1 – α dalam jangka panjang, jika sampel diulang-ulang, 1 - α kasus pada interval tersebut akan berisi A
atau B yang benar

Latihan soal 2 Tentukan interval dari parameter A dan B pada latihan
soal 1 dengan α = 5% atau tingkat keyakinan 95% dan jelaskan artinya!
Regresi Linear

Pengujian Hipotesis Koefisien Regresi (Parameter A da B)
Pengujian hipotesis bagi parameter A dan B menggunakan uji t,
dengan langkah- langkah sbb:
Regresi Linear
1) Untuk parameter A:H0 : A = A0
H1 : A > A0
A < A0
A ≠ A0
2) Untuk parameter B:H0 : B = B0, mewakili nilai B tertentu, sesuai hipotesisnyaH1 : B > B0 , berarti pengaruh X terhadap Y adalah positif
B < B0, berarti pengaruh X terhadap Y adalah negatifB ≠ B0, berarti X mempengaruhi Y
a. Menentukan formulasi hipotesis
b. Menentukan taraf nyata (αlfa) dan nilai t tabel
Taraf nyata dan nilai t tabel ditentukan dengan derajat bebas (db) = n - 2

Regresi Linear Sederhana
Pengujian Hipotesis Koefisien Regresi (Parameter A da B)
c. Menentukan kriteria pegujian
1) H0 diterima jika t0 ≤ tα
H0 ditolak jika t0 > tα
2) H0 diterima jika t0 ≥ -tα
H0 ditolak jika t0 < -tα
3) H0 diterima jika –tα/2 ≤ t0 ≤ tα/2
H0 ditolak jika t0 < -tα/2 atau t0 > tα/2
d. Menentukan nilai uji statistik
1) Untuk parameter A
2) Untuk parameter B
e. Membuat kesimpulan apakah H0 diterima ataukah ditolak

Peramalan (Prediksi)
Peramalan
Ŷ sebagai penduga memiliki nilai yang mungkin sama atau tidak sama dengan nilai sebenarnya.
Untuk membuat Ŷ sebagai penduga yang dapat dipercaya, maka dibuat pendugaan bagi Y.
Peramalan (Prediksi)

Peramalan (Prediksi)
Peramalan Tunggal
Peramalan Interval Individu
Regresi Linear

Peramalan (Prediksi)
Peramalan Interval Rata-rata
Regresi Linear

Latihan Soal:Dengan menggunakan data dari tabel 3,
Buatlah:
a. Ramalan interval untuk individu Y, jika biaya iklan dinaikkan menjadi 15% dengan tingkat keyakinan 99%!
b. Ramalan interval untuk rata-rata E(Y), jika biaya iklan dinaikkan menjadi 15% dengan tingkat keyakinan 99%!
Regresi Linear
n = 7 cari tα/2;5 Lihat tabel distribusi t