Statistik :: Multiple Regression Model

66
MULTIPLE REGRESSION MODEL Dr. Ir. H. Tjiptogoro Dinarjo, MM UNIVERSITAS MERCU BUWANA 2012 1

description

in Bahasa Indonesia only:: about Multiple Regession

Transcript of Statistik :: Multiple Regression Model

Page 1: Statistik :: Multiple Regression Model

1

MULTIPLE REGRESSION

MODEL

Dr. Ir. H. Tjiptogoro Dinarjo, MM

UNIVERSITAS MERCU BUWANA

2012

Page 2: Statistik :: Multiple Regression Model

2

Multiple Regression Model

• Multiple Regression Model Y=β0+β1X1+β2X2+ --------- +βpXp+ ε• Multiple Regression Equation E(Y)= β0+β1X1+β2X2+ --------- +βpXp+ ε• Β0, β1, β2 --------- βp are unknown parameters

Sample DataX1 X2 ------------Xp Y

. . . . . . . . . . . .

• b0, b1, b2 --------- bp

provide the estimates of Β0, β1, β2 --------- βp

• Compute the Estimated Multiple Regressiom Equation. Y=b0+b1X1+b2X2+ --------- +bpXp+ ε• b0, b1, b2 --------- bp are sample statistics.

Page 3: Statistik :: Multiple Regression Model

3

Analisis Regresi Berganda secara manual.

Perasamaa regresi dua variabel independen: Y = a + b1X1 + b2X2

Perasamaa regresi tiga variabel independen: Y = a + b1X1 + b2X2 + b3X3

Secara umum persamaan regresi untuk k variabel:

Y = a + b1X1 + b2X2 + b3X3 + ---------------- + bkXk

Untuk memperoleh koefisien regresi a, b1, b2, b3 dapat diperoleh dengan cara simultan dari tiga persamaan sebagi berikut:

ΣY = na + b1ΣX1 + b2ΣX2 ----------------------- (1)

ΣYX1 = aΣX1 + b1ΣX12 + b2ΣX1X2 --------------- (2)

ΣYX2 = aΣX2 + b1ΣX1X2 + b2ΣX22 ---------------- (3)

Page 4: Statistik :: Multiple Regression Model

4

Contoh soal:

Teori permintaan menyatakan bahwa permintaan suatu produk akan ditentukan oleh harga barang itu sendiri dan pendapatan seseorang.

Hukum permintaan juga menyatakan bahwa apabila harga barang meningkat , maka permintaan menurun, sehingga hubungan antara permintaan dan harga barang adalah negatif. Hubungan natara pendapatan dengan permintaan dapat negatif dapat pula positif. Terhadap barang normal terdapat hubungan yang positif, artinya apabila pendapatan meningkat, permintaan terhadap barang normal juga meningkat. Sebaliknya untuk barang inferior, terdapat hubungan yang negatif yaitu apabila pendapatan meningkat, permintaan terhadap barang inferior justru menurun. Berdasarkan teori tersebut , Suryani (2003) melakukan penelitian di Hero Supermarket untuk mengetahui hubungan dan pengaruh variabel harga dan pendapatan terhadap permintaan minyak goreng. Pada lembar berikut adalah hasil penelitiannya.

Page 5: Statistik :: Multiple Regression Model

5

Berdasarkan pada data tersebut, Hitung koefisien regresi.

Jawaban:

Untuk mendapatkan koefisien regresi, sesuai persamaan (1), (2), dan (3) perlu dihitung terlebih dulu dari nilai-nilai:

ΣY; ΣX1; ΣX2; ΣX12; ΣX2

2; ΣYX1; ΣYX2; ΣX1ΣX2

No Sampe

l

Permintaan Minyak (liter/bulan)

Harga Minyak(Rp ribu/liter)

Pendapatan(Rp juta/bulan)

1 3 8 10

2 4 7 10

3 5 7 8

4 6 7 5

5 6 6 4

6 7 6 3

7 8 6 2

8 9 6 2

9 10 5 1

10 10 5 1

Page 6: Statistik :: Multiple Regression Model

6

ΣY ΣX1 ΣX2 ΣYX1 ΣYX2 ΣY2 ΣX12 ΣX2

2 ΣX1X2

3 8 10 24 30 9 64 100 80

4 7 10 28 40 16 47 100 70

5 7 8 35 40 25 47 64 56

6 7 5 42 30 36 47 25 35

6 6 4 36 24 36 36 16 24

7 6 3 42 21 49 36 9 18

8 6 2 48 16 64 36 4 12

9 6 2 54 18 81 36 4 12

10 5 1 50 10 100 25 1 5

10 5 1 50 10 100 25 1 5

68 63 46 409 239 516 405 324 317

Persamaan (1), (2), (3):

68 = 10a + 63b1 + 46 b2 (1)409 = 63a + 405b1 + 317b2 (2)239 = 46a + 317b1 + 324b2 (3)

Substitusi antar persamaan (1) dan (2) diman persamaan (1) dikalikan -6,3:

-428,4 = - 63a – 396,9b1 – 289,8b2 pers (1)x -6,3 409,0 = 63a + 405,0b1 + 317,0b2 (2)-------------------------------------------------- -19,4 = 0 + 8,1 b1 + 27,2b2

(4)

Page 7: Statistik :: Multiple Regression Model

7

Substitusi antar persamaan (1) dan (3) diman persamaan (1) dikalikan -4,6

-312,8 = - 46a – 289,8b1 – 211,6b2 pers (1) x -4,6

239,0= 46a + 317,0b1 + 324,0b2 (3)

--------------------------------------------------

-73,8 = 0 + 27,2b1 + 112,4b2 (5)

Untuk mendapatkan nilai b2 gunakan persamaan 4 dan 5 dengan mengalikan persamaan 4 dengan -3,36.

-19,4 = 0 + 8,1 b1 + 27,2b2 (4)x -3,36 65,18 = 0 - 27,2b1 - 91,39b2 -73,80 = 0 + 27,2b1 + 112,40b2

__________________________ - 8,62 = 0 + 0 + 21,01b2 (6)

Dari pers 6 diperoleh b2 = -8,62 : 21,01 = -0,41Dengan memasukan nilai b2 = -0,41 ke dalam persamaan 4 atau 5, dalam hal ini menggunakan

persamaan 4 maka:

-19,4 = 0 + 8,1 b1 + 27,2 x (-0,41) = 8,1b1 – 11,18 8,1b1 = -19,4 + 11,18 = -8,22Maka bi = -8,22 : 8,1 = -1,015

Setelah didapat nilai b1 dan b2 maka nilai a dapat dicari dari persamaan 1 atau 2 atau 3, dalam hal ini menggunakan persamaan 1:

68 = 10a + 63x(-1,015) + 46x(-0,41) = 10a – 92,8610a = 68+92,86 = 150,86Maka a = 150,86 : 10 = 15,086

Maka persamaan regresi :

Y = 15,086 – 1,015X1 – 0,41X2

Page 8: Statistik :: Multiple Regression Model

8

Cara lain untuk mendapatkan persamaan regresi sebagi berikut:

A = n ΣYX1 - ΣX1ΣY

B = n ΣX22 - (ΣX2)2

C = n ΣX1X2 - ΣX1ΣX2

D = n ΣYX2 - ΣX2ΣY

E = n ΣX12 - (ΣX1)2

F = EB –C2

Nilai koefisien regresi:

b1 = (AB - CD) : F

b2 = (DE – AC) : F

a = (ΣY - b1ΣX1 - b2ΣX2) : n

Page 9: Statistik :: Multiple Regression Model

9

Dari tabel dan rumus diatas ma

ka koefisien regresi:

A = n ΣYX1 - ΣX1ΣY = 10x409 – 63x68 = -194

B = n ΣX22 - (ΣX2)2 = 10x324 – (46)2 = 1124

C = n ΣX1X2 - ΣX1ΣX2 = 10x317 – 63x46 = 272

D = n ΣYX2 - ΣX2ΣY = 10x239 – 46x68 = -738

E = n ΣX12 - (ΣX1)2 = 10x405 – (63)2 = 81

F = EB –C2 = 81x1124 – (272)2 = 17060

b1 = (AB - CD) : F = {(-194x1124) – (272x-738)} : 17060 = -1,015

b2 = (DE – AC) : F = {(-738x81) – (-194x272)} : 17060 = -0,41

a = (ΣY - b1ΣX1 - b2ΣX2) : n = { 68 - (-1,015x63) – (-0,41x46)} : 10

= 15,086

Page 10: Statistik :: Multiple Regression Model

10

JKT 17/11/2012 10:09:00

Welcome to Minitab, press F1 for help. Regression Analysis: Y versus X1; X2

The regression equation isY = 15,1 - 1,02 X1 - 0,411 X2

Predictor Coef SE Coef T PConstant 15,086 3,035 4,97 0,002X1 -1,0152 0,5805 -1,75 0,124X2 -0,4109 0,1558 -2,64 0,034

S = 0,715114 R-Sq = 93,3% R-Sq(adj) = 91,4%

Analysis of Variance

ource DF SS MS F PRegression 2 50,020 25,010 48,91 0,000Residual Error 7 3,580 0,511Total 9 53,600

Page 11: Statistik :: Multiple Regression Model

11

Koefisien Determinasi, Korelasi Berganda dan Parsial.

Koefisien determinasi menunjukan suatu proporsi dari varian yang dapat diterangkan oleh persamaan regresi (regression of sum square, RSS)

(Y - Ȳ)2 terhadap varian total (total sum of square. TSS) (Yi - Yi)2.

R2 = SSR/SST = (Y - Ȳ)2 : (Yi - Yi)2

Untuk menghitung R2 menggunakan rumus;

R2 = {n(a. ΣY + b1.ΣYX1 + b2. ΣYX2) – (ΣY)2} : {n. ΣY2 – (ΣY)2}

Nilai R2 atau multiple coefficient of determination berada pada kisaran 0 sampai dengan 1. Jika R2 = 1 menunjukan bahwa proporsi dari varian 100% dapat diterangkan oleh persamaan regresi. Atau dapat dikatakan bahwa 100% dari variability pada Y yang dapat dijelaskan dengan persamaan regresi hasil perhitungan. Jika R2 = 0 menunjukan bahwa proporsi dari varian 0% atau tidak ada yang dapat diterangkan oleh persamaan regresi. Atau dapat dikatakan bahwa 0% atau tidak ada dari variability pada Y yang dapat dijelaskan dengan persamaan regresi hasil perhitungan.

Menutut Lind (2002), nilai multiple coefficient of determination lebih besar dari 0,5 menunjukan variabel bebas dapat menjelaskan variabel tidak bebas dengan baik atau kuat, sama dengan 0,5 sedang,, dan bila kurang dari 0,5 kurang baik.

Jika nilai multiple coefficient of determination kurang dari 0,5 dapt terjadi karena: model yang salah, atau variabel kurang tepat, atau pengukuran yang tidak tepat.

Page 12: Statistik :: Multiple Regression Model

12

Contoh: Hitunglah koefisien determinasi antara permintaan minyak goreng dengan harga minyak goreng dan pendapatan, sebagaimana pada contoh tersebut diatas yang menghasilkan persamaan:

Y = 15,086 – 1,015X1 – 0,41X2

Jawab:

R2 = {n(a. ΣY + b1.ΣYX1 + b2. ΣYX2) – (ΣY)2} : {n. ΣY2 – (ΣY)2}

Diketahui:

ΣY = 68 ΣYX1 = 409 ΣYX2 = 239 (ΣY)2 = (68)2 ΣY2 = 516

n = 10 a = 15,086 b1 = -1,015 b2 = -0,41

R2 = {10 (15,086x68 + -1,015x409 + -0,41x239) - (68)2} : {10x516 - (68)2}

= 503,25 : 536 = 0,939

Page 13: Statistik :: Multiple Regression Model

13

Korelasi Parsial

Koefisien korelasi sederhana:

rYX1 = (n ΣYX1 - ΣYΣX1) : √{n ΣY2 - (ΣY)2} {nΣX12 - (ΣX1)2}

rYX2 = (n ΣYX2 – ΣYΣX2) : √{n ΣY2 - (ΣY)2} {nΣX22 - (ΣX2)2}

rX1X2 = (n ΣX1X2 - ΣX2ΣX1) : √{n ΣX12 - (ΣX1)2} {nΣX22 - (ΣX2)2}

Koefisien korelasi parsial diturunkan dari koefisien korelasi sederhana:

rYX1.X2 = {rYX1 – rYX2 rX1X2} : √{(1- r2YX2)(1- r2

X1X2)}

rYX2.X1 = {rYX2 – rYX1 rX1X2} : √{(1- r2YX1)(1- r2

X1X2)}

rX1X2.Y = {rX1X2 – rYX1 rYX2} : √{(1- r2YX1)(1- r2

YX2)}

Page 14: Statistik :: Multiple Regression Model

14

Contoh:

Hitunglah koefisien korelasi parsial pada contoh tersebut diatas, dan apa artinya.

Jawab:

ΣY = 68 ΣYX1 = 409 ΣYX2 = 239 (ΣY)2 = (68)2 ΣY2 = 516

ΣX1= 63 ΣX2 = 46 ΣX22 = 324 ΣX1

2 = 405 ΣX1X2 = 317

Menghitung koefisien korelasi sederhana

rYX1 = (n ΣYX1 - ΣYΣX1) : √{n ΣY2 - (ΣY)2} {nΣX12 - (ΣX1)2}

= (10.409 – 68.63) : √{10.516 – (68)2}{10.405 – (63)2}

= -194;208 = -0,931

rYX2 = (n ΣYX2 – ΣYΣX2) : √{n ΣY2 - (ΣY)2} {nΣX22 - (ΣX2)2}

= (10.293 – 68.46) :√{10.516 – (68)2} {10.324 – (46)2

= -738/776 = -0,951

rX1X2 = (n ΣX1X2 - ΣX2ΣX1) : √{n ΣX12 - (ΣX1)2} {nΣX2

2 - (ΣX2)2}

= (10. 317 – 46.63) : √{10.405 – (63)2}{10.324 – (46)2}

= 272 : 301 = 0,901

Page 15: Statistik :: Multiple Regression Model

15

Menghitung koefisien korelasi parsial

rYX1.X2 = {rYX1 – rYX2 rX1X2} : √{(1- r2YX2)(1- r2

X1X2)}

= {-0,931 - (-0,951x 0,901)} : √{(1-(-0,951)2)(1-(0,901)2)}

= -0,074 : 0,134 = -0,55

rYX2.X1 = {rYX2 – rYX1 rX1X2} : √{(1- r2YX1)(1- r2

X1X2)}

= {(-0,951 – (-0,931x0,91)}:√{(1-(-0,931)2}{(1-(0,901)2)}

= -0,111/0,158 = -0,71

rX1X2.Y = {rX1X2 – rYX1 rYX2} : √{(1- r2YX1)(1- r2

YX2)}

= {0,901 – (-0,931x0,951)} : √{(1-(-0,931)2)(1-(0,951)2}

= 0,016/0,113 = 0,143

Nilai koefisien korelasi parsial untuk:

Y dengan X1, dimana X2 tetap yang disimbulkan dengan rYX1.X2

Y dengan X2, dimana X1 tetap yang disimbulkan dengan rYX2.X1

lebih besar dari 0,5 menunjukan hubungan antara Y dengan X1 maupun X2 erat. Sedangkan nilai korelasi antara X2 dengan X1 lebih kecil dari 0,5 menunjukan hubungan yang lemah.

Regresi berganda mengharapkan hubungan Y dengan X kuat disertai hubungn X dengan X lainnya lemah, jika hubungan X dengan X lainnya kuat maka akan terjadi multikolinieritas yang menyebabkan nilai koefisien determinasi turun atau melemah

Page 16: Statistik :: Multiple Regression Model

16

Kesalahan Baku dalam Regresi Berganda

Kesalahan baku: besar penyimpangan nilai dugaan terhadap nilai sebenarnya.

Pada kasus tersebut diatas persamaan regresi:

Y = 15,086 – 1,015X1 – 0,41X2, dapat menduga bahwa seseorang dengan pendapatan (X2) Rp 5 juta dan harga minyak goreng (X1) Rp 7 ribu per liter maka permintaan akan minyak goreng (Y) sama dengan:

Y = 15,086 – 1,015x7 – 0,41x5 = 5,92 liter per bulan. Pada kenyataannya dari data menunjukan permintaan akan minyak goreng (Y) adalah 6 liter per bulan sehingga terdapat selisih 6 – 5,92 = 0,08 liter per bulan.Perbedaan antara nilai dugaan dengan keadaan sebenarnya (Y – Y) disebut residu atau error. Nilai dugaan tidak mungkin tepat sama atau 100% sama dengan kenyataan sehingga diperlukan suatu ukuran seberapa besar ketidak akuratan itu terjadi atau yang disebut Standar Error.

Kesalahan baku regresi berganda:

SY.X1.X2 = √{(ΣY – Y)2 : (n-(k+1)}

Rumus lain:

SY.X1.X2 = √{(ΣY2 - aΣY – b1ΣYX1 – b2ΣYX2) : (n-3)}

Page 17: Statistik :: Multiple Regression Model

17

Kesalahan baku regresi berganda:

SY.X1.X2 = √{(ΣY – Y)2 : (n-(k+1)}

dimana:

SY.X1.X2 : Kesalahan baku atau standar error pendugaan variabel Y berdasarkan variabel X1 dan X2.

Y : Nilai dugaan dari Y dimana X1 dan X2 diketahui

Y : Nilai pengamatan dari Y

n : Jumlah sampel

k : Jumlah variabel bebas.

Contoh:

Hitunglah kesalahan baku pendugaan dari persamaan

Y = 15,086 – 1,015X1 – 0,41X2 ?

Page 18: Statistik :: Multiple Regression Model

18

Jawaban.

Nilai kesalahan baku: SY.X1.X2 = √{(ΣY – Y)2 : (n-(k+1)}

= √{3,58:(10-(2+1)} = 0,72

Dg rumus lain SY.X1.X2 = √{(ΣY2 - aΣY – b1ΣYX1 – b2ΣYX2) : (n-3)}

= √ [{(516 –(15,086.68) –(-1,015x409) –(-0,41x239)}:{10-3}]

= 0,72

Y X1 X2 Y = 15,086 – 1,015X1 – 0,41X2 (Y-Y) (Y-Y)2

3 8 10 2,86 = 15,086-1,015(8)-0,41(10) 0,14 0,02

4 7 10 3,87 = 15,086-1,015(7)-0,41(10) 0,13 0,02

5 7 8 4,69 = 15,086-1,015(7)-0,41(8) 0,31 0,09

6 7 5 5,92 = 15,086-1,015(7)-0,41(5) 0,08 0,01

6 6 4 7,35 = 15,086-1,015(6)-0,41(4) -1,35 1,83

7 6 3 7,76 = 15,086-1,015(6)-0,41(3) -0,76 0,58

8 6 2 8,17 = 15,086-1,015(6)-0,41(2) -0,17 0,03

9 6 2 8,17 = 15,086-1,015(6)-0,41(2) 0,83 0,68

10 5 1 9,60 = 15,086-1,015(5)-0,41(1) 0,40 0,16

10 5 1 9,60 = 15,086-1,015(5)-0,41(1) 0,40 0,16

Σ(Y-Y)2 3,58

Page 19: Statistik :: Multiple Regression Model

19

Manfaat nilai kesalahan baku digunakan untuk menyusun selang kepercayaan atas nilai dugaan Y dari semua niali X yang diketahui.

Rumus interval nilai tengah Y sama dengan

Unterval nilai tengah Y = Y ± t(SY.X1.X2)

dimana:

Y : Nilai dugaan dari Y untuk nilai X tertentu

t : Nilai t-tabel untuk taraf nyata tertentu

SY.X1.X2 : Standar error variabel Y berdasarkan variabel X yang diketahui.

Contoh:

Hitung selang kepercayaan nilai dugaan jika diketahu nilai pendapatan Rp 5 juta perbulan dan harga minyak goreng Rp 7 ribu per liter, dengan tingkat kepercayaan 95% atau taraf nyata 5%.

Jawab: Y = 15,086 – 1,015X1 – 0,41X2 = 15,086 – 1,015(7) – 0,41(5) = 5,92

Nilai kesalahan baku SY.X1.X2 = 0,72

Nilai t tabel untuk (α) 0,05 dengan df = n – (k+1) = 10-3 = 7

t tabel = 2,365

Nilai selang kepercayaan: Y ± t(SY.X1.X2) = 5,92 ± 2,365.0,72

Nilai Y berada pada kisaran 4,23< Y < 7,61

Page 20: Statistik :: Multiple Regression Model

20

Kesalahan baku penduga atau standard error estimation berfungsi untuk melihat seberapa jauh nilai penduga b1 dan b2 dari nilai sebenarnya B1 dan B2 (parameter populasi. .

Rumus kesalahan baku penduga:

Sb1 = SY.X1.X2 : √{(ΣX12 – nXW 1

2)(1- rX1X22)}

Sb2 = SY.X1.X2 : √{(ΣX22 – nXW 2

2)(1- rX1X22)}

dimana:

Sb1 : Kesalahan baku penduga b1

Sb2 : Kesalahan baku penduga b2

SY.X1.X2 : Standard error variabel Y berdasarkan variabel X yang diketahui

ΣX12 : Jumlah X1 kuadrat

XW 12 : Kuadrat dari X1 rata-rata

ΣX22 : Jumlah X2 kuadrat

XW 22 : Kuadrat dari X2 rata-rata

Contoh:

Hitung kesaahan baku penduga b1 dan b2 contoh soal diatas.

Jawab:

Diketahui ΣX22 = 324 ΣX1

2 = 405 XW 12 = 39,69 XW 2

2 = 21,16

SY.X1.X2 = 0,72 rX1X2 = 0,901

Sb1 = 0,72:√{(405 – 10. 39,69)(1- (0,901)2)}= 0,72 : 1,23 = 0,580

Sb2 = 0,72:√{(324 – 10. 21,16)(1-(0,901)2 )}= 0,72 : 4,59 = 0,156

Kesalahan baku penduga b1 (Sb1 ) = 0,580 menunjukan bahwa nilai dugaan populasi B1 yang diduga dengan sampel b1 berada pada kisaran b1 ± 0,58, kisaran dugaan nilai koefisien parameter populasi pada interval 0,435 < B 1 < 1,95.

Kesalahan baku penduga b2 (Sb2 ) = 0,156 menunjukan bahwa nilai dugaan populasi B2 yang diduga dengan sampel b2 berada pada kisaran b2 ± 0,156, kisaran dugaan nilai koefisien parameter populasi pada interval -0,566 < B 2 < -0,254.

Page 21: Statistik :: Multiple Regression Model

21

Pengujian Hipotesa Pada Regresi Berganda

1. Uji Global.

Uji global disebut uji signifikansi serentak atau uji F yaitu untuk menguji seluruh variabel bebas X1, X2, X3 dst... Xk secara bersama-sama apakah dapt menjelaskan perilaku keragaman variabel bebas Y. Uji global ini dapat pula untuk mengetahui apakah semua variabel bebas memiliki koefisien regresi sama dengan nol. Jika sama dengan nol maka menunjukan bahwa variabel bebas X1, X2, X3 dst... Xk tidak dapat mempengaruhi variabel terikat Y

Langkah-langkah pengujian global:

a. Menyusun hipoptesa.

Dalam menyusun hipotesa selalu ada hipotesa nol yang lazim ditulis H0 dan hipotesa alternatif yang lazim ditulis Ha. Hipotesa nol (H0) selalu mengandung kesamaan yang mengandung arti koefisien regresi sama dengan nol. Hipotesa alternatif (Ha) mengandung arti bahwa koefisien regresi tidak sama dengan nol. Rumusan hipotesa:

H0 : B1 = B2 = 0

Ha : B1 ≠ B2 ≠ 0

Page 22: Statistik :: Multiple Regression Model

22

b. Uji F dengan menggunakan tabel F memerlukan:• Taraf nyata, pada umumnya untuk ilmu pasti 1% sedangkan untuk

ilmu sosial 5%• Derajat kebebasan pembilang (Numerator, df) menggunakan K-1 atau

jumlah variabel dikurangi 1.• Derajat kebebasan penyebut (Denominator, df) menggunakan n – K

atau jumlah sampel dikurangi jumlah variabel.

Contoh:

Variabel: Y, X1, X2 jadi K = 3 jadi derajat kebebasan pembilang 3 – 1 = 2

Misal jumlah sampel 10 atau n = 10 jadi derajat kebebasan penyebut adalah n – K = 10 – 3 = 7

Dengan taraf nyata misalkan 5% maka lihat F Tabel diperoleh 4,74.

c. Menentukan nilai F-hitung.

F = R2/(K-1) : (1-R2)/(n-K)

Misal diketahui R2 = 0,933 dan n = 10 maka serta k = 3

F-hit = 0,933/(3-1) : {(1-0,933)/(10-3)} = 0,4665/0,0098 = 48,73881

Page 23: Statistik :: Multiple Regression Model

23

d. Menentukan daerah keputusan.

0Fα

Area orProbability

Terima H0 Tolak H0 Terima Ha

Page 24: Statistik :: Multiple Regression Model

24

e. Memutuskan hipotesa.

Menentukan wilayah H0 dan Ha dan membandingkan F-tabel dengan F hitung.

Jika F hitung > F tabel maka H0 ditolak

Jika F hitung < F tabel maka Ho diterima

2. Uji Signifikansi Parsial atau Individual.

Uji sebuah variabel bebas berpengaruh nyata atau tidak terhadap variabel terikat, menggunakan uji t atau t-student, dengan langkah:

a. Menentukan hipotesa.

Variabel bebas berpengaruh tidak nyata apabila nilai koefisiennya sama dengan nol, berpengaruh nyata bila koefisiennya tidak sama dengan nol.

H0: B1 = 0 H1: B1 ≠ 0

Ho: B2 = 0 H1: B2 ≠ 0

b. Menentukan daerah kritis.

Daerah kritis ditentukan oleh nilai t tabel dengan derajat kebebasan n-k dan taraf nyata α. Untuk taraf nyata 5% (uji duaraha α/2 = 0,025) dan derajat kebebasan sebagai contoh pada linier berganda dengan variabel Y, X1, X2 dan jumlah sampel n = 10 sehingga: n-K = 10 – 3 = 7 maka t-tabel = 2,36.

Page 25: Statistik :: Multiple Regression Model

25

c. Menentukan nilai t-hitung.

t-hitung = (b – B) : Sb

t-hitung untuk b1: (b1 – B1) : Sb1

t-hitung untuk b2: (b2 – B2) : Sb2

Contoh: Y = 15,086 – 1,015X1 – 0,41X2

Sb1 = 0,58

Sb2 = 0,1558

t-hitung b1 = (-1,015 – 0) : 0,58 = -1,75

t-hitung b2 = (-0,410 – 0) : 0,1558 = - 2,637

d. Menetukan daerah keputusan.

EkorEkor

t = -2,36

Terima H0

t = 2,36

Tolak H0 Tolak H0

Contoh: dengan derajat kebebasan 7, taraf nyata 5% t-tabel = 2,36

Page 26: Statistik :: Multiple Regression Model

26

d. Menentukan Keputusan.

Koefisien regresi b1 dengan t-hitung = -1,75, ini berarti berada pada daerah tidak menolak H0. Ini menunjukan bahwa variabel bebas X1 tidak berpengaruh nyata terhadap Y.

Koefisien regresi b2 dengan t-hitung = -2,637, ini berarti berada pada daerah menolak H0.Ini menunjukan bahwa variabel bebas X2 berpengaruh nyata terhadap Y.

Dalam penerapan dilapangan hanya perlu memperhatikan variabel yang berpengaruh nyata untuk dasar pengambilan keputusan.

Multikolinieritas.

Frish mengemukakan bahwamultikolinier adalah adanya lebih dari satu hubungan linier yang sempurna.

Frish mengemukakan pula bahwa bila terjadi kolinier terlebih bila kolinier sempurna (koefisien korelasi antar variabel bebas = 1), maka koefisien korelasi dari variabel bebas yang bersangkutan tidak dapat ditentukan dan standar error tak terhingga.

Untuk mengenali multikolinieritas:

1. Uji F nyata uji t parsial tidak nyata.

2. R2 sangat besar, uji t tidak nyata

3. Koefisie korelasi rYX1.X2 ; rYX2.X1 ; rX1X2.Y ada yang lebih besar dari koefisien determinasi (R2)

Page 27: Statistik :: Multiple Regression Model

27

Tahun Pengamatan

Suku bunga(%pertahun)

Inflasi(%tahun)

Nilai Tukar(00Rp/USD)

123456789

101112

202119151717171825261919

999

109661177809

12

1920212122232457808290

100

Kajian literatur memperoleh hipotesa bahwa suku bunga dipengaruhi oleh inflasi dan nilai tukar. Untuk membuktikan hipotesa tersebut maka perlu melakukan analisis data-data tersebut diatas. 1. Berapa nilai koefisien regresi dan bentuk persamaan regresinya?. 2. Berapa nilai koefisien determinasi antara suku bunga, inflasi dan nilai tukar rupiah terhadap USD? 3. Berapa koefisien korelasi dan koefisien parsialnya?. 4. Hitung kesalahan baku pendugaan dari persamaan regresi pada jawaban pertanyaan 1. 5. Hitung standard error. 6. Hitung selang kepercayaan untuk nilai dugaan, apabila diketahui inflasi 9% dan nilai tukar 90, dengan tingkat kepercayaan 95% atau taraf nyata 5%.

Kasus Latihan:

Page 28: Statistik :: Multiple Regression Model

28

Demand Estimation By Regretion Analysis

Spesifikasi model:

Persamaan denmand:

Qx = f(Px, I, N, Py, T........dst) ....................................(1)

dimana:

Px : price of commodity

I : income

N : jumlah konsumen di pasar

Py : harga komoditi lainnya yang terkait (substitusi dan komplementer)

T : selera konsumen

dst : dan lain-lain seperti iklan, memungkinkan kredit dan bunganya, harga

yang diharapkan konsumen, itulah hal-hal dalam pembahasan ini.

Secara spesifik bentukpersamaan demand:

Qx = a0 + a1Px + a2I + a3N + a4Py + a5T +......+e ...........(2)

Catatan: parameter e adalah error.

Setiap perubahan dependent variabel Qx untuk setiap perubahan satu unit variabel independent yang dijelaskan oleh koefisien variabel yang bersangkutan, pada kondisi dimana variabel lain dan persamaan regresi tetap.

Terdapat kasus-kasus dimana hubungan non linier namun terjadi hubungan linier yang fit (cocok), sebagai contoh persamaan demand sebagai dependent variabel dengan harga komoditas dengan income konsumennya dengan persamaan

Qx = a(Pxb1)(Ib2) ......................................................................(3)

dalam persamaan linier dengan persamaan double log

ln Qx = ln a + b1 ln Px + b2 ln I ...................................................(4)

dimana b1, dan b2 dalam persamaan merepresentasikan prosentase perubahan atau elastisitas rata-rata. Secara spesifik b1 adalah elastisitas harga dari demand EP, b2 elastisitas income dari deamnd (EI) untuk komoditas X

Page 29: Statistik :: Multiple Regression Model

29

Testing The Econometric Results.

Persamaan (3) Qx = a(Pxb1)(Ib2)

EP = (δQx/δPx). (Px/Qx) maka

(δQx/δPx) = b1{ a(Pxb1-1)Ib2}

EP = [b1{ a(Pxb1-1)Ib2}].(Px/Qx)

= [b1{ a(Pxb1-1)Ib2}].Px/ {a(Px

b1)(Ib2)}

= [b1{a(Pxb1) Ib2}]/ {a(Px

b1)(Ib2)} = b1

Dengan cara yang sama dapat dilakukan untuk EI

EI = (δQx/δI). (I/Qx) maka

(δQx/δI) = b2{ a(Pxb1)Ib2-1}

EP = [b2{ a(Pxb1)Ib2-1}].(I/Qx)

= [b2{ a(Pxb1)Ib2-1}].I/ {a(Px

b1)(Ib2)}

= [b2{a(Pxb1) Ib2}]/ {a(Px

b1)(Ib2)} = b2

Page 30: Statistik :: Multiple Regression Model

30

Kasus. (Perhitungan of The Demand For Air Travel Over The Nort Atlantic)

J.M Cigliano menghitung demand untuk angkutan udara antara AS-Eropa dan antara Canada dan Eropa, antara tahun 1965 sd 1978. Pengujian dilakukan hanya untuk AS-Eropa namun ternyata hal serupa terjadi penerbangan Canada-Eropa. Persamaan regresi diperoleh sbb:

ln Qt = 2,737 – 1,247 ln Pt + 1,905 ln GNPt

(-5,07) (7,286)

R2 = 0,97 D-W = 1,83

dimana: Qt : jumlah penumpang per tahun rute AS-Eropa th 1965-1978

data dari IATA , dalam ratusan.

Pt : rata-rata tarif tahunan penerbangan New York – London.

GNPt : US gross national product pertahun.

dari persamaan regresi tsb menunjukan:• Price elasticity of demand -1,247 • GNP elasticity of demand 1,905

Ini mengindikasikan bahwa kenaikan tarif penerbangan 10% akan menurunkan jumlah penumpang 12,47%, kenaikan 10% GNP USA akan menaikan jumlah penumpang 19,05%. Fakta ini pada periode penelitian kapasitas penerbangan 2/3 sd 4/5, dengan tarif yang turun namun total revenue tanpa menimbulkan biaya lebih tinggi, sehingga keuntungan naik.

Page 31: Statistik :: Multiple Regression Model

31

Model persamaan regresi tersebut:

a. Mengisyaratkab bahwa perhitungan slope coefficients (elasticities) merupakan dalil demand theory.

b. Harga mutlak t hitung yang tertera dibawah persamaan regresi nilainya cukup tinggi slope coefficients mengindikasikan sebagai statistically significant dan menunjukan angka yang lebih baik dari 1%.

c. Koefisien determinasi (coefficient of determination) atau R2 mengindikasikan bahwa tarif penerbangan dan GNP menjelaskan 97%dari variation dalam log jumlah penumpang penerbangan New York- London.

d. Multikolinieritas (multycollinearity) antara dua independent variabel dapat dihindari mengingat nialai t dan R2 cukup tinggi.

e. Nilai Durbin-Watson (DW) 1, 83 menunjukan tidak terjadi autocorelation.

Page 32: Statistik :: Multiple Regression Model

32

Tahun Pengamatan

Suku bunga Y(%pertahun)

Inflasi X1(%tahun)

Nilai Tukar X2(00Rp/USD)

123456789

101112

202119151717171825261919

999

109661177809

12

1920212122232457808290

100

Tahun Pengamatan

Ln Y Ln X1 Ln X2

123456789

101112

2,995733,044522,944442,708052,833212,833212,833212,890373,218883,258102,944442,94444

2,197222,197222,197222,302592,197221,791761,791762,397904,343814,382032,197222,48491

2,944442,995733,044523,044523,091043,135493,178054,043054,382034,406724,499814,60517

Contoh Kasus, hubungan suku bunga, inflasi dan nilai tukar Valas:

Tahun Pengamatan

Ln Y Ln X1 Ln X2

123456789

101112

2,995733,044522,944442,708052,833212,833212,833212,890373,218883,258102,944442,94444

2,197222,197222,197222,302592,197221,791761,791762,397904,343814,382032,197222,48491

2,944442,995733,044523,044523,091043,135493,178054,043054,382034,406724,499814,60517

Page 33: Statistik :: Multiple Regression Model

33

Demo\Data\Latihan UAS Karyawan UMB.MPJ' Regression Analysis: Ln Y versus Ln X1; Ln X2

The regression equation isLn Y = 2,56 + 0,151 Ln X1 + 0,0040 Ln X2

Predictor Coef SE Coef T P VIFConstant 2,5562 0,1539 16,61 0,000Ln X1 0,15095 0,04179 3,61 0,006 1,6Ln X2 0,00400 0,05251 0,08 0,941 1,6

S = 0,0966094 R-Sq = 70,1% R-Sq(adj) = 63,5%

PRESS = 0,121486 R-Sq(pred) = 56,79%

Analysis of Variance

Source DF SS MS F PRegression 2 0,197152 0,098576 10,56 0,004Residual Error 9 0,084000 0,009333Total 11 0,281152

No replicates.Cannot do pure error test.

Durbin-Watson statistic = 1,25557

No evidence of lack of fit (P >= 0,1).

Page 34: Statistik :: Multiple Regression Model

34

Persamaan dalam bentuk Ln yang dihasilkan:

Ln Y = 2,56 + 0,151 Ln X1 + 0,0040 Ln X2

(3,61) (0,08)

R2 = 70,1% DW = 1,25557

Kesimpulan:

a. Mengisyaratkab bahwa perhitungan slope coefficients (elasticities) untuk inflasi terdapat korelasi yg signifikan sedangkan untuk nilai tukar rupiah sangat lemah sehingga secara umum khusus untuk nilai tukar tidak dapat dijadikan model regresi.

b. Harga mutlak t hitung yang tertera dibawah persamaan regresi nilainya cukup tinggi slope coefficients untuk inflasi sedangkan untuk nilai tukar sangat rendah.

c. Koefisien determinasi (coefficient of determination) atau R2 mengindikasikan bahwa inflasi dan nilai tukar menjelaskan 70,1% dari variation dalam ln besar suku bunga.

d. Multikolinieritas (multycollinearity) antara dua independent variabel untuk inflasi dapat dihindari mengingat nialai t dan R2 cukup tinggi, sedangkan untuk nilai tukar terdapat multikolinearitas mengingat t rendah

e. Nilai Durbin-Watson (DW) 1, 2557 menunjukan bahwa mengingat DW diatas dl = 0,925 dan dibawah du =1,54 menunjukan test is inclusive outocorellation.

Page 35: Statistik :: Multiple Regression Model

35

Kebijakan: Ln Y = 2,56 + 0,151 Ln X1 + 0,0040 Ln X2

Persamaan regresi ini menggambarkan:• Elastisitas suku bunga terhadap inflasi menunjukan bahwa tiap kenaikan 1% inflasi

akan berdampak kenaikan suku bunga 0,151% dengan catatan bahwa nilai tukar valas dan persamaan regresi tetap. Hubungan ini cukup kuat mengingat t hitung > t tabel tingkat kepercayaan 70,1%.

• Elastisitas suku bunga terhadap nilai tukar sangat rendah yaitu setiap kenaikan Rp100,-/$US akan menaikan suku bunga 0,004% atau kenaikan Rp1000,-/$US akan menaikan suku bunga hanya 0,04% dengan catatan inflasi dan persamaan regresi tetap.

• Secara model keseluruhan persamaan regresi terdapat hubungan yang cukup kuat terhadap suku bunga namun secara individual tidak signifikan dan terdapat indikasi multikolinearitas dengan demikian tidak dapat dijadikan dasar kebijakan secara individual.

Model persamaan dalam fungsi eksponensial:

Y = 2,56(X10,151)(X2

0,004)

Dimana: Y : Suku bungaX1 : Inflasi EX1 (elastisitas Y terhadap X1)= 0,151

X2 : Nilai tukar $US EX1 (elastisitas Y terhadap X1)= 0,0040

Page 36: Statistik :: Multiple Regression Model

36

Time Series Analysis

Time series data berkaitan dengan nilai atau angka dari variabel kronologi hari, minggu, bulan,kuartalatau tahun.

Time seri analysis untuk memforcastnilai akan datang dari time series dengan menguji pengamatan hanya data masa lalu. Asumsi bahwa time series akan terus bergerak seperti di masa lalu ( contoh; pola masa lalu akan terus tanpa berubah atau akan sangat mirip kedapan). Dengan alasan ini, time series analysys sering dikaikan sebagi “naive forcasting”

1. Reason for fluctuations in Time series Data.

Bila melakukan plotting kebanyakan data time-series economic, akan ditemukan bahwa mereka akan berfluktuasi atau sangat over time. Variasi ini seringkali disebabkan secular trends, cyclical fluctuations, seasonal variations, dan irregular or random influances. Lihat Gambar 1 dan Gambar 2

a. Secular trend.

Berdasarkan naik-turunnya data series jangka panjang sebagaimana digambarkan oleh garis penuh. Contoh banyak time series penjualan yang ditunjukan dengan trends berke,mbang selama bertahun-tahun karena pertumbuhan penduduk dan kenaikan per capita expenditures. Beberapa seperti gasoline (bensin), ikut turun trednnya sebesar/sebanyak dan lebih banyak mobil di jalan raya memerlukan bukan bensin.

Lihat garis penuh pada Gambar 1 .

Page 37: Statistik :: Multiple Regression Model

37

b. Cyclical fluctuations.

Pengembangan dan penyusustan besar dalam sebagian basar economic time series yang terlihat setelah beberapa tahun lihat garis titik-titik pada gambar. Contoh industri kosntruksi rumahmengikuti siklus panjang berkisar 15 – 20 tahun, siklus industri automobil terlihat lebih singkat.

Lihat garis putus-putus pada Gambar 1 .

c. Seasonal variation.

Keteraturan fluktuasi kegiatan ekonomi yang timbul kembaliselama setiap tahun yang disebabkan oleh cuaca dan social customs (kebiasaan masyarakat). Panen raya bulan maret-mei, kemarau bulan september otober, banyak orang belanja menjelang hari raya keagamaan seperti iedul fitri dst.

Lihat garis penuh pada Gambar 2 .

d. Irregular or random influences.

Variasi data series karena perang, bencana alam, pemogokan, atau kejadian unik lainnya

Lihat garis putus-putus pada Gambar 2 .

Page 38: Statistik :: Multiple Regression Model

38

0 1 2 3 4 1 2 3 4 1 2 3 4 Quarter Year I II III

0 1 2 3 4 1 2 3 4 1 2 3 4 Years

Gambar 1

Gambar 2

Sales ($)

Sales ($)

Secular trand

Cyclical fluctuation

Seasonal variation

Random influences

Page 39: Statistik :: Multiple Regression Model

39

2. Trends Projection

Bentuk sederhana dari time series analysis proyeksi trend yang lalau dengan fitting stright lines terhadap data visual atau lebih tepat dengan analisis regresi. Linier regression model akan diambil dalam bentuk:

St = S0 + bt ................................................(1)

dimana:

St : Nilai dari time series diforcast untu t time period.

S0 : nilai estimasi time series (konstanta regresi) pada periode dasar (pada

time period t = o)

b : angka absolut perrtumbuhan per periode

t : Time period dalam mana time series di forcast.

Contoh:

Fitting a regression line terhadap penjualan electricity data diambil dari kuartal pertama th 1988 (t=1) sampai ahir kuartal tahun 1991 (t = 16), lihat tabel sbb;

Tabel Seasonal Demand For (Sales of) electricity (in Million or Kilowatt-Hours) In USA City, !988-1991

Time period Quantity

1988.111

1988.215

1988.312

1988.414

1989.112

1989.217

1989.313

1989.416

Time period quantity

1990.114

1990.218

1990.315

1990.417

1991.115

1991.220

1991.316

1991.419

Page 40: Statistik :: Multiple Regression Model

40

————— 12/12/2012 22:03:18 ————————————————————

Welcome to Minitab, press F1 for help. Regression Analysis: Quantity versus Time

The regression equation isQuantity = 11,9 + 0,394 Time

Predictor Coef SE Coef T PConstant 11,9000 0,9525 12,49 0,000Time 0,39412 0,09851 4,00 0,001

S = 1,81636 R-Sq = 53,3% R-Sq(adj) = 50,0%

Analysis of Variance

Source DF SS MS F PRegression 1 52,812 52,812 16,01 0,001Residual Error 14 46,188 3,299Total 15 99,000

Durbin-Watson statistic = 3,59451

Page 41: Statistik :: Multiple Regression Model

41

1988 1989 1990 1991 Quarter Year

Sal

es

of e

lect

ricity

(m

illio

n ki

low

att

hou

rs)

Page 42: Statistik :: Multiple Regression Model

42

Dari data pada tabel diperoleh persamaan regresi:

St = 11,90 + 0,394t R2 = 0,50

(4,00)

Persamaan tersebut menunjukan bahwa electricity dijual pada ahir kuartal 1987 (S0) adalah 11,90 million kilowatt-hours dan naik rata-rata 0,394 mollion kilowatt-hours perkuartal. Trend variabel adalah statistically significant pada lebih baik dari tingkat 1 percents( dapat disimpulkan dari nilai t = 4) dan menerangkan 50% dalam quarterly variation dalam electricity consumtion di kota (R2 = 0,50). Berdasarkan trends masa lalu dapat diforcast sbb:

S17 = 11,90 + 0,394 (17) = 18,60 the first quarter of 1992

S18 = 11,90 + 0,394 (18) = 18,99 the first quarter of 1992

S19 = 11,90 + 0,394 (19) = 19,39 the first quarter of 1992

S20 = 11,90 + 0,394 (20) = 19,78 the first quarter of 1992

Lihat Gambar. Forcast terlihat sebagai titik-titik terus sampai th 1992. Nilai forcasting penjualan electricity dapat dibaca sebagai perpanjangan garis yang merupakan bentuk forcasting jangka panjang sesuai dengan data.

Dengan mengabaikan sepenuhnya very significant seasonal variation dalam data, nilai forcasting terlihat tidak jauh dari actual future values.

Page 43: Statistik :: Multiple Regression Model

43

Dengan asumsi besarnya konstanta absolut berubah per periode waktu tertentu (dalam hal ini perkuartal) yang mungkin cocok untuk banyak kasus, terdapat situasi ( seperti penjualan banyak products) dimana suatu prosentase terus berubah adalah lebih tepat.

The constan percenage growth rate model dapat ditulis:

St = S0 ( 1 + g)t

Dimana g adalah constant percentage growth rate untuk dihitung.Transformasi persamaan regresi dalam bentuk linier logarithms sbb:

ln St = ln S0 + t ln(1+g)

Persamaan regresi bila ditransformasi ke dalam log sbb:

St = 11,90 + 0,394t R2 = 0,50

(4,00) ln St = ln 11,90 + t ln 0,394

= 2,49 + 0,026t R2 = 0,50 (4,00)ln (1+g) = 0,026 maka (1+g) = e0,026 = (2,71828)0,026 = 1,026

Substitusi pada persamaan

St = S0(1+g)t = 12,0,6(1,026)t

St = 12,0,6(1,026)t

S0 = 12,06 diperoleh dengan antilog 2,49

(1+g) = 1,026 diperoleh dari anti log 1,026

Page 44: Statistik :: Multiple Regression Model

44

Untuk t dalam quarter (kuartal):

S17 = 12,0,6(1,026)17 = 18,66 kuartal pertama th 1992

S18 = 12,0,6(1,026)18 = 19,14 kuartal kedua th 1992

S19 = 12,0,6(1,026)19 = 19,64 kuartal ketiga th 1992

S20 = 12,0,6(1,026) 20 = 20,15 kuartal keempat th 1992

Forcasting ini hasilnya mirip dengan cara memcocokkan dengan trend garis forcasing.

Page 45: Statistik :: Multiple Regression Model

45

3. Seasonal Variation.

Data tahun 1988 sd 1991 terlihat seasonal variation yang kuat, dengan penjualan pada periode kuartal pertama dan ketiga setiap tahun konsisten berada dibawah nilai trend jangka panjang, dan periode kuartal 2 dan 4 konsisten berada diatas nilai trend (tercermin pada garis lurus forcasting). Dengan menghubungkan seasonal variation, kita dapat dengan significantly improve forcasting penjualan listrik kedepan. Kita bisa me;lakukan hal ini dengan ratio-to-trend method atau dengan dummy variabel.

Untuk menyesuaikan trend forcast untuk seasonal variation dengan ratio trend method, kita sederhanakan dengan mencari ratio rata-rata dengan mana nilai actual dari time series berbeda dari sama dengan hasil perhitungan nilai trend pada setiap kuartal selama periode 1988 sd 1991 dan kemudian dikalikan forcasted trend value dengan ratio ini. Prediksi nilai trend untuk setiap kuartal periode 1988 sd 1991 diperoleh dengan substitusi sederhana nilai t sama dengan kuartal dengan mempertimbangkan persamaan:

St = 11,90 + 0,394t R2 = 0,50

(4,00)

dan menghitung St lihat tabel.

Page 46: Statistik :: Multiple Regression Model

46

Mengalikan hasil forcasting (dari simple extension dari linier trend) dengan perhitungan seasonal factor lihat tabel ( 0,887 untuk kuartal pertama, 1,165 untuk kuartal ke dua dst) maka kita akan dapatkan forcast baru berdasarkan linear trend dan seasonal adjustment.:

S17 = 18,60(0,887) = 16,50 kuartal pertama th 1992

S18 = 18,99(1,165) = 22,12 kuartal kedua th 1992

S19 = 19,39(0,907) = 17,59 kuartal ketiga th 1992

S20 = 19,78(1,042) = 20,61 kuartal keempat th 1992

Forcasting ini ditunjukan oleh encircle points pada Tabel dibawah ini

Page 47: Statistik :: Multiple Regression Model

47

CALCULATION OF THE SEASONAL ADJUSTMENT OF TREND FORECAST BY THE RATIO-TO-TREND METHOD

Year forcasted Actual Actual/Forcasted

1988.11989.11990.11991.1

1988.21989.21990.21991.2

1988.31989.31990.31991.3

1988.41989.41990.41991.4

12,2913,8715,4517,02

12,6914,2615,8417,02

13,0814,6616,2317,81

13,4815,0516,6318,20

11,0012,0014,0015,00

15,0017,0018,0020,00

12,0013,0015,0016,00

14,0016,0017,0019,00

0,8950,8650,9060,881

Average 0,8871,1821,1921,1361,148

Average 1,1650,9170,8870,9240,898

Average 0,9071,0391,0631,0221,044

Average 1,042

Page 48: Statistik :: Multiple Regression Model

48

t St D1 D2 D3 D41 11 1 0 0 02 15 0 1 0 03 12 0 0 1 04 14 0 0 0 15 12 1 0 0 06 17 0 1 0 07 13 0 0 1 08 16 0 0 0 19 14 1 0 0 010 18 0 1 0 011 15 0 0 1 012 17 0 0 0 113 15 1 0 0 014 20 0 1 0 015 16 0 0 1 016 19 0 0 0 1

Data Periode pertriwulan th 1988 sd 1991

Page 49: Statistik :: Multiple Regression Model

49

————— 25/12/2012 16:35:09 —————————————————Welcome to Minitab, press F1 for help. Regression Analysis: St versus t; D1; D2; D3; D4

* D4 is highly correlated with other X variables* D4 has been removed from the equation.

The regression equation isSt = 12,8 + 0,375 t - 2,37 D1 + 1,75 D2 - 2,12 D3

Predictor Coef SE Coef T P VIFConstant 12,7500 0,2261 56,38 0,000t 0,37500 0,01685 22,25 0,000 1,1D1 -2,3750 0,2191 -10,84 0,000 1,6D2 1,7500 0,2158 8,11 0,000 1,5D3 -2,1250 0,2139 -9,94 0,000 1,5

S = 0,301511 R-Sq = 99,0% R-Sq(adj) = 98,6%

PRESS = 2,14957 R-Sq(pred) = 97,83%

Analysis of Variance

Source DF SS MS F PRegression 4 98,000 24,500 269,50 0,000Residual Error 11 1,000 0,091Total 15 99,000

Durbin-Watson statistic = 3

Page 50: Statistik :: Multiple Regression Model

50

Dengan menggunakan rumus: St = S0 + bt

• Mengambil dummy variabel D1 dimana triwulan pertama 1 sedangkan triwulan 2, 3, dan 4 sama dengan 0.

• Mengambil dummy variabel D2 dimana triwulan kedua 1 sedangkan triwulan 1, 3, dan 4 sama dengan 0.

• Mengambil dummy variabel D3 dimana triwulan ketiga 1 sedangkan triwulan 1, 2, dan 4 sama dengan 0.

• Mengambil dummy variabel D4 dimana triwulan keempat 1 sedangkan triwulan 1, 2, dan 3 sama dengan 0.

Maka diperoleh persamaan:

St = 12,8 + 0,375 t - 2,37 D1 + 1,75 D2 - 2,12 D3

(22,25) (-10,84) (8,11) (-9,94)

Durbin-Watson statistic = 3

Catatan• D4 is highly correlated with other X variables• * D4 has been removed from the equation.

Page 51: Statistik :: Multiple Regression Model

51

Dengan menggunakan persamaan tersebut diatas, penggunaan forcasting penjualan listrik tiap triwulan untuk th 1992 sbb:

S17 = 12,8 + 0,375 (17) - 2,37 = 16,80 the first quarter of 1992

S18 = 12,8 + 0,375 (18) + 1,75 = 21,30 the second quarter of 1992

S19 = 12,8 + 0,375 (19) - 2,12 = 17,80 the third quarter of 1992

S20 = 12,8 + 0,375 (20) = 20,30 the fourth quarter of 1992

Hasil perhitungan ini sama dengan hasil perhitungan pada halaman 45 yang dihitung berdasarkan perhitungan menggunakan persamaan eksponensial pada halaman 44 kemudian hasilnya dikoreksi dengan average tiap periode lihat pada tabel hal 48.

Page 52: Statistik :: Multiple Regression Model

52

Smoothing Techniques.

Memprediksi nilai yang akan datang dari suatu time series pada the basis of some average of its past values only.

1. Moving averages.

merupakan cara paling sederhana atas smoothing techniques.

Contoh: lihat Tabel halaman 54.

Pada kolom 1 dan 2 data hipotetis market share dari suatu perusahaan berupa 12 quarters (triwulan). Data bersifat random variation tetapi no secular atau seasonal variations.

Kolom 3 perhitungan three-quarter moving average. Contoh nilai 21,67 pada quarter ke 4 (angka pertamadi kolom 3) adalah penjumlahan tiga nilai dari quarter 1 sd 3 pada kolom pertama dibagi 3: (20+22+23):3 = 21,67. Dengan perhitungan seperti ini maka pada kolom 3 atau nilai F hanya memiliki three quarter forcast dengan dengan nilai fourth quarter yang pertama 21,67, sebagai bandingan lihat pada kolom 2 atau nilai A pada nilai 24 untuk firm’s market share pada fourth quarter. Perhitungan selanjutnya pada kolom 1 memulai pada angka (22+23+24):3 = 23 ditempatkan pada kolom 3 (F) pada baris ke 5 setelah angka 21,67 dan seterusnya sampai fourth quarter terahir yaitu (23+18+23):3 = 21,33 ditempatkan pada baris ke 13.

Dengan cara yang sama dapat menghitung five –quarter moving average forcasting untuk firm’s market share lihat pada kolom 6, 7 dan 8.

Page 53: Statistik :: Multiple Regression Model

53

Three-Quarter and Five-Quarter Moving Average Porcasts and Comparison

(1)Quarter

(2)Firm’s Actual Market Share

(A)

(3)Three-Quarter

Moving Average Forcast (F)

(4)

(A-F)

(5)

(A-F)2

(6)Five-Quarter

Moving AverageForcast (F)

(7)

(A-F)

(*)

(A-F)2

123456789

101112

13

202223241823191722231823

-

---

21,6723,0021,6721,6720,0019,6719,3320,6721,00

21,33

---

2,33-5,001,33

-2,67-3,002,333,67

-2,672,00

---

5,428925,0000

1,76897,12899,00005,4289

13,46897,12894,0000

Total=78,3534

-----

21,422,021,420,219,820,819,8

20,6

-----

1,6-3,0-4,41,83,2

-2,83,2

-----

2,569,00

19,363,24

10,247,84

10,24Total= 62,48

Page 54: Statistik :: Multiple Regression Model

54

Untuk melihat cara mana yang lebih baik dihitung root-mean-square error (RMSE) untuk setiap forcasting dan gunakan moving average dengan hasil RMSE yang terkecil.

Rumus RMSE:

RMSE = √{Σ(At – Ft)2 : n}

dimana:

At : actual value dari time series pada periode t.

Ft : forcasted value.

n : angka time periods atau angka pengamatan

At-Ft : perbedaan firm’s actual market share (kolom 2) dengan quarter moving average forcast (kolom 3 atau kolom 6)

Contoh:

RMSE = √{78,3534 : 9} = 2,95

Perhatikan n adalah jumlah data pengamatan pada kolom 5

Bandingkan dengan

RMSE = √{63,48 : 7} = 2,99

Perhatikan n adalah jumlah data pengamatan pada kolom 8.

Nilai RMSE pada three-quarter moving average forcast (2,95) lebih kecil dari RMSE pada five-quarte moving average forcast (2,990) maka hasil forcasting 21,33 lebih dapat dipercaya dari pada 20,6 lihat tabel.

Page 55: Statistik :: Multiple Regression Model

55

Exponential Smoothing.

Forcast untuk periode t+1 lihat Tabel hal 56.

Nilai forcast untuk time series pada periode t+1 adalah:

Ft+1 = wAt + (1+w)Ft

Dimana:

Ft+1 : forcast untuk time series pada periode t+1

w : bobot dengan nilai berada diantar 0 sd 1

At : nilai time series pada periode t

Contoh hitungan lihat tabel pad hal 47.

Pada kolom 1 dan 2 data hipotetis market share dari suatu perusahaan berupa 12 quarters (triwulan). Data bersifat random variation tetapi no secular atau seasonal variations.

Baris pertama pada kolom 3 (F untuk w = 0,3) dan kolom 6 (F untuk w = 0,5)adalah average market share dari perusahaan selama 12 quarter

Untuk baris 2 sd 13 pada kolom 3 dan 6 menggunakan rumus: Ft+1 = wAt + (1+w)Ft

Contoh untuk w = 0,3: F2 = 0,3(20) + (1- 0,3)21,0 = 20,7 (lihat baris ke 2, kolom 3)

F13 = 0,3(23) + (1-0,3)20,2 = 6,9 + 14,14 = 21,04 = 21,0

Contoh untuk w = 0,5: F2 = 0,5(20) + (1- 0,5)21,0 = 20,5 (lihat baris ke 2, kolom 6)

F13 = 0,5(23) + (1-0,5)19,9 = 11,5 + 9,95 = 21,45 = 21,5

Page 56: Statistik :: Multiple Regression Model

56

Exponential Forcasts With w = 0,3 and w = 0,5 And Comparison

(1)Quarter

(2)Firm’s Actual Market Share

(A)

(3)Forcast

With w = 0,3 (F)

(4)

(A-F)

(5)

(A-F)2

(6)Forcast

With w = 0,5(F)

(7)

(A-F)

(*)

(A-F)2

123456789

101112

13

202223241823191722231823

Total 252-

21,020,721,121,722,421,121,720,919,720,421,220,2

21,0

-1,01,31,92,3

-4,41,9

-2,7-3,92,32,6

-3,22,8

1,001,693,615,29

19,363,617,29

15,215,296,76

10,247,84

Total 87,19

21,020,521,322,223,120,621,820,418,720,421,719,9

21,5

-1,01,51,71,8

-5,12,4

-2,8-3,43,32,6

-3,73,1

1,002,252,893,24

26,015,767,84

11,5610,89

6,7613,69

9,61Total 101,50

Ā = ΣA/N = (252:12) = 21,0

Page 57: Statistik :: Multiple Regression Model

57

The root-mean-square error (RMSE) untuk exponential forcastings menggunakan w = 0,3 adalah:

RMSE = √{Σ(At – Ft) : n}

= √{87,19 : 12} = 2,70

The root-mean-square error (RMSE) untuk exponential forcastings menggunakan w = 0,5 adalah:

RMSE = √{Σ(At – Ft) : n}

= √{101,5 : 12} = 2,91

Kesimpulan:• Tingkat keyakinan hasil exponential forcast sebesar 21,0 untuk thirteenth

quarter menggunakan w = 0,3 lebih meyakinkan dengan RMSE = 2,70 dibandingkan dengan menggunakan w = 0,5 dengan RMSE = 2,91.

• Tingkat keyakinan hasil exponential forcast sebesar 21,0 untuk thirteenth quarter menggunakan w = 0,3 lebih meyakinkan dengan RMSE = 2,70 dibandingkan dengan menggunakan w = 0,5 dengan RMSE = 2,91. Bahkan lebih meyakinkan dibandingkan menggunakan three-quarter (RMSE = 2,95) dan five quarter (RMSE = 2,99) moving average

• Menggunakan exponensial forcast selama ini hasilnya lebih baik sehingga pada umumnya cara ini digunakan

Page 58: Statistik :: Multiple Regression Model

58

Batas Materi Anderson

Page 59: Statistik :: Multiple Regression Model

59

Pengamatan(Sampel)

Jarak TempuhX1= miles

Rit AngkutX2=Number

Waktu TempuhY=jam

123456789

10

10050

100100

508075659090

4342223432

9,34,88,96,54,26,27,46,07,66,1

Data Pengangkutan Mentega

Page 60: Statistik :: Multiple Regression Model

60

————— 17/11/2011 12:13:58 ————————————————————

Welcome to Minitab, press F1 for help. Regression Analysis: Y versus X1; X2

The regression equation isY = - 0,869 + 0,0611 X1 + 0,923 X2

Predictor Coef SE Coef T PConstant -0,8687 0,9515 -0,91 0,392X1 0,061135 0,009888 6,18 0,000X2 0,9234 0,2211 4,18 0,004

S = 0,573142 R-Sq = 90,4% R-Sq(adj) = 87,6%

Analysis of Variance

Source DF SS MS F PRegression 2 21,601 10,800 32,88 0,000Residual Error 7 2,299 0,328Total 9 23,900

Page 61: Statistik :: Multiple Regression Model

61

Multiple Coefficient of Determination

SST = SSR + SSE

Dimana

SST = total sum of squares = Σ(Yi - Ȳ)2

SSR = sum of squares due to regression = Σ(Y - Ȳ)2

SSE = sum of squares due to error = Σ(Yi - Yi)2

Dari hasil perhitungan diperoleh:

SST = 23,900

SSR = 21,601

SSE = 2,299

Multiple Coefficient of Determination: R2 = SSR/SST = 21,601/23,900 = 0,904

Angka ini sama dengan R-sq output Minitab 90,4%

Adjusted multiple coefficient of determination:

Ra2 = 1 – (1 – R2){(n-1)/(n-p-1)}

Dari contoh soal n =10 dan p = 2 maka

Ra2 = 1 – (1 – 0,904){(10-1)/(10-2-1)} = 0,88

Angka ini mirip dengan R-sq (adj) = 87,6%

Page 62: Statistik :: Multiple Regression Model

62

Test Untuk Mengetahui Signifikan. F test untuk mengetahui unsur model semua signifikan

(overall significance) t test untuk mengetahui masing-masing unsur model signifikan

(individual signifivance)

1. F test.

MSR = SSR/p

MSE = SSE/(n-p-1)

F = MSR/MSE

F test untuk overall significance

H0: β1 = β2 = ------------ = βp = 0

Ha: satu atau lebih dari para meter tidak sama dengan nol (0)

Test statistik

F = MSR/MSE

Aturan penolakan:

p-value approach H0 ditolak jika p-value ≤ 0

Critical value approach H0 ditolak jika F ≥ 0

Catatan: Fα berdasarkan F distribusi dimana p degrees of freedom pada numerator dan n-p-1 degreee of freedom pada denominator

Contoh:

MSR = 10,8 dan MSE = 0,328 maka F = 10,8/0,328 = 32,9

pada output minitab 32,88.

Menggunakan α = 0,01, pada tabel F0,01 diperoleh 9,55 dengan demikian F = 32,9 > F0,01 =9,55 maka H0 : β1 = β2 = ------------ = βp = 0 ditolak dan disimpulkan bahawa terdapat hubungan yang signifikan waktu tempuh Y dan 2 variabel bebas yaitu jarak tempuh dan jumlah rit yang dilakukan.

Page 63: Statistik :: Multiple Regression Model

63

Source of Variance

Sum of Squares Degree of Freedom

Mean Square F

Regression SSR p MSR = SSR/p F = MSR/MSE

Error SSE n – p - 1 MSE = SSE/ (n–p-1)

Total SST n - 1

Anova Tabel Untuk Multi Regresi Model Dengan p Variabel Bebas

Page 64: Statistik :: Multiple Regression Model

64

2. t testt test digunakan untuk test secara individual significancet test untuk individual significanceUntuk berbagai parameter βi

H0: βi = 0

Ha: βi ≠ 0

Test statistikt = bi/Sbi

Aturan penolakanp-value approach: H0 tolak bila p-value ≤ α

Critical value approach: H0 tolak bila t ≤ -tα/2 atau bila t ≥ tα/2

Dimana tα/2 berdasarkan pada t distribusi dengan n-p-1 sebagai degree of freedomContoh lihat printout.

b1 = 0,061135 Sb1 = 0,009888b2 = 0,9234 Sb2 = 0,2211

maka test statistik hipotesis parameter β1 dan β2

t = 0,061135/0,009888 = 6,18 > t0,005 = 3,499

t = 0,9234/0,2211 = 4,18 > t0,005 = 3,499

Maka tolak H0: βi = 0

Ha: βi ≠ 0

Page 65: Statistik :: Multiple Regression Model

65

Latihan soal1. Dari hasil 10 kali observasi diperoleh persamaan regresi SBB

Y = 29,1270 + 0,5900 X1 + 0,4980X2

Diketahui: SSt = 6724,125; SSR = 6216,375; Sb1 = 0,0813; Sb2 = 0,0567

a. Hitung MSR dan MSE.

b. Hitung F dan tampilkan F test . Gunakan α = 0,05

c. Tampilkan t test untuk menguji signifikansi β1. Gunakan α = 0,05

d. Tampilkan t test untuk menguji signifikansi β2. Gunakan α = 0,05

2. Terdapat suatu data sebagai berikut

a. Bagaimana bentuk persamaan regresi hubungan Y terhadap X1. Hitung Y jika X1 = 45

b. Bagaimana bentuk persamaan regresi hubungan Y terhadap X2. Hitung Y jika X2 = 15

c. Bagaimana bentuk persamaan regresi hubungan Y terhadap X1 dan X2. Hitung Y jika

X1 = 45 dan X2 = 15

X1 X2 Y

30472551405174365976

121017165

197

121316

9410811217894

175170117142211

Page 66: Statistik :: Multiple Regression Model

66

Batas Materi Anderson