REGRESI KOMPONEN UTAMA (PRINCIPAL COMPONENT … · Apabila terdapat masalah multikolinear pada...

Click here to load reader

  • date post

    14-May-2019
  • Category

    Documents

  • view

    224
  • download

    0

Embed Size (px)

Transcript of REGRESI KOMPONEN UTAMA (PRINCIPAL COMPONENT … · Apabila terdapat masalah multikolinear pada...

Analisis Regresi 2

Pokok Bahasan :

TUJUAN INSTRUKSIONAL KHUSUS :Mahasiswa dapat menjelaskan adanya multikolinieritas pada regresi

linier berganda serta prosedur penanganannya

Multikolinier &

penanganannya

Regresi linear berganda:Dalam notasi matriks

Y = X +

DenganY = vektor peubah tak bebas (nx1)X = matriks peubah bebas (nxk) = vektor penduga parameter (kx1) = vektor sisaan/galat (nx1)

i menyebar saling bebas mengikuti sebaran normal (0.2)i memiliki ragam homogenTidak adanya hubungan antar peubah X ( E(Xi,Xj) = 0, untuk semua i j ) atau sering disebut tidak ada masalah kolineari bebas terhadap peubah X

Beberapa asumsi yang mendasari

model tersebut adalah :

Muncul ketika adanya korelasi diantara peubah bebas yang dapat mempengaruhi ragam dari penduga kuadrat

terkecil dan pendugaan model yang dibuat. (Wetherhill,1986)

Apabila terdapat masalah multikolinear pada model regresi berganda, maka matriks XX akan memiliki sifat kondisi buruk (ill-conditioned) atau hampir singular yang pada

akhirnya akan menyebabkan dugaan bagi memiliki dugaan ragam yang menduga lebih (overestimate) walaupun tetap

takbias.

MULTIKOLINEARITAS

1.Semua variabel dilibatkan dengan nilai VIF >102.Uji parsial-t mengindikasikan terima Ho (model tidak nyata)3.Uji-F mengindikasikan tolak Ho (model nyata)4.Rsq(adj) bernilai tinggi5.Adanya korelasi antara peubah bebasKetidaksesuaian hubungan antara peubah bebas dan peubah respon berdasarkan teori dan hasil.

Indikasi adanya multikolinearitas

1. Condition Index (CI) atau Indeks Kondisi Dilakukan dengan mengukur

perubahan akar ciri yang umum, yaitu:

n = ( max / min )

Jika n>30 maka menandakan derajat multikolinearitas yang tinggi

Selain itu, cara mendeteksi adanya

multikolinearitas melalui nilai:

2. Multikolinearitas Index (MCI) (Thisted,1980)

MCI =

Dengan:m = nilai eigen (akar ciri) minimal1 = nilai eigen (akar ciri) dari matriks Bila MCI mendekati 1 Multikolinearitas tinggiBila MCI mendekati 3 Peubah saling bebas

p

x

m

1

2

1

3. Variance Inflation Factor (VIF)dengan

VIFi = 1/(1-Ri)Ri = koefisien determinasi ganda bila Xi diregresikan terhadap semua peubah bebas lainnya.Nilai VIF yang lebih besar dari 10 menunjukkan adanya kolinearitas(Myers,1990).

Membuang peubah bebas yang mempunyai korelasitinggi terhadap peubah bebas lainnya.Menambah data pengamatan/contoh.Melakukan transformasi terhadap peubah-peubah

bebas yang mempunyai kolinearitas atau menggabungkan menjadi peubah-peubah bebas baru yang lebih berarti. Menggunakan regresi Gulud, regresi

kuadrat terkecil parsial dan Regresi Komponen Utama (principal component regression).

Cara dan pendekatan yang dilakukan

untuk mengatasi masalah

multikolinearitas, seperti:

REGRESI KOMPONEN UTAMA

(PRINCIPAL COMPONENT REGRESSION)

Regresi Komponen Utama ( Principal Component Regression)

Analisis komponen utama pada dasarnya mentransformasi peubah-peubah bebas yang berkorelasi menjadi peubah-peubah baru yang ortogonal dan tidak

berkorelasi. Analisis ini bertujuan untuk menyederhanakan peubah-peubah yang diamati dengan cara mereduksi dimensinya. Hal ini dilakukan dengan menghilangkan

korelasi di antara peubah melalui transformasi peubah asal ke peubah baru (komponen utama) yang tidak berkorelasi

(Gesperz, 1995).

Tahapan-tahapan yang dilakukan dalam analisis regresi komponen utama adalah:

1.Membakukan peubah bebas asal yaitu X menjadi Z.2.Mencari akar ciri dan vektor ciri dari matriks R.3.Menentukan persamaan komponen utama dari vektor ciri.4.Meregresikan peubah respon Y terhadap skor komponen utama W.5.Transformasi balik.

Biasanya tidak semua W digunakan. Morrison (1978) menyarankan agar memilih komponen-komponen utama sampai komponen-komponen utama tersebut mempunyai keragaman kumulatif 75 %, namun

sebagian ahli menyarankan agar memilih komponen utama yang mempunyai akar ciri lebih dari satu, karena jika akar

ciri kurang dari satu, keragaman data yang dapat diterangkan kecil sekali.

Berdasarkan teori dan konsep ekonomi, variabel-variabel yang mempengaruhi penawaran ekspor TPT Indonesiaadalah sebagai berikut:Y = Volume ekspor TPT (Tekstil dan Produk Tekstil) (kg)X1 = Pendapatan per kapita (dolar)X2 = Upah tenaga kerja (dolar)X3 = Harga ekspor TPT pada (dolar/kg)X4 = Indeks persepsi korupsi Indonesia (CPI)X5 = Nilai tengah kurs rupiah (rupiah/dolar)X6 = Suku bunga kredit investasi (%)

contoh kasus

Y X1 X2 X3 X4 X5 X6

1231259 1221,02 101,518 100,741 6,366 2,31988 0,15

3784049 1252,35 107,148 95,819 7,296 2,82953 0,135

12610093 929,03 49,919 115,86 10,348 6,46352 0,135

16262677 1020,79 64,109 102,191 12,192 4,57276 0,135

19652917 1066,94 106,114 81,993 13,052 3,33007 0,135

26066585 1018,6 159,541 69,089 14,347 3,56899 0,135

54588512 4327,72 164,611 49,617 16,065 2,87178 0,135

84680680 3793,76 139,723 53,641 17,447 3,10394 0,135

1,01E+08 3613,34 140,651 51,051 18,329 3,81087 0,193

1,28E+08 2771,18 87,752 52,635 17,247 4,2792 0,178

1,59E+08 2841,22 96,019 43,769 19,239 3,90727 0,187

2,05E+08 2808,28 93,805 44,101 20,155 3,2182 0,196

2,48E+08 2847,93 78,978 41,936 21,008 4,0113 0,188

3,09E+08 2933,46 80,505 44,015 23,781 4,28146 0,232

4,08E+08 2909,73 77,761 44,048 24,999 3,76041 0,191

5,78E+08 2922,27 99,133 44,405 26,512 4,20033 0,1819

6,9E+08 2959 112,733 36,717 29,096 3,76027 0,1528

7,71E+08 3021,99 144,148 29,589 30,986 2,8298 0,1527

8,26E+08 3096,76 150,796 28,13 33,066 2,40781 0,161

9,71E+08 3057,78 147,18 24,718 35,041 2,23297 0,1741

8,58E+08 933,63 56,405 18,54 37,813 2,25327 0,1833

1,19E+09 820,67 95,347 4,043 76,989 1,69289 0,262

1,58E+09 925,35 136,239 4,773 81,369 2,11452 0,179

1,73E+09 707,91 113,51 4,731 90,048 2,27233 0,1686

1,73E+09 665,66 126,703 3,957 97,379 2,46266 0,179

1,76E+09 795 208,356 3,406 100 2,24986 0,1782

1,65E+09 865,11 223,453 3,754 104,37 2,46344 0,1575

1,63E+09 824,06 200,482 4,019 110,2 2,41005 0,1391

1,8E+09 812,45 183,482 3,774 116,39 2,54001 0,1623

1,88E+09 921,43 211,937 3,642 126,16 2,78449 0,1542

Regression Analysis: Y versus X1, X2, X3, X4, X5, X6 The regression equation isY = 1.36E+09 - 38255 X1 - 1882111 X2 - 7980119 X3 + 12350726 X4 -34507807 X5

- 2.69E+09 X6

Predictor Coef SE Coef T P VIFConstant 1356844891 424915011 3.19 0.004X1 -38255 52547 -0.73 0.474 4.6X2 -1882111 1239485 -1.52 0.143 4.2X3 -7980119 2843555 -2.81 0.010 11.0X4 12350726 2923637 4.22 0.000 15.8X5 -34507807 45042940 -0.77 0.451 2.5X6 -2689286254 1411764071 -1.90 0.069 2.2

S = 153742395 R-Sq = 96.1% R-Sq(adj) = 95.1%

standardized residual

Analysis of Variance

Source DF SS MS F PRegression 6 1.34843E+19 2.24739E+18 95.08 0.000Residual Error 23 5.43645E+17 2.36367E+16Total 29 1.40280E+19

Source DF Seq SSX1 1 3.71673E+18X2 1 4.09562E+18X3 1 5.11166E+18X4 1 4.61654E+17X5 1 1.28943E+16X6 1 8.57703E+16

Unusual Observations

Obs X1 Y Fit SE Fit Residual St Resid20 3058 971167565 653131316 53575981 318036249 2.21R

R denotes an observation with a large

Correlations: X1, X2, X3, X4, X5, X6

X1 X2 X3 X4 X5X2 -0.139

0.465

X3 0.141 -0.5500.458 0.002

X4 -0.566 0.664 -0.8110.001 0.000 0.000

X5 0.257 -0.529 0.651 -0.5530.170 0.003 0.000 0.002

X6 0.098 -0.271 -0.417 0.128 -0.1420.605 0.147 0.022 0.501 0.453

Cell Contents: Pearson correlationP-Value

Hasil pembakuan dari peubah-peubah X i ke ZiZ1 Z2 Z3 Z4 Z5 Z6

-0.62888 -0.50233 1.81149 -0.98524 -0.84248 -0.60552

-0.60209 -0.38325 1.66399 -0.96128 -0.3355 -1.10485

-0.87868 -1.59365 2.26457 -0.88257 3.27946 -1.10485

-0.80018 -1.29354 1.85494 -0.83502 1.3986 -1.10485

-0.7607 -0.40512 1.24969 -0.81284 0.16242 -1.10485

-0.80205 0.72487 0.86301 -0.77945 0.40009 -1.10485

2.02883 0.8321 0.2795 -0.73516 -0.29347 -1.10485

1.57204 0.30572 0.40008 -0.69954 -0.06253 -1.10485

1.4177 0.32533 0.32246 -0.67677 0.6407 0.82589

0.69725 -0.79348 0.36994 -0.70467 1.10658 0.32656

0.75716 -0.61864 0.10424 -0.65332 0.7366 0.62616

0.72898 -0.66545 0.11421 -0.6297 0.05113 0.92575

0.76291 -0.97905 0.04933 -0.60771 0.84008 0.65945

0.83607 -0.94677 0.11161 -0.53621 1.10883 2.12414

0.81577 -1.00479 0.1126 -0.50479 0.59051 0.75931

0.8265 -0.55276 0.12332 -0.46579 1.02812 0.45639

0.85792 -0.26513 -0.10707 -0.39916 0.59037 -0.51231

0.91181 0.3993 -0.32068 -0.35041 -0.33524 -0.51564

0.97577 0.53991 -0.36438 -0.29679 -0.75501 -0.23934

0.94243 0.46342 -0.46664 -0.24587 -0.92893 0.19674

-0.87475 -1.45647 -0.65179 -0.1744 -0.90874 0.50299

-0.97138 -0.63284 -1.0862 0.83574 -1.46618 3.12279

-0.88183 0.23203 -1.06432 0.94868 -1.04676 0.35985

-1.06784 -0.2487 -1.06558 1.17249 -0.88978 0.01365

-1.10398 0.03034 -1.08878 1.3615 -0.70045 0.35985

-0.99334 1.7573 -1.10528 1.42909 -0.91214 0.33322

-0.93336 2.07661 -1.09487 1.54177 -0.69967 -0.35585

-0.96848 1.59078 -1.08692 1.69209 -0.75279 -0.96836

-0.97841 1.23122 -1.09425 1.8517 -0.6235 -0.19607

-0.88518 1.83304 -1.09821 2.10362 -0.38031 -0.46571

Nilai eigen dan vektor eigen:Principal Component Analysis: Z1, Z2, Z3, Z4, Z5, Z6

Eigen analysis of the Correlation Matrix

Eigenvalue 3.0626 1.3123 0.9525 0.4737 0.1655 0.0332Proportion 0.510 0.219 0.159 0.079 0.028 0.006Cumulative 0.510 0.729 0.888 0.967 0.994 1.000

Variable PC1 PC2 PC3 PC4 PC5 PC6Z1 -0.261 0.332 -0.816 -0.095 -0.159 0.348Z2 0.426 -0.339 -0.461 -0.223 0.630 -0.211Z3 -0.503 -0.312 0.139 0.211 0.533 0.549Z4 0.534 -0.064 0.182 -0.385 -0.160 0.710Z5 -0.451 -0.063 0.144 -0.862 0.014 -0.168Z6 0.097 0.818 0.219 -0.070 0.517 0.023

Hasil yang di dapat dari komponen utama pertama W1 dan W2 yang merupakan kombinasi linear dari Z dapat dinyatakan dalam persamaan berikut:W1 = -0.261 Z1 + 0.426 Z2 + 0.503 Z3 +0.534 Z4 -0.451 Z5 + 0.097 Z6

W2 = 0.332 Z1 + 0.339 Z2 - 0.312 Z3 0.064 Z4 - 0.063 Z5 + 0.818 Z6

Skor komponen utamaW1 W2 W3 W4 W5 W6

-1.16649 -0.98347 0.56379 1.70166 0.582702 0.309045

-1.31276 -1.41091 0.43465 1.22996 0.319862 0.132363

-3.64533 -1.51295 1.83746 -1.49488 -0.03854 0.068403

-2.459 -1.34529 1.31563 -0.05189 -0.11521 0.158095

-1.21736 -1.36769 0.61526 0.67605 0.093751 -0.12398

-0.61974 -1.66044 0.11424 0.12842 0.603699 -0.60554

-0.68302 -0.53407 -2.41855 0.29402 -0.10855 0.185921

-0.93385 -0.56193 -1.74641 0.2674 -0.30523 0.190588

-0.96291 0.93865 -1.11264 -0.48903 0.695591 0.032673

-1.54896 0.62738 -0.04919 -0.51701 -0.11588 -0.06569

-1.13313 0.93616 -0.19417 -0.33938 -0.01561 -0.12181

-0.80014 1.22635 -0.17711 0.23693 0.106089 0.022883

-1.27963 1.09506 -0.00975 -0.38016 -0.26137 -0.05805

-1.25667 2.26605 0.29639 -0.74298 0.530649 0.034297

-1.15916 1.19241 -0.02755 -0.19747 -0.22065 0.11793

-1.18058 0.76162 -0.2394 -0.66834 -0.08867 -0.02097

-0.8118 -0.02283 -0.69256 -0.36442 -0.55354 -0.09865

0.00748 -0.11083 -1.19794 0.21684 -0.28051 -0.14704

0.31734 0.12551 -1.31135 0.49221 -0.09715 -0.06326

0.49288 0.5368 -1.18351 0.59078 0.020392 -0.03925

0.30095 0.88626 1.24213 1.0864 -0.85028 -0.31369

1.94085 2.82509 1.55744 0.72877 0.637612 0.112298

1.87734 0.26053 0.5653 0.32 -0.26178 -0.08178

1.73663 0.05442 0.9264 0.2474 -0.74817 0.078748

1.92588 0.21446 0.96141 -0.0766 -0.42752 0.104856

2.77007 -0.34123 0.04825 -0.31768 0.605883 -0.14749

2.78255 -1.01717 -0.24606 -0.57083 0.431483 -0.1601

2.62519 -1.37431 -0.10637 -0.42656 -0.2063 0.036139

2.58034 -0.63996 0.28319 -0.57387 -0.05921 0.214109

2.81304 -1.06366 -0.04901 -1.00572 0.126458 0.248942

Meregresikan peubah tak bebas Y dengan skor komponen utama W1 dan W2

Regression Analysis: Y versus W1, W2

The regression equation isY = 7.14E+08 + 3.71E+08 W1 + 3798390 W2

Predictor Coef SE Coef T P VIFConstant 713684077 47118974 15.15 0.000W1 371064003 27384750 13.55 0.000 1.0W2 3798390 41834820 0.09 0.928 1.0

S = 258081252 R-Sq = 87.2% R-Sq(adj) = 86.2%

Analysis of VarianceSource DF SS MS F PRegression 2 1.22296E+19 6.11480E+18 91.81 0.000Residual Error 27 1.79836E+18 6.66059E+16Total 29 1.40280E+19

Source DF Seq SSW1 1 1.22291E+19W2 1 5.49081E+14

Unusual ObservationsObs W1 Y Fit SE Fit Residual St Resid3 -3.65 12610093 -644713694 127246505 657323787 2.93R

Transformasi peubah Z ke peubah asal (X)

Y = 7.14E+08 + 3.71E+08 W1 + 3798390 W2

Y = 7.14E+08 + 3.71E+08 (-0.261 Z1 + 0.426 Z2 + 0.503 Z3 +0.534 Z4 -0.451 Z5 +0.097 Z6) + 3798390 (0.332 Z1 + 0.339 Z2 - 0.312 Z3 0.064 Z4 - 0.063 Z5 +0.818 Z6)

Y = 7.14E+08 + -95569934.52 Z1 + 156758345.79 Z2 +87798097.68 Z3+197870903.04 Z4 +167560298.57 Z5+39094083.02 Z6

Y = 7.14E+08 + -95569934.52 + 156758345.79 + 87798097.68 + 197870903.04 + 167560298.57 + 39094083.02

Y = 7.67E+08 - 81753.5796 X1 + 3315531.848 X2 - 5.63E+06 X3 + 5102395.643 X4-166726665.2 X5 + 1301400899 X6

Jadi model akhir yang kita dapat adalah:

Y = 7.67E+08 - 81753.5796 X1 + 3315531.848 X2 - 5.63E+06 X3 + 5102395.643 X4 -166726665.2 X5 + 1301400899 X6

Analisis signifikansi koefesien regresi parsialPeubah (Zi) koefisien(i) Simpangan baku s(i) t-hitung

Z1 -95569934,52 7,102218521 -13456349,48

Z2 156758345,8 8,349539489 18774490,02

Z3 -187798097,7 8,628167101 -21765700,12

Z4 197870903 6,759499313 29273011,78

Z5 -167560298,6 5,741958242 -29181734,09

Z6 39094083,02 15,60628974 2505020,967

Karena nilai |t-hitung|>t-tabel maka setiap koefisien berpengaruh nyata.

Penduga koefisien regresi pada model regresi yang diperoleh dengan menggunakan regresi komponen utama seringkali berbias,

padahal sifat penduga yang baik adalah tak bias dengan ragam penduga minimum.

KesimpulanAnalisis komponen utama pada dasarnya

mentransformasi peubah-peubah bebas yang berkorelasi menjadi peubah-peubah baru yang

ortogonal dan tidak berkorelasi. Analisis ini bertujuan untuk menyederhanakan peubah-peubah

yang diamati dengan cara mereduksi dimensi, sehingga masalah multikolinearitas dapat diatasi.