Bentuk Fungsional Model Data Cacah Rito.pdf · Regresi Poisson, berdasarkan fungsi ... gamma satu...
Transcript of Bentuk Fungsional Model Data Cacah Rito.pdf · Regresi Poisson, berdasarkan fungsi ... gamma satu...
-
Jurnal EKSPONENSIAL Volume 3, Nomor 1, Mei 2012 ISSN 2085-7829
Program Studi Statistika FMIPA Universitas Mulawarman 39
Bentuk Fungsional Model Data Cacah
(Functional Form for Model of Count Data)
Rito Goejantoro Program Studi Statistika FMIPA Universitas Mulawarman
Abstract
Poisson regression is the basic model of count data. Having an assumption of the equality of the distributional
mean and variance, Poisson models are inappropriate for many count-modeling situations. Overdispersion
occurs when the variance exceeds the nominal mean. The negative binomial is commonly employed to model
overdispersed
Ke words : Maximum Likelihood Estimation, Negative Binomial, Poisson
Pendahuluan
Model untuk data cacah banyak dijumpai
dalam berbagai bidang seperti statistika,
ekonometrika, ilmu-ilmu sosial dll. Beberapa
aplikasi di antaranya adalah banyaknya kejadian
penyakit di suatu populasi, banyaknya
penyalahgunaan obat-obat terlarang, banyaknya
kejadian keuangan seperti kebangkrutan dsb. Model
regresi Poisson merupakan model dasar untuk
pemodelan data cacah. Karena asumsi kesamaan
mean dan variansi, model Poisson tidak cocok
untuk banyak situasi pemodelan data cacah.
Overdispersi terjadi bila nilai variansi melebihi nilai
mean. Model binomial negatif digunakan untuk
memodelkan data Poisson yang overdispersi.
Bentuk Fungsional Dasar
Regresi Poisson, berdasarkan fungsi
peluang Poisson adalah metode dasar yang
digunakan untuk pemodelan data respon cacah.
Fungsi kepadatan peluang Poisson adalah
( )
Model Regresi Poisson
Spesifikasi regresi kanonik untuk variabel
Y yang merupakan cacah peristiwa adalah regresi
Poisson
[ | ] ( )
( )
( )
di mana xi : vektor kovariat, N : ukuran sampel.
Model Poisson mempunyai sifat :
[ | ]
dan sifat dispersi sama
[ | ]
Karena data hampir selalu memperlihatkan
overdispersi maka perlu dicari alternatif untuk
regresi Poisson, seperti model binomial negatif.
Estimasi parameter model menggunakan
N sampel obsevasi pada (yi,xi), i = 1,2,,N,
diperoleh dengan memaksimumkan fungsi log
likelihood .
( ) [ ( ) ( )]
Persamaan likelihood mempunyai bentuk sederhana
( )
(
)
( )
(
)
Efek parsial dalam model Poisson adalah
[ | ]
Model Binomial Negatif Baku
Model binomial negatif digunakan sebagai
bentuk fungsional untuk mengatasi kendala dispersi
sama dari model Poisson. Untuk memperkenalkan
heterogenitas laten ke dalam model data cacah
maka
[ | ] ( )
-
Jurnal EKSPONENSIAL Volume 3, Nomor 1, Mei 2012 ISSN 2085-7829
40 Program Studi Statistika FMIPA Universitas Mulawarman
di mana ( ) diasumsikan berdistribusi gamma satu parameter, G(,) dengan mean 1 dan
variansi 1/ = yaitu
( ) ( )
( ) *
Mean tak nol dari akan diserap ke dalam suku konstan dari fungsi indeks. Dengan perubahan
variabel menghasilkan variabel log gamma dengan fungsi kepadatan peluang :
( ) ( ( )) [ ( )]
( )
Mean dan variansi variabel acak adalah
( ) ( ) dan ( ) ( )
di mana ( ) adalah fungsi digamma, ( ) dan ( ) adalah fungsi trigamma. Untuk membuktikan hasil ini akan digunakan metode
derivasi tak langsung untuk memperlihatkan hasil
sederhana. Mengambil log persamaan * dan
membuang subskrip
( ) ( ) ( )
Fungsi peluang persamaan * regular menurut
kriteria Fisher untuk sifat estimasi kemungkinan
maksimum, sehingga
[ ( )
] ( ) ( ) ( )
E(h)=1 dari hasil sebelumnya untuk distribusi
gamma, sehingga bagian pertama hasil untuk
( ) terbukti karena . Untuk hasil kedua, dari persamaan matriks informasi
[ ( ) ] [ ( )
]
( )
Tetapi
[ ( ) ] ( ) ( ) ( )
dan
( )
sehingga
( ) ( ) ( )
Perlu dicari ( ) untuk memperoleh ( ) ( );
( ) [ ] [ ] [ ]
[ ] ( ( ) )
Dengan mengubah menjadi variabel berdistribusi
gamma untuk h :
[ ]
( )
( )
( )
( )
( ) ( )
( )
Di sini digunakan rekursi ( ) ( ). Hasil ini menunjukkan [ ] bila h mempunyai distribusi gamma ( ) dari hasil sebelumnya [ ] ( ) . Sehingga diperoleh
( )
Var( )
[( ( ) ) ( ( ) )]
Akhirnya dengan menggunakan rekursi
( ( ) ( ) )
Dengan mensubstitusikan ini pada persamaan
di atas diperoleh hasil akhir
Var( ) ( ) ( )
Model regresi Poisson bersyarat adalah :
[ | ] [ ( ) ] [ ( ) ]
( )
( ),
Peluang tak bersyarat yaitu hanya bersyarat pada xi,
diperoleh dengan mengintegralkan terhadap dari fungsi kepadatan peluang :
[ | ] [ | ]
( )
[ ( ) ] [ ( ) ]
( )
( ( )) [ ( )]
( )
Dengan mengubah variabel kembali menjadi
( ) maka peluang bersyarat menjadi :
-
Jurnal EKSPONENSIAL Volume 3, Nomor 1, Mei 2012 ISSN 2085-7829
Program Studi Statistika FMIPA Universitas Mulawarman 41
[ | ] [ ] [ ]
( )
( ),
dan peluang tak bersyarat adalah :
[ | ] [ | ] ( )
[ ] [ ]
( )
x ( )[ ]
( )
( ) ( )
[ ( )]
( ) ( )
( )
( )
Dengan mendefinisikan ( ) diperoleh
[ | ] ( )
( )
( ) ( )
yang merupakan fungsi kepadatan peluang untuk
distribusi binomial negatif.
Mean dan variansi bersyarat dari variabel acak
binomial negatif berhubungan dengan momen
distribusi Poisson sebagai berikut :
[ | ]
[ | ]
( )
( ) [ ]
(sama seperti model Poisson) dan
[ | ] [ ( ) ] [ ]
di mana [ ]
Model Campuran Lognormal Poisson
Selain memperkenalkan heterogenitas
sebagai variabel berdistribusi normal dengan mean
nol dan simpangan baku , akan diperkenalkan
model yang secara eksplisit membakukan . Model Poisson adalah
[ | ] ( )( )
( )
( ) ( )
Fungsi kepadatan peluang tak bersyarat adalah
P( | )
[ ( ) ][ ( ) ]
( )
( )
di mana ( ) menyatakan fungsi kepadatan normal baku. Fungsi log likelihood tak bersyarat
adalah
( )
( | )
( )
( | )
{ [ ( ) ] [ ( ) ]
( )
( ) }
Estimasi maksimum likelihood dari parameter
model diperoleh dengan memaksimumkan fungsi
log likelihood tak bersyarat terhadap parameter
model ( ).
Integral dalam fungsi log likelihood tidak
ada dalam bentuk tertutup. Pendekatan kuadratur
yang disarankan Butler dan Moffitt (1982) adalah
metode pendekatan yang cocok . Misalkan
dan . Setelah perubahan dari menjadi dan perubahan parameter peluang maka diperoleh
P( | )
[
] ( | )
di mana mean bersyarat adalah [ | ] (
) Estimasi maksimum likelihood dari ( ) diperoleh dengan memaksimumkan log likelihood yang diubah
parameternya. Dalam bentuk ini, ln L dapat
didekati dengan kuadratur Gauss-Hermite.
Pendekatannya adalah
[
( | )
]
di mana dan adalah node dan bobot untuk kuadratur. Simulasi juga merupakan pendekatan
yang efektif untuk memaksimumkan fungsi log
likelihood (Train, 2003).
-
Jurnal EKSPONENSIAL Volume 3, Nomor 1, Mei 2012 ISSN 2085-7829
42 Program Studi Statistika FMIPA Universitas Mulawarman
Kesimpulan
Regresi Poisson adalah model dasar untuk
data cacah. Model Poisson mempunyai keterbatasan
yaitu asumsi kesamaan nilai mean dan variansi.
Untuk mengatasi overdispersi digunakan model
binomial negatif.
Daftar Pustaka
Butler, J. and Moffitt, R., A Computationally
Efficient Quadrature Procedure for the One Factor
Multinomial Probit Model, Econometrica, 50,
1982, pp. 761-764.
Cameron, C., and P. Trivedi. (1998) Regression
Analysis of Count Data. New York: Cambridge
University Press.
McCullagh, P. and J.A. Nelder (1989). Generalized
Linear Model (2nd
ed.) London: Chapman and Hall.
Hilbe, Joseph M. (2011). Negative Binomial
Regression (2nd
ed.), New York : Cambridge
University Press.
Train, K.,(2003) Discrete Choice Models with
Simulation, Cambridge : Cambridge University
Press.
Winkelmann, R., (2003) Econometric Analysis of
Count Data (4th ed), Heidelberg : Springer Verlag.