Bentuk Fungsional Model Data Cacah Rito.pdf · Regresi Poisson, berdasarkan fungsi ... gamma satu...

download Bentuk Fungsional Model Data Cacah Rito.pdf · Regresi Poisson, berdasarkan fungsi ... gamma satu parameter, G(θ,θ) dengan mean 1 dan ... Gauss-Hermite.

If you can't read please download the document

Transcript of Bentuk Fungsional Model Data Cacah Rito.pdf · Regresi Poisson, berdasarkan fungsi ... gamma satu...

  • Jurnal EKSPONENSIAL Volume 3, Nomor 1, Mei 2012 ISSN 2085-7829

    Program Studi Statistika FMIPA Universitas Mulawarman 39

    Bentuk Fungsional Model Data Cacah

    (Functional Form for Model of Count Data)

    Rito Goejantoro Program Studi Statistika FMIPA Universitas Mulawarman

    Abstract

    Poisson regression is the basic model of count data. Having an assumption of the equality of the distributional

    mean and variance, Poisson models are inappropriate for many count-modeling situations. Overdispersion

    occurs when the variance exceeds the nominal mean. The negative binomial is commonly employed to model

    overdispersed

    Ke words : Maximum Likelihood Estimation, Negative Binomial, Poisson

    Pendahuluan

    Model untuk data cacah banyak dijumpai

    dalam berbagai bidang seperti statistika,

    ekonometrika, ilmu-ilmu sosial dll. Beberapa

    aplikasi di antaranya adalah banyaknya kejadian

    penyakit di suatu populasi, banyaknya

    penyalahgunaan obat-obat terlarang, banyaknya

    kejadian keuangan seperti kebangkrutan dsb. Model

    regresi Poisson merupakan model dasar untuk

    pemodelan data cacah. Karena asumsi kesamaan

    mean dan variansi, model Poisson tidak cocok

    untuk banyak situasi pemodelan data cacah.

    Overdispersi terjadi bila nilai variansi melebihi nilai

    mean. Model binomial negatif digunakan untuk

    memodelkan data Poisson yang overdispersi.

    Bentuk Fungsional Dasar

    Regresi Poisson, berdasarkan fungsi

    peluang Poisson adalah metode dasar yang

    digunakan untuk pemodelan data respon cacah.

    Fungsi kepadatan peluang Poisson adalah

    ( )

    Model Regresi Poisson

    Spesifikasi regresi kanonik untuk variabel

    Y yang merupakan cacah peristiwa adalah regresi

    Poisson

    [ | ] ( )

    ( )

    ( )

    di mana xi : vektor kovariat, N : ukuran sampel.

    Model Poisson mempunyai sifat :

    [ | ]

    dan sifat dispersi sama

    [ | ]

    Karena data hampir selalu memperlihatkan

    overdispersi maka perlu dicari alternatif untuk

    regresi Poisson, seperti model binomial negatif.

    Estimasi parameter model menggunakan

    N sampel obsevasi pada (yi,xi), i = 1,2,,N,

    diperoleh dengan memaksimumkan fungsi log

    likelihood .

    ( ) [ ( ) ( )]

    Persamaan likelihood mempunyai bentuk sederhana

    ( )

    (

    )

    ( )

    (

    )

    Efek parsial dalam model Poisson adalah

    [ | ]

    Model Binomial Negatif Baku

    Model binomial negatif digunakan sebagai

    bentuk fungsional untuk mengatasi kendala dispersi

    sama dari model Poisson. Untuk memperkenalkan

    heterogenitas laten ke dalam model data cacah

    maka

    [ | ] ( )

  • Jurnal EKSPONENSIAL Volume 3, Nomor 1, Mei 2012 ISSN 2085-7829

    40 Program Studi Statistika FMIPA Universitas Mulawarman

    di mana ( ) diasumsikan berdistribusi gamma satu parameter, G(,) dengan mean 1 dan

    variansi 1/ = yaitu

    ( ) ( )

    ( ) *

    Mean tak nol dari akan diserap ke dalam suku konstan dari fungsi indeks. Dengan perubahan

    variabel menghasilkan variabel log gamma dengan fungsi kepadatan peluang :

    ( ) ( ( )) [ ( )]

    ( )

    Mean dan variansi variabel acak adalah

    ( ) ( ) dan ( ) ( )

    di mana ( ) adalah fungsi digamma, ( ) dan ( ) adalah fungsi trigamma. Untuk membuktikan hasil ini akan digunakan metode

    derivasi tak langsung untuk memperlihatkan hasil

    sederhana. Mengambil log persamaan * dan

    membuang subskrip

    ( ) ( ) ( )

    Fungsi peluang persamaan * regular menurut

    kriteria Fisher untuk sifat estimasi kemungkinan

    maksimum, sehingga

    [ ( )

    ] ( ) ( ) ( )

    E(h)=1 dari hasil sebelumnya untuk distribusi

    gamma, sehingga bagian pertama hasil untuk

    ( ) terbukti karena . Untuk hasil kedua, dari persamaan matriks informasi

    [ ( ) ] [ ( )

    ]

    ( )

    Tetapi

    [ ( ) ] ( ) ( ) ( )

    dan

    ( )

    sehingga

    ( ) ( ) ( )

    Perlu dicari ( ) untuk memperoleh ( ) ( );

    ( ) [ ] [ ] [ ]

    [ ] ( ( ) )

    Dengan mengubah menjadi variabel berdistribusi

    gamma untuk h :

    [ ]

    ( )

    ( )

    ( )

    ( )

    ( ) ( )

    ( )

    Di sini digunakan rekursi ( ) ( ). Hasil ini menunjukkan [ ] bila h mempunyai distribusi gamma ( ) dari hasil sebelumnya [ ] ( ) . Sehingga diperoleh

    ( )

    Var( )

    [( ( ) ) ( ( ) )]

    Akhirnya dengan menggunakan rekursi

    ( ( ) ( ) )

    Dengan mensubstitusikan ini pada persamaan

    di atas diperoleh hasil akhir

    Var( ) ( ) ( )

    Model regresi Poisson bersyarat adalah :

    [ | ] [ ( ) ] [ ( ) ]

    ( )

    ( ),

    Peluang tak bersyarat yaitu hanya bersyarat pada xi,

    diperoleh dengan mengintegralkan terhadap dari fungsi kepadatan peluang :

    [ | ] [ | ]

    ( )

    [ ( ) ] [ ( ) ]

    ( )

    ( ( )) [ ( )]

    ( )

    Dengan mengubah variabel kembali menjadi

    ( ) maka peluang bersyarat menjadi :

  • Jurnal EKSPONENSIAL Volume 3, Nomor 1, Mei 2012 ISSN 2085-7829

    Program Studi Statistika FMIPA Universitas Mulawarman 41

    [ | ] [ ] [ ]

    ( )

    ( ),

    dan peluang tak bersyarat adalah :

    [ | ] [ | ] ( )

    [ ] [ ]

    ( )

    x ( )[ ]

    ( )

    ( ) ( )

    [ ( )]

    ( ) ( )

    ( )

    ( )

    Dengan mendefinisikan ( ) diperoleh

    [ | ] ( )

    ( )

    ( ) ( )

    yang merupakan fungsi kepadatan peluang untuk

    distribusi binomial negatif.

    Mean dan variansi bersyarat dari variabel acak

    binomial negatif berhubungan dengan momen

    distribusi Poisson sebagai berikut :

    [ | ]

    [ | ]

    ( )

    ( ) [ ]

    (sama seperti model Poisson) dan

    [ | ] [ ( ) ] [ ]

    di mana [ ]

    Model Campuran Lognormal Poisson

    Selain memperkenalkan heterogenitas

    sebagai variabel berdistribusi normal dengan mean

    nol dan simpangan baku , akan diperkenalkan

    model yang secara eksplisit membakukan . Model Poisson adalah

    [ | ] ( )( )

    ( )

    ( ) ( )

    Fungsi kepadatan peluang tak bersyarat adalah

    P( | )

    [ ( ) ][ ( ) ]

    ( )

    ( )

    di mana ( ) menyatakan fungsi kepadatan normal baku. Fungsi log likelihood tak bersyarat

    adalah

    ( )

    ( | )

    ( )

    ( | )

    { [ ( ) ] [ ( ) ]

    ( )

    ( ) }

    Estimasi maksimum likelihood dari parameter

    model diperoleh dengan memaksimumkan fungsi

    log likelihood tak bersyarat terhadap parameter

    model ( ).

    Integral dalam fungsi log likelihood tidak

    ada dalam bentuk tertutup. Pendekatan kuadratur

    yang disarankan Butler dan Moffitt (1982) adalah

    metode pendekatan yang cocok . Misalkan

    dan . Setelah perubahan dari menjadi dan perubahan parameter peluang maka diperoleh

    P( | )

    [

    ] ( | )

    di mana mean bersyarat adalah [ | ] (

    ) Estimasi maksimum likelihood dari ( ) diperoleh dengan memaksimumkan log likelihood yang diubah

    parameternya. Dalam bentuk ini, ln L dapat

    didekati dengan kuadratur Gauss-Hermite.

    Pendekatannya adalah

    [

    ( | )

    ]

    di mana dan adalah node dan bobot untuk kuadratur. Simulasi juga merupakan pendekatan

    yang efektif untuk memaksimumkan fungsi log

    likelihood (Train, 2003).

  • Jurnal EKSPONENSIAL Volume 3, Nomor 1, Mei 2012 ISSN 2085-7829

    42 Program Studi Statistika FMIPA Universitas Mulawarman

    Kesimpulan

    Regresi Poisson adalah model dasar untuk

    data cacah. Model Poisson mempunyai keterbatasan

    yaitu asumsi kesamaan nilai mean dan variansi.

    Untuk mengatasi overdispersi digunakan model

    binomial negatif.

    Daftar Pustaka

    Butler, J. and Moffitt, R., A Computationally

    Efficient Quadrature Procedure for the One Factor

    Multinomial Probit Model, Econometrica, 50,

    1982, pp. 761-764.

    Cameron, C., and P. Trivedi. (1998) Regression

    Analysis of Count Data. New York: Cambridge

    University Press.

    McCullagh, P. and J.A. Nelder (1989). Generalized

    Linear Model (2nd

    ed.) London: Chapman and Hall.

    Hilbe, Joseph M. (2011). Negative Binomial

    Regression (2nd

    ed.), New York : Cambridge

    University Press.

    Train, K.,(2003) Discrete Choice Models with

    Simulation, Cambridge : Cambridge University

    Press.

    Winkelmann, R., (2003) Econometric Analysis of

    Count Data (4th ed), Heidelberg : Springer Verlag.