Rabu, 18 Januari 2017

Analisis Regresi Data Panel (1)

Selamat sore sahabat...
Saat ini saya akan coba mengupas analisi regresi data panel. Analisis ini digunakan untuk data yang berbetuk panel atau gabungan dari data crossection dan time series.


Data panel atau yang sering disebut pooled data adalah suatu himpunan observasi yang terdiri dari beberapa individu pada periode tertentu. Susunan data panel merupakan gabungan dari dua jenis data, yaitu:
·         Data time series, yaitu serangkaian data hasil pengamatan yang nilainya diambil berdasarkan waktu, misalnya mingguan, bulanan, tahunan, dsb.
·          Data cross section, yaitu data yang dikumpulkan dari satu atau beberapa variabel pada suatu titik waktu, misalnya produksi untuk sejumlah perusahaan pada suatu waktu.
Oleh karena itu dalam data panel, periode waktu yang digunakan tidak terlalu panjang, dan cross section-nya dapat berupa karakteristik suatu perusahaan/wilayah/negara. Apabila data yang terdapat dalam data cross section terdapat jumlah data time series yang sama, maka data panel tersebut dikatakan balance panel. Sedangkan jika tidak sama jumlah time series-nya antarindividu maka disebut unbalaned panel.
Data panel memberikan informasi yang sangat berguna, tidak hanya untuk melihat variasi antarindividu dalam suatu waktu, tetapi juga dapat melihat kedinamisan perilaku individu seiring waktu. Struktur data yang demikian membuat model analisis yang menggunakan data panel memiliki beberapa keuntungan dibanding penggunaan data cross sectional atau data time series murni. Menurut Baltagi (Gujarati, 2003, hal. 637-638) dan Greene (2003, hal. 283-284), menggunakan data panel memiliki beberapa keuntungan antara lain:
a.       Data panel dapat mengontrol keheterogenitasan individu (perusahaan, provinsi, atau negara) yang tidak dapat dikontrol oleh data time series dan cross section.
b.      Data panel mampu menyediakan data yang lebih banyak, lebih bervariasi, dan informasi yang lebih lengkap, karena merupakan gabungan antara data time series dan cross section. Dengan demikian, model regresi data panel akan menghasilkan degree of freedom (df) yang lebih besar yang selanjutnya akan meningkatkan presisi dari estimasi regresi.
c.       Data panel mampu mengurangi kolinieritas antarvariabel penjelas.
d.      Dengan menggabungkan informasi dari data time series dan cross section, dapat mengatasi masalah yang timbul akibat penghilangan variabel.
e.       Data panel dapat meminimalkan bias yang dihasilkan oleh agregasi individu karena unit data lebih banyak.
f.        Data panel mampu mengindikasikan dan mengukur efek yang secara sederhana tidak dapat diperoleh dengan data cross section murni atau time series murni, misalnya efek dari upah minimum dan otonomisasi daerah.
g.       Data panel dapat menguji dan membangun model perilaku yang lebih kompleks, misalnya fenomena skala ekonomi dan perubahan teknologi.
h.       Dapat  menggambarkan perubahan yang dinamis dibandingkan dengan studi berulang dengan data cross section.
i.         Data panel baik untuk mengidentifikasi dan mengukur dampak yang tidak dapat dideteksi secara sederhana pada data time series dan cross section murni.
Kelebihan analisis regresi panel yang fundamental adalah adanya fleksibilitas yang lebih besar bagi peneliti dalam memodelkan perbedaan perilaku di antara individu-individu (Greene, 2003, hal. 284).
Secara sederhana, Greene (2003, hal. 285) menggambarkan bahwa model regresi data panel memiliki double subscript pada setiap variabel, i menunjukkan individu (cross section) dan t menunjukkan waktu (time series) dengan modelnya adalah sebagai berikut:
                      untuk i = 1,2,...,N dan t = 1,2,...,T             (1)
Keterangan:
      = Variabel dependen/respon yang bersifat stokastik.
     = Variabel penjelas yang bersifat nonstokastik.
     = Intersep yang dapat bernilai sama ataupun berbeda antar invididu maupun waktu.
        = Slope yang dapat bernilai sama ataupun berbeda antar individu maupun waktu.
      = Error atau ganggauan pada individu ke-i waktu ke-t.
Menurut Baltagi (2005), berdasarkan konsep gangguan (disturbance term) analisis data panel dapat dibedakan menjadi dua, yaitu:
1.         Model regresi dengan komponen error satu arah (one-way error component model), di mana struktur pembentuk gangguan εit hanya memasukkan komponen error yang merupakan efek individu. Spesifikasi error ditunjukkan pada model berikut:
 ;                                                                   (2)
di mana  adalah efek individu yang tidak diteliti (unobserved variable) dan  adalah sisa dari disturbance term dengan asumsi tidak memiliki hubungan dengan variabel penjelas.
2.         Model regresi dengan komponen error dua arah (two-way component model), di mana struktur pembentuk gangguan εit merupakan gabungan dari efek individu dan efek waktu. Spesifikasi error ditunjukkan pada model berikut:
 ;                                                             (3)
di mana  adalah efek individu yang tidak diteliti (unobserved variable),   adalah efek waktu yang tidak diteliti, dan  adalah sisa dari disturbance term dengan asumsi tidak memiliki hubungan dengan variabel penjelas.
Untuk menyelesaikan model regresi data panel, ada 3 (tiga) pendekatan dalam model regresi data panel yaitu pooled OLS atau biasa disebut model common effects, model efek tetap (fixed effects model) dan model efek random (random effects model) (Nahrowi dan Usman, 2006, hal. 311). Perbedaan ketiganya terletak pada asumsi intersep dan slope yang dapat konstan ataupun berbeda antarindividu dan waktu. Hsiao (2003) menunjukkan bahwa jika mengabaikan penggunaan heterogenitas parameter pada model maka bisa menghasilkan estimasi yang bias dan pemahaman interpretasi yang salah. Oleh karena itu, Hsiao (2003) menyarankan penggunaan model pooled regression atau model common effects lebih baik dihindari.
Jika hipotesis homogenitas secara keseluruhan ditolak, maka digunakan model dengan intersep yang bervariasi untuk menperhitungkan heterogenitas antarindividu dan antarwaktu. Terdapat 4 (empat) model yang digunakan (Hsiao, 2003, hal. 11-12):
1.        Koefisien slope konstan dan intersep bervariasi antarindividu:
     i = 1,2,...,N dan t = 1,2,...,T                                     (4)
2.        Koefisien slope konstan dan intersep bervariasi antarindividu dan waktu:
    i = 1,2,...,N dan t = 1,2,...,T                                     (5)
3.        Koefisien slope dan intersep bervariasi antarindividu:
    i = 1,2,...,N dan t = 1,2,...,T                                     (6)
4.        Koefisien slope dan intersep bervariasi antarindividu dan waktu:
   i = 1,2,...,N dan t = 1,2,...,T                                     (7)
Asumsi dalam pemilihan model data panel adalah sebagai berikut:
a.         Individual time-invariant, variabel-variabelnya yang berbeda antarunit cross section tetapi konstan sepanjang waktu. Misalnya, kemampuan manajemen setiap perusahaan, jenis kelamin, dan latar belakang sosial-ekonomi.
b.        Period individual-invariant, variabel-variabelnya berbeda sepanjang waktu namun sama untuk setiap unit cross section. Misalnya harga dan tingkat suku bunga.
c.         Individual time-varying, variabel-variabel yang berbeda antarunit cross section dan waktu. Contohnya, keuntungan perusahaan dan tingkat harga.

Pendekatan Model Regresi Data Panel
Telah dijelaskan sebelumnya bahwa ada 3 (tiga) pendekatan dalam model regresi data panel yaitu pooled OLS atau biasa disebut model common effects, model efek tetap (fixed effects model) dan model efek random (random effects model). Penjelasan ketiga model tersebut adalah sebagai berikut:
a.        Model Common Effects (Polled OLS)
Teknik yang paling sederhana dalam melakukan estimasi data panel adalah hanya dengan mengkombinasikan data time series dan cross section dengan menggunakan metode OLS. Menurut Nahrowi dan Usman (2006, hal. 312), penggabungan tersebut membuat hasil regresi lebih baik dibandingkan dengan regresi yang hanya menggunakan dara cross section atau time series saja. Akan tetapi, dengan menggabungkan data, maka kita tidak dapat melihat perbedaan baik antarindividu maupun antarwaktu. Model ini mengasumsikan bahwa perilaku individu sama pada berbagai kurun waktu. Model regresi common effects satu arah adalah sebagai berikut:
        i=1,2,..,N dan t=1,2,..,T                                                (8)
dengan                 
di mana N adalah jumlah unit cross section (individu) dan T adalah jumlah periode waktunya. Implikasinya, akan diperoleh sebanyak T persamaan deret lintang (cross section) yang sama. Begitu juga sebaliknya, kita juga akan dapat memperoleh persamaan deret waktu (time series) sebanyak N persamaan untuk setiap T periode observasi. Namun, untuk mendapatkan parameter α dan β yang konstan dan efisien, akan dapat diperoleh dalam bentuk regresi yang lebih besar dengan melibatkan sebanyak N x T observasi (Greene, 2003, hal. 285). Formula estimasi parameternya adalah sebagai berikut:
                                                                         (9)
                                                                                                 (10)
Keterangan:
                            
                    
Berdasarkan asumsi struktur matriks variance-covariance residual-nya, pada common effect terdapat 4 (empat) metode estimasi yang dapat digunakan, yaitu:
1.        Ordinary Least Square (OLS), di mana struktur matriks variance-covariance residual-nya diasumsikan bersifat homoskedastisitas dan tidak ada cross section correlation.
2.        Generalized Least Square (GLS)/ Weighted Least Square (WLS)/ cross sectional weight, jika struktur matriks variance-covariance residual-nya diasumsikan bersifat heteroskedastisitas dan tidak ada cross sectional correlation.
3.        Feasible Generalized Least Square (FGLS)/ Seemingly Unrelated Regression (SUR) atau Maximum Likelihood Estimator (MLE), jika struktur matriks variance-covariance residual-nya diasumsikan bersifat heteroskedastisitas dan ada cross sectional correlation.
4.        Feasible Generalized Least Square (FGLS) dengan proses autoregressive (AR) pada error term-nya, jika struktur matriks variance-covariance residual-nya diasumsikan bersifat heteroskedastisitas dan ada cross sectional correlation pada residualnya.
b.        Model Efek Tetap (Fixed Effects Model)
Model fixed effects mengasumsikan bahwa perbedaan antarindividu bisa diakomodir melalui perbedaan intersepnya, yaitu intersep pada setiap individu merupakan suatu parameter yang tidak diketahui dan akan dilakukan estimasi. Katakanlah  yi  dan  Xi   merupakan T pengamatan untuk setiap unit ke-i, i disusun dalam matriks  T  x  1 dan  εi  disusun dalam vektor  T  x  1 merupakan vektor gangguan. Secara umum, model fixed effects satu arah dapat dituliskan sebagai berikut (Gujarati, 2003, hal. 642):
                                                                                        (11)
i = 1,2,...,N; t = 1,2,...,T ; dan k = 1,2,...,K
dengan                     
di mana K adalah jumlah variabel penjelas, N adalah jumlah cross section, dan T adalah jumlah time series.
Selain dengan model di atas, efek individu dapat juga diperoleh dengan teknik Least Squares Dummy Variable (LSDV). Model estimasi Least Square Dummy Variable (LSDV)  adalah sebagai berikut (Greene, 2003, hal. 287):
                                                                                             (12)
Keterangan:
 ;        ;           
 ;       ;      ;  
di mana D merupakan variabel dumm untuk individu ke-i, sehingga estimasi parameternya adalah sebagai berikut:
                                                                (13)
di mana,
Berdasarkan asumsi struktur matriks variance-covariance residual-nya, pada model fixed effects, terdapat 3 (tiga) metode estimasi yang dapat digunakan, yaitu:
1.        Ordinary Least Square (OLS/LSDV), jika struktur matriks variance-covariance residual-nya diasumsikan bersifat homoskedastisitas dan tidak ada cross sectional correlation.
2.        Generalized Least Square (GLS)/ Weighted Least Square (WLS)/ cross sectional weight, jika struktur matriks variance-covariance residual-nya diasumsikan bersifat heteroskedastisitas dan tidak ada cross sectional correlation.
3.        Feasible Generalized Least Square (FGLS)/ Seemingly Unrelated Regression (SUR), jika struktur matriks variance-covariance residual-nya diasumsikan bersifat heteroskedastisitas dan ada cross sectional correlation.
c.         Model Efek Random (Random Effects Model)
Banyaknya parameter dalam model random effects dan kehilangan derajat bebas dapat dihindari jika ui bisa di asumsikan random  (Baltagi, 2005, hal. 298). Jadi, berbeda dengan pendekatan sebelumnya, pada model ini diasumsikan bahwa ada perbedaaan intersep untuk setiap individu sifatnya random (stokastik). Model random effects menganggap efek rata-rata dari data cross section dan error model dinterpretasikan melalui intersep yang diakomodasi. Karena terdapat dua komponen yang berkontribusi dalam pembentukan error, yaitu individu dan waktu, maka random error diuraikan menjadi dua bagian, yaitu error untuk komponen individu dan error komponen waktu.
Model random effects satu arah dituliskan sebagai berikut (Gujarati, 2003, hal. 647):
                                                        (14)
i = 1,2,...,N; t = 1,2,...,T ; dan k = 1,2,...,K
di mana K adalah jumlah variabel penjelas, N adalah jumlah cross section, dan T adalah jumlah time series.
Dengan mengasumsikan bahwa intersep  merupakan variabel random dengan rata-rata sebesar , nilai intersep untuk masing-masing individu dapat dinyatakan sebagai:
 dengan i = 1,2,...,N                                                                       (15)
di mana  merupakan random error dengan rata-rata nol dan variance konstan. Dengan melakukan subtitusi persamaan random error ke dalam persamaan umum REM (Random Effects Model) diperoleh persamaan sebagai berikut:
                                                    (16)
                                                        (17)
di mana  dengan  disebut error komponen dan  merupakan error kombinasi antara cross section dan time series. Beberapa asumsi yang harus dipenuhi dalam model random effects, yaitu (Gujarati, 2003, hal. 648):
                                                                                                (18)
                                                                                               (19)
 ;                                   (i≠j)                                     (20)
                     (i ≠ j ; t ≠ s)                         (21)
 ;                                                                      (22)
di mana i dan j menunjukkan individu sedangkan t dan s menunjukkan waktu.
Pada model random effects, metode OLS tidak bisa digunakan untuk mendapatkan estimator yang efisien, karena adanya korelasi antara wit dan wis.
                                                                                   (23)
Untuk itu metode yang tepat untuk mengestimasi model random effects adalah Generalized Least Squares (GLS) dan Feasible Generalized Least Square (FGLS) (Gujarati, 2003, hal. 649).
Perbedaan Fixed Effects Model (FEM) dan Random Effects Model (REM) terletak pada nilai intersepnya. Pada FEM, masing-masing unit cross section memiliki nilai intersep sendiri sedangkan pada REM intersep α menunjukkan nilai rata-rata seluruh intersep (cross section) dan komponen error ui menunjukkan deviasi intersep individu dari nilai rata-rata tersebut.

Tidak ada komentar:

Posting Komentar