Saat ini saya akan coba mengupas analisi regresi data panel. Analisis ini digunakan untuk data yang berbetuk panel atau gabungan dari data crossection dan time series.
Data panel atau yang sering disebut pooled data adalah
suatu himpunan observasi yang terdiri dari beberapa individu pada periode
tertentu. Susunan data panel merupakan gabungan dari dua jenis data, yaitu:
·
Data time series, yaitu serangkaian data
hasil pengamatan yang nilainya diambil berdasarkan waktu, misalnya mingguan,
bulanan, tahunan, dsb.
·
Data cross section, yaitu data yang
dikumpulkan dari satu atau beberapa variabel pada suatu titik waktu, misalnya
produksi untuk sejumlah perusahaan pada suatu waktu.
Oleh karena itu dalam
data panel, periode waktu yang digunakan tidak terlalu panjang, dan cross section-nya dapat berupa
karakteristik suatu perusahaan/wilayah/negara. Apabila data yang terdapat dalam
data cross section terdapat jumlah
data time series yang sama, maka data
panel tersebut dikatakan balance panel.
Sedangkan jika tidak sama jumlah time
series-nya antarindividu maka disebut unbalaned
panel.
Data panel memberikan informasi
yang sangat berguna, tidak hanya untuk melihat variasi antarindividu dalam
suatu waktu, tetapi juga dapat melihat kedinamisan perilaku individu seiring
waktu. Struktur data yang demikian membuat model analisis yang menggunakan data
panel memiliki beberapa keuntungan dibanding penggunaan data cross sectional atau data time series murni. Menurut Baltagi
(Gujarati, 2003, hal. 637-638) dan Greene (2003, hal. 283-284), menggunakan
data panel memiliki beberapa keuntungan antara lain:
a. Data
panel dapat mengontrol keheterogenitasan individu (perusahaan, provinsi, atau
negara) yang tidak dapat dikontrol oleh data time series dan cross section.
b.
Data panel mampu
menyediakan data yang lebih banyak, lebih bervariasi, dan informasi yang lebih
lengkap, karena merupakan gabungan antara data time series dan
cross section. Dengan demikian, model regresi data panel akan menghasilkan
degree of freedom (df) yang lebih besar yang selanjutnya
akan meningkatkan presisi dari estimasi regresi.
c.
Data panel mampu
mengurangi kolinieritas antarvariabel penjelas.
d. Dengan
menggabungkan informasi dari data time series dan cross section,
dapat mengatasi masalah yang timbul akibat penghilangan variabel.
e. Data
panel dapat meminimalkan bias yang dihasilkan oleh agregasi individu karena unit data lebih banyak.
f.
Data panel mampu
mengindikasikan dan mengukur efek yang secara sederhana tidak dapat diperoleh
dengan data cross section murni
atau time series murni,
misalnya efek dari upah minimum dan otonomisasi daerah.
g.
Data panel dapat
menguji dan membangun model perilaku yang lebih kompleks, misalnya fenomena
skala ekonomi dan perubahan teknologi.
h. Dapat menggambarkan
perubahan yang dinamis dibandingkan dengan studi berulang dengan data cross section.
i.
Data panel baik untuk
mengidentifikasi dan mengukur dampak yang tidak dapat dideteksi secara
sederhana pada data time series dan cross section murni.
Kelebihan analisis regresi panel
yang fundamental adalah adanya fleksibilitas yang lebih besar bagi peneliti
dalam memodelkan perbedaan perilaku di antara individu-individu (Greene, 2003,
hal. 284).
Secara sederhana, Greene (2003,
hal. 285) menggambarkan bahwa model regresi data panel memiliki double subscript pada setiap variabel, i menunjukkan individu (cross section) dan t menunjukkan waktu (time
series) dengan modelnya adalah sebagai berikut:
untuk
i = 1,2,...,N dan t = 1,2,...,T (1)
Keterangan:
=
Variabel dependen/respon yang bersifat stokastik.
=
Variabel penjelas yang bersifat nonstokastik.
=
Intersep yang dapat bernilai sama ataupun berbeda antar invididu maupun waktu.
=
Slope yang dapat bernilai sama ataupun berbeda antar individu maupun waktu.
= Error atau ganggauan pada individu ke-i waktu ke-t.
Menurut
Baltagi (2005), berdasarkan konsep gangguan (disturbance term) analisis data panel dapat dibedakan menjadi dua,
yaitu:
1.
Model regresi dengan
komponen error satu arah (one-way error component model), di mana
struktur pembentuk gangguan εit hanya memasukkan komponen error yang merupakan efek individu. Spesifikasi
error ditunjukkan pada model berikut:
;
(2)
di mana
adalah efek individu yang tidak diteliti (unobserved variable) dan
adalah sisa dari disturbance term dengan asumsi tidak memiliki hubungan dengan
variabel penjelas.
2.
Model regresi dengan
komponen error dua arah (two-way component model), di mana
struktur pembentuk gangguan εit merupakan gabungan dari efek
individu dan efek waktu. Spesifikasi error
ditunjukkan pada model berikut:
;
(3)
di mana
adalah efek individu yang tidak diteliti (unobserved variable),
adalah efek waktu yang tidak diteliti, dan
adalah sisa dari disturbance term dengan asumsi tidak memiliki hubungan dengan
variabel penjelas.
Untuk
menyelesaikan model regresi data panel, ada 3 (tiga) pendekatan dalam model regresi data panel yaitu pooled OLS atau biasa disebut model common effects, model efek tetap (fixed effects model) dan model efek
random (random effects model)
(Nahrowi dan Usman, 2006, hal. 311). Perbedaan ketiganya
terletak pada asumsi intersep dan slope yang dapat konstan ataupun berbeda
antarindividu dan waktu. Hsiao (2003) menunjukkan bahwa jika mengabaikan
penggunaan heterogenitas parameter pada model maka bisa menghasilkan estimasi
yang bias dan pemahaman interpretasi yang salah. Oleh karena itu, Hsiao (2003) menyarankan
penggunaan model pooled regression
atau model common effects lebih baik
dihindari.
Jika
hipotesis homogenitas secara keseluruhan ditolak, maka digunakan model dengan
intersep yang bervariasi untuk menperhitungkan heterogenitas antarindividu dan
antarwaktu. Terdapat 4 (empat) model yang digunakan (Hsiao, 2003, hal. 11-12):
1.
Koefisien slope konstan
dan intersep bervariasi antarindividu:
i = 1,2,...,N
dan t = 1,2,...,T (4)
2.
Koefisien slope konstan
dan intersep bervariasi antarindividu dan waktu:
i =
1,2,...,N dan t = 1,2,...,T (5)
3.
Koefisien slope dan
intersep bervariasi antarindividu:
i = 1,2,...,N
dan t = 1,2,...,T (6)
4.
Koefisien slope dan
intersep bervariasi antarindividu dan waktu:
i = 1,2,...,N
dan t = 1,2,...,T (7)
Asumsi dalam pemilihan model data panel
adalah sebagai berikut:
a.
Individual
time-invariant, variabel-variabelnya yang berbeda
antarunit cross section tetapi
konstan sepanjang waktu. Misalnya, kemampuan manajemen setiap perusahaan, jenis
kelamin, dan latar belakang sosial-ekonomi.
b.
Period
individual-invariant, variabel-variabelnya
berbeda sepanjang waktu namun sama untuk setiap unit cross section. Misalnya harga dan tingkat suku bunga.
c.
Individual
time-varying, variabel-variabel yang berbeda antarunit
cross section dan waktu. Contohnya,
keuntungan perusahaan dan tingkat harga.
Pendekatan Model
Regresi Data Panel
Telah dijelaskan sebelumnya bahwa ada 3 (tiga) pendekatan dalam model
regresi data panel yaitu pooled OLS
atau biasa disebut model common effects,
model efek tetap (fixed effects model)
dan model efek random (random effects
model). Penjelasan ketiga model tersebut adalah sebagai berikut:
a.
Model Common Effects (Polled OLS)
Teknik
yang paling sederhana dalam melakukan estimasi data panel adalah hanya dengan
mengkombinasikan data time series dan cross section dengan menggunakan
metode OLS.
Menurut Nahrowi dan Usman (2006, hal. 312), penggabungan tersebut membuat hasil
regresi lebih baik dibandingkan dengan regresi yang hanya menggunakan dara cross section atau time series saja. Akan tetapi, dengan menggabungkan data, maka kita
tidak dapat melihat perbedaan baik antarindividu maupun antarwaktu. Model ini
mengasumsikan bahwa perilaku individu sama pada berbagai kurun waktu. Model regresi common effects satu
arah adalah sebagai berikut:
i=1,2,..,N
dan t=1,2,..,T (8)
dengan
di
mana N adalah jumlah unit cross section (individu) dan T adalah jumlah periode waktunya.
Implikasinya, akan diperoleh sebanyak T
persamaan deret lintang (cross section)
yang sama. Begitu juga sebaliknya, kita juga akan dapat memperoleh persamaan
deret waktu (time series) sebanyak N persamaan untuk setiap T periode observasi. Namun, untuk
mendapatkan parameter α dan β yang konstan dan efisien, akan dapat diperoleh
dalam bentuk regresi yang lebih besar dengan melibatkan sebanyak N x
T observasi (Greene, 2003, hal. 285). Formula estimasi parameternya adalah sebagai
berikut:
(9)
(10)
Keterangan:
Berdasarkan
asumsi struktur matriks variance-covariance
residual-nya, pada common effect terdapat 4 (empat) metode
estimasi yang dapat digunakan, yaitu:
1.
Ordinary
Least Square (OLS), di mana struktur matriks variance-covariance residual-nya diasumsikan bersifat homoskedastisitas dan tidak ada cross section correlation.
2.
Generalized
Least Square (GLS)/ Weighted Least Square (WLS)/ cross
sectional weight, jika struktur matriks variance-covariance
residual-nya diasumsikan bersifat
heteroskedastisitas dan tidak ada cross
sectional correlation.
3.
Feasible
Generalized Least Square (FGLS)/ Seemingly Unrelated Regression (SUR)
atau Maximum Likelihood Estimator
(MLE), jika struktur matriks variance-covariance
residual-nya diasumsikan bersifat
heteroskedastisitas dan ada cross
sectional correlation.
4.
Feasible
Generalized Least Square (FGLS) dengan proses autoregressive (AR) pada error term-nya, jika struktur matriks variance-covariance
residual-nya diasumsikan bersifat
heteroskedastisitas dan ada cross
sectional correlation pada residualnya.
b.
Model
Efek Tetap (Fixed Effects Model)
Model fixed effects mengasumsikan bahwa
perbedaan antarindividu bisa diakomodir melalui perbedaan intersepnya, yaitu
intersep pada setiap individu merupakan suatu parameter yang tidak diketahui
dan akan dilakukan estimasi. Katakanlah yi dan Xi
merupakan T pengamatan untuk setiap unit ke-i, i
disusun dalam matriks T
x 1 dan εi disusun dalam vektor T x 1
merupakan vektor gangguan. Secara umum, model fixed effects satu arah dapat dituliskan sebagai berikut (Gujarati,
2003, hal. 642):
(11)
i
= 1,2,...,N; t = 1,2,...,T ; dan k = 1,2,...,K
dengan
di mana K adalah jumlah variabel penjelas, N adalah jumlah cross section, dan T
adalah jumlah time series.
Selain
dengan model di atas, efek individu dapat juga diperoleh dengan teknik Least Squares Dummy Variable (LSDV).
Model estimasi Least Square Dummy
Variable (LSDV) adalah sebagai
berikut (Greene, 2003, hal. 287):
(12)
Keterangan:
;
;
;
;
;
di mana D
merupakan variabel dumm untuk
individu ke-i, sehingga estimasi
parameternya adalah sebagai berikut:
(13)
di
mana,
Berdasarkan asumsi
struktur matriks variance-covariance residual-nya, pada model fixed effects, terdapat 3 (tiga) metode
estimasi yang dapat digunakan, yaitu:
1.
Ordinary
Least Square (OLS/LSDV), jika struktur matriks variance-covariance residual-nya
diasumsikan bersifat homoskedastisitas dan tidak ada cross sectional correlation.
2.
Generalized
Least Square (GLS)/ Weighted Least
Square (WLS)/ cross sectional weight,
jika struktur matriks variance-covariance
residual-nya diasumsikan bersifat heteroskedastisitas
dan tidak ada cross sectional correlation.
3.
Feasible Generalized Least Square (FGLS)/ Seemingly Unrelated Regression (SUR),
jika struktur matriks variance-covariance
residual-nya diasumsikan bersifat
heteroskedastisitas dan ada cross sectional
correlation.
c.
Model
Efek Random (Random Effects Model)
Banyaknya parameter dalam model random effects dan kehilangan derajat bebas dapat dihindari jika ui
bisa di asumsikan random (Baltagi, 2005, hal. 298). Jadi, berbeda dengan pendekatan sebelumnya,
pada model ini diasumsikan bahwa ada perbedaaan intersep untuk setiap individu
sifatnya random (stokastik). Model random effects menganggap efek
rata-rata dari data cross section dan error model
dinterpretasikan melalui intersep yang diakomodasi. Karena terdapat dua
komponen yang berkontribusi dalam pembentukan error, yaitu individu dan
waktu, maka random error diuraikan menjadi dua bagian, yaitu error
untuk komponen individu dan error komponen waktu.
Model random effects satu arah dituliskan
sebagai berikut (Gujarati, 2003, hal. 647):
(14)
i
= 1,2,...,N; t = 1,2,...,T ; dan k = 1,2,...,K
di mana K adalah jumlah variabel penjelas, N adalah jumlah cross section, dan T adalah
jumlah time series.
Dengan
mengasumsikan bahwa intersep
merupakan variabel random dengan rata-rata sebesar
, nilai intersep untuk
masing-masing individu dapat dinyatakan sebagai:
dengan i
= 1,2,...,N (15)
di mana
merupakan random
error dengan rata-rata nol dan variance konstan. Dengan melakukan
subtitusi persamaan random error ke
dalam persamaan umum REM (Random Effects
Model) diperoleh persamaan sebagai berikut:
(16)
(17)
di mana
dengan
disebut error
komponen dan
merupakan error
kombinasi antara cross section dan time series. Beberapa asumsi yang harus dipenuhi dalam model random effects,
yaitu (Gujarati, 2003, hal. 648):
(18)
(19)
;
(i≠j) (20)
(i
≠ j ; t ≠ s) (21)
;
(22)
di mana i dan j menunjukkan individu sedangkan t
dan s menunjukkan waktu.
Pada model random effects, metode OLS tidak
bisa digunakan untuk mendapatkan estimator yang efisien, karena adanya korelasi
antara wit dan wis.
(23)
Untuk itu metode yang tepat untuk mengestimasi
model random effects adalah Generalized Least Squares (GLS) dan Feasible
Generalized Least Square (FGLS) (Gujarati, 2003, hal. 649).
Perbedaan Fixed Effects Model (FEM) dan Random
Effects Model (REM) terletak pada nilai intersepnya. Pada FEM,
masing-masing unit cross section memiliki nilai intersep sendiri
sedangkan pada REM intersep α menunjukkan nilai rata-rata seluruh intersep (cross
section) dan komponen error ui menunjukkan deviasi
intersep individu dari nilai rata-rata tersebut.
Tidak ada komentar:
Posting Komentar