Ilustrasi analisis data panel.
Analisis data panel merupakan metode ekonometrika yang sangat kuat untuk mempelajari perilaku individu (perusahaan, negara, rumah tangga) seiring waktu. Dengan menggabungkan dimensi silang (cross-sectional) dan dimensi waktu (time-series), data panel memungkinkan peneliti untuk mengontrol heterogenitas yang tidak teramati dan menganalisis dinamika perubahan yang tidak dapat ditangkap oleh data statis. Salah satu perangkat lunak statistik yang paling populer dan mumpuni untuk melakukan analisis data panel adalah Stata. Artikel ini akan memandu Anda langkah demi langkah mengenai cara regresi data panel dengan Stata.
Data panel, juga dikenal sebagai data longitudinal, adalah kumpulan data yang mengamati unit subjek yang sama dari waktu ke waktu. Misalnya, data pendapatan 100 negara selama 20 tahun adalah contoh data panel. Keunggulan utama data panel meliputi:
Dalam analisis data panel, ada tiga model utama yang umum digunakan di Stata:
Sebelum memulai regresi, pastikan data panel Anda terstruktur dengan benar di Stata. Data panel biasanya memiliki dua pengenal kunci: pengenal untuk unit silang (misalnya, ID negara atau perusahaan) dan pengenal untuk waktu (misalnya, tahun atau kuartal). Anda perlu memberi tahu Stata tentang struktur ini menggunakan perintah xtset.
Misalnya, jika variabel pengenal individu Anda adalah id dan variabel waktu Anda adalah tahun, perintahnya adalah:
xtset id tahun
Perintah ini akan menandai data Anda sebagai data panel, yang memungkinkan Stata untuk menggunakan berbagai perintah analisis data panel.
Meskipun jarang digunakan sebagai model akhir karena keterbatasannya, Anda dapat menjalankan regresi OLS biasa pada data panel Anda:
regress variabel_dependen variabel_independen1 variabel_independen2 ...
Namun, untuk analisis data panel yang sesungguhnya, Anda akan menggunakan perintah khusus.
Model Fixed Effects sangat berguna untuk mengontrol efek spesifik individu yang tidak teramati. Perintah utamanya di Stata adalah xtreg dengan opsi fe.
xtreg variabel_dependen variabel_independen1 variabel_independen2 ..., fe
Opsi fe akan secara otomatis memasukkan variabel dummy untuk setiap unit silang, sehingga mengontrol perbedaan yang tidak teramati antar individu.
Model Random Effects cocok jika Anda yakin bahwa efek individu acak dan tidak berkorelasi dengan variabel penjelas. Perintahnya adalah xtreg dengan opsi re.
xtreg variabel_dependen variabel_independen1 variabel_independen2 ..., re
Pemilihan antara model FE dan RE seringkali didasarkan pada uji Hausman. Uji Hausman membandingkan koefisien dari model FE dan RE. Jika terdapat perbedaan signifikan antara kedua set koefisien, maka model FE lebih disukai karena asumsi RE (tidak ada korelasi antara efek individu dan variabel penjelas) dilanggar.
Setelah menjalankan kedua model, Anda bisa melakukan uji Hausman:
hausman fe re
Jika p-value dari uji Hausman kurang dari tingkat signifikansi yang Anda pilih (misalnya, 0.05), maka Anda harus memilih model FE.
Setelah menjalankan model, Stata akan menampilkan output yang mencakup koefisien regresi, standar error, nilai t-statistic atau z-statistic, dan p-value. Perhatikan:
Tergantung pada analisis Anda, Anda mungkin ingin melakukan uji tambahan seperti:
xttest3 setelah xtreg.xtserial.Melakukan regresi data panel di Stata adalah proses yang sistematis. Mulai dari persiapan data yang tepat dengan xtset, pemilihan model yang sesuai (FE atau RE), hingga penggunaan uji statistik untuk memvalidasi pilihan model Anda. Dengan menguasai teknik ini, Anda dapat memperoleh wawasan yang lebih mendalam dan akurat dari data panel Anda, memperkaya analisis ekonometrika Anda.