Visualisasi konsep regresi logistik: variabel dependen biner dan prediksi probabilitas.
Dalam analisis ekonometrika dan statistik, seringkali kita dihadapkan pada situasi di mana variabel dependen yang ingin kita jelaskan bersifat dikotomi atau biner. Artinya, variabel tersebut hanya memiliki dua kemungkinan nilai, seperti 'ya' atau 'tidak', 'sukses' atau 'gagal', 'memilih' atau 'tidak memilih', dan sebagainya. Untuk memodelkan hubungan antara variabel dependen biner ini dengan satu atau lebih variabel independen, metode regresi logistik menjadi pilihan yang tepat. EViews, sebagai salah satu perangkat lunak statistik dan ekonometrika yang populer, menyediakan fungsionalitas yang memadai untuk melakukan analisis regresi logistik.
Berbeda dengan regresi linear biasa yang memprediksi nilai variabel dependen kontinu, regresi logistik memprediksi probabilitas terjadinya suatu kejadian. Variabel dependen dalam regresi logistik diasumsikan mengikuti distribusi Bernoulli, di mana setiap observasi hanya memiliki dua hasil yang mungkin. Fungsi logit digunakan untuk mentransformasi probabilitas (yang nilainya terbatas antara 0 dan 1) menjadi skala yang tidak terbatas, sehingga memungkinkan penggunaan model linear.
Secara matematis, model regresi logistik sering dinyatakan dalam bentuk log-odds atau logit:
logit(P(Y=1|X)) = log(P(Y=1|X) / (1 - P(Y=1|X))) = β₀ + β₁X₁ + β₂X₂ + ... + βkXk
Di sini, P(Y=1|X) adalah probabilitas bahwa variabel dependen Y bernilai 1, diberikan nilai variabel independen X. Koefisien β mengukur perubahan dalam log-odds untuk setiap unit perubahan pada variabel independen yang bersangkutan.
Penggunaan regresi logistik sangat luas di berbagai bidang. Beberapa contoh umum meliputi:
EViews mempermudah pengguna untuk mengimplementasikan model regresi logistik. Langkah-langkah umumnya adalah sebagai berikut:
LS Y C X1 X2 ... Xn @LOGIT
@LOGIT dengan @PROBIT. EViews juga mendukung model Complementary log-log dengan @CLL.
Interpretasi koefisien dalam regresi logistik sedikit berbeda dari regresi linear. Koefisien β mengacu pada perubahan dalam log-odds. Untuk mendapatkan interpretasi yang lebih intuitif, seringkali kita mengubah koefisien menjadi Odds Ratio (OR) dengan menghitung exp(β).
OR > 1, peningkatan satu unit pada variabel independen meningkatkan peluang terjadinya kejadian (nilai Y=1) sebesar (OR - 1) * 100%.OR < 1, peningkatan satu unit pada variabel independen menurunkan peluang terjadinya kejadian (nilai Y=1) sebesar (1 - OR) * 100%.OR = 1, variabel independen tidak berpengaruh terhadap peluang terjadinya kejadian.Selain melihat signifikansi individu variabel, penting juga untuk mengevaluasi kesesuaian model secara keseluruhan. EViews menyediakan berbagai statistik, seperti nilai statistik Chi-squared, dan statistik pseudo R-squared (misalnya, McFadden's R-squared) untuk membantu evaluasi ini. Namun, perlu diingat bahwa pseudo R-squared tidak memiliki interpretasi yang sama persis dengan R-squared pada regresi linear.
Meskipun regresi logistik adalah alat yang ampuh, ada beberapa pertimbangan yang perlu diperhatikan:
Dengan pemahaman yang baik tentang prinsip-prinsip dasar regresi logistik dan pemanfaatan fitur yang disediakan oleh EViews, analisis data dengan variabel dependen biner dapat dilakukan secara efektif dan menghasilkan kesimpulan yang berarti.