Halo semuanya, setelah kemarin kita membahas teori regresi 2SLS dan kapan kita harus menggunakannya, sekarang kita bahas yuk gimana caranya melakukan regresi 2SLS di Stata.
Intro Penelitian
Kita akan menggunakan model dan persamaan regresi yang sama dengan penjelasannya sebelumnya. Untuk yang belum membaca dan baru mengenal 2SLS kita sarankan untuk baca dahulu artikel sebelumnya ya agar lebih paham 🙂 disini
Selanjutnya, kita bisa melihat contoh model regresi dibawah ini
Misalnya, kita ingin mengetahui faktor-faktor sosial ekonomi apa saja yang mungkin mempengaruhi tingkat gaji yang diterima oleh seseorang. Untuk itu kita membuat perkiraan model sebagai berikut wondershare tunesgo codigo de registro
lwage = +b1.educ+b2.black+b3.metro + e
Penjelasannya adalah
lwage = tingkat gaji dalam bentuk logaritma (variabel dependen)
Educ = lama sekolah dalam tahun (variabel independen)
Black = 1 apabila berkulit hitam/berwarna dan 0 apabila berkulit putih (variabel independen)
Metro = 1 apabila tinggal di daerah metropolitan dan 0 apabila tinggal di daerah non metropolitan (variabel independen)
e = error term (variabel lain yang tidak ada pada model, tetapi berkemungkinan punya pengaruh dan bisa menjelaskan variasi pada wage)
Seperti pada pembahasan sebelumnya, kita tahu bahwa variabel educ bersifat endogen atau memiliki pengaruh dan korelasi yang kuat dengan error term. Sedangkan untuk variabel black dan metro sudah bersifat eksogen/independen terhadap error term.
Jika kita sudah mengetahui variabel mana yang bersifat endogen maka kita bisa mulai mencari variabel instrumen untuk variabel independen tersebut. Dalam kasus kita, kita akan memakai variabel distance atau jarak tempuh ke institusi pendidikan terdekat sebagai variabel instrumen untuk educ atau lama sekolah dalam tahun. Hal ini disebabkan seseorang yang tinggal jauh dari institusi pendidikan akan cenderung berhenti sekolah pada tingkat tertentu dan mulai bekerja sehingga memiliki lama sekolah yang lebih sebentar, vice versa.
Langkah pertama
Kita akan menggunakan dataset dari buku Wooldridge ya, untuk itu kalian bisa pastikan sudah install datasetnya. Kalau belum boleh ikutin langkah dibawah iniya
Pertama, kita bisa mengakses data tersebut dengan menuliskan perintah dibawah ini
ssc install bcuse
Setelah loading dan instalasi selesai seperti gambar diatas kita bisa menuliskan perintah selanjutnya
bcuse card
Jika tampilan Stata anda sudah seperti diatas, maka kita sudah mengakses data yang akan digunakan untuk latihan. Akan ada 3010 observasi data dan 34 variabel yang bisa digunakan untuk latihan regresi 2SLS. Nah untuk memudahkan kita akan hilangin variabel yang tidak terpakai dalam model dan direname jadi sesuai sama model regresi kita sebelumnya yaa.
Jadi tampilannya nanti kaya giniya, kita akan pakai variabel-variabel ini saja untuk latihan regresi 2SLS nya
Langkah Kedua
Nah, kalau sudah dirapihkan kita bisa langsung ke regresi 2SLS nya nih guys.
Kalian bisa langsung ikutin ajay step-stepnya, untuk regresi 2SLS kita bisa pakai command ivreg ingat lagi yaa persamaan regresi kitaa iniya temen-temen
lwage = +b1.educ+b2.black+b3.metro + e
Penjelasannya adalah
lwage = tingkat gaji dalam bentuk logaritma (variabel dependen)
Educ = lama sekolah dalam tahun (variabel independen)
Black = 1 apabila berkulit hitam/berwarna dan 0 apabila berkulit putih (variabel independen)
Metro = 1 apabila tinggal di daerah metropolitan dan 0 apabila tinggal di daerah non metropolitan (variabel independen)
e = error term (variabel lain yang tidak ada pada model, tetapi berkemungkinan punya pengaruh dan bisa menjelaskan variasi pada wage)
Variabel independen yang mau kita instrumenkan adalah variabel educ dengan variabel insturmennya adalah distance. Untuk itu kita bisa langsung ketik command di bawah ini ya
ivreg lwage (educ = distance) black metro, first
Konsepnya mirip dengan regresi OLS ya guys sebenarnya, jadi untuk variabel dependen disini kita pakai lwage ya karena mau menguji pengaruh faktor sosial ekonomi apa saja yang mungkin mempengaruhi gaji yang diterima. Untuk variabel independen black dan metro bisa langsung diketikan saja pada command sedangkan untuk variabel educ yang bersifat endogen bisa diinstumentasikan dengan variabel distance.
Nah abis ini tampilan Stata nya akan seperti iniyaaa
Disini kalian bisa melihat hasil regresinya ya guys! Pada bagian pertama akan muncul first stage regressionnya atau regresi variabel educ dengan variabel independen lain dan variabel instrumen kita. Apabila variabel instrumen kita signifikan atau p valuenya <0.05 maka kita bisa memakai distance sebagai variabel instrumen kita.untuk variabel educ.
Pada tabel kedua akan muncul hasil regresi sesuai dengan model awal kita tetapi menggunakan variabel educ yang sudah diinstrumentasikan dengan variabel distance sehingga tidak lagi memiliki korelasi dan hubungan dengan error term.
wage = +b1.educ+b2.black+b3.metro + e
Penjelasannya adalah
Wage = tingkat gaji (variabel dependen)
educ= lama sekolah dalam tahun hasil instrumentasi (variabel independen)
Black = 1 apabila berkulit hitan/berwarna dan 0 apabila berkulit putih (variabel independen)
Metro = 1 apabila tinggal di daerah metropolitan dan 0 apabila tinggal di daerah non metropolitan (variabel independen)
e = error term (variabel lain yang tidak ada pada model, tetapi berkemungkinan punya pengaruh dan bisa menjelaskan variasi pada wage)
Penutup
Jadi, seperti tadi ya untuk regresi 2SLS di STATA, praktiknya cukup mudah hanya saja untuk mendapatkan intuisi dan mengapa menggunakan 2SLS yang perlu pemahaman lebih lanjut.Untuk hasil intepretasi hasil regresi 2SLS tidak berbeda dengan intepretasi hasil regresi OLS biasa yang bisa kalian baca juga disini ya!
Semoga bermanfaat dan membantu ya temen-temen!