Regresi 2SLS: Teori

Halo semuanya, kali ini Bisariset akan membahas mengenai regresi Two-Stage Least-Squares (2SLS). Biasanya, regresi ini dilakukan apabila regresi Ordinary Least Squares (OLS) menghasilkan hasil estimator regresi yang biased. Untuk OLS bisa diterima hasilnya atau menghasilkan regresi yang BLUE (Best, Linier, Unbiased Estimator), salah satu asumsi yang harus terpenuhi adalah variabel independen HARUS INDEPENDEN antara satu sama lain dan juga independen terhadap error term [(variabel tidak memiliki pengaruh dan korelasi dengan variabel lain yang tidak ada pada model (error term)].  avast cleanup activation code 2016

Kapan sebaiknya menggunakan 2SLS?

Ketika salah satu variabel independen memiliki pengaruh atau korelasi dengan error term atau bersifat dependen maka regresi menggunakan OLS tidak bisa dilakukan (akan menghasilkan hasil yang biased). Untuk mengecek apakah variabel independen kita memiliki pengaruh atau korelasi dengan error term bisa dibaca disini ya!. Oleh karena itu, regresi 2SLS digunakan karena bisa mengurangi kemungkinan biased yang terjadi pada estimator dengan adanya penambahan Variabel Instrumen (untuk penjelasan lebih lanjut mengenai variabel instrumen bisa dibaca disini ya) photoshop crack ita

Contoh regresi yang memerlukan 2SLS

Untuk lebih memudahkan pemahaman, kita bisa melihat contoh model regresi dibawah ini

Misalnya, kita ingin mengetahui faktor-faktor sosial ekonomi apa saja yang mungkin mempengaruhi tingkat gaji yang diterima oleh seseorang. Untuk itu kita membuat perkiraan model sebagai berikut

wage = +b1.educ+b2.black+b3.metro + e

Penjelasannya adalah

Wage = tingkat gaji (variabel dependen)

Educ = lama sekolah dalam tahun (variabel independen)

Black = 1 apabila berkulit hitam/berwarna dan 0 apabila berkulit putih (variabel independen)

Metro = 1 apabila tinggal di daerah metropolitan dan 0 apabila tinggal di daerah non metropolitan (variabel independen)

 e = error term (variabel lain yang tidak ada pada model, tetapi berkemungkinan punya pengaruh dan bisa menjelaskan variasi pada wage)

Pada model ini kita mengasumsikan bahwa lama sekolah seseorang akan berpengaruh positif terhadap tingkat gaji, sebab seseorang yang memiliki pendidikan lebih lama akan cenderung mendapat pekerjaan dengan posisi tinggi dan gaji besar. Kita juga mengasumsikan bahwa ras seseorang memiliki pengaruh terhadap tingkat gaji, sebab seseorang berkulit putih biasanya cenderung memiliki keadaan sosial ekonomi yang lebih baik. Selanjutnya, asumsi ketiga adalah tempat tinggal memiliki pengaruh signifikan terhadap tingkat gaji, sebab orang yang tinggal di daerah metropolitan akan lebih berkemungkinan menemukan tempat kerja dengan gaji lebih tinggi. Untuk variabel lain yang mungkin mempengaruhi tingkat gaji, tetapi tidak masuk dalam model dijelaskan oleh error term. Contoh dari error term, misalnya, variabel pengalaman kerja yang dimiliki seseorang (dalam tahun). Orang dengan pengalaman kerja yang lebih lama cenderung akan digaji dengan lebih tinggi. 

Namun, jika kita menggunakan metode regresi OLS bisa saja menghasilkan hasil regresi yang biased. Mengapa demikian? Hal ini dikarenakan bisa saja salah satu variabel independen memiliki korelasi dan pengaruh dengan error term sehingga tidak bersifat independen. Contohnya, bisa saja variabel educ atau lama sekolah memiliki hubungan dan pengaruh dengan salah satu faktor di error term, misalnya, tingkat pendidikan orang tua. Hal ini memungkinkan karena apabila orang tua seseorang berpendidikan tinggi biasanya level lama sekolah anaknya akan tinggi juga. Misalnya orang tuanya S1 kemungkinan besar anaknya akan S1 juga atau bahkan lulusan S2. Kemungkinan inilah yang menyebabkan asumsi OLS tidak terpenuhi karena variabel independen memiliki pengaruh dengan error term dan diperlukan regresi 2SLS.

Menggunakan Variabel Instrumen

Untuk mengatasi hal tersebut, kita harus melakukan regresi 2SLS. Regresi ini memungkinkan kita untuk menghilangkan biased yang terjadi pada variabel educ dengan error term. Variabel instrumen disini berfungsi untuk menjelaskan variasi yang terjadi pada variabel independen yang dicurigai memiliki korelasi dengan error term. Contoh variabel instrumen yang bisa digunakan adalah jarak rumah dari institusi pendidikan. Orang yang tinggal jauh/sangat jauh dari institusi pendidikan akan cenderung memiliki tendensi untuk tidak melanjutkan sekolah dan langsung bekerja. Oleh karena itu, kita bisa menggunakan variabel jarak tempuh ke institusi pendidikan (distance) sebagai variabel instrumen untuk variabel independen educ. Perlu diperhatikan, dalam memilih variabel instrumen haruslah variabel yang mempengaruhi variabel independen yang kita curigai, tetapi tidak memiliki pengaruh dengan error term. 

Tahapan sederhana regresi 2SLS

Setelah menemukan variabel instrumen (distance) yang mungkin bisa menjelaskan variasi pada variabel independen kita yang punya pengaruh dengan error term (educ) maka kita bisa memulai tahapan regresi 2SLS. Pertama kita akan meregresi educ sebagai variabel dependen dengan variabel instrumen (distance) dan variabel independen lain dalam model awal (black dan metro).

educ = +b1.distance+b2.black+b3.metro +v

Penjelasannya adalah

Educ = lama sekolah dalam tahun (variabel dependen)

Distance = jarak tempuh ke institusi pendidikan terdekat (variabel instrumen)

Black = 1 apabila berkulit hitam/berwarna dan 0 apabila berkulit putih (variabel independen)

Metro = 1 apabila tinggal di daerah metropolitan dan 0 apabila tinggal di daerah non metropolitan (variabel independen)

v  = error term (variabel lain yang tidak ada pada model, tetapi berkemungkinan punya pengaruh dan bisa menjelaskan variasi pada educ)

Kita bisa menjalankan stage regresi pertama dan melihat apakah variabel instrumen distance berpengaruh signifikan terhadap variasi educ. Apabila iya maka kita bisa lanjut menggunakan variabel distance sebagai variabel instrumen untuk educ.

Selanjutnya kita akan melakukan estimasi pada stage regresi pertama dan mendapatkan estimator yang sudah diestimasi.

educ =a+b1.distance+b2.black+b3.metro

Setelah itu, baru kita bisa menjalankan stage regresi kedua dengan menggunakan model awa dan metode OLS,l tetapi untuk variabel independennya kita menggunakan estimator educ yang sudah diestimasi pada stage regresi pertama.

wage = +b1.educ+b2.black+b3.metro + e

Penjelasannya adalah

Wage = tingkat gaji (variabel dependen)

educ= lama sekolah dalam tahun hasil estimasi (variabel independen)

Black = 1 apabila berkulit hitan/berwarna dan 0 apabila berkulit putih (variabel independen)

Metro = 1 apabila tinggal di daerah metropolitan dan 0 apabila tinggal di daerah non metropolitan (variabel independen)

 e = error term (variabel lain yang tidak ada pada model, tetapi berkemungkinan punya pengaruh dan bisa menjelaskan variasi pada wage)

Kesimpulan

Dengan menggunakan regresi 2SLS kita bisa mengisolasi dan mengatakan bahwa variabel independen educ hanya dipengaruhi dari variabel instrumen kita (distance) dan juga variabel independen lain pada model sehingga TIDAK mungkin lagi memiliki korelasi dan pengaruh dengan error term. Hal ini disebabkan juga variabel educ merupakan hasil estimasi dari variabel instrumen dan variabel independen lain. Dengan demikian, model bisa diregresi dengan menggunakan metode OLS karena setiap variabel independen kini tidak ada lagi yang memiliki pengaruh dengan error term.

Untuk tutorial dan contoh pengerjaan regresi 2SLS di Stata akan dibahas pada artikel lain ya! Semoga bermanfaat!!!

3 Comments

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *