Multicollinearity: Definisi dan Potensi Masalah yang Muncul

Definisi

Dalam melakukan regresi Multicollinearity sangat mungkin terjadi. Secara definisi Multicollinearity terjadi apabila ada dua atau lebih variabel independen yang berkorelasi. Jika tingkat korelasi antara kedua variabel independen ini cukup tinggi maka bisa menjadi masalah dalam interpretasi model regresi kita.

Penyebab

Contoh Multicollinearity bisa diamati pada contoh model regresi dibawah ini. Biasanya Multicollinearity terjadi apabila kita memasukan beberapa variabel independen yang memiliki korelasi cukup tinggi atau mewakili hal sejenis atau sama.

y= a + b1.x1 + b2.x2 +...+ bk.xk

Contohnya kita mau meneliti faktor-faktor apa saja yang menentukan harga mobil dan mana yang paling berdampak. Kita menggunakan Harga Mobil (price) sebagai variabel dependen dan Berat Mobil dalam Kg (weightkg), Berat Mobil dalam Pound (weightlb), Panjang Mobil (length), dan Jarak Tempuh (mpg) sebagai variabel independen.

price = a + b1.weightkg + b2.weightlb + b3.length + b4.mpg

Secara intuisi saja, mobil yang lebih panjang akan cenderung memiliki berat yang lebih besar. Dari intuisi ini saja kita bisa bilang bahwa variabel length dan weight memiliki korelasi yang cukup besar. Hal ini bisa berpotensi memunculkan masalah multicollinearity.

Selanjutnya, dalam model kita ada variabel independen yang sangat mirip dan hanya berbeda secara satuan yaitu berat mobil dalam Kg dan Pound. Model kita akan menjadi tidak stabil dan memberikan hasil yang tidak tepat akibat multicollinearity apabila salah satu dari variabel yang sangat mirip ini tidak dikeluarkan.

Mengapa Multicollinearity Menjadi Masalah?

Salah satu tujuan dari model regresi adalah untuk mencari dan mengisolasi efek atau hubungan antara tiap variabel independen dengan variabel dependennya. Contohnya saja, dalam interpretasi koefisien hasil regresi menandakan adanya perubahan nilai variabel dependen setiap perubahan 1 nilai di variabel independennya, dengan keadaan variabel lain dianggap konstan atau tidak ikut berubah. Contohnya, apabila koefisien untuk variabel weight pada model regresi kita sebelumnya adalah 4,3 bisa diinterpretasikan sebagai berikut.

Apabila Berat Mobil bertambah 1 Kg maka Harga Mobil akan bertambah 4,3 Dollar, saat variabel lain dianggap konstan

Ketika ada Multicollinearity, keadaan variabel lain dianggap konstan menjadi tidak valid karena ada kemungkinan ketika variabel price berubah maka ada dua kemungkinan apakah ini disebabkan oleh variabel weight atau length dalam kasus model Harga Mobil kita. Kita jadi tidak bisa mengetahui dengan pasti apakah kenaikan Harga Mobil lebih dipengaruhi oleh variabel weight atau length karena kedua variabel tersebut memiliki variasi yang kurang lebih sama karena mereka berkorelasi. Oleh karena itu, Multicollinearity menjadi masalah bagi model kita sebab jadi tidak bisa mengukur dampak setiap variabel-variabel independen terhadap variabel dependennya secara mandiri dan independen.

Multicollinearity sendiri bisa saja tidak menjadi masalah apabila kita menggunakan model regresi hanya untuk kebutuhan prediksi dan tidak peduli mengenai hubungan dan pengukuran dampak dari setiap variabel independen terhadap variabel dependennya. 

Masalah yang Muncul Akibat Multicollinearity

Pertama, masalah utama yang muncul dari keadaan Multicollinearity adalah hasil dari regresi menjadi tidak reliable sebab kita tidak mengetahui apakah dampak dari sebuah variabel independen terhadap satu variabel dependen benar-benar hasil dan pengaruh secara mandiri atau ada pengaruh juga dari variabel independen lain yang saling berkorelasi.

Kedua, estimasi koefisien bisa berubah dengan tiba-tiba tergantung variabel independen lainnya yang ada dalam model. Koefisien menjadi sangat sensitif terhadap perubahan kecil dalam model.

Ketiga, multikolinearitas mengurangi ketepatan estimasi koefisien. Bisa jadi, p value yang menentukan sebuah variabel signifikan atau tidak pada hasil regresi tidak dapat dipercaya sebab memiliki pengaruh dan korelasi terhadap variabel independen lain.

Misalnya, contoh kasus regresi kita tadi bisa saja variabel yang sebenarnya berpengaruh besar dan signifikan mempengaruhi harga mobil (price) hanya variabel weight saja. Namun, karena dalam model memasukan variabel length bisa saja hasil regresi menunjukan bahwa length juga signifikan berpengaruh terhadap price. 

Sumber

Wooldridge, J. M. (2012). Introductory econometrics: A modern approach (5th ed.). Cengage Learning. 

One comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *