Heteroskedastisitas adalah fenomena statistik di mana varians dari sebuah variabel tidak konstan di seluruh rentang nilai dari variabel lain yang memprediksinya. Dalam kata lain, residual dari model regresi tidak homoskedastik, artinya residual tidak memiliki varians yang konstan. Untuk mengetahui apakah sebuah model mengalami masalah heteroskedastisitas atau tidak, kita akan melakukan uji heteroskedastisitas.
Heteroskedastisitas dapat disebabkan oleh beberapa faktor, yaitu:
- Outliers: Outliers adalah observasi yang jauh lebih besar atau lebih kecil daripada observasi lain dalam dataset. Outliers dapat menyebabkan heteroskedastisitas karena dapat meningkatkan varians dari residu.
- Hubungan non-linear: Jika hubungan antara dua variabel tidak linear, maka heteroskedastisitas dapat terjadi. Hal ini karena varians dari residu akan berbeda untuk nilai-nilai yang berbeda dari variabel independen.
- Kesalahan dalam model: Jika model regresi salah spesifikasi, maka heteroskedastisitas dapat terjadi. Hal ini karena model tidak akan mampu menangkap semua variasi dalam variabel dependen, dan varians dari residu akan berbeda untuk nilai-nilai yang berbeda dari variabel independen.
Dampak Negatif dari Heteroskedastisitas
Heteroskedastisitas termasuk salah satu masalah yang perlu diatasi dalam sebuah model regresi, bila tidak diatasi, heteroskedastisitas dapat memiliki beberapa dampak negatif yaitu:
- Standar error yang tidak akurat: Standar error dari koefisien regresi akan tidak akurat jika ada heteroskedastisitas. Ini berarti bahwa interval kepercayaan untuk koefisien regresi akan terlalu lebar atau terlalu sempit.
- Uji hipotesis yang tidak akurat: Uji hipotesis untuk koefisien regresi akan tidak akurat jika ada heteroskedastisitas, sehingga nilai p (P-value) yang ditampilkan untuk uji signifikansi atau uji hipotesis dapat salah.
- Inferensi yang tidak tepat: Inferensi yang dibuat dari model regresi dapat menjadi tidak akurat jika ada heteroskedastisitas.
Cara Melakukan Uji Heteroskedastisitas
Ada dua cara utama untuk menguji heteroskedastisitas:
- Inspeksi visual terhadap plot residu: Ini adalah cara paling umum untuk memeriksa heteroskedastisitas. Plot residu adalah grafik dari residu (perbedaan antara nilai yang diamati dan nilai yang diprediksi) terhadap nilai-nilai yang diprediksi. Jika residu tersebar secara acak di sekitar sumbu horizontal, maka model homoskedastik. Namun, jika residu menunjukkan bentuk kipas atau kerucut, maka model heteroskedastik.
- Uji statistik: Ada beberapa uji statistik yang dapat digunakan untuk menguji heteroskedastisitas. Uji yang paling umum adalah uji Breusch-Pagan dan uji White. Uji ini menggunakan residu dari model regresi untuk menghitung statistik uji. Jika statistik uji signifikan, maka menunjukkan bahwa model heteroskedastik.
Uji Heteroskedastisitas Menggunakan Plot Residu
Berikut adalah langkah-langkah untuk menguji heteroskedastisitas menggunakan plot residu:
- Jalankan model regresi dan simpan residu.
- Plot residu terhadap nilai-nilai yang diprediksi.
- Cari bentuk kipas atau kerucut di plot. Jika Anda melihat bentuk kipas atau kerucut, maka ini adalah tanda heteroskedastisitas.
Uji Heteroskedastisitas Menggunakan Uji Statistik
Berikut adalah beberapa uji statistik yang paling umum untuk heteroskedastisitas:
- Uji Breusch-Pagan: Uji ini didasarkan pada asumsi bahwa varians dari residu proporsional dengan kuadrat nilai-nilai yang diprediksi.
- Uji White: Uji ini adalah uji umum yang lebih umum untuk heteroskedastisitas yang tidak membuat asumsi tentang hubungan antara varians dari residu dan nilai-nilai yang diprediksi.
- Uji Goldfeld-Quandt: Uji ini mirip dengan uji Breusch-Pagan, tetapi lebih kuat ketika varians dari residu tidak proporsional dengan kuadrat nilai-nilai yang diprediksi.
Cara Mengatasi Heteroskedastisitas
Jika Anda menemukan bahwa data Anda memiliki heteroskedastisitas, ada beberapa hal yang dapat Anda lakukan untuk menanganinya. Beberapa cara paling umum untuk mengatasi heteroskedastisitas termasuk:
- Least squares terbobot: Least squares terbobot adalah metode analisis regresi yang dapat digunakan untuk mengatasi heteroskedastisitas. Dalam least squares terbobot, bobot bersifat invers-proposional terhadap varians dari residu.
- Transformasi data: Data dapat diubah untuk membuatnya lebih homoskedastik. Misalnya, data dapat diubah dengan log atau akar kuadrat.
- Kesalahan standar robust: Kesalahan standar robust adalah metode untuk menghitung kesalahan standar yang tahan terhadap heteroskedastisitas.
Cara terbaik untuk menangani heteroskedastisitas akan tergantung pada penyebab spesifik dari masalah tersebut. Berikut adalah beberapa contoh heteroskedastisitas:
- Studi tentang hubungan antara pendapatan dan pengeluaran pada makanan mungkin menemukan bahwa varians pengeluaran lebih tinggi untuk orang dengan pendapatan yang lebih tinggi. Hal ini disebabkan karena orang dengan pendapatan yang lebih tinggi memiliki fleksibilitas yang lebih dalam pengeluaran mereka, sehingga mereka lebih cenderung mengeluarkan uang besar pada makanan pada beberapa kesempatan dan uang kecil pada kesempatan lain.
- Studi tentang hubungan antara skor tes dan waktu yang dihabiskan untuk belajar mungkin menemukan bahwa varians skor tes lebih tinggi untuk siswa yang menghabiskan lebih banyak waktu belajar. Hal ini disebabkan karena siswa yang menghabiskan lebih banyak waktu belajar lebih cenderung berada pada ujung atas distribusi skor tes, sehingga ada lebih banyak variasi pada skor mereka.
Cukup baik