Uji Normalitas

Uji normalitas merupakan tes statistik yang dilakukan pada sampel untuk mengetahui apakah sampel memenuhi asumsi normalitas atau tidak. Uji asumsi normalitas ini perlu dilakukan bila kita ingin menjalankan prosedur statistik parametrik karena menjadi syarat validnya hasil dari uji parametrik ini.

Asumsi normalitas bukan berarti data (atau lebih tepatnya populasi data) harus berdistribusi normal, namun asumsi ini menekankan pada distribusi normal dari residual model atau distribusi sampel yang kita ambil (bukan populasi)

Reminder: meskipun suatu populasi tidak memiliki distribusi normal, jika kita mengambil sampel yang cukup besar (kasarnya lebih dari 30) maka rerata sampel tersebut akan mengikuti distribusi normal. Inilah yang kita sebut dengan teorema limit pusat (central limit theorem)

Kapan asumsi normalitas harus terpenuhi?

  1. Saat estimasi parameter

Agar interval kepercayaan di sekitar estimasi parameter (misalnya, mean, atau koefisien β dalam regresi) akurat, estimasi tersebut harus berasal dari distribusi sampling normal. 

  1. Saat melakukan uji signifikansi

Agar uji signifikansi model menjadi akurat, distribusi pengambilan sampel dari apa yang sedang diuji harus normal. Sekali lagi, teorema limit pusat memberitahu kita bahwa dalam sampel besar ini akan benar tidak peduli apa bentuk populasinya. 

  1. Mengoptimalkan hasil regresi

Agar pendugaan parameter model regresi menjadi optimal (menggunakan metode kuadrat terkecil) residual dalam populasi harus berdistribusi normal. Metode kuadrat terkecil akan selalu memberi Anda perkiraan parameter model yang meminimalkan kesalahan, jadi dalam hal itu Anda tidak perlu mengasumsikan normalitas apapun agar sesuai dengan model linier dan memperkirakan parameter yang mendefinisikannya (Gelman & Hill, 2007).

Ketiga kondisi di atas pada dasarnya tidak akan menjadi masalah karena normalitas pasti akan terpenuhi secara langsung bila kita memiliki sampel yang cukup besar. Teorema limit pusat memberitahu kita bahwa dalam sampel besar, estimasi akan berasal dari distribusi normal terlepas dari seperti apa distribusi sampel atau data populasi itu. Karena teorema ini, jika kita ingin memperkirakan parameter model, membangun interval kepercayaan di sekitar parameter, melakukan uji signifikansi atau mengoptimalkan model regresi, kita tidak perlu khawatir dengan asumsi normalitas jika sampel kita cukup besar.

Kamu perlu secara khusus mengkhawatirkan normalitas dan melakukan uji normalitas bila sampel yang Anda miliki kecil atau Anda membuat model dari populasi. Di sisi lain uji normalitas umumnya hanya digunakan untuk menguji normalitas pada model regresi sebagai pelengkap.

Pilihan uji normalitas yang bisa dilakukan

  1. Membuat histogram
  2. P-P plot
  3. Q-Q plot
  4. Skewness and Kurtosis Test
  5. Kolmogorov-Smirnov test
  6. Shapiro-Wilk test
  7. Jarque Bera test

11 Comments

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *