Apa itu R-Squared (R2)

R-squared atau R2 pada dasarnya digunakan untuk melihat bagaimana penambahan variabel independen membantu menjelaskan varians variabel dependen. Secara umum R2 dapat memberikan ukuran seberapa baik model dalam menjelaskan variabel dependen (variabel yang dipengaruhi) atau goodness of fit.

Rumus/formula R-Squared 

R2 secara definisi merupakan rasio dari varians yang dijelaskan oleh variabel independen (penjelas) dibandingkan varians tanpa adanya variabel independen, berikut rumus dari R2

R2 = SSE/SST = 1 - SSR/SST

Dimana 
SST (Sum Square Total) → sum squares total variabel dependen tanpa adanya variabel independen
SSE (Sum Square Explained) → sum squares yang dijelaskan oleh model
SSR (Sum Square residual) → sum squares residual 

Dengan formula masing masing berikut
SST → Σ ( yi – y mean)2
SSE → Σ ( y hat – y mean)2
SSR → Σ ( yi – y hat)2
SST = SSE + SSR
SSE = SSR – SST

*Mean adalah rata rata, sehingga y mean adalah rata-rata dari nilai y (variabel dependen)
y hat disini yang kita maksud adalah nilai yang diprediksi oleh garis regresi

Rumus R2 diatas yang sering kita jumpai di buku teks, namun menurut kami rumus tersebut dirasa kurang intuitif. Untuk itu penjelasan kami kali ini akan menggunakan rumus berikut yang sesuai dengan definisinya (rasio varians yang dijelaskan) meski pada akhirnya secara matematis akan memiliki formula dan hasil yang sama.

R2 = (VAR mean - VAR hat)/VAR mean

Dimana
VAR mean → varians dari variabel dependen terhadap mean (menunjukkan varians dari dependen TANPA adanya variabel independen)
VAR hat → varians dari variabel dependen terhadap garis regresi (menunjukkan varians dari dependen DENGAN adanya variabel independen)

Sehingga (VAR mean – VAR hat) dapat diartikan sebagai “varians yang dijelaskan oleh penambahan variabel independen”

Rumus varians secara umum untuk populasi adalah sebagai berikut

VAR = ( Σ ( Xi - mean)2)/n

Dimana 
Xi → nilai variabel di satu data
mean → rata-rata
n → jumlah populasi

VAR mean = ( Σ ( yi - mean)2)/n
VAR hat = ( Σ ( yi - y hat )2)/n

Sehingga dengan kata lain 

VAR mean = SST / n
VAR hat = SSR / n

Atau bisa dianggap varians adalah sum of squares rata rata
Sehingga dari rumus awal kita

R2 = (VAR mean - VAR hat)/VAR mean
R2 = (SST - SSR) / SST

Ingat lagi tadi bahwa SSE = SSR – SST, maka

R2 = (SSE) / SST

Seperti formula yang ada di textbook

Cara menghitung R2 

Mari kita langsung lakukan contoh penghitungan R2 secara manual untuk mendapatkan pemahaman yang lebih baik

Berat kucingTinggi kucing
4.815
3.810
2.88
411
5.420
5.518
2.86
3.39
3.914
3.713
2.88
3.510
4.716
4.517
3.711

Misal kita akan menggunakan data fiktif sebagai berikut dimana berat kucing menjadi variabel dependen (dipengaruhi) dan kita telah mendapatkan persamaan regresi sebagai berikut

Berat kucing = 1.445965498 + tinggi kucing * 0.2016694491

Dari sini kita bisa memperoleh nilai prediksi garis regresi dengan tinggi kucing yang diketahui, umumnya ini kita sebut dengan y hat atau y prediksi, menghitung y mean, dan pada akhirnya menghitung R2 dari SSE dan SST

Berat kucing (BK)Tinggi kucing (TK)Prediksi BK dari model regresi (y hat)rata-rata BK (y mean)SSE = Σ( y hat – y mean)^2SST = Σ( yi – y mean)^2
4.8154.471013.946670.274930.72818
3.8103.462663.946670.234260.02151
2.883.059323.946670.787381.31484
4113.664333.946670.079710.00284
5.4205.479353.946672.349132.11218
5.5185.076023.946671.275432.41284
2.862.655983.946671.665871.31484
3.393.260993.946670.470150.41818
3.9144.269343.946670.104120.00218
3.7134.067673.946670.014640.06084
2.883.059323.946670.787381.31484
3.5103.462663.946670.234260.19951
4.7164.672683.946670.527090.56751
4.5174.874353.946670.860590.30618
3.7113.664333.946670.079710.06084
Total9.7446710.83733
R^2 (SSE/SST)0.8991757917

Tenang saja kamu tidak perlu menghitung R2 secara manual, kebanyakan software akan mampu memberikan hasil R2 regresi, kita akan memberikan contoh regresi di google sheets melalui command linest

kamu juga bisa melihat bagaimana cara melakukan regresi di google sheets di artikel berikut https://bisariset.id/cara-melakukan-regresi-linier-di-google-sheets/

slope/β1 (TK)intercept
coefficient for slope; coefficient for intercept0.20166944911.445965498
Standard error for slope; standard error for intercept0.018729601750.2440125218
coefficient for determination/R2; standard error0.89917579170.2899158437
F stat; degree of freedom115.937288113
sum square regression explained; sum square residual9.744667781.092665554

Di Google sheets menunjukkan langsung nilai R2 0.8991757917, atau jika mau menghitungnya dari sum squares google sheets memberikan SSE dan SSR

Interpretasi  R-Squared 

Jika R2 adalah 0,89 atau 89% dari itu berarti variabel independen membantu menjelaskan 89% varians pada variabel independen, semakin tinggi semakin baik

Ini juga berlaku untuk regresi berganda di mana kita menggunakan bidang (3D atau lebih) daripada garis (2D). Perlu digaris bawahi disini bahwa penambahan variabel independen lain bisa jadi tidak menambah nilai R2 namun nilai R2 TIDAK AKAN DAPAT BERKURANG jika ditambahkan variabel independen. 

Berat kucingTinggi kucingPanjang ekorLebar mata
4.81590.9
3.81020.2
2.883.50.5
4113.50.3
5.42040.1
5.51860.4
2.863.50.5
3.3960.2
3.91490.5
3.7131.50.5
2.8870.7
3.5109.50.9
4.7163.50.4
4.5174.50.2
3.7112.50.5

Mari kita lihat hasil R2 bila menambahkan variabel variabel yang tidak berhubungan dengan berat badan yaitu panjang ekor dan lebar mata

slope/β3 (LM)slope/β2 (PE)slope/β1 (TK)intercept
coefficient for slope; coefficient for intercept0.02720934547-0.0012327356430.20219391731.433290867
Standard error for slope; standard error for intercept0.48002060650.042440566420.022523163830.3603459172
coefficient for determination/R2; standard error0.89920620010.315124219#N/A#N/A
F stat; degree of freedom32.7112322711#N/A#N/A
sum square regression explained; sum square residual9.7449973261.092336008#N/A#N/A

Terlihat bahwa penambahan variabel panjang ekor (PE) dan lebar mata (LM) tidak banyak menambah R2, dari yang awalnya 0.8991757917 ke 0.8992062001. Bila nanti kita melihat uji antar variabelnya akan terlihat bahwa panjang ekor dan lebar mata tidak terlalu berpengaruh pada berat kucing, bila dari hasil diatas ini ditunjukkan oleh nilai standard error yang besar pada variabel panjang ekor dan lebar mata.

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *