Korelasi Pearson

Korelasi Pearson adalah pengukuran statistik yang banyak digunakan untuk menilai kekuatan dan arah hubungan linear antara dua variabel yang diukur pada skala rasio atau interval (sering disebut sebagai variabel numerik). Namun, perlu diingat bahwa korelasi tidak menunjukkan sebab-akibat, dan faktor lain yang dapat memengaruhi hubungan antara variabel harus selalu dipertimbangkan.

Lihatlah tabel dibawah untuk menentukan pengujian asosiasi yang harus digunakan untuk setiap tingkat pengukuran.

Variables level of measurementRatio or IntervalOrdinalCategorical (nominal)Dichotomous (binary)
Ratio or IntervalPearson Correlation
OrdinalSpearman correlation Kendall’s Tau Polychoric correlationSpearman correlation Kendall’s Tau Polychoric correlation
Categorical (nominal)Eta squaredCramér’s VCramér’s V
Dichotomous (binary)Point-biserial correlation Biserial correlationSpearman correlation Kendall’s Tau Polychoric correlationCramér’s VPhi-coefficient Tetrachoric correlation

Kasus Penggunaan Korelasi Pearson

Berikut adalah beberapa kasus penggunaan Korelasi Pearson.

  • Menilai hubungan antara dua variabel dalam ilmu sosial, seperti hubungan antara tingkat pendidikan dan pendapatan
  • Menganalisis data keuangan, seperti hubungan antara harga saham dua perusahaan
  • Mengevaluasi kinerja peralatan, seperti hubungan antara suhu dan tekanan dalam proses manufaktur

Korelasi Pearson hanya cocok untuk menguji hubungan linear antara dua variabel rasio atau interval. Oleh karena itu, biasanya digunakan sebagai analisis awal dalam kasus di mana ada lebih dari dua variabel, karena analisis regresi akan digunakan.

Formula Korelasi Pearson

Untuk memeriksa korelasi, kita dapat menggunakan komputer untuk menghitungnya, sehingga Anda mungkin tidak perlu mengetahui formula sebenarnya. Namun, jika Anda mau menghitungnya secara manual, korelasi Pearson antara variabel X dan Y dihitung menggunakan formula berikut:

Formula/rumus korelasi pearson

Formula untuk koefisien korelasi melibatkan pembagian kovariansi dengan hasil kali simpangan baku. Inilah mengapa kita menyebutnya sebagai “koefisien” korelasi – karena itu adalah angka yang dibagi dengan angka lain.

Contoh Korelasi Pearson

Misalkan kita ingin meneliti hubungan antara class attended (kehadiran kelas) dan termGPA (IPK semester), berikut adalah data 10 observasi awal:

attendtermGPA
273.190000057
222.730000019
303
312.039999962
323.680000067
293.230000019
301.539999962
262
242.25
293

Untuk mengakses dataset lengkap, Anda dapat mengunduhnya dari tautan ini. R Dataset / Package wooldridge / attend | R Datasets (pmagunia.com)

Dengan menggunakan software statistik, kita dapat menghitung koefisien korelasi Pearson antara kelas yang dihadiri dan IPK semester, yang bernilai 0,5598. Ini menunjukkan hubungan linear positif yang kuat antara kehadiran kelas dan IPK semester. Dengan kata lain, ketika kelas yang dihadiri meningkat, IPK semester cenderung meningkat juga.

Kita juga dapat memplot data pada diagram pencar untuk memvisualisasikan hubungan antara kelas yang dihadiri dan IPK semester. Plot menunjukkan tren linear positif yang jelas, yang mendukung hasil koefisien korelasi Pearson.

scatter plot yang menunjukkan adanya hubungan linier positif

Rentang Nilai Korelasi Pearson

Koefisien Korelasi Pearson berkisar dari -1 hingga 1. Nilai -1 menunjukkan hubungan linear negatif yang sempurna antara dua variabel, sedangkan nilai 1 menunjukkan hubungan linear positif yang sempurna. Nilai 0 menunjukkan tidak ada hubungan linier antara dua variabel.

Interpretasi Hasil Korelasi Pearson

Interpretasi hasil Korelasi Pearson tergantung pada konteks masalah dan kekuatan korelasinya. Secara umum, kita dapat menginterpretasikannya sebagai berikut:

Nilai koefisien korelasi Pearson (r)KekuatanArah
Lebih besar dari 0,5KuatPositif
Antara 0,3 dan 0,5SedangPositif
Antara 0 dan 0,3LemahPositif
0Tidak adaTidak ada
Antara 0 dan -0,3LemahNegatif
Antara -0,3 dan -0,5SedangNegatif
Kurang dari -0,5KuatNegatif

Kelebihan dan Kekurangan Menggunakan Korelasi Pearson

Salah satu keuntungan utama Korelasi Pearson adalah mudah dihitung dan diinterpretasikan. Ini juga banyak digunakan dalam berbagai bidang dan memiliki rentang nilai yang terdefinisi dengan baik. Namun, Korelasi Pearson mengasumsikan bahwa hubungan antara dua variabel adalah linear dan mungkin tidak efektif dalam menangkap hubungan non-linear. Ini juga sensitif terhadap outlier dan mungkin tidak sesuai untuk variabel dengan distribusi non-normal.

One comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *