Korelasi Pearson adalah pengukuran statistik yang banyak digunakan untuk menilai kekuatan dan arah hubungan linear antara dua variabel yang diukur pada skala rasio atau interval (sering disebut sebagai variabel numerik). Namun, perlu diingat bahwa korelasi tidak menunjukkan sebab-akibat, dan faktor lain yang dapat memengaruhi hubungan antara variabel harus selalu dipertimbangkan.
Lihatlah tabel dibawah untuk menentukan pengujian asosiasi yang harus digunakan untuk setiap tingkat pengukuran.
Variables level of measurement | Ratio or Interval | Ordinal | Categorical (nominal) | Dichotomous (binary) |
---|---|---|---|---|
Ratio or Interval | Pearson Correlation | |||
Ordinal | Spearman correlation Kendall’s Tau Polychoric correlation | Spearman correlation Kendall’s Tau Polychoric correlation | ||
Categorical (nominal) | Eta squared | Cramér’s V | Cramér’s V | |
Dichotomous (binary) | Point-biserial correlation Biserial correlation | Spearman correlation Kendall’s Tau Polychoric correlation | Cramér’s V | Phi-coefficient Tetrachoric correlation |
Kasus Penggunaan Korelasi Pearson
Berikut adalah beberapa kasus penggunaan Korelasi Pearson.
- Menilai hubungan antara dua variabel dalam ilmu sosial, seperti hubungan antara tingkat pendidikan dan pendapatan
- Menganalisis data keuangan, seperti hubungan antara harga saham dua perusahaan
- Mengevaluasi kinerja peralatan, seperti hubungan antara suhu dan tekanan dalam proses manufaktur
Korelasi Pearson hanya cocok untuk menguji hubungan linear antara dua variabel rasio atau interval. Oleh karena itu, biasanya digunakan sebagai analisis awal dalam kasus di mana ada lebih dari dua variabel, karena analisis regresi akan digunakan.
Formula Korelasi Pearson
Untuk memeriksa korelasi, kita dapat menggunakan komputer untuk menghitungnya, sehingga Anda mungkin tidak perlu mengetahui formula sebenarnya. Namun, jika Anda mau menghitungnya secara manual, korelasi Pearson antara variabel X dan Y dihitung menggunakan formula berikut:
Formula untuk koefisien korelasi melibatkan pembagian kovariansi dengan hasil kali simpangan baku. Inilah mengapa kita menyebutnya sebagai “koefisien” korelasi – karena itu adalah angka yang dibagi dengan angka lain.
Contoh Korelasi Pearson
Misalkan kita ingin meneliti hubungan antara class attended (kehadiran kelas) dan termGPA (IPK semester), berikut adalah data 10 observasi awal:
attend | termGPA |
---|---|
27 | 3.190000057 |
22 | 2.730000019 |
30 | 3 |
31 | 2.039999962 |
32 | 3.680000067 |
29 | 3.230000019 |
30 | 1.539999962 |
26 | 2 |
24 | 2.25 |
29 | 3 |
Untuk mengakses dataset lengkap, Anda dapat mengunduhnya dari tautan ini. R Dataset / Package wooldridge / attend | R Datasets (pmagunia.com)
Dengan menggunakan software statistik, kita dapat menghitung koefisien korelasi Pearson antara kelas yang dihadiri dan IPK semester, yang bernilai 0,5598. Ini menunjukkan hubungan linear positif yang kuat antara kehadiran kelas dan IPK semester. Dengan kata lain, ketika kelas yang dihadiri meningkat, IPK semester cenderung meningkat juga.
Kita juga dapat memplot data pada diagram pencar untuk memvisualisasikan hubungan antara kelas yang dihadiri dan IPK semester. Plot menunjukkan tren linear positif yang jelas, yang mendukung hasil koefisien korelasi Pearson.
Rentang Nilai Korelasi Pearson
Koefisien Korelasi Pearson berkisar dari -1 hingga 1. Nilai -1 menunjukkan hubungan linear negatif yang sempurna antara dua variabel, sedangkan nilai 1 menunjukkan hubungan linear positif yang sempurna. Nilai 0 menunjukkan tidak ada hubungan linier antara dua variabel.
Interpretasi Hasil Korelasi Pearson
Interpretasi hasil Korelasi Pearson tergantung pada konteks masalah dan kekuatan korelasinya. Secara umum, kita dapat menginterpretasikannya sebagai berikut:
Nilai koefisien korelasi Pearson (r) | Kekuatan | Arah |
---|---|---|
Lebih besar dari 0,5 | Kuat | Positif |
Antara 0,3 dan 0,5 | Sedang | Positif |
Antara 0 dan 0,3 | Lemah | Positif |
0 | Tidak ada | Tidak ada |
Antara 0 dan -0,3 | Lemah | Negatif |
Antara -0,3 dan -0,5 | Sedang | Negatif |
Kurang dari -0,5 | Kuat | Negatif |
Kelebihan dan Kekurangan Menggunakan Korelasi Pearson
Salah satu keuntungan utama Korelasi Pearson adalah mudah dihitung dan diinterpretasikan. Ini juga banyak digunakan dalam berbagai bidang dan memiliki rentang nilai yang terdefinisi dengan baik. Namun, Korelasi Pearson mengasumsikan bahwa hubungan antara dua variabel adalah linear dan mungkin tidak efektif dalam menangkap hubungan non-linear. Ini juga sensitif terhadap outlier dan mungkin tidak sesuai untuk variabel dengan distribusi non-normal.
[…] Korelasi Pearson […]