Korelasi menyatakan hubungan antara dua variabel, dalam statistik korelasi seringkali digunakan untuk mengukur hubungan antara dua buah variabel, apakah hubungannya positif? Negatif? Seberapa kuat hubungannya?

Mengapa kita perlu mengecek korelasi? Umumnya korelasi di cek untuk mengetahui variabel mana saja yang mempengaruhi suatu variabel dependent, korelasi juga seringkali di cek pada variabel variabel independent pada kasus regresi.

Salah satu koefisien korelasi yang sering digunakan adalah korelasi Pearson

Dimana nilai r akan berada diantara -1 sampai 1, dengan -1 menyatakan hubungan linear negatif yang kuat, dan 1 menyatakan hubungan linear positif yang kuat.

Perlu dicatat bahwa korelasi bernilai 0 bukan berarti tidak ada hubungan antara kedua variabel, namun hanya menyatakan tidak ada hubungan linear antara kedua variabel tersebut.

                         Sumber : https://blog.majestic.com/case-studies/majesticseo-beginners-guide-to-correlation-part-5/

Perhatikan bahwa walupun korelasinya 0, hal ini tidak menyatakan bahwa tidak ada hubungan antara x dan y, namun hanya menyatakan tidak ada hubungan linear antara x dan y. Pada gambar diatas hubungannya adalah kuadratik

Perlu diperhatikan juga bahwa korelasi yang cukup tinggi pun, tidak selalu berarti hubungan linear yang kuat

                                                                                                        Anscombe’s Quartet

Keempat gambar ini memiliki korelasi 0.81, namun jika kita perhatikan gambar ke 2 (kanan atas), hubungannya adalah kuadratik dan gambar ke 4 (kanan bawah) sebenarnya hubungannya dapat diwakilkan dengan garis vertikal, namun korelasinya sangat terpengaruh oleh sebuah outlier

Hal ini menggambarkan betapa pentingnya visualisasi terlebih dahulu sebelum ‘mempercayai’ hasil dari korelasi

Hal selanjutnya yang mesti di perhatikan adalah, korelasi tidak menyatakan hubungan kausalitas (sebab – akibat), perhatikan grafik berikut​

Tentu saja kedua hal ini tidak menyebabkan satu sama lain

Nah, tadi kan kita sudah membahas koefisien korelasi dari pearson ya, ketika kita menggunakan korelasi pearson, sebenarnya ada asumsi yang dicek, yaitu apakah kedua variabel yang kita bandingkan berdistribusi normal.

Bagaimana jika tidak demikian? Bagaimana jika data kita banyak terdapat outlier? Telah kita lihat bahwa adanya outlier menyebabkan korelasi menjadi tidak akurat. Ada metode lain untuk mengukur korelasi, yaitu korelasi spearman, singkatnya, korelasi spearman mengukur korelasi dari ranking pada data (jadi data diurutkan terlebih dahulu, lalu dicari korelasinya)

                                            Sumber: http://www.real-statistics.com/correlation/spearmans-rank-correlation/

Nah korelasi spearman ini pun dapat mengukur hubungan monoton, tidak hanya hubungan linear

          Sumber: https://statistics.laerd.com/statistical-guides/spearmans-rank-order-correlation-statistical-guide.php

Nah, korelasi spearman ini dapat digunakan untuk mengukur korelasi antara variabel numerik vs ordinal (kategorik yang mempunyai urutan), dan juga ordinal dan ordinal.

Begitulah yang disebut korelasi sobat TS, jangan lupa ya untuk visualisasi terlebih dahulu sebelum mengecek korelasi, agar kesimpulan yang didapat lebih sesuai

Sampai jumpa di post berikutnya!