İki değişken arasındaki doğrusal ilişkinin gücünü ve yönünü ölçün.
Bilimde ve günlük hayatta sıkça iki veya daha fazla olayın birbiriyle ilişkili olup olmadığını merak ederiz. Örneğin, "daha fazla ders çalışan öğrenciler daha mı yüksek not alır?", "dondurma satışları ile boğulma vakaları arasında bir ilişki var mıdır?" gibi sorular korelasyon analizinin alanına girer. **Korelasyon**, iki veya daha fazla değişken arasındaki ilişkinin yönünü ve gücünü ifade eden istatistiksel bir ölçüttür. Bu analizin en yaygın kullanılan aracı ise **Pearson Korelasyon Katsayısı (r)**'dir. Bu katsayı, iki sürekli değişken arasındaki **doğrusal** ilişkinin ne kadar güçlü olduğunu ve bu ilişkinin pozitif mi yoksa negatif mi olduğunu gösteren -1 ile +1 arasında bir değer alır.
Korelasyon katsayısının değeri, bize ilişkinin hem yönü hem de gücü hakkında bilgi verir:
İstatistik analizinde yapılan en yaygın ve en tehlikeli hatalardan biri, iki değişken arasında güçlü bir korelasyon bulunduğunda, birinin diğerine neden olduğunu varsaymaktır. Yukarıda bahsedilen "dondurma satışları ile boğulma vakaları" örneği buna klasiktir. Bu iki değişken arasında yaz aylarında çok güçlü bir pozitif korelasyon bulunur. Ancak bu, dondurma yemenin boğulmaya neden olduğu anlamına gelmez. Aradaki ilişki, her ikisini de etkileyen üçüncü bir değişkenden kaynaklanır: **sıcak hava**. Sıcak havada hem dondurma satışları artar hem de daha fazla insan yüzmeye gittiği için boğulma vakaları artar. Korelasyon, sadece bir ilişkiyi veya "birlikte hareket etme" durumunu gösterir, neden-sonuç mekanizmasını kanıtlamaz. Nedenselliği kanıtlamak için kontrollü deneyler gibi daha ileri araştırma yöntemleri gereklidir.