Kruskal-Wallis H Testi Hesaplama

Üç veya daha fazla bağımsız grubun medyanları arasında anlamlı bir fark olup olmadığını non-parametrik olarak test edin.

İkiden Fazla Grup için Non-parametrik Analiz: Kruskal-Wallis H Testi

Tek Yönlü Varyans Analizi (ANOVA), üç veya daha fazla grubun ortalamaları arasında bir fark olup olmadığını test etmek için kullanılan güçlü bir parametrik testtir. Ancak ANOVA'nın güvenilir sonuçlar vermesi için, verilerin normal dağılıma uyması ve grup varyanslarının homojen olması gibi bazı varsayımların karşılanması gerekir. Peki, verilerimiz bu varsayımları karşılamıyorsa ne yapmalıyız? İşte bu noktada **Kruskal-Wallis H Testi** devreye girer. Kruskal-Wallis testi, **Tek Yönlü ANOVA'nın non-parametrik alternatifidir**. Bu test, üç veya daha fazla bağımsız grubun, aynı popülasyondan gelip gelmediğini, yani medyanlarının istatistiksel olarak birbirinden farklı olup olmadığını test eder. Mann-Whitney U testinin ikiden fazla grup için genişletilmiş bir versiyonu olarak da düşünülebilir.

Testin Mantığı: Ortalamalar Yerine Sıralamalar

Kruskal-Wallis H testinin temel mantığı, verilerin orijinal değerlerini değil, onların **sıralamalarını** (rank) kullanmaktır. Bu yaklaşım, testi normal dağılım varsayımından bağımsız kılar ve aykırı değerlerin (outliers) etkisini büyük ölçüde azaltır. Testin arkasındaki fikir şudur: Eğer tüm gruplar aslında aynı popülasyondan geliyorsa, tüm veriler birleştirilip sıralandığında her gruba ait elemanların sıraları da bu birleşik liste içinde rastgele dağılmalıdır. Bu durumda, her grubun "ortalama sıra" değeri de birbirine yakın olacaktır. Ancak, eğer bir veya daha fazla grup sistematik olarak diğerlerinden daha yüksek veya daha düşük değerlere sahipse, bu grupların ortalama sıra değerleri de birbirinden anlamlı şekilde farklılaşacaktır. Kruskal-Wallis H istatistiği, bu ortalama sıralar arasındaki farkın tesadüfi olup olmadığını ölçer.

Hesaplama Adımları

  1. Tüm Verileri Birleştir ve Sırala: Tüm gruplardaki veriler tek bir büyük listede toplanır ve küçükten büyüğe doğru sıralanır.
  2. Sıralama (Ranking): Her bir veri noktasına genel sıralamadaki yerine göre bir sıra numarası (1, 2, 3, ... N) verilir. Eğer aynı değere sahip birden fazla nokta varsa (bağlı değerler - ties), bu noktaların alacağı sıraların ortalaması her birine verilir.
  3. Sıra Toplamlarını Hesapla (Rᵢ): Her grup için, o gruba ait elemanların sıra numaraları toplanır.
  4. H İstatistiğini Hesapla: Sıra toplamları, grup büyüklükleri (nᵢ) ve toplam veri sayısı (N) kullanılarak H istatistiği aşağıdaki formülle hesaplanır:
    H = [ 12 / (N(N+1)) ] * Σ( Rᵢ² / nᵢ ) - 3(N+1)

Sonucun Yorumlanması

Hesaplanan H istatistiğinin dağılımı, **Ki-Kare (χ²)** dağılımına benzer. Bu nedenle, sonucun istatistiksel anlamlılığı, bir ki-kare kritik değer tablosu kullanılarak yorumlanır. Serbestlik derecesi (df), grup sayısının bir eksiği olarak hesaplanır (**df = k - 1**). Eğer hesaplanan H değeri, belirli bir anlamlılık düzeyi (örn: α = 0.05) ve ilgili serbestlik derecesi için tablodaki kritik ki-kare değerinden büyükse, sıfır hipotezi (H₀: tüm grupların medyanları eşittir) reddedilir. Bu, "en az bir grubun medyanının diğerlerinden farklı" olduğu anlamına gelir.

ANOVA'da olduğu gibi, Kruskal-Wallis testinin anlamlı çıkması da bize sadece gruplar arasında genel bir fark olduğunu söyler, ancak hangi grupların birbirinden farklı olduğunu belirtmez. Bu detayı öğrenmek için, testin ardından **Dunn's testi** gibi non-parametrik bir post-hoc (çoklu karşılaştırma) testi uygulanması gerekir.