Mann-Whitney U Testi Hesaplama

İki bağımsız grubun medyanları arasında anlamlı bir fark olup olmadığını non-parametrik olarak test edin.

Normal Dağılım Olmadığında: Non-parametrik Testler ve Mann-Whitney U

İstatistikteki t-testi gibi birçok güçlü hipotez testi, verilerin belirli varsayımları karşılamasına dayanır. Bu varsayımların en önemlilerinden biri, verilerin **normal dağılıma** (çan eğrisine) uymasıdır. Ancak gerçek hayattaki veriler her zaman bu ideal duruma uymaz. Veri setimiz küçük olduğunda, çarpık olduğunda veya sıralama verileri (ordinal data) içerdiğinde, t-testi gibi parametrik testlerin sonuçları yanıltıcı olabilir. İşte bu gibi durumlarda **non-parametrik testler** devreye girer. Bu testler, verinin dağılımı hakkında herhangi bir varsayımda bulunmazlar ve bu yüzden "dağılımdan bağımsız" testler olarak da bilinirler.

**Mann-Whitney U Testi** (Wilcoxon Rank-Sum Testi olarak da bilinir), **bağımsız örneklemler t-testinin** en popüler non-parametrik alternatifidir. Amacı, birbirinden bağımsız iki grubun, aynı popülasyondan gelip gelmediğini, yani dağılımlarının (ve dolayısıyla medyanlarının) benzer olup olmadığını test etmektir. t-testi ortalamaları karşılaştırırken, Mann-Whitney U testi verilerin kendisi yerine onların **sıralamalarını** karşılaştırır, bu da onu aykırı değerlere (outliers) karşı çok daha dirençli hale getirir.

Testin Mantığı ve Hesaplama Adımları

Testin temel mantığı, iki gruptan alınan tüm verileri bir araya getirip, en küçükten en büyüğe doğru sıralamak ve her değere bir sıra numarası (rank) atamaktır. Eğer iki grup arasında bir fark yoksa, her iki gruba ait değerlerin sıralamalarının da karışık bir şekilde dağılması beklenir ve dolayısıyla her grubun sıra toplamları da birbirine yakın olur. Ancak bir grup sistematik olarak diğerinden daha büyük değerlere sahipse, o grubun sıra toplamı da anlamlı şekilde daha yüksek olacaktır. Mann-Whitney U istatistiği, bu sıra toplamlarındaki farkın ne kadar anlamlı olduğunu ölçer.

  1. Verileri Birleştir ve Sırala: Her iki gruptan tüm veri noktaları tek bir listede toplanır ve küçükten büyüğe doğru sıralanır.
  2. Sıralama (Ranking): Her bir veri noktasına, sıralamadaki yerine göre bir sıra numarası (1, 2, 3, ...) verilir. Eğer aynı değere sahip birden fazla nokta varsa (bağlı değerler - ties), bu noktaların alacağı sıraların ortalaması her birine verilir. (Örn: 5. ve 6. sırada aynı değer varsa, her ikisine de 5.5 rankı verilir).
  3. Sıra Toplamlarını Hesapla (R₁ ve R₂): Her grup için kendi elemanlarının sıra numaraları toplanır.
  4. U İstatistiklerini Hesapla: Her grup için U değeri aşağıdaki formüllerle hesaplanır:
    U₁ = n₁n₂ + [n₁(n₁+1)/2] - R₁
    U₂ = n₁n₂ + [n₂(n₂+1)/2] - R₂
    Burada n₁ ve n₂, sırasıyla 1. ve 2. grubun eleman sayılarıdır. Ayrıca, U₁ + U₂ = n₁n₂ eşitliği bir kontrol noktası olarak kullanılabilir.
  5. Test İstatistiğini Belirle: Mann-Whitney U test istatistiği, hesaplanan iki U değerinden **küçük olanıdır**: U = min(U₁, U₂).

Sonucun Yorumlanması

Hesaplanan U değeri, bir **Mann-Whitney U kritik değer tablosu** ile karşılaştırılır. Bu tablolarda, n₁ ve n₂ değerlerine ve seçilen anlamlılık düzeyine (α, genellikle 0.05) karşılık gelen bir kritik U değeri bulunur.

Eğer **hesaplanan U değeri, tablodaki kritik U değerinden küçük veya ona eşitse**, sıfır hipotezi (H₀: iki grubun dağılımı arasında fark yoktur) reddedilir. Bu, iki grup arasında istatistiksel olarak anlamlı bir fark olduğu anlamına gelir. Bu hesaplayıcı, size U istatistiğini ve grup büyüklüklerini (n₁ ve n₂) verir; sonucu yorumlamak için bu değerlerle bir kritik değer tablosuna başvurmanız gerekir.