Ki-Kare (χ²) Uyum İyiliği Testi Hesaplama

Gözlemlenen ve beklenen frekansları girerek hipotezinizin verilerle uyumlu olup olmadığını test edin.

Gözlemlenen Frekans (O)Beklenen Frekans (E)

Kategorik Veri Analizi: Ki-Kare Testi Ne İşe Yarar?

İstatistiksel analizler sadece sayılarla sınırlı değildir. Çoğu zaman, verilerimiz "erkek/kadın", "evet/hayır/kararsız", "A/B/C markası" gibi kategoriler halinde gelir. Bu tür sayısal olmayan, gruplandırılmış verileri analiz etmek için kullanılan en temel ve güçlü araçlardan biri **Ki-Kare (Chi-Square, χ²) Testi**'dir. Ki-kare testi, genel olarak, gözlemlediğimiz kategorik verilerin, belirli bir beklentiye veya teoriye uyup uymadığını test etmemizi sağlar. Başka bir deyişle, "Gördüğümüz sonuçlar tesadüf mü, yoksa altında istatistiksel olarak anlamlı bir desen var mı?" sorusuna cevap arar. Bu özelliği sayesinde sosyal bilimlerden pazar araştırmasına, genetikten kalite kontrole kadar çok geniş bir yelpazede kullanılır.

Ki-Kare Uyum İyiliği (Goodness of Fit) Testi

Bu hesaplayıcının odaklandığı **Uyum İyiliği Testi**, ki-kare testinin en yaygın uygulamalarından biridir. Bu test, tek bir kategorik değişkene ait gözlemlenen frekansların (sayımların), önceden belirlenmiş beklenen frekanslardan anlamlı bir şekilde farklılık gösterip göstermediğini inceler. Temel mantığı şudur: Eğer gözlemlerimiz beklentilerimizle mükemmel bir uyum içinde olsaydı, her kategori için gözlemlenen ve beklenen değerler arasındaki fark sıfır olurdu ve dolayısıyla ki-kare istatistiği de sıfır olurdu. Gözlemlenen ve beklenen değerler arasındaki fark arttıkça, ki-kare değeri de artar ve bu durum, gözlemlerimizin beklentilerimizle uyumlu olmadığına dair bir kanıt oluşturur.

Örneğin, bir şirketin yeni ürettiği bir ürünü dört farklı renkte (kırmızı, mavi, yeşil, sarı) piyasaya sürdüğünü ve her renkten eşit sayıda satılmasını beklediğini varsayalım. 1000 adet satıştan sonra renk dağılımı ölçülür. Uyum iyiliği testi, bu gerçek satış rakamlarının (gözlemlenen), "her renkten 250 adet satılır" beklentisine (beklenen) uyup uymadığını, yani belirli renklerin tüketiciler tarafından anlamlı bir şekilde daha fazla tercih edilip edilmediğini test eder.

Hesaplama Formülü ve Yorumlama Adımları

Ki-kare istatistiği, her kategori için gözlemlenen ve beklenen frekanslar arasındaki farkın karesinin, beklenen frekansa bölünmesiyle elde edilen değerlerin toplanmasıyla hesaplanır:

χ² = Σ [ (Oᵢ - Eᵢ)² / Eᵢ ]

Test sonucunu yorumlamak için şu adımlar izlenir:

  1. Hipotezlerin Kurulması: Sıfır hipotezi (H₀) genellikle "gözlemlenen ve beklenen frekanslar arasında anlamlı bir fark yoktur" derken, alternatif hipotez (H₁) "anlamlı bir fark vardır" der.
  2. Ki-Kare Değerinin Hesaplanması: Yukarıdaki formül kullanılarak χ² istatistiği hesaplanır.
  3. Serbestlik Derecesinin (df) Bulunması: Uyum iyiliği testi için serbestlik derecesi, kategori sayısının bir eksiğidir: **df = k - 1**.
  4. Karar Aşaması: Hesaplanan χ² değeri, belirli bir anlamlılık düzeyi (genellikle α = 0.05) ve hesaplanan serbestlik derecesi için bir ki-kare dağılım tablosundan bulunan **kritik değer** ile karşılaştırılır. Eğer hesaplanan değer kritik değerden büyükse, sıfır hipotezi (H₀) reddedilir ve gözlemlenen dağılımın beklenen dağılımdan istatistiksel olarak anlamlı ölçüde farklı olduğu sonucuna varılır.
Ki-kare testinin güvenilir sonuçlar vermesi için bazı varsayımların karşılanması gerekir. En önemlisi, her bir kategorideki **beklenen frekansın (E) genellikle 5'ten küçük olmaması** önerilir. Eğer beklenen frekanslar çok düşükse, testin gücü azalır ve sonuçlar yanıltıcı olabilir.