p-Değeri Nedir?
p-değeri (olasılık değeri), istatistiksel hipotez testlerinde kullanılan temel bir kavramdır. Sıfır hipotezinin (H₀ - yani, gruplar arasında bir fark veya ilişki olmadığı varsayımı) doğru olduğu varsayımı altında, en az gözlemlenen kadar aşırı sonuçların elde edilme olasılığını ifade eder. Basitçe, "Eğer aslında hiçbir şey olmuyorsa, bu kadar ilginç bir sonuç görme şansımız neydi?" sorusuna verilen cevaptır.
p-Değeri Nasıl Yorumlanır?
p-değeri, önceden belirlenmiş bir anlamlılık düzeyi (alfa - α) ile karşılaştırılır. Genellikle α değeri 0.05 (%5) olarak kabul edilir.
- p ≤ α (örn. p ≤ 0.05): Sonuç istatistiksel olarak anlamlı kabul edilir. Gözlemlenen verilerin sadece şans eseri ortaya çıkma olasılığı düşüktür. Bu durumda, sıfır hipotezi (H₀) reddedilir ve alternatif hipotezin (H₁) desteklendiği sonucuna varılır.
- p > α (örn. p > 0.05): Sonuç istatistiksel olarak anlamlı kabul edilmez. Gözlemlenen veriler, sıfır hipotezi altında makul bir şekilde beklenebilecek bir durumdur. Bu durumda, sıfır hipotezini reddetmek için yeterli kanıt yoktur.
Yaygın Yanlış Anlaşılmalar: p-değeri, alternatif hipotezin doğru olma olasılığı DEĞİLDİR. Aynı şekilde, sıfır hipotezinin doğru olma olasılığı da DEĞİLDİR. Sadece, verilerin sıfır hipotezi ile ne kadar uyumsuz olduğunun bir ölçüsüdür.
Kavramın Geliştiricisi: Sir Ronald A. Fisher
p-değeri kavramı, modern istatistiğin kurucularından biri olarak kabul edilen İngiliz istatistikçi ve biyolog Sir Ronald A. Fisher tarafından 1920'lerde popüler hale getirilmiştir. Fisher, bilimsel araştırmalarda sonuçların şans eseri mi yoksa gerçek bir etkiden mi kaynaklandığını ayırt etmek için objektif bir yönteme ihtiyaç duyuyordu. "Anlamlılık testi" (test of significance) adını verdiği yaklaşımı geliştirdi.
Fisher, p-değerini, bir deneyin sonuçlarının sıfır hipoteziyle ne kadar tutarsız olduğunun bir ölçüsü olarak sundu. Onun için p=0.05, bir sonucun "anlamlı" olarak kabul edilebileceği ve daha fazla araştırılmaya değer olduğu bir eşikti. Bu yaklaşım, bilimsel yöntemin temel bir parçası haline gelmiş ve veriye dayalı karar verme süreçlerinde devrim yaratmıştır. Her ne kadar günümüzde p-değerinin yanlış kullanımı ve yorumlanması üzerine yoğun tartışmalar olsa da, Fisher'ın istatistiksel çıkarım üzerine yaptığı temel katkılar hala geçerliliğini korumaktadır.
Literatür ve Kaynakça
p-değeri, hipotez testi ve istatistiksel anlamlılık konuları üzerine temel ve güncel bazı kaynaklar:
- Fisher, R. A. (1925). Statistical Methods for Research Workers. Oliver and Boyd. - (Fisher'ın, p-değeri ve anlamlılık testi kavramlarını bilim dünyasına tanıttığı klasik eseri.)
- Pearson, K. (1900). On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. Philosophical Magazine, Series 5, 50(302), 157-175. - (Ki-kare testini ve dolayısıyla p-değeri kavramının erken bir formunu ortaya koyan temel makale.)
- Wasserstein, R. L., & Lazar, N. A. (2016). The ASA Statement on p-Values: Context, Process, and Purpose. The American Statistician, 70(2), 129-133. - (Amerikan İstatistik Derneği'nin p-değerlerinin doğru kullanımı ve yorumlanması üzerine yayımladığı önemli bildiri.)
- Goodman, S. N. (2008). A dirty dozen: twelve p-value misconceptions. Seminars in Hematology, 45(3), 135-140. - (p-değeri ile ilgili en yaygın yanlış anlaşılmaları açıklayan popüler bir makale.)