Standart Sapma ve Varyans Hesaplama

Veri setinizi girerek merkezi dağılım ölçülerini anında hesaplayın.

Veri Dağılımını Anlamak: Varyans ve Standart Sapma

İstatistikte, bir veri setini sadece ortalamasıyla özetlemek genellikle yetersizdir. Örneğin, {49, 50, 51} ve {0, 50, 100} veri setlerinin her ikisinin de ortalaması 50'dir. Ancak ilk setin ne kadar tutarlı ve ortalamaya yakın, ikinci setin ise ne kadar dağınık ve değişken olduğu açıktır. İşte bu "dağınıklığı" veya "yayılımı" sayısal olarak ifade etmemizi sağlayan ölçütlere **dağılım ölçüleri** denir. Bunların en önemlileri ve en sık kullanılanları **varyans** ve onun karekökü olan **standart sapmadır**.

Varyans Nedir?

Varyans (σ²), bir veri setindeki her bir değerin, setin ortalamasından ne kadar uzakta olduğunun karesel ortalamasıdır. Her bir veri noktasının ortalamadan farkı alınır, bu farkların karesi toplanır ve son olarak bu toplam, veri sayısına (veya örneklem için n-1'e) bölünür. Karelerin alınmasının sebebi, pozitif ve negatif farkların birbirini sıfırlamasını önlemektir. Varyansın birimi, orijinal verinin biriminin karesidir (örn: cm ise cm²), bu da yorumlamasını zorlaştırır. Bu nedenle genellikle bir sonraki adıma geçmek için bir ara hesaplama olarak kullanılır.

Standart Sapma Nedir?

**Standart sapma (σ)**, varyansın kareköküdür ve istatistikteki en temel dağılım ölçüsüdür. Bize, veri noktalarının ortalamadan "ortalama olarak" ne kadar saptığını söyler. Birimi orijinal veri ile aynı olduğu için yorumlaması çok daha kolay ve sezgiseldir.

Örneklem vs. Popülasyon: Neden 'n-1'? (Bessel Düzeltmesi)

Standart sapma ve varyans hesaplanırken dikkat edilmesi gereken en önemli ayrım, eldeki verinin bir **popülasyon** mu (ilgilenilen grubun tamamı, örn: Türkiye'deki tüm üniversite öğrencileri) yoksa bir **örneklem** mi (popülasyon içinden seçilen daha küçük bir grup, örn: 1000 üniversite öğrencisi) olduğudur. Araştırmaların çoğu örneklemlerle yapılır.

Eğer elinizdeki veri, çalıştığınız grubun tamamını temsil ediyorsa (örn: bir sınıftaki tüm öğrencilerin notları), popülasyon formülünü kullanmalısınız. Eğer daha büyük bir gruptan (popülasyondan) alınmış bir kesiti analiz ediyorsanız (örn: Türkiye'deki seçmenlerin nabzını ölçmek için 1000 kişiyle yapılan bir anket), örneklem formülü kullanılmalıdır. Bu hesaplayıcı, her iki durumu da sizin için hesaplar.