Veri setinizi girerek merkezi dağılım ölçülerini anında hesaplayın.
İstatistikte, bir veri setini sadece ortalamasıyla özetlemek genellikle yetersizdir. Örneğin, {49, 50, 51} ve {0, 50, 100} veri setlerinin her ikisinin de ortalaması 50'dir. Ancak ilk setin ne kadar tutarlı ve ortalamaya yakın, ikinci setin ise ne kadar dağınık ve değişken olduğu açıktır. İşte bu "dağınıklığı" veya "yayılımı" sayısal olarak ifade etmemizi sağlayan ölçütlere **dağılım ölçüleri** denir. Bunların en önemlileri ve en sık kullanılanları **varyans** ve onun karekökü olan **standart sapmadır**.
Varyans (σ²), bir veri setindeki her bir değerin, setin ortalamasından ne kadar uzakta olduğunun karesel ortalamasıdır. Her bir veri noktasının ortalamadan farkı alınır, bu farkların karesi toplanır ve son olarak bu toplam, veri sayısına (veya örneklem için n-1'e) bölünür. Karelerin alınmasının sebebi, pozitif ve negatif farkların birbirini sıfırlamasını önlemektir. Varyansın birimi, orijinal verinin biriminin karesidir (örn: cm ise cm²), bu da yorumlamasını zorlaştırır. Bu nedenle genellikle bir sonraki adıma geçmek için bir ara hesaplama olarak kullanılır.
**Standart sapma (σ)**, varyansın kareköküdür ve istatistikteki en temel dağılım ölçüsüdür. Bize, veri noktalarının ortalamadan "ortalama olarak" ne kadar saptığını söyler. Birimi orijinal veri ile aynı olduğu için yorumlaması çok daha kolay ve sezgiseldir.
Standart sapma ve varyans hesaplanırken dikkat edilmesi gereken en önemli ayrım, eldeki verinin bir **popülasyon** mu (ilgilenilen grubun tamamı, örn: Türkiye'deki tüm üniversite öğrencileri) yoksa bir **örneklem** mi (popülasyon içinden seçilen daha küçük bir grup, örn: 1000 üniversite öğrencisi) olduğudur. Araştırmaların çoğu örneklemlerle yapılır.