İstatistikte Varyans (Kullanım, tanım ve formül)

  • Jul 26, 2021
click fraud protection

varyans veya varyans rastgele bir değişkenin dağılımının bir ölçüsüdür (rastgele elde edilen değerler). Söz konusu dağılımın değişkenliğini bir sayı aracılığıyla ifade eden istatistik alanında yaygın olarak kullanılmaktadır.

İngiliz matematikçi, fizikçi, biyolog ve istatistikçi olan Ronald Fisher, 1918'de terimi ilk kullanan kişi oldu. varyans, biyometri üzerine yayınlanmış çalışmalarından birinde. Buna karşılık, varyans analizi üzerine çalışmalar başlattı.

Reklamlar

Bu yazıda şunları bulacaksınız:

Varyans nedir?

varyans bir numunenin veya bir dizi değerin, ortalama veya ortalamaya göre sapmaların karesinin toplamıdır, tüm bunlar toplam gözlem sayısı eksi 1'e bölünür.

Çok genel bir şekilde, varyansın standart sapmanın karesi olduğu söylenebilir.

Reklamlar

Ekonomi ve finans alanlarında, varyans, bazı prosedürlerde gerçekleştirilen getirinin beklenen getiriden farklı olması riski olarak yorumlanır. Genellikle daha yüksek bir getiri beklendiğinde, risk de daha yüksektir.

Dağılım ölçüsü olarak varyans

Varyans, standart sapma ile birlikte, verilerin veya gözlemlerin dağılımının ölçüleridir. Bu verilerin dağılımı, bunların mevcut çeşitliliğini gösterir, yani bir dizideki tüm değerler veri kümesi eşittir, o zaman dağılım olmaz, bunun yerine, hepsi eşit değilse, o zaman dağılım.

Reklamlar

Bu dağılım, değerlerin ortalamaya ne kadar yakın olduğuna bağlı olarak büyük veya küçük olabilir.

Bir örneğin varyansı S olarak sembolize edilir2, bir popülasyonun varyansı σ olarak sembolize edilirken2.

Reklamlar

Bir örneğin varyansı, genellikle bilinmeyen bir popülasyonun varyansını tahmin etmek için kullanılır. Bu yüzden S2 ayrıca yaygın olarak bir istatistik olarak kabul edilir ve σ2 parametre olarak.

Varyans Formülü

Bir örneğin varyansı aşağıdaki formüle sahiptir:

Reklamlar

S2 =

Burada, örneklenen değerlerin her biri () ile ortalama kare arasındaki çıkarmanın toplamını temsil eder.

Sırayla, toplam gözlem veya örneklenen veri sayısını temsil eder. Çok büyük değerler için varyans minimumdur ve hatta ihmal edilebilir düzeydedir.

Bunun yerine, bir popülasyonun varyansı aşağıdaki formüle sahiptir:

σ2 =

Burada N, toplam gözlem veya örneklenen veri sayısını temsil eder.

Çoğu durumda, örneğin aşağıdakilerden bahsederken, toplam N veri elde etmek imkansız değilse bile çok zordur. Bir popülasyondan bireyler, zaman ve kaynak faktörü olduğu için tüm bu bireyleri örneklemek mümkün değildir. sınırlayıcı.

Bu nedenle istatistikler genellikle bir popülasyonun parametrelerini tahmin etmek için kullanılır. Bu formülün yazılma şekline göre, varyansın birimleri değişkenin aynı birimlerine sahiptir, ancak kareleri vardır.

Ayrıca varyansın negatif olamayacağını, dolayısıyla elde edilebilecek minimum değerin sıfır olduğunu görüyoruz.

Bir örneğin standart sapması

Varyanstan farklı olarak, standart sapma örneklem aşağıdaki gibi temsil edilir:

S =

Bu durumda, bu ölçü, örneklenen değişkenin aynı birimlerini sunar.

Varyans Örneği

Varyansı hesaplamak için önce kullanılan verilerin ortalamasını veya ortalamasını hesaplamanız gerekir. Öte yandan, standart sapmaya sahipseniz, bu sonucun karesini alırsınız ve böylece varyansı elde edersiniz.

İşte varyansın nasıl hesaplandığını ve yorumunun ne olabileceğini anlamak için bir örnek.

Aynı girişimciye ait beş farklı şirketin yıllık gelirine sahip olduğumuzu varsayalım:

  • A Şirketi: 2500 $
  • B Şirketi: 1.800 $
  • C Şirketi: 2.300 $
  • D Şirketi: 3.000 $
  • E Şirketi: 2.700 $

Sonra hesaplıyoruz yarım gelir, sadece her bir rakamı ekleyerek ve toplam şirket sayısına bölerek, sonuç olarak: 2.460 $.

Veri Ortalama Veri - Ortalama
Veri 1 2500 2460 40 1600
Veri 2 1800 2460 -660 435600
Gerçek 3 2300 2460 -160 25600
Veri 4 3000 2460 540 291600
Veri 5 2700 2460 240 57600
Toplam 812000

Popülasyonun varyansı, verilerin kare ortalaması ile farklarının toplamının n'ye bölümüdür, bu durumda 5'tir.

812000/5 = 203000

σ2=162400

Bu sonucun karekökünü alarak standart sapmayı elde ederiz, bu beş şirketin gelirleri arasındaki 402 dolarlık farktır.

Bu önlemin uygulamaları

Bir dağılım ölçüsü olarak varyans, çeşitli alanlarda birden fazla uygulamaya sahiptir, yardımcı programlarından bazıları şunlardır:

  • Bir yatırım hakkında karar vermede yardımcı olmayı temsil eder (Yatırımdaki risk olarak da yorumlanır). Bir yatırımın getirilerinin varyansı veya olasılık dağılımının yüksek olması, olumsuz bir yatırıma işaret edebilir.
  • Bir değişkenin zaman içindeki davranışını tanımlamak, analiz etmek ve anlamak.
  • Farklı veri grupları arasında karşılaştırma yapmanızı sağlar.
  • Verilebilecek en iyi kararın ne olacağını analiz etmenizi sağlar. Bu, örneğin, hangi yöntemin en iyi öğrenmeyi temsil ettiğine karar vermek veya hangi yatırımın yılda daha yüksek bir geliri temsil edeceğine karar vermek, varyans analizi yoluyla.

Çözüm

Varyans analizinde, bir örneğin iki veya daha fazla ortalaması arasındaki önemli farklılıklar incelenir. Bu analiz yaygın olarak ANOVA olarak bilinir ve bu araçların bir aynı nüfus (bir şirketin toplam çalışan sayısı olabilir) veya iki nüfusun ortalamaları eşit.

Öte yandan, varyans ve standart sapma aykırı değerlere karşı çok hassastırlar, bunlar ortalamadan çok uzak veya ondan çok farklı değerlerdir.

Bu önlemlerin çok etkilenmemesi için analizler ve hatta hesaplamalar yapılırken bu aykırı değerler göz ardı edilebilir. Bu durumlarda daha faydalı olan diğer dağılım ölçüleri de kullanılabilir.

Bir yatırımın riskinin analiz edilmesi durumunda, biri yatırılan getiri, diğeri ise yapılan yatırıma göre beklenen olmak üzere iki önemli husus dikkate alınır. Daha önce de belirtildiği gibi, varyans bu riski analiz etmek için kullanılabilir.

instagram viewer