Различия в статистиката (използване, дефиниция и формула)

  • Jul 26, 2021
click fraud protection

The отклонение или отклонение е мярка за дисперсията на случайна променлива (стойности, които се получават на случаен принцип). Той се използва широко в областта на статистиката, изразяваща чрез редица променливостта на споменатата дисперсия.

Роналд Фишър, английски математик, физик, биолог и статистик, през 1918 г. е първият, който въвежда термина отклонение, в едно от публикуваните му изследвания върху биометрията. На свой ред той представи изследвания за дисперсионния анализ.

Реклами

В тази статия ще намерите:

Какво е отклонението?

The отклонение на извадка или набор от стойности, това е сумата от отклоненията в квадрат по отношение на средната или средната стойност, всичко това разделено на общия брой наблюдения минус 1.

Съвсем общо може да се каже, че дисперсията е стандартното отклонение на квадрат.

Реклами

В областите на икономиката и финансите отклонението се интерпретира като риск, че възвръщаемостта, извършена в някаква процедура, е различна от очакваната възвръщаемост. Обикновено, когато се очаква по-висока възвръщаемост, рискът от своя страна е по-висок.

Дисперсията като мярка за дисперсия

Дисперсията, заедно със стандартното отклонение, са мерки за разпръскване на данни или наблюдения. Дисперсията на тези данни показва разнообразието, което те представят, т.е. ако всички стойности в a набор от данни са равни, тогава няма дисперсия, но вместо това, ако не всички са равни, тогава има дисперсия.

Реклами

Тази дисперсия може да бъде голяма или малка, в зависимост от това колко близки са стойностите до средната стойност.

Дисперсията на пробата е символизирана като S2, докато дисперсията на популация е символизирана като σ2.

Реклами

Дисперсията на извадката се използва за оценка на дисперсията на популация, която често е неизвестна. Ето защо S2 също се счита за статистика и σ2 като параметър.

Формула на отклонение

Дисперсията на пробата има следната формула:

Реклами

С2 =

Където представлява сумата от изваждането между всяка от извадковите стойности () и средната стойност на квадрат.

На свой ред той представлява общия брой на наблюденията или данните, взети от извадката. За много големи стойности вариацията е минимална или дори незначителна.

Вместо това дисперсията на популация има следната формула:

σ2 =

Където N представлява общия брой наблюдения или взети данни.

В повечето случаи е много трудно, ако не и невъзможно да се получат общо N данни, например, когато се говори за индивиди от популация, не е възможно да се вземат проби от всички тези индивиди, тъй като има фактор за време и ресурси ограничаващ.

Ето защо статистическите данни често се използват за оценка на параметрите на една популация. Според начина на писане на тази формула мерните единици на дисперсията имат същите единици на променливата, но на квадрат.

Също така виждаме, че дисперсията не може да бъде отрицателна, така че минималната стойност, която може да се получи в нея, е нула.

Стандартно отклонение на пробата

За разлика от дисперсията, стандартно отклонение на проба е представен, както следва:

S =

В този случай тази мярка представя същите единици от пробната променлива.

Пример за отклонение

За да изчислите дисперсията, първо трябва да изчислите средната или средната стойност на използваните данни. От друга страна, ако имате стандартното отклонение, просто квадратирате този резултат и получавате дисперсията.

Ето пример, за да разберем как се изчислява дисперсията и каква може да бъде нейната интерпретация.

Да предположим, че имаме годишен доход на пет различни компании, принадлежащи на един и същ предприемач, които са:

  • Компания A: 2500 долара
  • Компания B: 1800 долара
  • Компания C: $ 2300
  • Компания D: 3000 долара
  • Компания E: 2700 долара

След това изчисляваме половината от приходите, като просто добавите всяка цифра и я разделите на общия брой компании, което дава като резултат: 2460 $.

Данни Средно аритметично Данни - средно
Данни 1 2500 2460 40 1600
Данни 2 1800 2460 -660 435600
Факт 3 2300 2460 -160 25600
Данни 4 3000 2460 540 291600
Данни 5 2700 2460 240 57600
Обща сума 812000

Дисперсията на популацията е сумата от разликите в данните със средната на квадрат, разделена на n, в този случай тя е 5.

812000/5 = 203000

σ2=162400

Като вземем квадратния корен от този резултат, получаваме стандартното отклонение, което е 402 долара разлика между приходите на петте компании.

Приложения на тази мярка

Дисперсията като мярка за дисперсия има множество приложения в различни области, някои от нейните помощни програми са:

  • Представлява помощ при вземане на решения за инвестиция (Също тълкувана като риск при инвестиция). Ако дисперсията или разпределението на вероятността на възвръщаемостта на инвестицията е висока, това може да означава неблагоприятна инвестиция.
  • Да описва, анализира и разбира поведението на дадена променлива във времето.
  • Позволява да се правят сравнения между различни групи данни.
  • Тя ви позволява да анализирате кое би било най-доброто решение, което може да бъде взето. Това чрез дисперсионен анализ, например, вземане на решение кой метод представлява най-доброто обучение или решаване коя инвестиция ще представлява по-висок доход годишно.

Заключение

При анализа на дисперсиите се изследват значителните разлики между две или повече средства от пробата. Този анализ е известен като ANOVA и ни позволява също така да определим дали тези средства идват от една и съща популация (може да бъде общият брой служители на дадена компания) или ако средствата на две популации са равен.

От друга страна, дисперсия, както и стандартно отклонение те са много чувствителни към отклоненията, това са стойностите, които са много далеч от средната стойност или които са много различни от нея.

Така че тези мерки не са толкова засегнати, тези отклонения могат да бъдат игнорирани при извършване на анализи и дори изчисления. Могат да се използват и други мерки за дисперсия, които са по-полезни в тези случаи.

В случай на анализ на риска от инвестиция се вземат предвид два важни аспекта, единият е инвестираната възвръщаемост, а другият е очакваният според направената инвестиция. Както вече споменахме, дисперсията може да се използва за анализ на този риск.

instagram viewer