Відхилення в статистиці (використання, визначення та формула)

  • Jul 26, 2021
click fraud protection

дисперсія або дисперсія є мірою дисперсії випадкової величини (значення, які отримують випадковим чином). Він широко використовується в галузі статистики, що виражає через ряд змінність зазначеної дисперсії.

Рональд Фішер, англійський математик, фізик, біолог і статистик, в 1918 році першим ввів цей термін дисперсія, в одному з опублікованих досліджень з біометрії. У свою чергу, він представив дослідження з дисперсійного аналізу.

Реклама

У цій статті ви знайдете:

Що таке дисперсія?

дисперсія вибірки або набору значень - це сума квадратичних відхилень відносно середнього або середнього значення, все це ділиться на загальну кількість спостережень мінус 1.

Дуже загальним чином можна сказати, що дисперсія - це квадратичне стандартне відхилення.

Реклама

В галузях економіки та фінансів дисперсія інтерпретується як ризик того, що віддача, виконана в якійсь процедурі, відрізняється від очікуваної. Зазвичай, коли очікується вища віддача, ризик, у свою чергу, вищий.

Дисперсія як міра дисперсії

Дисперсія, поряд із стандартним відхиленням, є мірами розпорошення даних або спостережень. Дисперсія цих даних вказує на різноманітність, яку вони представляють, тобто якщо всі значення в a набір даних рівний, тоді дисперсія відсутня, але замість цього, якщо не всі рівні, тоді є дисперсія.

Реклама

Ця дисперсія може бути великою або малою, залежно від того, наскільки величини наближаються до середнього.

Дисперсія вибірки символізується як S2, тоді як дисперсія сукупності символізується як σ2.

Реклама

Дисперсія вибірки використовується для оцінки дисперсії сукупності, яка у багатьох випадках невідома. Ось чому S2 також зазвичай розглядається як статистика та σ2 як параметр.

Формула дисперсії

Дисперсія вибірки має таку формулу:

Реклама

S2 =

Де, являє собою суму віднімання між кожним із вибіркових значень () та середнім значенням у квадраті.

У свою чергу, це представляє загальну кількість спостережень або даних, відібраних. Для дуже великих значень дисперсія мінімальна або навіть незначна.

Натомість дисперсія сукупності має таку формулу:

σ2 =

Де N являє собою загальну кількість спостережень або даних, відібраних.

У більшості випадків дуже складно, а то й неможливо отримати загальну кількість даних, наприклад, коли мова йде про неможливо взяти вибірку для всіх цих осіб, оскільки існує фактор часу та ресурсів обмежує.

Ось чому статистичні дані часто використовують для оцінки параметрів сукупності. Відповідно до способу написання цієї формули, одиниці дисперсії мають однакові одиниці змінної, але в квадраті.

Крім того, ми бачимо, що дисперсія не може бути від’ємною, тому мінімальне значення, яке можна отримати в ній, дорівнює нулю.

Стандартне відхилення вибірки

На відміну від дисперсії, стандартне відхилення зразка представлений наступним чином:

S =

У цьому випадку цей показник дійсно представляє ті самі одиниці вибіркової змінної.

Приклад дисперсії

Щоб розрахувати дисперсію, спочатку потрібно обчислити середнє або середнє значення використаних даних. З іншого боку, якщо у вас стандартне відхилення, ви просто квадрат цей результат і таким чином отримуєте дисперсію.

Ось приклад для розуміння того, як обчислюється дисперсія та яка може бути її інтерпретація.

Припустимо, що ми маємо річний дохід п’яти різних компаній, що належать одному підприємцю, а саме:

  • Компанія А: 2500 доларів
  • Компанія B: 1800 доларів
  • Компанія C: 2300 доларів
  • Компанія D: 3000 доларів
  • Компанія E: 2700 доларів

Тоді ми обчислюємо наполовину доходу, просто додавши кожну цифру та розділивши її на загальну кількість компаній, що призводить до: 2460 доларів.

Дані Середній Дані - Середнє
Дані 1 2500 2460 40 1600
Дані 2 1800 2460 -660 435600
Факт 3 2300 2460 -160 25600
Дані 4 3000 2460 540 291600
Дані 5 2700 2460 240 57600
Усього 812000

Дисперсія сукупності - це сума різниць даних із середнім квадратом, поділеним на n, в даному випадку вона дорівнює 5.

812000/5 = 203000

σ2=162400

Беручи квадратний корінь з цього результату, ми отримуємо стандартне відхилення, це 402 долари різниці між доходами п’яти компаній.

Застосування цього заходу

Дисперсія як міра дисперсії має безліч застосувань у різних сферах, деякі її корисні функції:

  • Представляє допомогу у прийнятті рішень щодо інвестиції (також інтерпретується як ризик в інвестиції). Якщо дисперсія або розподіл ймовірності прибутковості інвестиції високі, це може свідчити про несприятливу інвестицію.
  • Для опису, аналізу та розуміння поведінки змінної протягом часу.
  • Дозволяє проводити порівняння між різними групами даних.
  • Це дозволяє проаналізувати, яке було б найкраще рішення, яке можна прийняти. Це шляхом дисперсійного аналізу, наприклад, вирішення того, який метод представляє найкраще навчання, або рішення, яка інвестиція представлятиме більший дохід на рік.

Висновок

При аналізі дисперсій вивчаються суттєві відмінності між двома або більше засобами вибірки. Цей аналіз широко відомий як ANOVA і дозволяє нам також визначити, чи походять ці засоби від однакова сукупність (це може бути загальна кількість працівників компанії), або якщо кошти двох груп населення рівний.

З іншого боку, дисперсія, а також середнє відхилення вони дуже чутливі до викидів, це величини, які дуже далекі від середнього значення або дуже відрізняються від нього.

Щоб на ці заходи не впливали настільки, ці відхилення можна ігнорувати під час проведення аналізів і навіть розрахунків. Також можуть бути застосовані інші заходи дисперсії, які є більш корисними у цих випадках.

У разі аналізу ризику інвестиції беруться до уваги два важливі аспекти, один - це інвестована прибутковість, а інший - очікуваний відповідно до вкладених інвестицій. Як уже зазначалося, дисперсію можна використовувати для аналізу цього ризику.

instagram viewer