Дисперсия в статистике (использование, определение и формула)

  • Jul 26, 2021
click fraud protection

В отклонение или отклонение является мерой дисперсии случайной величины (значений, получаемых случайным образом). Он широко используется в области статистики, выражающей посредством числа изменчивость указанной дисперсии.

Рональд Фишер, английский математик, физик, биолог и статистик, в 1918 году первым ввел термин отклонение, в одном из опубликованных им исследований по биометрии. В свою очередь, он представил исследования по дисперсионному анализу.

Рекламные объявления

В этой статье вы найдете:

Что такое дисперсия?

В отклонение Для выборки или набора значений это сумма квадратов отклонений относительно среднего или среднего, деленная на общее количество наблюдений минус 1.

В очень общем виде можно сказать, что дисперсия - это квадрат стандартного отклонения.

Рекламные объявления

В области экономики и финансов дисперсия интерпретируется как риск того, что доход, полученный в результате какой-либо процедуры, будет отличаться от ожидаемого дохода. Обычно, когда ожидается более высокая доходность, риск, в свою очередь, выше.

Дисперсия как мера дисперсии

Дисперсия, наряду со стандартным отклонением, является мерой разброса данных или наблюдений. Разброс этих данных указывает на разнообразие, которое они представляют, то есть, если все значения в набор данных равен, тогда нет разброса, но вместо этого, если не все равны, то есть дисперсия.

Рекламные объявления

Этот разброс может быть большим или маленьким, в зависимости от того, насколько близки значения к среднему.

Дисперсия выборки обозначается как S2, а дисперсия популяции обозначается как σ2.

Рекламные объявления

Дисперсия выборки используется для оценки дисперсии генеральной совокупности, которая часто неизвестна. Вот почему S2 также обычно рассматривается как статистика, а σ2 в качестве параметра.

Формула отклонения

Дисперсия выборки имеет следующую формулу:

Рекламные объявления

S2 =

Где, представляет собой сумму вычитания между каждым из выбранных значений () и средним квадратом.

В свою очередь, он представляет собой общее количество наблюдений или данных. Для очень больших значений дисперсия минимальна или даже незначительна.

Вместо этого дисперсия генеральной совокупности имеет следующую формулу:

σ2 =

Где N представляет собой общее количество наблюдений или данных.

В большинстве случаев очень сложно, а то и невозможно получить всего N данных, например, когда речь идет о людей из популяции, невозможно выбрать всех этих людей, так как есть фактор времени и ресурсов. ограничение.

Вот почему статистика часто используется для оценки параметров популяции. Согласно тому, как написана эта формула, единицы дисперсии имеют те же единицы переменной, но возведены в квадрат.

Также мы видим, что дисперсия не может быть отрицательной, поэтому минимальное значение, которое может быть получено в ней, равно нулю.

Стандартное отклонение выборки

В отличие от дисперсии среднеквадратичное отклонение Образец представлен следующим образом:

S =

В этом случае эта мера представляет те же единицы выборки переменной.

Пример отклонения

Чтобы вычислить дисперсию, вы должны сначала вычислить среднее или среднее значение используемых данных. С другой стороны, если у вас есть стандартное отклонение, вы просто возводите этот результат в квадрат и получаете дисперсию.

Вот пример, чтобы понять, как рассчитывается дисперсия и какова может быть ее интерпретация.

Предположим, что у нас есть годовой доход пяти разных компаний, принадлежащих одному предпринимателю, а именно:

  • Компания A: 2500 долларов США
  • Компания B: 1800 долларов США
  • Компания C: 2300 долларов
  • Компания D: 3000 долларов
  • Компания E: 2700 долларов

Затем вычисляем половина доходов, просто сложив каждую цифру и разделив ее на общее количество компаний, что дает в результате: 2460 долларов.

Данные Средний Данные - Среднее
Данные 1 2500 2460 40 1600
Данные 2 1800 2460 -660 435600
Факт 3. 2300 2460 -160 25600
Данные 4 3000 2460 540 291600
Данные 5 2700 2460 240 57600
Общее 812000

Дисперсия генеральной совокупности - это сумма разностей данных со средним квадратом, деленная на n, в данном случае это 5.

812000/5 = 203000

σ2=162400

Извлекая квадратный корень из этого результата, мы получаем стандартное отклонение, которое составляет 402 доллара разницы между доходами пяти компаний.

Применение этой меры

Дисперсия как мера дисперсии имеет множество применений в различных областях, некоторые из ее полезностей:

  • Представляет собой помощь в принятии решений об инвестициях (также интерпретируется как риск инвестиций). Если дисперсия или распределение вероятностей доходности инвестиций является высоким, это может указывать на неблагоприятные инвестиции.
  • Чтобы описать, проанализировать и понять поведение переменной во времени.
  • Позволяет сравнивать разные группы данных.
  • Это позволяет проанализировать, какое решение можно принять наилучшим образом. Это посредством анализа дисперсии, например, выбора метода, представляющего лучшее обучение, или принятия решения, какие инвестиции принесут более высокий доход в год.

Вывод

При дисперсионном анализе изучаются существенные различия между двумя или более средними значениями выборки. Этот анализ широко известен как ANOVA и позволяет нам также определить, получены ли эти средства из одного и того же населения (это может быть общее количество сотрудников компании), или если средства двух популяций равный.

С другой стороны, дисперсия, а также стандартное отклонение они очень чувствительны к выбросам, это значения, которые очень далеки от среднего или сильно отличаются от него.

Чтобы не повлиять на эти показатели, эти выбросы можно игнорировать при выполнении анализа и даже вычислений. Также можно использовать другие меры дисперсии, которые более полезны в этих случаях.

В случае анализа риска инвестиций принимаются во внимание два важных аспекта: один - это инвестированный доход, а другой - ожидаемый в соответствии с сделанными инвестициями. Как уже упоминалось, для анализа этого риска можно использовать дисперсию.

instagram viewer