Varianz in Statistik (Verwendung, Definition und Formel)

  • Jul 26, 2021
click fraud protection

Das Varianz oder Varianz ist ein Maß für die Streuung einer Zufallsvariablen (zufällig erhaltene Werte). Es wird häufig im Bereich der Statistik verwendet, das die Variabilität der Streuung durch eine Zahl ausdrückt.

Ronald Fisher, ein englischer Mathematiker, Physiker, Biologe und Statistiker, führte 1918 den Begriff als erster ein Abweichung, in einer seiner veröffentlichten Studien zur Biometrie. Im Gegenzug führte er Studien zur Varianzanalyse ein.

Anzeige

In diesem Artikel finden Sie:

Was ist die Varianz?

Das Abweichung einer Stichprobe oder einer Reihe von Werten ist es die Summe der quadrierten Abweichungen in Bezug auf den Mittelwert oder den Mittelwert, dividiert durch die Gesamtzahl der Beobachtungen minus 1.

Ganz allgemein kann man sagen, dass die Varianz das Quadrat der Standardabweichung ist.

Anzeige

In den Bereichen Wirtschaft und Finanzen wird die Varianz als das Risiko interpretiert, dass die in einem Verfahren erzielte Rendite von der erwarteten Rendite abweicht. Wenn eine höhere Rendite erwartet wird, ist in der Regel auch das Risiko höher.

Varianz als Maß für die Streuung

Die Varianz ist zusammen mit der Standardabweichung ein Maß für die Streuung von Daten oder Beobachtungen. Die Streuung dieser Daten zeigt die Vielfalt an, die diese aufweisen, dh wenn alle Werte in a Datenmengen gleich sind, dann gibt es keine Streuung, sondern wenn nicht alle gleich sind, dann gibt es Dispersion.

Anzeige

Diese Streuung kann groß oder klein sein, je nachdem wie nahe die Werte am Mittelwert liegen.

Die Varianz einer Stichprobe wird symbolisiert als S2, während die Varianz einer Population symbolisiert wird als σ symbol2.

Anzeige

Die Varianz einer Stichprobe wird verwendet, um die Varianz einer Grundgesamtheit zu schätzen, die oft unbekannt ist. Deshalb S2 wird auch allgemein als Statistik angesehen und2 als Parameter.

Abweichungsformel

Die Varianz einer Stichprobe hat die folgende Formel:

Anzeige

S2 =

Wobei steht für die Summe der Subtraktion zwischen jedem der abgetasteten Werte () und dem Mittelwert, quadriert.

Es stellt wiederum die Gesamtzahl der Beobachtungen oder der Stichprobendaten dar. Bei sehr großen Werten ist die Varianz minimal oder sogar vernachlässigbar.

Stattdessen hat die Varianz einer Grundgesamtheit die folgende Formel:

σ2 =

Dabei steht N für die Gesamtzahl der Beobachtungen oder Stichprobendaten.

In den meisten Fällen ist es sehr schwierig, wenn nicht unmöglich, eine Gesamtzahl von N Daten zu erhalten, z Individuen aus einer Population, ist es nicht möglich, alle diese Individuen zu beproben, da es einen Faktor von Zeit und Ressourcen gibt begrenzend.

Aus diesem Grund werden Statistiken häufig verwendet, um die Parameter einer Population zu schätzen. Nach der Schreibweise dieser Formel haben die Einheiten der Varianz die gleichen Einheiten der Variablen, jedoch quadriert.

Wir sehen auch, dass die Varianz nicht negativ sein kann, sodass der minimale Wert, der darin erhalten werden kann, Null ist.

Standardabweichung einer Probe

Im Gegensatz zur Varianz ist die Standardabweichung einer Stichprobe wird wie folgt dargestellt:

S =

In diesem Fall stellt dieses Maß die gleichen Einheiten der abgetasteten Variablen dar.

Abweichungsbeispiel

Um die Varianz zu berechnen, müssen Sie zuerst den Mittelwert oder Durchschnitt der verwendeten Daten berechnen. Auf der anderen Seite, wenn Sie die Standardabweichung haben, quadrieren Sie dieses Ergebnis und erhalten die Varianz.

Hier ist ein Beispiel, um zu verstehen, wie die Varianz berechnet wird und was ihre Interpretation sein könnte.

Nehmen wir an, wir haben das Jahreseinkommen von fünf verschiedenen Unternehmen, die demselben Unternehmer gehören, und zwar:

  • Unternehmen A: 2.500 $
  • Unternehmen B: 1.800 $
  • Unternehmen C: 2.300 $
  • Firma D: $ 3.000
  • Unternehmen E: 2.700 $

Dann berechnen wir die Hälfte des Umsatzes, indem man einfach jede Zahl addiert und durch die Gesamtzahl der Unternehmen dividiert, was als Ergebnis: 2.460 US-Dollar ergibt.

Daten Durchschnittlich Daten - Durchschnitt
Daten 1 2500 2460 40 1600
Daten 2 1800 2460 -660 435600
Fakt 3 2300 2460 -160 25600
Daten 4 3000 2460 540 291600
Daten 5 2700 2460 240 57600
Gesamt 812000

Die Populationsvarianz ist die Summe der Differenzen der Daten mit dem quadrierten Durchschnitt geteilt durch n, in diesem Fall beträgt sie 5.

812000/5 = 203000

σ2=162400

Wenn wir die Quadratwurzel dieses Ergebnisses ziehen, erhalten wir die Standardabweichung, die 402 $ Differenz zwischen den Einnahmen der fünf Unternehmen beträgt.

Anwendungen dieser Maßnahme

Die Varianz als Maß für die Streuung hat mehrere Anwendungen in verschiedenen Bereichen, einige ihrer Nutzen sind:

  • Stellt eine Entscheidungshilfe für eine Investition dar (wird auch als Risiko einer Investition interpretiert). Wenn die Varianz oder Wahrscheinlichkeitsverteilung der Renditen einer Anlage hoch ist, kann dies auf eine ungünstige Anlage hindeuten.
  • Das Verhalten einer Variablen im Zeitverlauf beschreiben, analysieren und verstehen.
  • Ermöglicht Vergleiche zwischen verschiedenen Datengruppen.
  • Es ermöglicht zu analysieren, was die beste Entscheidung wäre, die getroffen werden kann. Dies durch Varianzanalysen, beispielsweise durch die Entscheidung, welche Methode das beste Lernen darstellt, oder durch die Entscheidung, welche Investition ein höheres Einkommen pro Jahr bedeuten würde.

Fazit

Bei der Varianzanalyse werden die signifikanten Unterschiede zwischen zwei oder mehreren Mittelwerten einer Stichprobe untersucht. Diese Analyse ist allgemein als ANOVA bekannt und ermöglicht es uns auch zu bestimmen, ob diese Mittelwerte von a gleichen Grundgesamtheit (es kann die Gesamtzahl der Beschäftigten eines Unternehmens sein) oder wenn die Mittelwerte zweier Grundgesamtheiten sind gleich.

Auf der anderen Seite ist die Varianz sowie Standardabweichung sie reagieren sehr empfindlich auf Ausreißer, dies sind die Werte, die sehr weit vom Mittelwert entfernt sind oder sich stark davon unterscheiden.

Damit diese Maßnahmen nicht so stark beeinflusst werden, können diese Ausreißer bei Analysen und sogar Berechnungen vernachlässigt werden. Andere Dispersionsmaße, die in diesen Fällen nützlicher sind, können ebenfalls verwendet werden.

Bei der Risikoanalyse eines Investments werden zwei wichtige Aspekte berücksichtigt, zum einen die investierte Rendite und zum anderen die aufgrund der getätigten Investition erwartete. Wie bereits erwähnt, kann die Varianz verwendet werden, um dieses Risiko zu analysieren.

instagram viewer