Variantie in statistieken (gebruik, definitie en formule)

  • Jul 26, 2021
click fraud protection

De variantie of variantie is een maat voor de spreiding van een willekeurige variabele (waarden die willekeurig worden verkregen). Het wordt veel gebruikt op het gebied van statistieken die door middel van een getal de variabiliteit van de dispersie uitdrukken.

Ronald Fisher, een Engelse wiskundige, natuurkundige, bioloog en statisticus, was in 1918 de eerste die de term introduceerde variantie, in een van zijn gepubliceerde studies over biometrie. Op zijn beurt introduceerde hij studies over de analyse van variantie.

advertenties

In dit artikel vind je:

Wat is de variantie?

De variantie van een steekproef of van een reeks waarden, het is de som van de gekwadrateerde afwijkingen ten opzichte van het gemiddelde of het gemiddelde, dit alles gedeeld door het totale aantal waarnemingen min 1.

In een zeer algemene manier kan worden gezegd dat de variantie de standaarddeviatie in het kwadraat is.

advertenties

Op het gebied van economie en financiën wordt de variantie geïnterpreteerd als het risico dat het in een bepaalde procedure uitgevoerde rendement afwijkt van het verwachte rendement. Meestal wanneer een hoger rendement wordt verwacht, is het risico op zijn beurt hoger.

Variantie als maat voor spreiding

De variantie, samen met de standaarddeviatie, zijn maatstaven voor de spreiding van gegevens of waarnemingen. De spreiding van deze gegevens geeft de variëteit aan die deze presenteren, dat wil zeggen, als alle waarden in a set van gegevens gelijk zijn, dan is er geen spreiding, maar in plaats daarvan, als niet alle gegevens gelijk zijn, is er spreiding.

advertenties

Deze spreiding kan groot of klein zijn, afhankelijk van hoe dicht de waarden bij het gemiddelde liggen.

De variantie van een steekproef wordt gesymboliseerd als S2, terwijl de variantie van een populatie wordt gesymboliseerd als σ2.

advertenties

De variantie van een steekproef wordt gebruikt om de variantie van een populatie te schatten, die vaak onbekend is. Dit is waarom S2 wordt ook algemeen beschouwd als een statistiek en2 als parameter.

Variantie formule

De variantie van een steekproef heeft de volgende formule:

advertenties

S2 =

Waar, vertegenwoordigt de som van de aftrekking tussen elk van de bemonsterde waarden () en het kwadraat van het gemiddelde.

Het vertegenwoordigt op zijn beurt het totale aantal waarnemingen of bemonsterde gegevens. Voor zeer grote waarden is de variantie minimaal of zelfs verwaarloosbaar.

In plaats daarvan heeft de variantie van een populatie de volgende formule:

σ2 =

Waarbij N staat voor het totale aantal waarnemingen of bemonsterde gegevens.

In de meeste gevallen is het erg moeilijk, zo niet onmogelijk om in totaal N aan gegevens te verkrijgen, bijvoorbeeld als we het hebben over: individuen uit een populatie, is het niet mogelijk om al deze individuen te samplen, aangezien er een factor tijd en middelen is beperken.

Dit is de reden waarom statistieken vaak worden gebruikt om de parameters van een populatie te schatten. Volgens de manier waarop deze formule is geschreven, hebben de eenheden van de variantie dezelfde eenheden van de variabele, maar dan in het kwadraat.

We zien ook dat de variantie niet negatief kan zijn, dus de minimumwaarde die erin kan worden verkregen is nul.

Standaarddeviatie van een steekproef

In tegenstelling tot de variantie, is de standaardafwijking van een monster wordt als volgt weergegeven:

S =

In dit geval presenteert deze maat wel dezelfde eenheden van de gesamplede variabele.

Variantie voorbeeld

Om de variantie te berekenen, moet u eerst het gemiddelde of gemiddelde van de gebruikte gegevens berekenen. Aan de andere kant, als u de standaarddeviatie heeft, kwadrateert u dat resultaat en krijgt u de variantie.

Hier is een voorbeeld om te begrijpen hoe de variantie wordt berekend en wat de interpretatie ervan kan zijn.

Stel dat we het jaarinkomen hebben van vijf verschillende bedrijven die tot dezelfde ondernemer behoren, namelijk:

  • Bedrijf A: $ 2.500
  • Bedrijf B: $ 1.800
  • Bedrijf C: $ 2.300
  • Bedrijf D: $ 3.000
  • Bedrijf E: $ 2.700

Dan berekenen we de voor de helft van de inkomsten, door simpelweg elk cijfer op te tellen en te delen door het totale aantal bedrijven, wat resulteert in: $ 2.460.

Gegevens Gemiddelde Gegevens - Gemiddeld
Gegevens 1 2500 2460 40 1600
Gegevens 2 1800 2460 -660 435600
feit 3 2300 2460 -160 25600
Gegevens 4 3000 2460 540 291600
Gegevens 5 2700 2460 240 57600
Totaal 812000

De variantie van de populatie is de som van de verschillen van de gegevens met het gekwadrateerde gemiddelde, gedeeld door n, in dit geval is het 5.

812000/5 = 203000

σ2=162400

Als we de vierkantswortel van dit resultaat nemen, krijgen we de standaarddeviatie, dit is $ 402 verschil tussen de inkomsten van de vijf bedrijven.

Toepassingen van deze maatregel

De variantie als een maatstaf voor spreiding heeft meerdere toepassingen op verschillende gebieden, enkele van de hulpprogramma's zijn:

  • Vertegenwoordigt een hulpmiddel bij het nemen van beslissingen over een investering (ook geïnterpreteerd als het risico van een investering). Als de variantie of waarschijnlijkheidsverdeling van het rendement van een belegging hoog is, kan dit duiden op een ongunstige belegging.
  • Het gedrag van een variabele in de tijd beschrijven, analyseren en begrijpen.
  • Het maakt het mogelijk om vergelijkingen te maken tussen verschillende groepen gegevens.
  • Hiermee kunt u analyseren wat de beste beslissing is die kan worden genomen. Dit door variantieanalyse, bijvoorbeeld door te beslissen tussen welke methode de beste leerervaring vertegenwoordigt of te beslissen welke investering een hoger inkomen per jaar zou opleveren.

Gevolgtrekking

Bij de variantieanalyse worden de significante verschillen tussen twee of meer gemiddelden van een steekproef bestudeerd. Deze analyse is algemeen bekend als ANOVA en stelt ons in staat om ook te bepalen of deze middelen afkomstig zijn van een dezelfde populatie (het kan het totale aantal werknemers van een bedrijf zijn), of als de gemiddelden van twee populaties zijn: Gelijk.

Aan de andere kant, de variantie en standaarddeviatie ze zijn erg gevoelig voor uitbijters, dit zijn de waarden die heel ver van het gemiddelde liggen of er heel anders van zijn.

Om deze maatregelen niet zo te beïnvloeden, kunnen deze uitbijters worden genegeerd bij het uitvoeren van analyses en zelfs berekeningen. Andere dispersiemaatregelen die in deze gevallen nuttiger zijn, kunnen ook worden gebruikt.

Bij het analyseren van het risico van een belegging worden twee belangrijke aspecten in aanmerking genomen, het ene is het geïnvesteerde rendement en het andere is het verwachte rendement op basis van de gedane investering. Zoals eerder vermeld, kan de variantie worden gebruikt om dit risico te analyseren.

instagram viewer