Variation i statistik (brug, definition og formel)

  • Jul 26, 2021
click fraud protection

Det varians eller varians er et mål for dispersionen af ​​en tilfældig variabel (værdier, der opnås tilfældigt). Det bruges i vid udstrækning inden for statistikområdet, der gennem et tal udtrykker variationen i dispersionen.

Ronald Fisher, en engelsk matematiker, fysiker, biolog og statistiker, var i 1918 den første til at introducere udtrykket varians, i en af ​​hans offentliggjorte studier om biometri. Til gengæld introducerede han undersøgelser om variansanalyse.

Annoncer

I denne artikel finder du:

Hvad er variansen?

Det varians af en prøve eller et sæt værdier er summen af ​​de kvadratiske afvigelser i forhold til middelværdien eller middelværdien, alt dette divideret med det samlede antal observationer minus 1.

På en meget generel måde kan det siges, at variansen er standardafvigelsen i kvadrat.

Annoncer

Inden for økonomi og økonomi fortolkes variationen som risikoen for, at afkastet, der udføres i en eller anden procedure, er forskelligt fra det forventede afkast. Normalt når der forventes et højere afkast, er risikoen igen højere.

Variation som et mål for spredning

Variansen sammen med standardafvigelsen er mål for spredning af data eller observationer. Spredningen af ​​disse data indikerer den variation, som disse præsenterer, det vil sige, hvis alle værdierne i a datasættet er ens, så er der ingen spredning, men hvis ikke alle er ens, så er der spredning.

Annoncer

Denne spredning kan være stor eller lille, afhængigt af hvor tæt værdierne er på middelværdien.

Variansen af ​​en prøve er symboliseret som S2, mens variationen af ​​en population er symboliseret som σ2.

Annoncer

Variansen i en prøve bruges til at estimere varianterne hos en population, hvilket ofte er ukendt. Dette er grunden til S2 betragtes også almindeligvis som en statistik og σ2 som en parameter.

Variansformel

Variansen af ​​en prøve har følgende formel:

Annoncer

S2 =

Hvor repræsenterer summen af ​​subtraktionen mellem hver af de samplede værdier () og middelværdien, kvadratisk.

Til gengæld repræsenterer det det samlede antal observationer eller data, der er samplet. For meget store værdier er variansen minimal eller endog ubetydelig.

I stedet har variationen af ​​en population følgende formel:

σ2 =

Hvor N repræsenterer det samlede antal stikprøver af observationer eller data.

I de fleste tilfælde er det meget vanskeligt, hvis ikke umuligt at få et samlet N-antal data, for eksempel når man taler om enkeltpersoner fra en befolkning, er det ikke muligt at prøve alle disse individer, da der er en faktor for tid og ressourcer begrænsende.

Derfor bruges statistikker ofte til at estimere parametrene for en befolkning. Ifølge den måde, denne formel er skrevet på, har variansenhederne de samme enheder af variablen, men i kvadrat.

Vi ser også, at variansen ikke kan være negativ, så den mindste værdi, der kan opnås i den, er nul.

Standardafvigelse for en prøve

I modsætning til variansen er standardafvigelse af en prøve er repræsenteret som følger:

S =

I dette tilfælde præsenterer denne foranstaltning de samme enheder af den samplede variabel.

Varianseksempel

For at beregne variansen skal du først beregne gennemsnittet eller gennemsnittet af de anvendte data. På den anden side, hvis du har standardafvigelsen, kvadrerer du bare resultatet og får variansen.

Her er et eksempel for at forstå, hvordan variansen beregnes, og hvad der kan være dens fortolkning.

Lad os antage, at vi har den årlige indkomst for fem forskellige virksomheder, der tilhører den samme iværksætter, som er:

  • Virksomhed A: $ 2.500
  • Virksomhed B: $ 1.800
  • Virksomhed C: $ 2.300
  • Virksomhed D: $ 3.000
  • Virksomhed E: $ 2.700

Så beregner vi halvt af indtægterne ved blot at tilføje hvert tal og dividere det med det samlede antal virksomheder, hvilket giver som et resultat: $ 2.460.

Data Gennemsnit Data - Gennemsnit
Data 1 2500 2460 40 1600
Data 2 1800 2460 -660 435600
Fakta 3 2300 2460 -160 25600
Data 4 3000 2460 540 291600
Data 5 2700 2460 240 57600
Total 812000

Befolkningsvariansen er summen af ​​forskellene i dataene med det kvadrerede gennemsnit divideret med n, i dette tilfælde er det 5.

812000/5 = 203000

σ2=162400

Ved at tage kvadratroden af ​​dette resultat opnår vi standardafvigelsen, dette er $ 402 forskel mellem indtægterne fra de fem virksomheder.

Anvendelser af denne foranstaltning

Variationen som et mål for spredning har flere anvendelser inden for forskellige områder, nogle af dens hjælpeprogrammer er:

  • Repræsenterer en hjælp til at træffe beslutninger om en investering (fortolkes også som risikoen ved en investering). Hvis variansen eller sandsynlighedsfordelingen for en investerings afkast er høj, kan det indikere en ugunstig investering.
  • At beskrive, analysere og forstå en variabels opførsel over tid.
  • Giver dig mulighed for at foretage sammenligninger mellem forskellige datagrupper.
  • Det gør det muligt at analysere, hvad der ville være den bedste beslutning, der kan tages. Dette gennem variansanalyse, for eksempel ved at beslutte mellem hvilken metode, der repræsenterer den bedste læring eller beslutte, hvilken investering der vil repræsentere en højere indkomst pr. År.

Konklusion

I analysen af ​​afvigelser undersøges de signifikante forskelle mellem to eller flere måder for en prøve. Denne analyse er almindeligt kendt som ANOVA og giver os mulighed for også at afgøre, om disse midler kommer fra en samme befolkning (det kan være det samlede antal ansatte i en virksomhed), eller hvis middel til to befolkninger er lige.

På den anden side er varians samt standardafvigelse de er meget følsomme over for outliers, det er værdier, der er meget langt fra gennemsnittet, eller som er meget forskellige fra det.

For at disse tiltag ikke påvirkes så meget, kan disse afvigelser ignoreres, når der udføres analyser og endda beregninger. Andre dispersionsmål, der er mere nyttige i disse tilfælde, kan også anvendes.

I tilfælde af analyse af risikoen ved en investering tages to vigtige aspekter i betragtning, det ene er det investerede afkast og det andet det forventede i henhold til den foretagne investering. Som allerede nævnt kan afvigelsen bruges til at analysere denne risiko.

instagram viewer