Razlike v statistiki (uporaba, opredelitev in formula)

  • Jul 26, 2021
click fraud protection

The variance ali variance je mera razpršenosti naključne spremenljivke (vrednosti, ki se dobijo naključno). Veliko se uporablja na področju statistik, ki skozi številne izražajo spremenljivost omenjene razpršenosti.

Ronald Fisher, angleški matematik, fizik, biolog in statistik, je leta 1918 prvi uvedel izraz variance, v eni od objavljenih študij o biometriji. V zameno je uvedel študije o analizi variance.

Oglasi

V tem članku boste našli:

Kaj je varianca?

The variance vzorca ali nabora vrednosti je vsota kvadratnih odstopanj glede na srednjo ali srednjo vrednost, vse to deljeno s skupnim številom opazovanj minus 1.

Na zelo splošen način lahko rečemo, da je varianca na kvadrat standardni odklon.

Oglasi

Na področjih ekonomije in financ se varianca razlaga kot tveganje, da se donos, izveden v nekem postopku, razlikuje od pričakovanega donosa. Običajno, ko se pričakuje višji donos, je tveganje posledično večje.

Variacija kot merilo razpršenosti

Variacije so skupaj s standardnim odklonom mere razpršenosti podatkov ali opazovanj. Razpršenost teh podatkov kaže na raznolikost, ki je prisotna, to je, če so vse vrednosti v a Nabor podatkov je enak, potem ni razpršenosti, ampak če niso vsi enaki, potem obstaja disperzija.

Oglasi

Ta disperzija je lahko velika ali majhna, odvisno od tega, kako blizu so vrednosti srednji vrednosti.

Variacija vzorca je simbolizirana kot S2, medtem ko je varianca populacije simbolizirana kot σ2.

Oglasi

Variacija vzorca se uporablja za oceno variance populacije, ki je pogosto neznana. Zato je S2 se pogosto šteje tudi za statistiko in σ2 kot parameter.

Formula variance

Varianca vzorca ima naslednjo formulo:

Oglasi

S2 =

Kje predstavlja vsoto odštevanja med vsako vzorčeno vrednostjo () in srednjo vrednostjo na kvadrat.

Po drugi strani predstavlja skupno število opazovanj ali vzorčenih podatkov. Pri zelo velikih vrednostih je varianca minimalna ali celo zanemarljiva.

Namesto tega ima varianca populacije naslednjo formulo:

σ2 =

Kjer N predstavlja skupno število opazovanj ali vzorčenih podatkov.

V večini primerov je zelo težko, če ne celo nemogoče pridobiti skupni N podatkov, na primer med pogovorom posameznikov iz populacije vseh teh posameznikov ni mogoče vzorčiti, saj gre za dejavnik časa in virov omejujoča.

Zato se statistika pogosto uporablja za oceno parametrov populacije. Glede na način zapisa te formule imajo enote variance enake spremenljivke, vendar na kvadrat.

Prav tako vidimo, da varianca ne more biti negativna, zato je najmanjša vrednost, ki jo lahko dobimo v njej, enaka nič.

Standardni odmik vzorca

Za razliko od variance je standardni odklon vzorca je predstavljen na naslednji način:

S =

V tem primeru ta ukrep predstavlja enake enote vzorčene spremenljivke.

Primer variance

Za izračun variance morate najprej izračunati povprečje ali povprečje uporabljenih podatkov. Po drugi strani pa, če imate standardni odklon, rezultat le poravnate na kvadrat in dobite varianco.

Tu je primer, kako razumeti, kako se izračuna varianca in kakšna je njena interpretacija.

Predpostavimo, da imamo letni dohodek petih različnih podjetij istega podjetnika, ki so:

  • Podjetje A: 2.500 USD
  • Podjetje B: 1.800 USD
  • Podjetje C: 2.300 USD
  • Podjetje D: 3000 dolarjev
  • Podjetje E: 2.700 USD

Nato izračunamo pol prihodkov, tako da vsako številko preprosto dodate in delite s skupnim številom podjetij, kar ima za posledico: 2.460 USD.

Podatki Povprečno Podatki - povprečno
Podatki 1 2500 2460 40 1600
Podatki 2 1800 2460 -660 435600
Dejstvo 3 2300 2460 -160 25600
Podatki 4 3000 2460 540 291600
Podatki 5 2700 2460 240 57600
Skupaj 812000

Variacija populacije je vsota razlik med podatki in kvadratnim povprečjem, deljeno z n, v tem primeru je 5.

812000/5 = 203000

σ2=162400

Če vzamemo kvadratni koren tega rezultata, dobimo standardni odklon, to je 402 USD razlike med prihodki petih podjetij.

Uporaba tega ukrepa

Variacija kot merilo razpršenosti ima več aplikacij na različnih področjih, nekateri njeni pripomočki pa so:

  • Predstavlja pomoč pri odločanju o naložbi (razlaga se tudi kot tveganje pri naložbi). Če je varianca ali verjetnostna porazdelitev donosnosti naložbe velika, lahko to kaže na neugodno naložbo.
  • Za opis, analizo in razumevanje vedenja spremenljivke skozi čas.
  • Omogoča primerjavo med različnimi skupinami podatkov.
  • Omogoča vam analizo, katera bi bila najboljša odločitev, ki jo je mogoče sprejeti. To z analizo variance, na primer z odločitvijo, katera metoda predstavlja najboljše učenje, ali z odločitvijo, katera naložba bi predstavljala večji dohodek na leto.

Zaključek

Pri analizi variance se preučujejo pomembne razlike med dvema ali več sredstvi vzorca. Ta analiza je splošno znana kot ANOVA in nam omogoča tudi ugotavljanje, ali ta sredstva prihajajo iz isto populacijo (lahko je skupno število zaposlenih v podjetju) ali če gre za sredstva dveh populacij enako.

Po drugi strani pa varianco kot tudi standardni odklon so zelo občutljivi na izstopajoče vrednosti, to so vrednosti, ki so zelo daleč od povprečja ali pa se zelo razlikujejo od njega.

Da ti ukrepi ne bodo tako prizadeti, jih je mogoče pri izvajanju analiz in celo izračunov prezreti. Uporabijo se lahko tudi drugi ukrepi razpršitve, ki so v teh primerih koristnejši.

Pri analizi tveganja naložbe se upoštevata dva pomembna vidika, eden je vloženi donos in drugi pričakovani glede na opravljeno naložbo. Kot smo že omenili, lahko varianco uporabimo za analizo tega tveganja.

instagram viewer