Varianța în statistici (utilizare, definiție și formulă)

  • Jul 26, 2021
click fraud protection

varianță sau varianță este o măsură a dispersiei unei variabile aleatorii (valori obținute aleatoriu). Este utilizat pe scară largă în domeniul statisticilor exprimând, printr-un număr, variabilitatea dispersiei menționate.

Ronald Fisher, matematician, fizician, biolog și statistician englez, în 1918 a fost primul care a introdus termenul varianță, într-unul dintre studiile sale publicate despre biometrie. La rândul său, a introdus studii privind analiza varianței.

Reclame

În acest articol veți găsi:

Ce este varianța?

varianță dintr-un eșantion sau un set de valori, este suma abaterilor pătrate față de medie sau medie, toate acestea împărțite la numărul total de observații minus 1.

Într-un mod foarte general, se poate spune că varianța este deviația standard pătrată.

Reclame

În domeniile economiei și finanțelor, varianța este interpretată ca riscul ca randamentul efectuat într-o anumită procedură să fie diferit de randamentul așteptat. De obicei, atunci când este de așteptat o rentabilitate mai mare, riscul la rândul său este mai mare.

Varianța ca măsură a dispersiei

Varianța, împreună cu abaterea standard, sunt măsuri de dispersie a datelor sau a observațiilor. Dispersia acestor date indică varietatea pe care o prezintă acestea, adică dacă toate valorile dintr-un setul de date este egal, atunci nu există dispersie, dar în schimb, dacă nu toate sunt egale, atunci există dispersie.

Reclame

Această dispersie poate fi mare sau mică, în funcție de cât de aproape sunt valorile de medie.

Varianța unui eșantion este simbolizată ca S2, în timp ce varianța unei populații este simbolizată ca σ2.

Reclame

Varianța unui eșantion este utilizată pentru a estima varianța unei populații, care este adesea necunoscută. Acesta este motivul pentru care S2 este, de asemenea, considerat în mod obișnuit ca o statistică și σ2 ca parametru.

Formula varianței

Varianța unui eșantion are următoarea formulă:

Reclame

S2 =

Unde, reprezintă suma scăderii dintre fiecare dintre valorile eșantionate () și media, pătrată.

La rândul său, reprezintă numărul total de observații sau date eșantionate. Pentru valori foarte mari, varianța este minimă sau chiar neglijabilă.

În schimb, varianța unei populații are următoarea formulă:

σ2 =

Unde N reprezintă numărul total de observații sau date eșantionate.

În majoritatea cazurilor, este foarte dificil, dacă nu imposibil să obțineți un total de N de date, de exemplu, atunci când vorbim despre indivizii dintr-o populație, nu este posibil să se probeze toți acești indivizi, deoarece există un factor de timp și resurse limitativ.

Acesta este motivul pentru care statistica este adesea utilizată pentru a estima parametrii unei populații. În funcție de modul în care este scrisă această formulă, unitățile varianței au aceleași unități ale variabilei, dar pătrate.

De asemenea, vedem că varianța nu poate fi negativă, deci valoarea minimă care poate fi obținută în ea este zero.

Abaterea standard a unui eșantion

Spre deosebire de varianță, deviație standard a unui eșantion este reprezentat după cum urmează:

S =

În acest caz, această măsură prezintă aceleași unități ale variabilei eșantionate.

Exemplu de varianță

Pentru a calcula varianța, trebuie mai întâi să calculați media sau media datelor utilizate. Pe de altă parte, dacă aveți abaterea standard, trebuie doar să pătrateți rezultatul și să obțineți varianța.

Iată un exemplu pentru a înțelege modul în care este calculată varianța și care ar putea fi interpretarea acesteia.

Să presupunem că avem venituri anuale a cinci companii diferite, aparținând aceluiași antreprenor, care sunt:

  • Compania A: 2.500 USD
  • Compania B: 1.800 USD
  • Compania C: 2.300 USD
  • Compania D: 3.000 USD
  • Compania E: 2.700 USD

Apoi calculăm jumătate din venituri, pur și simplu adăugând fiecare cifră și împărțind-o la numărul total de companii, ceea ce dă drept rezultat: 2.460 USD.

Date In medie Date - Media
Date 1 2500 2460 40 1600
Date 2 1800 2460 -660 435600
Faptul 3 2300 2460 -160 25600
Date 4 3000 2460 540 291600
Date 5 2700 2460 240 57600
Total 812000

Varianța populației este suma diferențelor datelor cu media pătrată, împărțită la n, în acest caz este 5.

812000/5 = 203000

σ2=162400

Luând rădăcina pătrată a acestui rezultat, obținem abaterea standard, aceasta fiind o diferență de 402 USD între veniturile celor cinci companii.

Aplicațiile acestei măsuri

Varianța ca măsură a dispersiei are mai multe aplicații în diferite domenii, unele dintre utilitățile sale sunt:

  • Reprezintă un ajutor în luarea deciziilor cu privire la o investiție (interpretat și ca riscul unei investiții). Dacă variația sau distribuția probabilității randamentelor unei investiții este mare, aceasta poate indica o investiție nefavorabilă.
  • Pentru a descrie, analiza și înțelege comportamentul unei variabile în timp.
  • Vă permite să faceți comparații între diferite grupuri de date.
  • Vă permite să analizați care ar fi cea mai bună decizie care poate fi luată. Acest lucru prin analiza varianței, de exemplu, decidând între ce metodă reprezintă cea mai bună învățare sau decidând care investiție ar reprezenta un venit mai mare pe an.

Concluzie

În analiza varianțelor, sunt studiate diferențele semnificative între două sau mai multe mijloace ale unui eșantion. Această analiză este cunoscută în mod obișnuit ca ANOVA și ne permite să determinăm, de asemenea, dacă aceste mijloace provin de la aceeași populație (poate fi numărul total de angajați ai unei companii), sau dacă mijloacele a două populații sunt egal.

Pe de altă parte, varianță, precum și abaterea standard sunt foarte sensibili la valori aberante, acestea sunt valorile care sunt foarte departe de medie sau care sunt foarte diferite de aceasta.

Pentru ca aceste măsuri să nu fie atât de afectate, aceste valori aberante pot fi ignorate atunci când se efectuează analize și chiar calcule. Pot fi folosite și alte măsuri de dispersie care sunt mai utile în aceste cazuri.

În cazul analizei riscului unei investiții, se iau în considerare două aspecte importante, unul este randamentul investit și celălalt este cel așteptat în funcție de investiția realizată. După cum sa menționat deja, varianța poate fi utilizată pentru a analiza acest risc.

instagram viewer