Razlike u statistikama (uporaba, definicija i formula)

  • Jul 26, 2021
click fraud protection

The odstupanje ili odstupanje je mjera disperzije slučajne varijable (vrijednosti koje se dobivaju nasumično). Široko se koristi u području statistike koja kroz niz izražava varijabilnost spomenute disperzije.

Ronald Fisher, engleski matematičar, fizičar, biolog i statističar, 1918. prvi je uveo pojam varijance, u jednoj od objavljenih studija o biometriji. Zauzvrat je uveo studije o analizi varijance.

Reklame

U ovom ćete članku pronaći:

Što je varijansa?

The varijance uzorka ili skupa vrijednosti, to je zbroj kvadratnih odstupanja u odnosu na srednju ili srednju vrijednost, a sve to podijeljeno s ukupnim brojem opažanja minus 1.

Na vrlo općenit način, može se reći da je varijanca kvadrat standardne devijacije.

Reklame

U područjima ekonomije i financija varijanca se tumači kao rizik da se povrat izveden u nekom postupku razlikuje od očekivanog. Obično kada se očekuje veći povrat, rizik je pak veći.

Varijansa kao mjera disperzije

Odstupanja, zajedno sa standardnim odstupanjem, mjere su raspršivanja podataka ili opažanja. Raspršenost ovih podataka ukazuje na raznolikost koju oni predstavljaju, odnosno ako su sve vrijednosti u a skup podataka je jednak, tada nema disperzije, ali umjesto toga, ako nisu svi jednaki, onda postoji disperzija.

Reklame

Ova disperzija može biti velika ili mala, ovisno o tome koliko su vrijednosti blizu srednje vrijednosti.

Varijansa uzorka simbolizirana je kao S2, dok je varijansa populacije simbolizirana kao σ2.

Reklame

Varijansa uzorka koristi se za procjenu varijance populacije, koja je često nepoznata. Zbog toga je S2 također se obično smatra statistikom i σ2 kao parametar.

Formula varijance

Varijansa uzorka ima sljedeću formulu:

Reklame

S2 =

Gdje predstavlja zbroj oduzimanja između svake uzorkovane vrijednosti () i srednje vrijednosti na kvadrat.

Zauzvrat, on predstavlja ukupan broj promatranja ili podataka koji su uzorkovani. Za vrlo velike vrijednosti varijansa je minimalna ili čak zanemariva.

Umjesto toga, varijanca populacije ima sljedeću formulu:

σ2 =

Gdje N predstavlja ukupan broj promatranja ili uzoraka podataka.

U većini slučajeva vrlo je teško, ako ne i nemoguće dobiti ukupni N podataka, na primjer, kada se govori o tome pojedinaca iz populacije, nije moguće uzorkovati sve te pojedince, jer postoji faktor vremena i resursa ograničavajući.

Zbog toga se statistika često koristi za procjenu parametara populacije. Prema načinu pisanja ove formule, jedinice varijance imaju iste jedinice varijable, ali na kvadrat.

Također, vidimo da varijanca ne može biti negativna, pa je minimalna vrijednost koja se u njoj može dobiti nula.

Standardno odstupanje uzorka

Za razliku od varijance, standardna devijacija uzorka predstavljen je na sljedeći način:

S =

U ovom slučaju, ova mjera prikazuje iste jedinice uzorkovane varijable.

Primjer varijance

Da biste izračunali varijancu, prvo morate izračunati srednju vrijednost ili prosjek korištenih podataka. S druge strane, ako imate standardno odstupanje, taj rezultat samo poravnate i dobijete varijancu.

Evo primjera kako bismo razumjeli kako se izračunava varijanca i koja bi mogla biti njena interpretacija.

Pretpostavimo da imamo godišnji prihod pet različitih tvrtki koje pripadaju istom poduzetniku, a to su:

  • Tvrtka A: 2500 dolara
  • Tvrtka B: 1.800 dolara
  • Tvrtka C: 2300 dolara
  • Tvrtka D: 3000 dolara
  • Tvrtka E: 2.700 američkih dolara

Tada izračunavamo pola prihoda, jednostavno dodajući svaku brojku i dijeleći je s ukupnim brojem tvrtki, što kao rezultat daje: 2.460 USD.

Podaci Prosječno Podaci - Prosječno
Podaci 1 2500 2460 40 1600
Podaci 2 1800 2460 -660 435600
Činjenica 3 2300 2460 -160 25600
Podaci 4 3000 2460 540 291600
Podaci 5 2700 2460 240 57600
Ukupno 812000

Varijacija populacije je zbroj razlika podataka s kvadratnim prosjekom, podijeljen s n, u ovom slučaju je 5.

812000/5 = 203000

σ2=162400

Uzimajući kvadratni korijen ovog rezultata, dobivamo standardno odstupanje, to je razlika od 402 USD između prihoda pet tvrtki.

Primjene ove mjere

Varijansa kao mjera disperzije ima višestruku primjenu u raznim područjima, a neke od njenih značajki su:

  • Predstavlja pomoć u donošenju odluka o ulaganju (Također se tumači kao rizik u ulaganju). Ako su varijance ili raspodjela vjerojatnosti povrata ulaganja visoki, to može ukazivati ​​na nepovoljno ulaganje.
  • Opisati, analizirati i razumjeti ponašanje varijable tijekom vremena.
  • Omogućuje vam usporedbu između različitih skupina podataka.
  • Omogućuje vam analizu koja bi bila najbolja odluka koja se može donijeti. Na primjer, analizom varijance, na primjer, odlukom koja metoda predstavlja najbolje učenje ili odlukom koja bi investicija predstavljala veći prihod godišnje.

Zaključak

U analizi varijanci proučavaju se značajne razlike između dva ili više načina uzorka. Ova analiza je obično poznata kao ANOVA i omogućuje nam da utvrdimo dolaze li ta sredstva iz a iste populacije (to može biti ukupan broj zaposlenih u tvrtki) ili ako su sredstva dvije populacije jednak.

S druge strane, varijance kao i standardna devijacija vrlo su osjetljivi na izvanredne vrijednosti, to su vrijednosti koje su vrlo daleko od srednje vrijednosti ili se vrlo razlikuju od nje.

Kako ove mjere ne bi bile toliko pogođene, ti se izuzeci mogu zanemariti prilikom izvođenja analiza, pa čak i izračuna. Mogu se primijeniti i druge mjere disperzije koje su korisnije u tim slučajevima.

U slučaju analize rizika ulaganja uzimaju se u obzir dva važna aspekta, jedan je uloženi povrat, a drugi očekivani u skladu s uloženim ulaganjem. Kao što je već spomenuto, varijance se može koristiti za analizu ovog rizika.

instagram viewer