The odstupanje ili odstupanje je mjera disperzije slučajne varijable (vrijednosti koje se dobivaju nasumično). Široko se koristi u području statistike koja kroz niz izražava varijabilnost spomenute disperzije.
Ronald Fisher, engleski matematičar, fizičar, biolog i statističar, 1918. prvi je uveo pojam varijance, u jednoj od objavljenih studija o biometriji. Zauzvrat je uveo studije o analizi varijance.
Reklame
U ovom ćete članku pronaći:
Što je varijansa?
The varijance uzorka ili skupa vrijednosti, to je zbroj kvadratnih odstupanja u odnosu na srednju ili srednju vrijednost, a sve to podijeljeno s ukupnim brojem opažanja minus 1.
Na vrlo općenit način, može se reći da je varijanca kvadrat standardne devijacije.
Reklame
U područjima ekonomije i financija varijanca se tumači kao rizik da se povrat izveden u nekom postupku razlikuje od očekivanog. Obično kada se očekuje veći povrat, rizik je pak veći.
Varijansa kao mjera disperzije
Odstupanja, zajedno sa standardnim odstupanjem, mjere su raspršivanja podataka ili opažanja. Raspršenost ovih podataka ukazuje na raznolikost koju oni predstavljaju, odnosno ako su sve vrijednosti u a skup podataka je jednak, tada nema disperzije, ali umjesto toga, ako nisu svi jednaki, onda postoji disperzija.
Reklame
Ova disperzija može biti velika ili mala, ovisno o tome koliko su vrijednosti blizu srednje vrijednosti.
Varijansa uzorka simbolizirana je kao S2, dok je varijansa populacije simbolizirana kao σ2.
Reklame
Varijansa uzorka koristi se za procjenu varijance populacije, koja je često nepoznata. Zbog toga je S2 također se obično smatra statistikom i σ2 kao parametar.
Formula varijance
Varijansa uzorka ima sljedeću formulu:
Reklame
S2 =
Gdje predstavlja zbroj oduzimanja između svake uzorkovane vrijednosti () i srednje vrijednosti na kvadrat.
Zauzvrat, on predstavlja ukupan broj promatranja ili podataka koji su uzorkovani. Za vrlo velike vrijednosti varijansa je minimalna ili čak zanemariva.
Umjesto toga, varijanca populacije ima sljedeću formulu:
σ2 =
Gdje N predstavlja ukupan broj promatranja ili uzoraka podataka.
U većini slučajeva vrlo je teško, ako ne i nemoguće dobiti ukupni N podataka, na primjer, kada se govori o tome pojedinaca iz populacije, nije moguće uzorkovati sve te pojedince, jer postoji faktor vremena i resursa ograničavajući.
Zbog toga se statistika često koristi za procjenu parametara populacije. Prema načinu pisanja ove formule, jedinice varijance imaju iste jedinice varijable, ali na kvadrat.
Također, vidimo da varijanca ne može biti negativna, pa je minimalna vrijednost koja se u njoj može dobiti nula.
Standardno odstupanje uzorka
Za razliku od varijance, standardna devijacija uzorka predstavljen je na sljedeći način:
S =
U ovom slučaju, ova mjera prikazuje iste jedinice uzorkovane varijable.
Primjer varijance
Da biste izračunali varijancu, prvo morate izračunati srednju vrijednost ili prosjek korištenih podataka. S druge strane, ako imate standardno odstupanje, taj rezultat samo poravnate i dobijete varijancu.
Evo primjera kako bismo razumjeli kako se izračunava varijanca i koja bi mogla biti njena interpretacija.
Pretpostavimo da imamo godišnji prihod pet različitih tvrtki koje pripadaju istom poduzetniku, a to su:
- Tvrtka A: 2500 dolara
- Tvrtka B: 1.800 dolara
- Tvrtka C: 2300 dolara
- Tvrtka D: 3000 dolara
- Tvrtka E: 2.700 američkih dolara
Tada izračunavamo pola prihoda, jednostavno dodajući svaku brojku i dijeleći je s ukupnim brojem tvrtki, što kao rezultat daje: 2.460 USD.
Podaci | Prosječno | Podaci - Prosječno | ||
Podaci 1 | 2500 | 2460 | 40 | 1600 |
Podaci 2 | 1800 | 2460 | -660 | 435600 |
Činjenica 3 | 2300 | 2460 | -160 | 25600 |
Podaci 4 | 3000 | 2460 | 540 | 291600 |
Podaci 5 | 2700 | 2460 | 240 | 57600 |
Ukupno | 812000 |
Varijacija populacije je zbroj razlika podataka s kvadratnim prosjekom, podijeljen s n, u ovom slučaju je 5.
812000/5 = 203000
σ2=162400
Uzimajući kvadratni korijen ovog rezultata, dobivamo standardno odstupanje, to je razlika od 402 USD između prihoda pet tvrtki.
Primjene ove mjere
Varijansa kao mjera disperzije ima višestruku primjenu u raznim područjima, a neke od njenih značajki su:
- Predstavlja pomoć u donošenju odluka o ulaganju (Također se tumači kao rizik u ulaganju). Ako su varijance ili raspodjela vjerojatnosti povrata ulaganja visoki, to može ukazivati na nepovoljno ulaganje.
- Opisati, analizirati i razumjeti ponašanje varijable tijekom vremena.
- Omogućuje vam usporedbu između različitih skupina podataka.
- Omogućuje vam analizu koja bi bila najbolja odluka koja se može donijeti. Na primjer, analizom varijance, na primjer, odlukom koja metoda predstavlja najbolje učenje ili odlukom koja bi investicija predstavljala veći prihod godišnje.
Zaključak
U analizi varijanci proučavaju se značajne razlike između dva ili više načina uzorka. Ova analiza je obično poznata kao ANOVA i omogućuje nam da utvrdimo dolaze li ta sredstva iz a iste populacije (to može biti ukupan broj zaposlenih u tvrtki) ili ako su sredstva dvije populacije jednak.
S druge strane, varijance kao i standardna devijacija vrlo su osjetljivi na izvanredne vrijednosti, to su vrijednosti koje su vrlo daleko od srednje vrijednosti ili se vrlo razlikuju od nje.
Kako ove mjere ne bi bile toliko pogođene, ti se izuzeci mogu zanemariti prilikom izvođenja analiza, pa čak i izračuna. Mogu se primijeniti i druge mjere disperzije koje su korisnije u tim slučajevima.
U slučaju analize rizika ulaganja uzimaju se u obzir dva važna aspekta, jedan je uloženi povrat, a drugi očekivani u skladu s uloženim ulaganjem. Kao što je već spomenuto, varijance se može koristiti za analizu ovog rizika.