Rozptyl v štatistike (použitie, definícia a vzorec)

  • Jul 26, 2021
click fraud protection

The rozptyl alebo rozptyl je miera disperzie náhodnej premennej (hodnoty, ktoré sa získavajú náhodne). Je široko používaný v oblasti štatistiky vyjadrujúcej prostredníctvom množstva variabilitu uvedenej disperzie.

Ronald Fisher, anglický matematik, fyzik, biológ a štatistik, v roku 1918 ako prvý zaviedol tento pojem rozptyl, v jednej zo svojich publikovaných štúdií o biometrii. Na druhej strane zaviedol štúdie o analýze rozptylu.

Reklamy

V tomto článku nájdete:

Čo je to rozptyl?

The rozptyl vzorky alebo súboru hodnôt, je to súčet štvorcových odchýlok vzhľadom na priemer alebo priemer, to všetko vydelené celkovým počtom pozorovaní mínus 1.

Veľmi všeobecne sa dá povedať, že odchýlka je štvorcová štandardná odchýlka.

Reklamy

V oblastiach ekonomiky a financií sa odchýlka interpretuje ako riziko, že návratnosť vykonaná v rámci niektorého postupu sa líši od očakávaného výnosu. Zvyčajne, keď sa očakáva vyššia návratnosť, je riziko zasa vyššie.

Rozptyl ako miera disperzie

Rozptyl spolu so štandardnou odchýlkou ​​sú mierou rozptylu údajov alebo pozorovaní. Rozptyl týchto údajov naznačuje rozmanitosť, ktorú tieto predstavujú, teda ak sú všetky hodnoty v a množina údajov je rovnaká, potom nedochádza k ich rozptylu, ale ak nie sú všetky rovnaké, potom existuje disperzia.

Reklamy

Táto disperzia môže byť veľká alebo malá podľa toho, ako blízko sú hodnoty priemeru.

Rozptyl vzorky je symbolizovaný ako S2, zatiaľ čo rozptyl populácie je symbolizovaný ako σ2.

Reklamy

Rozptyl vzorky sa používa na odhad odchýlky populácie, ktorá je často neznáma. To je dôvod, prečo S2 sa tiež bežne považuje za štatistiku a σ2 ako parameter.

Variačný vzorec

Rozptyl vzorky má nasledujúci vzorec:

Reklamy

S2 =

Kde, predstavuje súčet odčítania medzi každou zo vzorkovaných hodnôt () a strednou hodnotou, na druhú.

Na druhej strane predstavuje celkový počet pozorovaní alebo údajov, z ktorých sa odobrali vzorky. Pri veľmi vysokých hodnotách je odchýlka minimálna alebo dokonca zanedbateľná.

Rozptyl populácie má namiesto toho nasledujúci vzorec:

σ2 =

Kde N predstavuje celkový počet pozorovaní alebo údajov, z ktorých sa odobrali vzorky.

Vo väčšine prípadov je veľmi ťažké, ak nie nemožné získať celkový počet N, napríklad keď hovoríme o jednotlivcov z populácie, nie je možné odobrať vzorky všetkých týchto jednotlivcov, pretože existuje faktor času a zdrojov obmedzujúci.

Preto sa štatistika často používa na odhad parametrov populácie. Podľa spôsobu, akým je tento vzorec napísaný, majú jednotky rozptylu rovnaké jednotky premennej, ale na druhú.

Vidíme tiež, že variancia nemôže byť záporná, takže minimálna hodnota, ktorá sa v nej dá získať, je nula.

Štandardná odchýlka vzorky

Na rozdiel od rozptylu, štandardná odchýlka vzorky je znázornený takto:

S =

V tomto prípade toto opatrenie predstavuje rovnaké jednotky vzorkovanej premennej.

Príklad odchýlky

Ak chcete vypočítať odchýlku, musíte najskôr vypočítať priemer alebo priemer použitých údajov. Na druhej strane, ak máte štandardnú odchýlku, tento výsledok iba umocníte a získate rozptyl.

Tu je príklad na pochopenie toho, ako sa rozptyl počíta a aká môže byť jeho interpretácia.

Predpokladajme, že máme ročný príjem piatich rôznych spoločností patriacich k tomu istému podnikateľovi, ktorými sú:

  • Spoločnosť A: 2 500 dolárov
  • Spoločnosť B: 1 800 dolárov
  • Spoločnosť C: 2 300 dolárov
  • Spoločnosť D: 3 000 dolárov
  • Spoločnosť E: 2 700 dolárov

Potom vypočítame polovica výnosov, jednoducho pridať každú číslicu a vydeliť ju celkovým počtom spoločností, čo vo výsledku dáva: 2 460 USD.

Údaje Priemerná Údaje - priemer
Údaje 1 2500 2460 40 1600
Údaje 2 1800 2460 -660 435600
Fakt 3 2300 2460 -160 25600
Údaje 4 3000 2460 540 291600
Údaje 5 2700 2460 240 57600
Celkom 812000

Populačný rozptyl je súčtom rozdielov údajov s druhou mocninou, vydelený n, v tomto prípade je to 5.

812000/5 = 203000

σ2=162400

Ak odmocnime tento výsledok, získame štandardnú odchýlku, čo je rozdiel 402 USD medzi príjmami piatich spoločností.

Uplatnenie tohto opatrenia

Rozptyl ako miera disperzie má viac aplikácií v rôznych oblastiach, niektoré z jeho utilít sú:

  • Predstavuje pomoc pri rozhodovaní o investícii (interpretuje sa tiež ako riziko v investícii). Ak je rozptyl alebo rozdelenie pravdepodobnosti výnosov investície vysoké, môže to znamenať nepriaznivú investíciu.
  • Popísať, analyzovať a pochopiť správanie premennej v čase.
  • Umožňuje vám porovnávať rôzne skupiny údajov.
  • Umožňuje vám analyzovať, aké by bolo najlepšie rozhodnutie, aké je možné urobiť. A to prostredníctvom analýzy odchýlok, napríklad rozhodnutím medzi tým, ktorá metóda predstavuje najlepšie učenie, alebo rozhodnutím, ktorá investícia by predstavovala vyšší príjem za rok.

Záver

Pri analýze odchýlok sa študujú významné rozdiely medzi dvoma alebo viacerými prostriedkami vzorky. Táto analýza je všeobecne známa ako ANOVA a umožňuje nám tiež určiť, či tieto prostriedky pochádzajú z a rovnaká populácia (môže to byť celkový počet zamestnancov spoločnosti), alebo ak sú prostriedky dvoch populácií rovný.

Na druhej strane odchýlka, ako aj štandardná odchýlka sú veľmi citlivé na odľahlé hodnoty, sú to hodnoty, ktoré sú veľmi vzdialené od strednej hodnoty alebo sa od nej veľmi líšia.

Aby tieto opatrenia neboli tak ovplyvnené, môžu sa tieto mimoriadne hodnoty pri analýzach a dokonca aj pri výpočtoch ignorovať. Môžu sa použiť aj ďalšie miery disperzie, ktoré sú v týchto prípadoch užitočnejšie.

V prípade analýzy rizika investície sa berú do úvahy dva dôležité aspekty, jeden je investovaný výnos a druhý je očakávaný podľa uskutočnenej investície. Ako už bolo spomenuté, na analýzu tohto rizika je možné použiť odchýlku.

instagram viewer