Statistikas atšķirības (lietošana, definīcija un formula)

  • Jul 26, 2021
click fraud protection

The dispersija vai dispersija ir gadījuma lieluma (vērtības, kas iegūtas nejauši) izkliedes mērs. To plaši izmanto statistikas jomā, caur skaitli izsakot minētās izkliedes mainīgumu.

Ronalds Fišers, angļu matemātiķis, fiziķis, biologs un statistiķis, 1918. gadā pirmais ieviesa šo terminu dispersija, vienā no viņa publicētajiem pētījumiem par biometriku. Savukārt viņš ieviesa pētījumus par dispersijas analīzi.

Sludinājumi

Šajā rakstā jūs atradīsit:

Kas ir dispersija?

The dispersija parauga vai vērtību kopa ir kvadrātu noviržu summa attiecībā pret vidējo vai vidējo, to visu dalot ar kopējo novērojumu skaitu mīnus 1.

Ļoti vispārīgi var teikt, ka dispersija ir kvadrāta standarta novirze.

Sludinājumi

Ekonomikas un finanšu jomās dispersiju interpretē kā risku, ka kādā procedūrā veiktā atdeve atšķiras no paredzamās atdeves. Parasti, kad gaidāma lielāka atdeve, risks savukārt ir lielāks.

Dispersija kā dispersijas mērs

Dispersija kopā ar standartnovirzi ir datu vai novērojumu izkliedes mēraukla. Šo datu izkliede norāda dažādību, kāda tiem ir, tas ir, ja visas vērtības a datu kopa ir vienāda, tad nav izkliedes, bet tā vietā, ja ne visi ir vienādi, tad ir izkliede.

Sludinājumi

Šī dispersija var būt liela vai maza, atkarībā no tā, cik tuvas vērtības ir vidējai vērtībai.

Parauga dispersiju simbolizē kā S2, savukārt populācijas dispersiju simbolizē kā σ2.

Sludinājumi

Parauga dispersiju izmanto, lai novērtētu populācijas dispersiju, kas bieži nav zināma. Tāpēc S2 arī parasti uzskata par statistiku un σ2 kā parametru.

Dispersijas formula

Parauga dispersijai ir šāda formula:

Sludinājumi

S2 =

Kur, ir atņemšanas summa starp katru no atlasītajām vērtībām () un vidējo kvadrātā.

Savukārt tas atspoguļo kopējo novērojumu vai atlasīto datu skaitu. Ļoti lielām vērtībām dispersija ir minimāla vai pat nenozīmīga.

Tā vietā populācijas dispersijai ir šāda formula:

σ2 =

Kur N ir kopējais novērojumu vai atlasīto datu skaits.

Vairumā gadījumu ir ļoti grūti, ja ne neiespējami iegūt kopējo N datu, piemēram, runājot indivīdiem no populācijas, nav iespējams atlasīt visus šos indivīdus, jo pastāv laika un resursu faktors ierobežojoši.

Tāpēc populācijas parametru novērtēšanai bieži izmanto statistiku. Saskaņā ar šīs formulas rakstīšanas veidu dispersijas vienībām ir vienādas mainīgā lieluma vienības, bet kvadrātā.

Tāpat mēs redzam, ka dispersija nevar būt negatīva, tāpēc minimālā vērtība, ko tajā var iegūt, ir nulle.

Parauga standartnovirze

Atšķirībā no dispersijas, standarta novirze paraugs tiek attēlots šādi:

S =

Šajā gadījumā šis rādītājs uzrāda tās pašas mainīgā lieluma vienības.

Dispersijas piemērs

Lai aprēķinātu dispersiju, vispirms jāaprēķina izmantoto datu vidējais vai vidējais. No otras puses, ja jums ir standarta novirze, jūs vienkārši kvadrātveida šo rezultātu un iegūt dispersiju.

Šeit ir piemērs, lai saprastu, kā tiek aprēķināta dispersija un kāda varētu būt tās interpretācija.

Pieņemsim, ka mūsu gada ienākumi ir pieciem dažādiem uzņēmumiem, kas pieder vienam un tam pašam uzņēmējam:

  • Uzņēmums A: 2500 USD
  • B uzņēmums: 1800 USD
  • Uzņēmums C: 2300 USD
  • D uzņēmums: 3000 USD
  • Uzņēmums E: 2700 USD

Tad mēs aprēķinām puse no ieņēmumiem, vienkārši saskaitot katru skaitli un dalot to ar kopējo uzņēmumu skaitu, kas rezultātā dod: 2460 USD.

Dati Vidēji Dati - vidēji
Dati 1 2500 2460 40 1600
2. dati 1800 2460 -660 435600
3. fakts 2300 2460 -160 25600
4. dati 3000 2460 540 291600
5. dati 2700 2460 240 57600
Kopā 812000

Populācijas dispersija ir datu atšķirību summa ar vidējo kvadrātiņu, dalīta ar n, šajā gadījumā tā ir 5.

812000/5 = 203000

σ2=162400

Ņemot šī rezultāta kvadrātsakni, mēs iegūstam standartnovirzi, kas ir 402 USD starpība starp piecu uzņēmumu ieņēmumiem.

Šī pasākuma piemērošana

Dispersijai kā dispersijas mērījumam ir vairākas lietojumprogrammas dažādās jomās, dažas no tām ir:

  • Pārstāv atbalstu lēmumu pieņemšanā par ieguldījumu (interpretē arī kā ieguldījumu risku). Ja ieguldījumu atdeves dispersijas vai varbūtības sadalījums ir augsts, tas var norādīt uz nelabvēlīgu ieguldījumu.
  • Lai aprakstītu, analizētu un izprastu mainīgā uzvedību laika gaitā.
  • Ļauj salīdzināt dažādas datu grupas.
  • Tas ļauj analizēt, kāds būtu labākais lēmums, ko var pieņemt. To veic, analizējot dispersiju, piemēram, izlemjot, kura metode ir vislabākā mācīšanās, vai izlemjot, kurš ieguldījums būtu lielāks ienākums gadā.

Secinājums

Analizējot dispersijas, tiek pētītas būtiskas atšķirības starp diviem vai vairākiem vidējiem izlases veidiem. Šī analīze ir plaši pazīstama kā ANOVA un ļauj mums arī noteikt, vai šie līdzekļi nāk no a (tas var būt kopējais uzņēmuma darbinieku skaits) vai ja ir divu iedzīvotāju vidējie rādītāji vienāds.

No otras puses dispersija, kā arī standartnovirze tie ir ļoti jutīgi pret nepieļaujamajiem rādītājiem, tās ir vērtības, kas ir ļoti tālu no vidējā vai kas ļoti atšķiras no tā.

Lai šie pasākumi netiktu tik ļoti ietekmēti, veicot analīzi un pat aprēķinus, tos var neņemt vērā. Var izmantot arī citus izkliedes pasākumus, kas šajos gadījumos ir noderīgāki.

Investīciju riska analīzes gadījumā tiek ņemti vērā divi svarīgi aspekti: viens ir ieguldītais ienākums un otrs ir sagaidāmais saskaņā ar veikto ieguldījumu. Kā jau minēts, dispersiju var izmantot, lai analizētu šo risku.

instagram viewer