Varianza nelle statistiche (uso, definizione e formula)

  • Jul 26, 2021
click fraud protection

Il varianza o varianza è una misura della dispersione di una variabile casuale (valori che si ottengono casualmente). Trova largo impiego nell'ambito della statistica esprimendo, attraverso un numero, la variabilità di detta dispersione.

Ronald Fisher, matematico, fisico, biologo e statistico inglese, nel 1918 fu il primo a introdurre il termine varianza, in uno dei suoi studi pubblicati sulla biometria. A sua volta, ha introdotto studi sull'analisi della varianza.

Annunci

In questo articolo troverai:

Cos'è la varianza?

Il varianza di un campione o di un insieme di valori, è la somma dei quadrati degli scarti rispetto alla media o alla media, tutto questo diviso per il numero totale di osservazioni meno 1.

In modo molto generale, si può dire che la varianza è la deviazione standard al quadrato.

Annunci

Nelle aree dell'economia e della finanza, la varianza è interpretata come il rischio che il rendimento ottenuto in qualche procedura sia diverso dal rendimento atteso. Di solito quando ci si aspetta un rendimento più elevato, il rischio a sua volta è maggiore.

La varianza come misura della dispersione

La varianza, insieme alla deviazione standard, sono misure di dispersione di dati o osservazioni. La dispersione di questi dati indica la varietà che presentano, cioè se tutti i valori in a i set di dati sono uguali, quindi non c'è dispersione, ma invece, se non tutti sono uguali, allora c'è dispersione.

Annunci

Questa dispersione può essere grande o piccola, a seconda di quanto i valori sono vicini alla media.

La varianza di un campione è simboleggiata da S2, mentre la varianza di una popolazione è simboleggiata come σ2.

Annunci

La varianza di un campione viene utilizzata per stimare la varianza di una popolazione, che spesso è sconosciuta. Ecco perché S2 è anche comunemente considerato come una statistica e .2 come parametro.

Formula della varianza

La varianza di un campione ha la seguente formula:

Annunci

S2 =

Dove, rappresenta la somma della sottrazione tra ciascuno dei valori campionati() e la media, al quadrato.

A sua volta, rappresenta il numero totale di osservazioni o dati campionati. Per valori molto grandi la varianza è minima o addirittura trascurabile.

Invece, la varianza di una popolazione ha la seguente formula:

σ2 =

Dove N rappresenta il numero totale di osservazioni o dati campionati.

Nella maggior parte dei casi è molto difficile, se non impossibile, ottenere un totale N di dati, ad esempio quando si parla di individui di una popolazione, non è possibile campionare tutti questi individui, poiché c'è un fattore di tempo e risorse limitante.

Questo è il motivo per cui le statistiche vengono spesso utilizzate per stimare i parametri di una popolazione. Secondo il modo in cui è scritta questa formula, le unità della varianza hanno le stesse unità della variabile, ma al quadrato.

Inoltre, vediamo che la varianza non può essere negativa, quindi il valore minimo che può essere ottenuto in essa è zero.

Deviazione standard di un campione

A differenza della varianza, il deviazione standard di un campione è rappresentato come segue:

S =

In questo caso, questa misura presenta le stesse unità della variabile campionata.

Esempio di varianza

Per calcolare la varianza, è necessario prima calcolare la media o la media dei dati utilizzati. D'altra parte, se hai la deviazione standard, fai semplicemente il quadrato di quel risultato e ottieni la varianza.

Ecco un esempio per capire come viene calcolata la varianza e quale potrebbe essere la sua interpretazione.

Supponiamo di avere il reddito annuo di cinque diverse società, appartenenti allo stesso imprenditore, che sono:

  • Azienda A: $ 2.500
  • Azienda B: $ 1.800
  • Azienda C: $ 2,300
  • Azienda D: $ 3.000
  • Azienda E: $ 2,700

Quindi calcoliamo il metà dei ricavi, semplicemente sommando ogni cifra e dividendo per il numero totale di aziende, che dà come risultato: $ 2.460.

Dati Media Dati - Media
Dati 1 2500 2460 40 1600
Dati 2 1800 2460 -660 435600
Fatto 3 2300 2460 -160 25600
Dati 4 3000 2460 540 291600
Dati 5 2700 2460 240 57600
Totale 812000

La varianza della popolazione è la somma delle differenze dei dati con la media al quadrato, divisa per n, in questo caso è 5.

812000/5 = 203000

σ2=162400

Facendo la radice quadrata di questo risultato, otteniamo la deviazione standard, ovvero $ 402 di differenza tra i ricavi delle cinque società.

Applicazioni di questa misura

La varianza come misura della dispersione ha molteplici applicazioni in varie aree, alcune delle sue utilità sono:

  • Rappresenta un aiuto nel prendere decisioni su un investimento (interpretato anche come rischio in un investimento). Se la varianza o la distribuzione di probabilità dei rendimenti di un investimento è elevata, può indicare un investimento sfavorevole.
  • Descrivere, analizzare e comprendere il comportamento di una variabile nel tempo.
  • Consente di effettuare confronti tra diversi gruppi di dati.
  • Ti permette di analizzare quale sarebbe la migliore decisione che può essere presa. Questo attraverso l'analisi della varianza, ad esempio, decidendo tra quale metodo rappresenta il miglior apprendimento o decidendo quale investimento rappresenterebbe un reddito annuo più elevato.

Conclusione

Nell'analisi delle varianze si studiano le differenze significative tra due o più medie di un campione. Questa analisi è comunemente nota come ANOVA e ci permette di determinare anche se questi mezzi provengono da a stessa popolazione (può essere il numero totale di dipendenti di un'azienda), o se le medie di due popolazioni sono pari.

D'altra parte, il varianza e deviazione standard sono molto sensibili agli outlier, questi sono i valori che sono molto lontani dalla media o che sono molto diversi da essa.

In modo che queste misure non siano così influenzate, questi valori anomali possono essere ignorati durante l'esecuzione di analisi e persino calcoli. Possono essere impiegate anche altre misure di dispersione più utili in questi casi.

Nel caso di analisi del rischio di un investimento si prendono in considerazione due aspetti importanti, uno è il rendimento investito e l'altro è quello atteso in base all'investimento effettuato. Come già accennato, la varianza può essere utilizzata per analizzare questo rischio.

instagram viewer