Écart dans les statistiques (utilisation, définition et formule)

  • Jul 26, 2021
click fraud protection

La écart ou écart est une mesure de la dispersion d'une variable aléatoire (valeurs obtenues de manière aléatoire). Elle est largement utilisée dans le domaine des statistiques exprimant, à travers un nombre, la variabilité de ladite dispersion.

Ronald Fisher, un mathématicien anglais, physicien, biologiste et statisticien, en 1918 a été le premier à introduire le terme variance, dans l'une de ses études publiées sur la biométrie. À son tour, il a introduit des études sur l'analyse de la variance.

Annonces

Dans cet article vous trouverez :

Qu'est-ce que l'écart ?

La variance d'un échantillon ou d'un ensemble de valeurs, c'est la somme des carrés des écarts par rapport à la moyenne ou à la moyenne, le tout divisé par le nombre total d'observations moins 1.

De manière très générale, on peut dire que la variance est l'écart-type au carré.

Annonces

Dans les domaines de l'économie et de la finance, la variance est interprétée comme le risque que le rendement réalisé dans une procédure soit différent du rendement attendu. Habituellement, lorsqu'un rendement plus élevé est attendu, le risque à son tour est plus élevé.

La variance comme mesure de la dispersion

La variance, ainsi que l'écart type, sont des mesures de la dispersion des données ou des observations. La dispersion de ces données indique la variété qu'elles présentent, c'est-à-dire si toutes les valeurs d'un ensemble de données sont égaux, alors il n'y a pas de dispersion, mais à la place, si tous ne sont pas égaux alors il y a dispersion.

Annonces

Cette dispersion peut être grande ou petite, selon la proximité des valeurs par rapport à la moyenne.

La variance d'un échantillon est symbolisée par S2, tandis que la variance d'une population est symbolisée par σ2.

Annonces

La variance d'un échantillon est utilisée pour estimer la variance d'une population, qui est souvent inconnue. C'est pourquoi S2 est aussi communément considéré comme une statistique et σ2 comme paramètre.

Formule d'écart

La variance d'un échantillon a la formule suivante:

Annonces

S2 =

Où, représente la somme de la soustraction entre chacune des valeurs échantillonnées () et la moyenne, au carré.

À son tour, il représente le nombre total d'observations ou de données échantillonnées. Pour de très grandes valeurs la variance est minime voire négligeable.

Au lieu de cela, la variance d'une population a la formule suivante:

σ2 =

Où N représente le nombre total d'observations ou de données échantillonnées.

Dans la plupart des cas, il est très difficile, voire impossible d'obtenir un total N de données, par exemple, lorsqu'on parle de individus d'une population, il n'est pas possible d'échantillonner tous ces individus, car il y a un facteur de temps et de ressources limitant.

C'est pourquoi les statistiques sont souvent utilisées pour estimer les paramètres d'une population. Selon la façon dont cette formule est écrite, les unités de la variance ont les mêmes unités de la variable, mais au carré.

De plus, nous voyons que la variance ne peut pas être négative, donc la valeur minimale qui peut y être obtenue est zéro.

Écart-type d'un échantillon

Contrairement à la variance, la écart-type d'un échantillon est représenté comme suit :

S =

Dans ce cas, cette mesure présente les mêmes unités de la variable échantillonnée.

Exemple d'écart

Pour calculer la variance, vous devez d'abord calculer la moyenne ou la moyenne des données utilisées. D'un autre côté, si vous avez l'écart type, vous ajustez simplement ce résultat et obtenez la variance.

Voici un exemple pour comprendre comment la variance est calculée et quelle pourrait être son interprétation.

Supposons que nous ayons les revenus annuels de cinq sociétés différentes, appartenant au même entrepreneur, qui sont :

  • Entreprise A: 2 500 $
  • Entreprise B: 1 800 $
  • Entreprise C: 2 300 $
  • Entreprise D: 3 000 $
  • Entreprise E: 2 700 $

Ensuite, nous calculons le moitié de revenus, en additionnant simplement chaque chiffre et en le divisant par le nombre total d'entreprises, ce qui donne comme résultat: 2 460 $.

Données Moyenne Données - Moyenne
Données 1 2500 2460 40 1600
Données 2 1800 2460 -660 435600
Fait 3 2300 2460 -160 25600
Données 4 3000 2460 540 291600
Données 5 2700 2460 240 57600
Le total 812000

La variance de la population est la somme des différences des données avec la moyenne au carré, divisée par n, dans ce cas elle est de 5.

812000/5 = 203000

σ2=162400

En prenant la racine carrée de ce résultat, nous obtenons l'écart type, soit 402 $ de différence entre les revenus des cinq entreprises.

Applications de cette mesure

La variance en tant que mesure de la dispersion a de multiples applications dans divers domaines, certaines de ses utilités sont :

  • Représente une aide à la prise de décisions concernant un investissement (également interprété comme le risque d'un investissement). Si la variance ou la distribution de probabilité des rendements d'un investissement est élevée, cela peut indiquer un investissement défavorable.
  • Décrire, analyser et comprendre le comportement d'une variable dans le temps.
  • Vous permet de faire des comparaisons entre différents groupes de données.
  • Il vous permet d'analyser quelle serait la meilleure décision qui peut être prise. Ceci grâce à l'analyse de variance, par exemple, en décidant entre quelle méthode représente le meilleur apprentissage ou en décidant quel investissement représenterait un revenu plus élevé par an.

Conclusion

Dans l'analyse des variances, les différences significatives entre deux ou plusieurs moyennes d'un échantillon sont étudiées. Cette analyse est communément appelée ANOVA et permet également de déterminer si ces moyennes proviennent d'un même population (il peut s'agir du nombre total d'employés d'une entreprise), ou si les moyennes de deux populations sont égal.

D'autre part, le la variance ainsi que l'écart type ils sont très sensibles aux valeurs aberrantes, ce sont les valeurs qui sont très éloignées de la moyenne ou qui en sont très différentes.

Afin que ces mesures ne soient pas aussi affectées, ces valeurs aberrantes peuvent être ignorées lors de l'exécution des analyses et même des calculs. D'autres mesures de dispersion qui sont plus utiles dans ces cas peuvent également être employées.

Dans le cas de l'analyse du risque d'un investissement, deux aspects importants sont pris en compte, l'un est le rendement investi et l'autre est celui attendu en fonction de l'investissement réalisé. Comme déjà mentionné, la variance peut être utilisée pour analyser ce risque.

instagram viewer