統計の分散（使用、定義、式）

ザ・ 分散または分散 確率変数（ランダムに取得された値）の分散の尺度です。これは、上記の分散の変動性を数値で表す統計の分野で広く使用されています。

イギリスの数学者、物理学者、生物学者、統計学者であるロナルドフィッシャーは、1918年にこの用語を最初に導入しました。分散、バイオメトリクスに関する彼の公開された研究の1つ。次に、彼は分散分析に関する研究を紹介しました。

この記事では、次のことがわかります。

差異とは何ですか？

ザ・分散サンプルまたは値のセットの場合、これは平均または平均に関する偏差の2乗の合計であり、これをすべて観測値の総数から1を引いたもので割ったものです。

非常に一般的な方法で、分散は標準偏差の2乗であると言えます。

経済学と金融の分野では、分散は、ある手順で実行された収益が期待収益と異なるリスクとして解釈されます。通常、より高いリターンが期待される場合、リスクはさらに高くなります。

分散の尺度としての分散

分散は、標準偏差とともに、データまたは観測値の分散の尺度です。これらのデータの分散は、これらが存在する多様性を示しています。つまり、すべての値がデータのセットが等しい場合、分散はありませんが、代わりに、すべてが等しくない場合は、分散があります。分散。

この分散は、値が平均にどれだけ近いかに応じて、大きくなることも小さくなることもあります。

サンプルの分散はSとして表されます²、母集団の分散はσとして表されます².

サンプルの分散は、母集団の分散を推定するために使用されますが、これは多くの場合不明です。これがSが理由です² また、一般的に統計およびσと見なされます² パラメータとして。

分散式

サンプルの分散には、次の式があります。

NS²=

ここで、は、サンプリングされた各値（）と平均の2乗の間の減算の合計を表します。

次に、サンプリングされた観測値またはデータの総数を表します。非常に大きな値の場合、分散は最小であるか、無視できる程度ですらあります。

代わりに、母集団の分散は次の式になります。

σ² =

ここで、Nは、サンプリングされた観測値またはデータの総数を表します。

ほとんどの場合、たとえば、話しているときに、合計N個のデータを取得することは不可能ではないにしても非常に困難です。集団からの個人の場合、時間とリソースの要因があるため、これらすべての個人をサンプリングすることはできません。制限。

これが、母集団のパラメーターを推定するために統計がよく使用される理由です。この式の記述方法によれば、分散の単位は変数の同じ単位ですが、2乗されます。

また、分散を負にすることはできないため、分散で取得できる最小値はゼロであることがわかります。

サンプルの標準偏差

分散とは異なり、標準偏差サンプルのは次のように表されます。

S =

この場合、このメジャーは、サンプリングされた変数の同じ単位を示します。

分散の例

分散を計算するには、最初に使用されたデータの平均または平均を計算する必要があります。一方、標準偏差がある場合は、その結果を2乗して、分散を取得します。

これは、分散がどのように計算され、その解釈が何であるかを理解するための例です。

同じ起業家に属する5つの異なる会社の年収があるとします。

A社：2,500ドル
B社：1,800ドル
C社：2,300ドル
D社：3,000ドル
E社：2,700ドル

次に、半分各数値を加算し、それを企業の総数で割ると、結果として$ 2,460になります。

データ	平均	データ-平均
データ1	2500	2460	40	1600
データ2	1800	2460	-660	435600
事実3	2300	2460	-160	25600
データ4	3000	2460	540	291600
データ5	2700	2460	240	57600
合計	812000

母分散は、データの差と平均の2乗の合計を、nで割ったものです。この場合は5です。

812000/5 = 203000

σ²=162400

この結果の平方根をとると、標準偏差が得られます。これは、5社の収益間の402ドルの差です。

この措置の適用

分散の尺度としての分散には、さまざまな分野で複数の用途があり、そのユーティリティのいくつかは次のとおりです。

投資に関する意思決定の支援を表します（投資のリスクとしても解釈されます）。投資のリターンの分散または確率分布が高い場合、それは不利な投資を示している可能性があります。
時間の経過に伴う変数の動作を説明、分析、および理解すること。
これにより、異なるデータグループ間の比較を行うことができます。
それはあなたが下すことができる最良の決定が何であるかを分析することを可能にします。これは、分散分析を通じて、たとえば、どの方法が最良の学習を表すかを決定するか、どの投資が年間のより高い収入を表すかを決定します。

結論

分散分析では、サンプルの2つ以上の平均間の有意差が調査されます。この分析は一般にANOVAとして知られており、これらの平均が同じ母集団（会社の従業員の総数である可能性があります）、または2つの母集団の平均が同等。

一方、 分散と標準偏差 それらは外れ値に非常に敏感です、これらは平均から非常に遠い、またはそれとは非常に異なる値です。

これらの測定値がそれほど影響を受けないように、分析や計算を実行するときにこれらの外れ値を無視できます。これらの場合により有用な他の分散測定も採用することができます。

投資のリスクを分析する場合、2つの重要な側面が考慮されます。1つは投資収益率であり、もう1つは行われた投資に応じて期待されるものです。すでに述べたように、分散はこのリスクを分析するために使用できます。