統計における自由度(それらが何であり、どのように適用されるか)

  • Jul 26, 2021
click fraud protection

ザ・ 自由度 現代の統計では、それらは中心的な内容を構成します、しかし、それらの定義は主題に関する本で非常に漠然と説明されています。

その概念は、幾何学的、代数的、直感的な観点から簡単に理解できます。

広告

ジオメトリは、自由度を、サマリーの測定単位が変化してさまざまな値を表示できるスペースとして指定します。 代数的観点から、それはデータを使用して確立された方程式の数として理解されます。

その適用はすべての統計科学に及ぶため、両方の定義は概念の理解を助けることに関連しています。

広告

この記事では、次のことがわかります。

自由度とは何ですか?

主題をもう少し理解するために、以下に、一般的に使用される統計テキストに見られる定義のいくつかを示します。

広告

自由度の定義

ダニエル・ウェインによれば、「平均がゼロに等しいことに関して、値、偏差、および個々の値の合計です」 平均からn-1個の値、n番目の値は既知であり、nのすべての値が合計される3の制限によって自動的に決定されます ゼロ。

ドーソンの場合「自由度とその価値は、サンプル情報が使用される機会の数に関連しています。」

広告

最後になりましたが、Paganoは、「統計的検定を計算するときに変動のないデータの数としての自由度」を理解しています。

自由度はどれくらいですか?

ザ・ GL(自由度) 母集団の未知のパラメーターを推定し、推定値の変動性を計算するために使用できるデータによって提供される情報の量です。

広告

これは、モデルのパラメーターの数との観測値に従って決定されます。 公演. サンプルサイズが大きくなると、より多くの情報が取得され、その結果、データの自由度が高くなります。 たとえば、パラメータがモデルに追加された場合、回帰方程式の項が増加します。 情報を費やし、評価の変動性を推定するための可能な自由度を減らす パラメーター。

また、特定の分布、F、t、などの分布のファミリーを定義するためにも使用されます。 カイ二乗、モデル内のさまざまなサンプルサイズとさまざまな量のパラメーターに対して適切な特定の分布を指定するためにGLによって使用されます。

結論として、 自由度GL 統計計算に必要な独立した値の数から、観測値に関連付けられた制約の数を引いたものを指します。 つまり、サンプルに関する情報を知った後、自由に指定できるのはサンプル内の値の数です。

自由度の使用

ザ・ 自由度 それらは必然的にサンプルのサイズに関連しているため、仮説検定を実行するための統計的分布の定義に使用されます。

それらは計算時に使用されます 標準偏差 平均の周りのn個のデータによる分散の程度の表現を与えるサンプルの 平均を知ることは、データを加算し、それらの数で割ることによって、データ間の関係を確立します 自分自身。

これらは、2つのデータグループ間の平均が等しいという仮説を検定するために使用されるスチューデントのt分布の基礎です。

その使用は、主に使用する統計間で区別されます 母集団パラメータ Y 見せる。

母集団パラメータでは、n個のすべての値がわかっているとすると、 自由度は人口のすべての要素になります」N "。

サンプルパラメータについては、すべてのサンプル値がわかっているため、これらは推定値です。

どちらの場合も、サンプルセットの観測値をランダムにすることができるため、統計を推定するときに、異なる結果を得ることができます。 したがって、観測値には、母集団セットの観測値のように変化する完全な特性があります。

自由度を理解する

のより良い理解のために 自由度の数、値が自由に変化または移動できる空間内の次元の数として表示することをお勧めします。

各関係は、サンプル自体によって提供されたデータから確立または計算されます。 統計が計算に使用される場合、自由度GLを変更する必要が生じます 先物。 この意味で、 自由度 それらは、データの量とそれらの間に確立された関係の量から生じる違いに限定されたままです。

それらは次の式で見積もることができます。

N-r

ここで、nはサンプルに属する被験者の数に等しく、値を打ち負かすことができます。

ここで、rは、値がサンプルの自由要素の値に依存する被験者の数に等しくなります。

最後に、統計の他のトピックと同様に、 統計の自由度 科学や社会などの他の分野の研究において重要な役割を果たしています。

instagram viewer