統計におけるクラスターサンプリングとは何ですか?

  • Jul 26, 2021
click fraud protection

統計では、 集落抽出 は、研究者が研究のために母集団を複数のグループ(クラスター)に分割する確率サンプリング手法です。 次に、研究者は、データ収集と分析のための単純または体系的なランダムサンプリング手法を使用してランダムグループを選択します。

言い換えれば、クラスターサンプリングは サンプリング方法 研究対象集団全体が、クラスターと呼ばれる、外部的には同質であるが内部的には異質なグループに分割されます。 基本的に、各グループは母集団全体のミニ表現です。

広告

グループを特定した後、いくつかの方法で選択されます 単純ランダムサンプリング他のものは研究に表されていませんが。 また、グループを選択した後、研究者は適切な方法を選択して、選択した各グループからアイテムをサンプリングする必要があります。

集落抽出

広告

この記事では、次のことがわかります。

クラスターサンプリングタイプ

クラスターサンプリングには2つのタイプがあり、その中には次のものがあります。

  • 1段階のクラスターサンプリング:このタイプのクラスターサンプリングは、研究者がグループの母集団全体をランダムに選択して作業する場合に対処します。
  • 二段式:一方、2段階のクラスターサンプリングは、研究者が特定の 体系的なランダムサンプリングによって選択された各グループの母集団全体の量または 単純。

のために クラスターサンプリングを実行する、一連の手順を実行する必要があります。 それらの中には:

広告

  1. サンプル:ターゲットオーディエンスとそのサイズが決定されます。
  2. サンプリングフレームの開発と評価-サンプリングフレームは、既存のフレームを使用するか、作成することによって作成されます 新しいものを作成し、調整を行ってカバレッジとグループ化に基づいてそれらを評価します 対応します。
  3. グループの決定:グループの数は、各グループに同じ平均メンバー数を含めることによって決定されます。 各グループは互いに異なっている必要があります。
  4. グループの選択:グループは、ランダムな選択を適用して選択されます。
  5. サブタイプの作成:2段階および多段階のサブタイプは、研究者がグループを形成するために実行するステップ数に応じて分割されます。

クラスターサンプリングの長所と短所

利点の一部には次のものがあります。

  • コストや時間などのリソースが少ない
  • それはより実現可能です
  • 便利なアクセス
  • より正確なデータ
  • サンプリングの実装のしやすさ

不利な点に関しては、それは持っています:

広告

  • 高いサンプリングエラー:一般に、プーリング法を使用して抽出されたサンプルは、他のサンプリング方法を使用して抽出されたサンプルよりもサンプリングエラーが高くなる傾向があります。
  • 偏ったサンプル:この方法は偏りがちです。 母集団全体を表すグループが偏った意見の下で形成された場合、母集団全体に関する推論にもバイアスがかかります。

クラスターサンプリングと層化サンプリングの違い

層化サンプリングでは、母集団は、関心のある変数に関連すると見なされるいくつかの変数に従って層に分割されます。 次に、各層からサンプルが取得されます。

これは サンプリングエラーを減らす なぜなら、層が実際に対象の変数に関連している場合、各層はより均一になります(ターゲット変数の変動が少なくなります)。

広告

クラスターサンプリングでは、母集団がグループに分割され、それらからサンプルが取得されます。 しかし、一部のグループのみが採用されています。 グループは類似している傾向があるため、これはサンプリングエラーを増加させる傾向があります。

それらが同一である場合、それらはすべて同一であるため、グループ内で複数の観察を行うことは意味がありません。 精度の低下は、サンプルを採取した後にのみわかるグループ内の変動性に関連しています。

表面的には、グループ化と階層化は似ています。どちらの場合も、母集団は重複しないグループに分けられます。 しかし、そこで類似性は終わります。 層化サンプリングはサンプリングエラーを減らすことができますが、クラスターサンプリングはそれを増やします(同じサンプルサイズの場合)。

ただし、クラスターサンプリングでは より大きなサンプルを取得する 同じコストで、コストの観点から、エラーを減らすことを望んでいます。 理想的には、層内の変動は可能な限り小さくする必要がありますが、変動は グループ内が可能な限り最善である必要があります(ただし、後者を制御することはできず、 です)。

いつクラスターサンプリングを選択しますか?

母集団に関する完全な情報を取得できないが、グループ/クラスターに関する情報を取得できる場合は、クラスターサンプリングを選択する必要があります。

クラスターサンプリングを決定したとすると、予算や時間の制約を受ける可能性があります。 その場合、より近くにいる、より速く反応する、またはより安価に到達できる人またはアイテムを選択することにより、クラスターサンプリングを使用する方が便利な場合があります。

クラスターサンプリングは、次の場合に役立ちます。母集団から要素のリストがないが、グループのリストを簡単に取得できる。 距離が要素を分離するにつれて、観測値を取得するコストが増加する場合。

instagram viewer