クラスマークとは何ですか?

  • Jul 26, 2021
click fraud protection

ザ・ クラスマーク としても知られています 中点. クラスの中心にある値であり、特定のカテゴリにあるすべての値を表します。 基本的に、それは実行するために使用されます さまざまなパラメータの計算、算術平均や 標準偏差.

ザ・ クラスマーク値、すでに存在する一連のデータのセットのバリアントを見つけることも非常に便利です クラスごとにグループ化すると同時に、これらの特定のデータが 中心。

広告

この記事では、次のことがわかります。

クラスマークとは何ですか?

上記のように、 クラスマーク これは、特定のデータグループの算術平均と分散に到達するための優れた機能を備えています。これらのデータグループは、すでにさまざまなクラスにグループ化されています。

算術平均は、サンプルサイズから取得されたすべての観測値の合計として定義できます。 物理的な観点から見ると、データグループの損益分岐点として解釈できます。

広告

ザ・ データマークは、データセットを完全に識別するのに役立ちます、ただし、非常にリスクが高い可能性があるため、損益分岐点と実際のデータの差を考慮する必要があります。 これらの値は、算術平均の導出として知られており、データの算術平均がどのように変化するかを判断しようとします。

この値を見つける最も一般的な方法は、分散を使用することです。 この分散は、算術平均からの偏差の2乗の平均です。 クラスで見つかったデータのグループの分散と算術平均の両方の計算を実行するには、いくつかの参照式を使用する必要があります。

広告

クラスマークを計算する

すでに前に言ったように、mクラスアークは、各間隔の中点として知られています. これは、標準偏差などの特定のパラメーターの計算を実行するための間隔全体を表す値です。

それを計算するには、次の手順に従う必要があります。

広告

  • クラスマーク(Xi)が計算されます。これは、各間隔の平均または平均値です。 これにより、さまざまな位置と分散の測定値を簡単に計算できます。
  • 間隔の数を選択すると、各クラスまたは間隔(C)の振幅を決定できます。
  • この振幅は、間隔の数に分割されるデータの範囲と等しくなければなりません。
  • 最初の間隔では、最小のデータ値が含まれている必要があり、逆に、最後の間隔では最大のデータ値が含まれている必要があります。
  • データのグループ化を実行できるようにするために使用される間隔またはクラス(K)の数を決定する必要があります。
  • 最も適切なのは、5から20の間隔またはクラス(K)を持つことです。
  • それでも、使用する間隔の数が確実でない場合は、Sturgesルールと呼ばれるルールを適用できます。 これを使用すると、それらをグループ化するために必要な間隔の数をかなり正確に概算することができます。
  • このSturgesルールでは、母集団またはサンプルのサイズがわかれば、クラスの数量の計算を実行できます。

グループ化されたデータのクラスマークはどのようなものですか?

間隔でグループ化されたデータのテーブル内で、 変数. 集中化の尺度を計算するには、値が間隔に均一に分布していることを考慮する必要があります。

これは、同様のデータが間隔でグループ化されている場合にも発生する可能性があります。 これが行われると、真の値を忘れるリスクがあり、均一な間隔分布が想定する近似のみが考慮されます。

広告

これらすべてが、データが グループ化されていないか、間隔でグループ化されていることがわかっています。つまり、それほど大きくはありません。 サイズ。

サンプルに30以上のデータが含まれている場合は、クラス分類ごとにデータをグループ化することをお勧めします。 サンプルの特性を決定してから、サンプルの元となった母集団の特性を決定する必要があります。 取られた。

サンプルデータをクラスにグループ化するときに対象の特性を決定する方法を定義する前に、データをどのように分離するかを知ることが非常に重要です。

データをグループ化するには、次の手順に従う必要があります。

データの範囲またはパスを決定します

範囲=高い値-低い値

クラス数の設定(K)

データがグループ化されるクラスの数を確立するには、次の表に示すようなベースが必要です。

サンプルサイズまたはデータ数

クラス数

50未満 5から7まで
50から99まで 6から10まで
100から250まで 7から12
250以上 10から20
instagram viewer