Was ist Cluster-Sampling in der Statistik?

  • Jul 26, 2021
click fraud protection

In der Statistik ist die Cluster-Sampling ist ein Wahrscheinlichkeitsstichprobenverfahren, bei dem Forscher die Bevölkerung zu Forschungszwecken in mehrere Gruppen (Cluster) aufteilen. Die Forscher wählen dann zufällige Gruppen mit einer einfachen oder systematischen Zufallsstichprobe für die Datenerhebung und -analyse aus.

Mit anderen Worten, Cluster-Sampling ist a Probenahmeverfahren bei der die gesamte Studienpopulation in äußerlich homogene, aber innerlich heterogene Gruppen, sogenannte Cluster, eingeteilt wird. Im Wesentlichen ist jede Gruppe eine Mini-Repräsentation der gesamten Bevölkerung.

Anzeige

Nach der Identifizierung der Gruppen werden einige mittels a. ausgewählt einfache Zufallsstichprobewährend die anderen nicht in einer Studie vertreten sind. Außerdem muss ein Forscher nach der Auswahl der Gruppen die geeignete Methode wählen, um die Gegenstände aus jeder ausgewählten Gruppe zu beproben.

Cluster-Sampling

Anzeige

In diesem Artikel finden Sie:

Arten von Cluster-Stichproben

Es gibt zwei Arten von Cluster-Sampling, darunter:

  • Einstufiges Cluster-Sampling: Diese Art von Cluster-Sampling beschäftigt sich, wenn ein Forscher mit der gesamten Population einer Gruppe arbeitet, indem er sie zufällig auswählt.
  • Zweistufig: Andererseits befasst sich das zweistufige Cluster-Sampling damit, wenn ein Forscher mit einem bestimmten Menge in der Gesamtbevölkerung für jede Gruppe, die durch systematische Zufallsstichproben ausgewählt wurde oder einfach.

Um zu ein Cluster-Sampling durchführen, müssen eine Reihe von Schritten durchgeführt werden. Darunter ist:

Anzeige

  1. Die Stichprobe: Die Zielgruppe und ihre Größe werden bestimmt.
  2. Sampling-Frames entwickeln und evaluieren - Ein Sampling-Frame wird aus einem bestehenden erstellt oder durch Erstellen einen neuen und bewerten Sie sie dann basierend auf Abdeckung und Gruppierung, indem Sie Anpassungen vornehmen dazugehörigen.
  3. Gruppen bestimmen: Die Anzahl der Gruppen wird bestimmt, indem die gleiche durchschnittliche Anzahl von Mitgliedern in jede Gruppe aufgenommen wird. Jede Gruppe muss sich voneinander unterscheiden.
  4. Gruppen auswählen: Gruppen werden nach dem Zufallsprinzip ausgewählt.
  5. Subtypen erstellen: Zwei- und mehrstufige Subtypen werden entsprechend der Anzahl der Schritte unterteilt, die von den Forschern zur Bildung von Gruppen befolgt werden.

Vor- und Nachteile von Cluster-Sampling

Seitens der Vorteile gibt es:

  • Weniger Ressourcen wie Kosten und Zeit
  • Es ist machbarer
  • Bequemer Zugang
  • Genauere Daten
  • Einfache Implementierung von Stichproben

Zu den Nachteilen gibt es:

Anzeige

  • Hoher Stichprobenfehler: Im Allgemeinen neigen Stichproben, die mit der Pooling-Methode gezogen wurden, zu einem höheren Stichprobenfehler als Stichproben, die mit anderen Stichprobenmethoden gezogen wurden.
  • Verzerrte Stichproben: Die Methode ist anfällig für Verzerrungen. Würden die Gruppen, die die gesamte Bevölkerung repräsentieren, unter einer verzerrten Meinung gebildet, wären auch die Schlussfolgerungen über die gesamte Bevölkerung verzerrt.

Unterschiede zwischen Cluster- und geschichteter Stichprobe

Bei der geschichteten Stichprobenziehung wird die Bevölkerung nach einigen Variablen in Schichten unterteilt, die als mit den uns interessierenden Variablen in Beziehung stehen. Aus jeder Schicht wird dann eine Stichprobe gezogen.

Dies soll Stichprobenfehler reduzieren denn wenn die Schichten wirklich mit den interessierenden Variablen in Beziehung stehen, dann ist jede Schicht homogener (sie weist weniger Variationen bei den Zielvariablen auf).

Anzeige

Beim Cluster-Sampling wird die Grundgesamtheit in Gruppen eingeteilt und daraus eine Stichprobe gezogen. Aber nur ein Teil der Gruppen ist besetzt. Dies erhöht tendenziell den Stichprobenfehler, da die Gruppen dazu neigen, ähnlich zu sein.

Wenn sie identisch wären, wäre es nicht sinnvoll, mehr als eine Beobachtung innerhalb der Gruppe zu machen, da sie alle identisch wären. Der Präzisionsverlust hängt mit der Variabilität innerhalb der Gruppen zusammen, die erst nach der Probenahme bekannt ist.

Oberflächlich gesehen sind die Gruppierung und Schichtung ähnlich: In beiden wird die Bevölkerung in sich nicht überschneidende Gruppen eingeteilt. Aber damit endet die Ähnlichkeit. Während die geschichtete Stichprobenziehung den Stichprobenfehler reduzieren kann, erhöht die Clusterstichprobe ihn (bei gleichem Stichprobenumfang).

Cluster-Sampling kann jedoch ermöglichen Holen Sie sich eine größere Probe für die gleichen Kosten und in Bezug auf die Kosten hoffen wir immer noch, den Fehler zu reduzieren. Idealerweise sollte die Streuung innerhalb der Schichten so gering wie möglich sein, während die Streuung innerhalb von Gruppen sollte das bestmögliche sein (aber letzteres können wir nicht kontrollieren und wir müssen es als ist).

Wann sollte man Cluster-Sampling wählen?

Wenn Sie keine vollständigen Informationen über die Population, aber Informationen über Gruppen/Cluster erhalten können, sollten Sie Cluster-Stichproben wählen.

Angenommen, Sie haben sich für das Cluster-Sampling entschieden, unterliegen möglicherweise Budget- oder Zeitbeschränkungen. In diesem Fall ist es möglicherweise bequemer, Cluster-Sampling zu verwenden, indem Personen oder Elemente ausgewählt werden, die näher sind, schneller reagieren oder billiger zu erreichen sind.

Clusterstichproben sind in folgenden Fällen nützlich: Sie haben keine Liste mit Elementen aus der Grundgesamtheit, aber es ist einfach, eine Liste mit Gruppen zu erhalten. Wenn die Kosten für das Erhalten von Beobachtungen mit zunehmender Entfernung der Elemente steigen.

instagram viewer