Co to jest histogram i jak się go robi?

  • Jul 26, 2021
click fraud protection

Statystycznie histogram to przydatne narzędzie ułatwiające zrozumienie danych liczbowych, które są trudne do zrozumienia, pod warunkiem stworzenia uporządkowanego i zrozumiałego obrazu.

W tym artykule znajdziesz:

Co oznacza histogram?

A histogramjest reprezentacją graficzną w postaci słupków, który symbolizuje dystrybucję zestawu danych. Ogólnie rzecz biorąc, narzędzie to jest używane w statystyce, jego funkcją jest graficzne wyświetlanie liczb, zmiennych i liczb, dla uporządkowanego i bardziej przejrzystego wyświetlania.

Reklamy

Ze względu na rodzaj informacji i sposób ich udostępniania uważa się, że są one szczególnie przydatne w: nauki społeczne, umożliwiające porównywanie danych w spisach, płci, piśmienności, urodzeniu, śmierci, itp.

Na ogół służą one do przedstawienia widoku lub panoramy rozkładu próbki, w odniesieniu do określonej cechy ilościowej, pozwalając na częściowe obserwowanie preferencji tego samego, udowadniając zachowania, jednorodność lub zgodność między różnymi wartościami części tworzących próbkę, lub odwrotnie, odnotowując stopień rozproszenia wartości.

Reklamy

Jak zrobić histogram?

Co to jest histogram i jak to się robi?

Ta reprezentacja jest zawsze w postaci słupków, wydłużenie każdego z słupków jest proporcjonalne do ciągłości wartości, które reprezentuje.

Reklamy

Na osi poziomej wartości zmiennych są reprezentowane od najniższej do najwyższej, a na osi pionowej włączone są częstotliwości, Zazwyczaj podaje się oceny klasowe, czyli średnią przedziału grupowania danych, znanego jako częstotliwość względny.

W celu poprawnie skonstruować histogram konieczne jest wcześniejsze wykonanie budowy tabeli częstości.

Reklamy

Słupki są rysowane z taką samą szerokością i proporcjonalnie do interwału, wysokość będzie podana przez częstotliwość bezwzględną. Te słupki są rysowane obok siebie, jeden obok drugiego, bez przecinania się, to znaczy słupki dotykają słupków po bokach, chyba że istnieje przedział częstotliwości zerowej.

Dziś są statystyczne oprogramowanie aplikacyjne, które ułatwiają konstruowanie tych histogramów, dlatego musimy skupić się na ich interpretacji. Jednak nadal można je wykonać ręcznie za pomocą odpowiednich narzędzi.

Reklamy

Do czego służą histogramy?

pomocne są histogramy do:

  • Zinterpretuj w prosty sposób zmienność danych.
  • Zapewnij jasny wgląd w informacje zawarte w danych, ułatwiając ich interpretację.
  • Porównaj wartości i zidentyfikuj możliwe przyczyny problemu.
  • Sprawdź przyczyny.
  • Oceń możliwe rozwiązania po wyeliminowaniu przyczyn problemu.

Charakterystyka histogramu

  • Pokazuje rozkład zbioru danych.
  • Pionowy wykres słupkowy
  • Pokazuje pręt przymocowany do innego pręta, bez odstępu między nimi.
  • Każdy słupek stanowi podzbiór danych.
  • Oblicza akumulację lub trend, zmienność lub rozproszenie i dystrybucję próbki.
  • Służy do reprezentowania zmiennych ciągłych i dyskretnych.
  • Dane są pogrupowane w klasy, są to przedziały o tej samej wielkości.

Rodzaje histogramów

Istnieją różne rodzaje ich reprezentacji graficznej, najczęściej są to:

Proste histogramy słupkowe

Reprezentują prostą częstotliwość, bezwzględną lub względną, poprzez wysokość ustawioną na słupku, która musi być proporcjonalna do częstotliwości klasy, którą reprezentuje.

Histogram słupka złożonego

Jest używany w reprezentacji 2 zmiennych, które są pokazane zgodnie z prostą częstotliwością trybu zmiennej, a jej wysokość jest do niej proporcjonalna.

Histogram słupków klastrowych

Jest używany do reprezentacji informacji o dwóch zmiennych, gdzie za pomocą zestawu słupków reprezentują różne modalności.

Wielokąt częstotliwości

Jest to graficzna reprezentacja linii, która służy do pokazywania bezwzględnych częstotliwości wszystkich wartości w a rozkład, gdzie można zaobserwować, że wysokość punktu przywiązanego do wartości zmiennej jest proporcjonalna do wspomniana wartość.

Procentowa głowica bojowa

Jest to zbiorcza reprezentacja graficzna, przydatna, gdy dąży się do reprezentacji procentowej klasy każdej wartości w rozkładzie częstości.

Interpretacja histogramu

Ocena kluczowych cech

Na tym etapie należy szczegółowo zbadać piki i rozrzuty w rozkładzie. Ocena wpływu wielkości próbki na ostateczny wygląd histogramu.

Szukaj nietypowych wskaźników danych

Dane często przekrzywione i multimodalne wskazują na nieprawidłowości w danych, wartości odstające mogą wskazywać na inne rodzaje warunków w danych.

Gdy dane są przekrzywione, są one w większości zlokalizowane w dolnej lub górnej części wykresu, ta asymetria wskazuje, że dane mogą być nienormalnie rozłożone.

Wartości odstające to wartości, które są dalekie od innych wartości i mogą znacząco wpłynąć na wyniki.

Ocena dopasowania w rozkładzie

Występuje w przypadkach, gdy histogram pokazuje bardzo wąską linię rozkładu, dlatego należy ocenić, jak bliskie są wysokości słupków i kształt linii.

Jeśli te słupki zbliżają się do linii rozkładu, dane muszą pasować do rozkładu prawidłowo.

Ocena i porównanie grup

W przypadku, gdy histogram zawiera grupy danych, należy porównać i ocenić środek i rozproszenie tych grup.

Poszukiwanie różnic między ośrodkami i rozproszenia grup.

Na zakończenie warto wspomnieć, że histogram jest graficznym kompendium wartości pochodzą z wariacji pewnej cechy, reprezentujących częstotliwość, z jaką różne kategorie są pokazywane we wspomnianym zestawie.

Głównym celem analiza i interpretacja histogramów w statystyce jest zidentyfikowanie i sklasyfikowanie modelu zmienności w badanym zbiorze danych oraz przeprowadzenie istotne i dopuszczalne wyjaśnienie dla tego modelu, gdzie zmienność związana jest ze zjawiskiem w nauka. Wynik tej analizy stanowi możliwą teorię o procesie lub przyczynie badanego problemu i ułatwia poszukiwanie możliwych rozwiązań.

instagram viewer