Wat is een histogram en hoe wordt het gemaakt?

  • Jul 26, 2021
click fraud protection

Statistisch gezien is de histogram is een handig hulpmiddel dat het begrip van moeilijk te begrijpen numerieke gegevens vergemakkelijkt, met de mogelijkheid om een ​​ordelijk en begrijpelijk beeld te creëren.

In dit artikel vind je:

Wat wordt bedoeld met histogram?

EEN histogramis de grafische weergave in de vorm van balken, die de distributie van een dataset symboliseert. Over het algemeen wordt deze tool gebruikt door statistieken, zijn functie is de grafische weergave van getallen, variabelen en cijfers, voor een overzichtelijke en duidelijkere weergave.

advertenties

Vanwege het soort informatie en de manier waarop deze beschikbaar is, wordt gedacht dat ze vooral nuttig zijn bij: sociale wetenschappen, waardoor de vergelijking van gegevens in tellingen, geslacht, alfabetisering, geboorte, overlijden, enz.

Over het algemeen dienen ze om een ​​beeld of panorama te geven van de verdeling van een steekproef, in relatie tot een bepaald kwantitatief kenmerk, waardoor de voorkeur per onderdeel kan worden waargenomen van hetzelfde, waaruit blijkt dat gedrag, homogeniteit of overeenstemming tussen de verschillende waarden van de delen waaruit het monster bestaat, of in tegenstelling daarmee de mate van dispersie van de waarden.

advertenties

Hoe maak je een histogram?

Wat is een histogram en hoe wordt het gedaan?

Deze weergave is altijd in de vorm van balken, de verlenging van elk van de balken is evenredig met de continuïteit van de waarden die het vertegenwoordigt.

advertenties

De horizontale as vertegenwoordigt de waarden van de variabelen van laag naar hoog en de verticale as bevat de frequenties, klassemarkeringen worden meestal aangegeven, dat wil zeggen, het gemiddelde van het groeperingsinterval van de gegevens, ook wel frequentie genoemd familielid.

Om zo te een histogram correct construeren construct het is noodzakelijk om vooraf de constructie van een frequentietabel uit te voeren.

advertenties

De staven worden getekend met dezelfde breedte en evenredig met het interval, de hoogte wordt gegeven door de absolute frequentie. Deze staven worden naast elkaar getekend, de een naast de ander, zonder elkaar te snijden, dat wil zeggen dat de staven de staven aan hun zijde raken, tenzij er een frequentie-interval van nul is.

Vandaag zijn er statistische toepassingssoftware, die de constructie van deze histogrammen vergemakkelijken, dus we moeten ons concentreren op hun interpretatie. Ze kunnen echter nog steeds handmatig worden gedaan met behulp van een aantal geschikte hulpmiddelen.

advertenties

Waar worden histogrammen voor gebruikt?

De histogrammen zijn handig tot:

  • Interpreteer op een eenvoudige manier de variatie van de gegevens.
  • Geef een duidelijk beeld van de informatie die door de gegevens wordt verstrekt, waardoor de interpretatie ervan wordt vergemakkelijkt.
  • Vergelijk waarden en identificeer mogelijke oorzaken van een probleem.
  • Controleer de oorzaken.
  • Evalueer mogelijke oplossingen, zodra de oorzaken van het probleem zijn weggenomen.

Kenmerken van een histogram

  • Toont de verdeling van een dataset.
  • Verticale staafgrafiek
  • Het toont een balk die aan een andere balk is bevestigd, zonder ruimte ertussen.
  • Elke balk vormt een subset van de gegevens.
  • Het geeft de accumulatie of trend, variabiliteit of dispersie en distributie van een monster weer.
  • Het wordt gebruikt om continue variabelen en discrete variabelen weer te geven.
  • De gegevens zijn gegroepeerd in klassen, dit zijn intervallen van dezelfde grootte.

Histogramtypen

Er zijn verschillende soorten grafische weergaven hiervan, de meest voorkomende zijn:

Eenvoudige staafhistogrammen

Ze vertegenwoordigen de eenvoudige frequentie, absoluut of relatief, via de hoogte die is ingesteld op de balk, die evenredig moet zijn met de frequentie van de klasse die hij vertegenwoordigt.

Samengesteld staafhistogram

Het wordt gebruikt bij de weergave van 2 variabelen, die worden weergegeven volgens de eenvoudige frequentie van de variabele modus en de hoogte is daarmee evenredig.

Geclusterd staafhistogram

Het wordt gebruikt bij de weergave van informatie over twee variabelen, waarbij ze door middel van een reeks balken de verschillende modaliteiten vertegenwoordigen.

Frequentiepolygoon

Het is een grafische weergave van lijnen die wordt gebruikt om de absolute frequenties van alle waarden in a. weer te geven verdeling, waarbij kan worden waargenomen dat de hoogte van het punt dat aan de waarde van een variabele is gekoppeld, evenredig is met de volharding van genoemde waarde.

Percentage kernkop

Het is een cumulatieve grafische weergave, handig wanneer de weergave van de procentuele klasse van elke waarde in de frequentieverdeling wordt nagestreefd.

Interpretatie van een histogram

Beoordeling van de belangrijkste kenmerken

In deze stap moeten de pieken en spreiding in de verdeling in detail worden onderzocht. Evalueren hoe de steekproefomvang het uiteindelijke uiterlijk van het histogram kan beïnvloeden.

Zoeken naar ongebruikelijke gegevensindicatoren

Vaak scheve en multimodale gegevens duiden op afwijkingen in de gegevens, uitbijters kunnen wijzen op andere soorten omstandigheden in de gegevens.

Wanneer er scheve gegevens zijn, bevinden de gegevens zich meestal in het onderste of bovenste deel van de grafiek, deze asymmetrie geeft aan dat de gegevens abnormaal verdeeld kunnen zijn.

Uitbijters zijn waarden die verre van andere waarden zijn en de resultaten aanzienlijk kunnen beïnvloeden.

De fit in een verdeling evalueren

Het komt voor in gevallen waarin het histogram een ​​zeer strakke distributielijn vertoont, dus moet worden geëvalueerd hoe dicht de hoogte van de staven en de vorm van de lijn zijn.

Als deze balken dicht bij de distributielijn komen, moeten de gegevens goed passen in de distributie.

Evaluatie en vergelijking van de groepen

Als het histogram groepen gegevens heeft, moeten het centrum en de spreiding van deze groepen worden vergeleken en geëvalueerd.

Op zoek naar de verschillen tussen de centra en de spreidingen van de groepen.

Tot slot is het vermeldenswaard dat dehistogram wordt beschouwd als een grafisch compendium van de waarden afgeleid van de variaties van een bepaalde karakteristiek, die de frequentie weergeeft waarmee verschillende categorieën in de set worden getoond.

Het belangrijkste doel van de analyse en interpretatie van histogrammen in statistieken is het identificeren en classificeren van een variatiemodel in de bestudeerde dataset en het uitvoeren van een relevante en toelaatbare verklaring voor genoemd model, waarbij de variatie gerelateerd is aan het fenomeen in studie. Het resultaat van deze analyse vormt een mogelijke theorie over het proces of de oorzaak van het onderzochte probleem en vergemakkelijkt het zoeken naar mogelijke oplossingen.

instagram viewer