▷ 2 Scatter Plot-voorbeelden

  • May 06, 2023
click fraud protection

Een spreidingsdiagram is een grafische weergave waarin de correlatie die bestaat tussen twee variabelen bekend kan worden met behulp van het vlak Cartesisch, erg handig om de correlatie te bepalen en weer te geven die bestaat tussen de gegevens van twee studievariabelen, zoals de relatie tussen oorzaak en gevolg.

Scatterplots is een weergave van variabelen in het cartesiaanse vlak met behulp van kwantitatieve gegevens.

In dit artikel vind je:

Wat is een scatterplot en waar is het nuttig voor?

Een scatterplot is een soort grafische weergave waarin het is mogelijk om de correlatie te kennen die bestaat tussen twee variabelen gebruikmakend van het Cartesiaanse vlak, hiervoor worden de waarden of gegevens van de variabelen toegewezen aan de assen (X, Y) en elk snijpunt tussen beide variabelen vertegenwoordigt een punt op de grafiek van de vlak.

Advertenties

Deze punten samen worden weergegeven als een puntenwolk, die de scatterplot vertegenwoordigen.

Dispersie diagram

Advertenties

Waar is een scatterplot handig voor? Dit spreidingsdiagram is erg handig om de correlatie te kunnen bepalen en weergeven die bestaat tussen de gegevens van twee studievariabelen, zoals relaties tussen oorzaak en gevolg of relaties tussen oorzaken.

Dit type diagram Het wordt op grote schaal toegepast in toegepaste statistiek, zoals in economie en ook in marketing, omdat het bedrijven helpt belangrijke marktgegevens te begrijpen, hoewel het toepassingsgebied zeer gevarieerd kan zijn.

Advertenties

Stappen om een ​​scatterplot te maken

Hoewel het maken van een scatterplot een eenvoudig proces is, moeten we rekening houden met de volgende stappen:

  1. Definieer de situatie waarvan u de determinanten in het diagram wilt weergeven.
  2. Verzamel de gegevens van deze factoren, de gegevens moeten representatief zijn voor de situatie, waarbij beide variabelen dezelfde hoeveelheid steekproefgegevens moeten hebben.
  3. Identificeer de variabelen, op de (Y)-as de afhankelijke variabele, dit vertegenwoordigt de factor wiens gedrag wordt beïnvloed door de andere variabele, waarbij deze andere de onafhankelijke variabele is die wordt weergegeven op de (X)-as.
  4. Geef de waarden van elke variabele weer in de grafiek en markeer met een punt het snijpunt van de gegevens op de (Y)-as met die op de (X)-as.
  5. Analyse van de dispersiegegevens weergegeven in de grafiek om te bepalen of er een correlatie bestaat.

Lineaire correlatie in de analyse van scatterplots

lineaire correlaties op scatterplots ons in staat stellen de intensiteit te interpreteren waarmee beide variabelen aan elkaar gerelateerd zijn, In die zin kan een correlatie zijn:

Advertenties

  • positieve correlatie: geeft aan dat beide variabelen een stijgend gedrag hebben, als de ene de andere ook verhoogt.
  • Negatieve correlatie: in deze weergave neemt de ene variabele toe en neemt de andere af.
    nulcorrelatie: er is geen correlatie tussen beide variabelen.
correlaties-scatterplot

Hoe dan ook, een correlatie is ideaal of perfect aangezien de correlaties tussen beide variabelen een even proportioneel gedrag vertonen, met a correlatiecoëfficiënt gelijk aan één.

Advertenties

als we willen nauwkeurig de correlatiecoëfficiënt bepalen, in Excelleren kan voeg de formules toe standaard “=COEFF.DE.CORREL(…,..)” U hoeft alleen de formule in te voegen, de gegevens van de eerste variabele te slepen, er een komma op te zetten, de gegevens van de tweede variabele te slepen en dat is alles.

1. Scatterplot voorbeeld

In dit voorbeeld wil een bedrijf de relatie tussen het aantal gewerkte uren en het aantal defecte producten, hiervoor voerde het bedrijf een 20 weken studeren, leverde de follow-up de volgende gegevens op:

scatterplot-voorbeeld-1

Zodra de benodigde gegevens zijn geïdentificeerd, gaan we over tot de grafische weergave.Hiervoor is het noodzakelijk om te identificeren welke van de factoren de afhankelijke variabele vertegenwoordigt en welke de onafhankelijke variabele vertegenwoordigt.

We kunnen vaststellen dat de gewerkte uren zijn de onafhankelijke variabele weergegeven op de (X)-as en de defecte producten de afhankelijke die altijd wordt weerspiegeld in de (y)-as.

We zien de gegevens weergegeven in de grafiek:

scatterplot-voorbeeld-1.1

Zoals te zien is in de grafiek, zijn de relaties tussen de verzamelde gegevens worden weergegeven met verspreide blauwe stippen, elk punt geeft de verhouding weer tussen gewerkte uren en de per week aangeboden gebrekkige producten.

Naar de voeg een trendlijn toe aan de grafiek dat kunnen we definiëren In deze grafiek is er een positieve correlatie, want naarmate de werkuren toenemen, neemt ook het percentage defecte producten toe.

Deze trendlijn vertegenwoordigt a correlatiecoëfficiënt van 0,91.

2. Scatterplot voorbeeld

In dit geval proberen we te weten of er een relatie tussen gewicht en lengte van 18 willekeurig geselecteerde mensen in een bepaalde plaats moet worden opgemerkt dat hoe meer gegevens worden verzameld, hoe representatiever de steekproef is van de toestand van de totale bevolking; Laten we de gegevens bekijken:

scatterplot-voorbeeld-2

Laten we eens kijken naar de representatie in de scatterplot:

Zoals te zien is in het diagram, er is een intermediaire positieve correlatie, omdat de hoogte, hoewel het het gewicht beïnvloedt, de incidentie niet erg hoog is, waarvan de correlatiecoëfficiënt 0,59 is.

Voor de uitwerking van het diagram kunnen we Microsoft Office Excel als hulpmiddel gebruiken, we gaan gewoon naar de Excel-werkbalk en voegen de scatterplot in en voegen de benodigde gegevens eraan toe.

instagram viewer