Bepalingscoëfficiënt r2

  • Jul 26, 2021
click fraud protection

De determinatiecoëfficiënt die ook wel bekend staat als r2, is een term die in de statistiek wordt gebruikt en waarvan de belangrijkste functie is om het resultaat van hypothesen te voorspellen. Dit is essentieel in elk onderzoek met wetenschappelijke onderbouwing en de toepassingen ervan kunnen een breed, bereik zoals in economie, marktstudie of om het succes van sommigen te bepalen Product.

Er zijn verschillende definities over deze bekende tool, die niet allemaal samenvallen, dus dat is het wel Het is belangrijk om ze allemaal te kennen, zoals die welke verband houden met regressie lineair.

advertenties

In dit artikel vind je:

Definitie van determinatiecoëfficiënt

Is hij correlatie kwadraat welke meet welk deel in een bepaalde variant wordt verklaard als onderdeel van een variatie, dat wil zeggen welk deel voorspeld kan worden door de variatie van de ander.

Hoe wordt de determinatiecoëfficiënt berekend?

Statistische modellen zijn bedoeld om een ​​willekeurige variabele te testen of te verklaren, dit wordt gedaan door andere willekeurige variabelen die bekend staan ​​als factoren. Aangezien een variabele die als willekeurig wordt beschouwd, kan worden voorspeld door zijn meting en dat in dit geval de variantie zal dezelfde gemiddelde kwadratische fout zijn, de maximale gemiddelde kwadratische fout die kan worden geaccepteerd is de variantie.

advertenties

Het resultaat kan variëren tussen 0 en 1, dit betekent dat hoe dichter het bij één is, het meer zal worden aangepast aan de variabele die u probeert te testen, terwijl dat in het tegenovergestelde geval, dat wil zeggen, hoe dichter het bij 0 ligt, hoe minder betrouwbaar het zal zijn aangezien de model.

Hoe wordt de determinatiecoëfficiënt uitgedrukt?

Hier zie je een breuk waarin de teller als volgt wordt uitgedrukt:

advertenties

Hier is te zien dat in de variantie-uitdrukking de Y omcirkeld is, wat betekent dat het de schatting van een model is, dit is niet de werkelijke waarde van Y maar een schatting. Een ander verschil met betrekking tot deze uitdrukking van de variantie is dat deze niet wordt gedeeld door T aangezien de noemer het ook zou uitdrukken, dan worden beide geëlimineerd zodat op deze manier de uitdrukking.

Met betrekking tot de noemer zien we dat het enige verschil met de variantie dat kan worden opgemerkt, is dat deze niet wordt gedeeld door T of N

advertenties

Toepassingen van de determinatiecoëfficiënt

Er zijn veel hulpprogramma's die deze formule heeft, bijvoorbeeld in het geval van het proberen van het aantal punten dat een voetballer scoort of basketbal met betrekking tot het aantal games dat hij speelt, gebaseerd op de veronderstelling dat hoe meer games, hoe meer punten er zullen zijn geannoteerd. Laten we rekening houden met 8 spellen.

De grafiek zou een hellende lijn laten zien, met een positieve relatie, aangezien zoals verwacht, hoe meer games er werden gespeeld, hoe meer punten waren opgemerkt, zou deze grafiek een resultaat boven nul laten zien, wat, zoals we eerder vermeldden, zou bewijzen dat het is aangepast aan de variabele echt.

advertenties

Waarom ontstaat het ingerichte R-kwadraat?

Wat gebeurt er met? R vierkant en de reden waarom het aangepaste R-kwadraat wordt gegeven, heeft te maken met het feit dat het opname niet bestraft met betrekking tot niet-significante verklarende variabelen, dit betekent dat, als er bijvoorbeeld 5 verklarende variabelen aan het model worden toegevoegd die niet veel verband houden met de score die deze bepaalde speler heeft gescoord, het R-kwadraat hoger of zal toenemen.

R kwadraat gemonteerd

Het is een maatstaf die het percentage bepaalt dat wordt verklaard door de regressievariantie ten opzichte van de variantie van de verklaarde variabele. Je kunt zien dat het hetzelfde is als bij het R-kwadraat, maar met het kleine verschil dat het het opnemen van variabelen bestraft.

Het R-kwadraat neemt altijd toe, ook al zijn de variabelen in het genoemde model niet echt relevant. Om dit probleem op te lossen wordt toegepast dat:

In deze vergelijking wordt N de steekproefomvang genoemd en komt K overeen met de verklarende variabelen. Vanuit het oogpunt van wiskundige aftrek bij waarden boven k, zal het aangepaste R-kwadraat verder verwijderd zijn van het gewone R-kwadraat.

Andere functies van de determinatiecoëfficiënt

Het is niet alleen nuttig om het verklarend vermogen van een model uit te leggen of beter gezegd te meten, maar het maakt het tegelijkertijd mogelijk om te kiezen welke van de verschillende modellen het meest geschikt is. Dit betekent dat de modellen dezelfde afhankelijke variabelen en hetzelfde aantal hebben met betrekking tot de variabelen die bekend staan ​​als verklarend, de meest geschikte is degene met een coëfficiënt groter dan bepaling.

Het is duidelijk dat dit kan variëren afhankelijk van het gekozen model, omdat het bijvoorbeeld niet hetzelfde zal zijn in het geval van een genest model. Het belangrijkste van deze coëfficiënt is het vermogen om de effectiviteit van de modellen of theorieën te voorspellen. voorstellen, dit kan niet alleen worden toegepast op cijfers, dit is van vitaal belang om te weten of de voorspellingen goed of slecht zijn.

instagram viewer