Coeficientul de determinare r2

  • Jul 26, 2021
click fraud protection

coeficient de determinare care este, de asemenea, cunoscut sub numele de r2, este un termen folosit în statistici, a cărui funcție principală este de a prezice rezultatul ipotezelor. Acest lucru este esențial în orice studiu cu fundament științific și aplicațiile sale pot avea un larg, gama ca în economie, studiu de piață sau pentru a determina succesul unora produs.

Există mai multe definiții despre acest bine-cunoscut instrument, care nu toate coincid, așa este Este important să cunoașteți fiecare dintre ele, cum ar fi cele care au legătură cu regresia liniar.

Reclame

În acest articol veți găsi:

Definiția coeficientului de determinare

Este el pătrat de corelație care măsoară ce parte este explicată într-o anumită variantă ca parte a unei variații, aceasta înseamnă care una poate fi prezisă prin variația celeilalte.

Cum se calculează coeficientul de determinare?

Modelele statistice sunt destinate testării sau explicării unei variabile aleatorii, aceasta se face prin alte variabile aleatoare cunoscute sub numele de factori. Deoarece o variabilă considerată aleatorie poate fi prezisă prin măsurarea sa și că pentru acest caz varianța va fi aceeași eroare pătrată medie, eroarea pătrată medie maximă care poate fi acceptată este varianță.

Reclame

Rezultatul poate varia între 0 și 1, acest lucru înseamnă că cu cât este mai aproape de unul, acesta va fi mai ajustat la variabila pe care încercați să o testați, în timp ce că, în cazul opus, adică cu cât este mai aproape de 0, cu atât va fi mai puțin fiabil din moment ce model.

Cum se exprimă coeficientul de determinare?

Aici puteți vedea o fracție în care numărătorul este exprimat după cum urmează:

Reclame

Aici se poate vedea că în expresia varianței Y este circumflexat, ceea ce înseamnă că este estimarea unui model, aceasta nu este valoarea reală a lui Y, ci o estimare. O altă diferență în ceea ce privește această expresie a varianței este că nu este împărțită la T din moment ce numitorul l-ar exprima, apoi ambii sunt eliminați astfel încât în ​​acest mod expresie.

În ceea ce privește numitorul, observăm că singura diferență cu varianța care poate fi observată este că nu este împărțit la T sau N

Reclame

Aplicații ale coeficientului de determinare

Există multe utilități pe care le are această formulă, de exemplu, în cazul încercării numărului de puncte pe care le marchează un jucător de fotbal sau baschet în ceea ce privește numărul de jocuri pe care le joacă, pe baza presupunerii că cu cât mai multe jocuri vor fi mai multe puncte adnotat. Să luăm în calcul 8 jocuri.

Graficul ar arăta o linie înclinată, cu o relație pozitivă, deoarece, așa cum era de așteptat, cu cât mai multe jocuri jucate, cu atât mai multe puncte erau adnotat, acest grafic ar arăta un rezultat peste zero, care, după cum am menționat anterior, ar demonstra că este ajustat la variabilă real.

Reclame

De ce apare R pătrat montat?

Ce se întâmplă cu R pătrat iar motivul pentru care se dă R-pătrat ajustat are legătură cu faptul că nu penalizează includerea în ceea ce privește variabilele explicative nesemnificative, aceasta înseamnă că, dacă, de exemplu, la model sunt adăugate 5 variabile explicative care nu au o relație prea mare cu scorul pe care acest jucător l-a marcat, R pătratul va fi mai mare sau va creste.

R pătrat montat

Este o măsură care stabilește procentul explicat de varianța de regresie față de varianța variabilei explicate. Puteți vedea că este la fel ca la R pătrat, totuși cu diferența mică că penalizează includerea variabilelor.

R pătratul crește întotdeauna chiar dacă variabilele incluse în modelul menționat nu sunt cu adevărat relevante. Pentru a rezolva această problemă, se aplică faptul că:

În această ecuație, N este denumit dimensiunea eșantionului și K corespunde variabilelor explicative. Din punctul de vedere al deducerii matematice la valori peste k, R-pătratul ajustat va fi mai departe de R-pătratul comun.

Alte funcții ale coeficientului de determinare

Nu numai că este util să explicăm sau mai degrabă să măsurăm capacitatea explicativă a unui model, dar în același timp permite alegerea careia dintre mai multe modele este cea mai potrivită. Aceasta înseamnă că modelele au aceleași variabile dependente și același număr față de variabile care sunt cunoscute ca explicative, cea mai potrivită va fi cea cu un coeficient mai mare de determinare.

În mod clar, acest lucru poate varia în funcție de modelul ales, deoarece nu va fi același în cazul unui model imbricat, de exemplu. Cel mai important lucru la acest coeficient este capacitatea sa de a prezice eficacitatea modelelor sau a teoriilor. propuneri, acest lucru poate fi aplicat nu numai numerelor, acest lucru este vital pentru a ști dacă predicțiile sunt bune sau rele.

instagram viewer