Coefficiente di determinazione r2

  • Jul 26, 2021
click fraud protection

Il coefficiente di determinazione che è anche conosciuto come r2, è un termine utilizzato in statistica, la cui funzione principale è quella di prevedere il risultato di ipotesi. Questo è essenziale in qualsiasi studio con fondamenti scientifici e le sue applicazioni possono avere un ampia, gamma come in economia, studio di mercato o per determinare il successo di alcuni Prodotto.

Esistono diverse definizioni su questo noto strumento, che non tutte coincidono, quindi è È importante conoscerli ciascuno, come quelli relativi alla regressione lineare.

Annunci

In questo articolo troverai:

Definizione di coefficiente di determinazione

È lui quadrato di correlazione che misura quale parte è spiegata in una certa variante come parte di una variazione, ciò significa quale può essere prevista attraverso la variazione dell'altra.

Come si calcola il coefficiente di determinazione?

I modelli statistici hanno lo scopo di testare o spiegare alcune variabili casuali, questo viene fatto attraverso altre variabili casuali note come fattori. Poiché una variabile considerata casuale può essere prevista attraverso la sua misura e che per questo caso il la varianza sarà lo stesso errore quadratico medio, il massimo errore quadratico medio che può essere accettato è il varianza.

Annunci

Il risultato può variare tra 0 e 1, questo significa che più è vicino a uno sarà più adattato alla variabile che stai cercando di testare, mentre che nel caso opposto, cioè, più è vicino a 0, meno affidabile sarà poiché il modello.

Come si esprime il coefficiente di determinazione?

Qui puoi vedere una frazione in cui il numeratore è espresso come segue:

Annunci

Qui si può vedere che nell'espressione della varianza la Y è circonflessa, il che significa che è la stima di un modello, questo non è il valore reale di Y ma una stima. Un'altra differenza rispetto a questa espressione della varianza è che non è divisa per T poiché il lo esprimerebbe anche il denominatore, quindi si eliminano entrambi in modo che in questo modo il espressione.

Per quanto riguarda il denominatore, osserviamo che l'unica differenza con la varianza che si può notare è che non è divisa per T o N

Annunci

Applicazioni del coefficiente di determinazione

Sono molte le utilità che questa formula ha, ad esempio, nel caso di provare il numero di punti che segna un calciatore o basket rispetto al numero di partite giocate, partendo dal presupposto che più partite ci saranno più punti annotato. Prendiamo in considerazione 8 giochi.

Il grafico mostrerebbe una linea inclinata, con una relazione positiva, poiché come previsto più partite giocate più punti sono stati annotato, questo grafico mostrerebbe un risultato sopra lo zero, che come abbiamo detto prima dimostrerebbe che è adattato alla variabile vero.

Annunci

Perché nasce la R al quadrato adattata?

Cosa succede con R quadrato e il motivo per cui viene dato l'R-quadrato corretto ha a che fare con il fatto che non penalizza l'inclusione rispetto a variabili esplicative non significative, questo significa che, se, per esempio, si aggiungono al modello 5 variabili esplicative che non hanno molta relazione con il punteggio che questo determinato giocatore ha segnato, la R al quadrato sarà maggiore o crescerà.

R quadrato montato

È una misura che stabilisce la percentuale spiegata dalla varianza della regressione rispetto alla varianza della variabile spiegata. Si vede che è lo stesso della R al quadrato, però con la piccola differenza che penalizza l'inclusione delle variabili.

La R al quadrato aumenta sempre anche se le variabili incluse nel modello citato non sono realmente rilevanti. Per risolvere questo problema si applica che:

In questa equazione, N è indicato come la dimensione del campione e K corrisponde alle variabili esplicative. Dal punto di vista della deduzione matematica a valori superiori a k, l'R-quadrato corretto sarà più lontano dal comune R-quadrato.

Altre funzioni del coefficiente di determinazione

Non solo è utile per spiegare o meglio, per misurare la capacità esplicativa di un modello, ma allo stesso tempo permette di scegliere quale tra più modelli è il più appropriato. Ciò significa che i modelli hanno le stesse variabili dipendenti e lo stesso numero rispetto al variabili che sono note come esplicative, la più appropriata sarà quella con un coefficiente maggiore di determinazione.

Chiaramente questo può variare a seconda del modello scelto poiché non sarà lo stesso nel caso di un modello annidato, ad esempio. La cosa più importante di questo coefficiente è la sua capacità di prevedere l'efficacia di modelli o teorie. proposte, questo può essere applicato non solo ai numeri, questo è fondamentale per sapere se le previsioni sono buone o cattive.

instagram viewer