Coeficiente de Determinação r2

  • Jul 26, 2021
click fraud protection

O coeficiente de determinação que também é conhecido como r2, é um termo utilizado em estatística, cuja principal função é prever o resultado de hipóteses. Isso é essencial em qualquer estudo com embasamento científico e suas aplicações podem ter um ampla, gama como na economia, estudo de mercado ou para determinar o sucesso de alguns produtos.

Existem várias definições sobre esta ferramenta bem conhecida, que nem todas coincidem, por isso é É importante conhecer cada um deles, como os que estão relacionados à regressão linear.

Anúncios

Neste artigo você encontrará:

Definição do coeficiente de determinação

É o quadrado de correlação que mede qual parte é explicada em uma determinada variante como parte de uma variação, isso significa que uma pode ser prevista através da variação da outra.

Como o coeficiente de determinação é calculado?

Os modelos estatísticos têm como objetivo testar ou explicar alguma variável aleatória, isso é feito por meio de outras variáveis ​​aleatórias que são conhecidas como fatores. Uma vez que uma variável considerada aleatória pode ser prevista por meio de sua medida e que, para este caso, o variância será o mesmo erro quadrático médio, o erro quadrático médio máximo que pode ser aceito é o variância.

Anúncios

O resultado pode variar entre 0 e 1, isso significa que quanto mais próximo estiver de um, mais ajustado à variável que você está tentando testar, enquanto que no caso oposto, isto é, quanto mais próximo estiver de 0, menos confiável será, pois o modelo.

Como o coeficiente de determinação é expresso?

Aqui você pode ver uma fração em que o numerador é expresso da seguinte forma:

Anúncios

Aqui pode ser visto que na expressão de variância o Y é circunflexo, o que significa que é a estimativa de um modelo, este não é o valor real de Y mas uma estimativa. Outra diferença com relação a esta expressão da variância é que ela não é dividida por T uma vez que o denominador também expressaria isso, então ambos são eliminados para que, desta forma, o expressão.

Em relação ao denominador, observamos que a única diferença com a variância que se pode notar é que ele não é dividido por T ou N

Anúncios

Aplicações do coeficiente de determinação

Muitas são as utilidades que essa fórmula possui, por exemplo, no caso de tentar a quantidade de pontos que um jogador de futebol marca. ou basquete com relação ao número de jogos que ele joga, com base na suposição de que quanto mais jogos, mais pontos serão anotado. Vamos levar em consideração 8 jogos.

O gráfico mostraria uma linha inclinada, com uma relação positiva, pois como era de se esperar, quanto mais jogos disputados, mais pontos eram anotado, este gráfico mostraria um resultado acima de zero, o que, como mencionamos antes, provaria que está ajustado à variável real.

Anúncios

Por que surge o R quadrado ajustado?

O que acontece com Quadrado R e a razão pela qual o R-quadrado ajustado é dado tem a ver com o fato de que ele não penaliza a inclusão com relação a variáveis ​​explicativas não significativas, isso significa que, se, por exemplo, forem adicionadas ao modelo 5 variáveis ​​explicativas que não tenham muita relação com a pontuação que este determinado jogador pontuou, o R ao quadrado será maior ou vai aumentar.

R quadrado ajustado

É uma medida que estabelece o percentual explicado pela variância da regressão em relação à variância da variável explicada. Você pode ver que é igual ao R ao quadrado, porém com a pequena diferença que penaliza a inclusão de variáveis.

O R ao quadrado sempre aumenta, embora as variáveis ​​incluídas no modelo mencionado não sejam realmente relevantes. Para resolver este problema, é aplicado que:

Nesta equação, N é referido como o tamanho da amostra e K corresponde às variáveis ​​explicativas. Do ponto de vista da dedução matemática em valores acima de k, o R ao quadrado ajustado estará mais longe do R ao quadrado comum.

Outras funções do coeficiente de determinação

Não só serve para explicar, ou melhor, para medir a capacidade explicativa de um modelo, mas ao mesmo tempo permite escolher qual dos vários modelos é o mais adequado. Isso significa que os modelos têm as mesmas variáveis ​​dependentes e o mesmo número em relação ao variáveis ​​conhecidas como explicativas, a mais adequada será aquela com coeficiente maior que determinação.

É claro que isso pode variar dependendo do modelo escolhido, uma vez que não será o mesmo no caso de um modelo aninhado, por exemplo. O mais importante sobre esse coeficiente é sua capacidade de prever a eficácia de modelos ou teorias. propostas, isso pode ser aplicado não apenas a números, isso é vital para saber se as previsões são boas ou ruins.

instagram viewer