Grader af frihed i statistikker (hvad de er og hvordan de anvendes)

  • Jul 26, 2021
click fraud protection

Det grader af frihed i moderne statistik udgør de et centralt indhold, men deres definition forklares meget vagt i bøger om emnet.

Dens koncept forstås let fra et geometrisk, algebraisk og intuitivt perspektiv.

Annoncer

Geometri angiver frihedsgrader som rum, hvormed den opsummerende måleenhed kan variere og vise forskellige værdier. Fra et algebraisk synspunkt forstås det som antallet af ligninger, der er etableret ved hjælp af dataene.

Begge definitioner er relateret til hjælp til forståelsen af ​​konceptet, da dets anvendelser strækker sig gennem al statistisk videnskab.

Annoncer

I denne artikel finder du:

Hvad kaldes frihedsgrader?

For at forstå emnet lidt mere nedenfor præsenterer jeg nogle af definitionerne i almindeligt anvendte statistiske tekster:

Annoncer

Definitioner af frihedsgrader

Ifølge Daniel Wayne "Det er summen af ​​værdierne, afvigelser og individuelle værdier, med hensyn til at deres middel er lig med nul" At vide n-1-værdier fra middelværdien, den n-th-værdi er kendt, automatisk bestemt ved begrænsning af 3, hvor alle værdierne af n tilføjes nul.

For Dawson "Frihedsgraderne og deres værdi er relateret til antallet af muligheder, hvor prøveoplysningerne bruges."

Annoncer

Sidst men ikke mindst forstår Pagano ”Frihedsgraderne som antallet af data uden variation ved beregning af en statistisk test”.

Hvad er frihedsgraderne?

Det GL (frihedsgrader) er mængden af ​​information leveret af dataene, der kan bruges til at estimere de ukendte parametre i befolkningen og beregne variabiliteten af ​​estimaterne.

Annoncer

Dette bestemmes i henhold til antallet af parametre i modellen og observationer af at vise. Efterhånden som stikprøvestørrelsen stiger, opnås mere information, og følgelig øges frihedsgraderne i dataene. Hvis parametre tilføjes til modellen, øges f.eks. Udtrykkene i regressionsligningen, bruge information og reducere de mulige frihedsgrader til at estimere variabiliteten af ​​vurderingerne af parametre.

De bruges også til at definere en bestemt fordeling, familier af fordelinger, såsom F, t, chi-firkant, det bruges af GL'er til at specificere den passende specifikke fordeling for forskellige stikprøvestørrelser og forskellige mængder parametre i modellen.

Afslutningsvis, frihedsgrader GL henviser til antallet af uafhængige værdier, der er nødvendige i den statistiske beregning minus antallet af begrænsninger, der er knyttet til observationerne. Det vil sige, det er antallet af værdier i prøven, der frit kan specificeres efter at have kendskab til information om prøven.

Anvendelse af frihedsgrader

Det grader af frihed de er nødvendigvis relateret til størrelsen på prøven, derfor bruges de i definitionen af ​​statistiske fordelinger til at udføre hypotesetest.

De bruges til beregning af standardafvigelse af prøven, der giver en repræsentation af graden af ​​spredning ved n data omkring middelværdien og for at kende middelværdien etablerer forholdet mellem dataene ved at tilføje dem og dividere dem med antallet af dem dem selv.

De er grundlaget for Studentens t-distribution, som bruges til at teste hypoteser om lighed mellem midlerne mellem to datagrupper.

Dens anvendelse skelnes hovedsageligt mellem statistikker, der bruger befolkningsparametre Y Vis dem.

I populationsparametre, da n alle værdierne er kendte, er frihedsgrader vil være alle befolkningselementer "N ".

For prøveparametrene er de estimater, da alle prøveværdierne er kendte.

Begge tilfælde tillader, at observationer af prøvesættet er tilfældige, og når du estimerer statistikken, kan du opnå forskellige resultater. Så observationer har fuld egenskab af at variere ligesom observationer af befolkningssættet.

Forståelse af grader af frihed

For en bedre forståelse af antal frihedsgraderanbefales det at se det som antallet af dimensioner i rummet, hvor en værdi er fri til at variere eller bevæge sig.

Hvert forhold etableres eller beregnes ud fra de data, der leveres af selve prøven, som genererer behovet for at ændre frihedsgraderne GL, hvis statistikken vil blive brugt i beregningerne futures. I denne forstand, grader af frihed de forbliver begrænset til forskellen, der skyldes mængden af ​​data og mængden af ​​forhold, der er etableret mellem dem.

De kan estimeres med formlen:

N - r

Hvor n er lig med antallet af emner, der hører til prøven, hvilket kan slå en værdi.

Hvor r er lig med antallet af emner, hvis værdi afhænger af værdien af ​​de frie elementer i prøven.

Endelig er det værd at nævne, at som andre emner i statistikker frihedsgrader i statistikker De spiller en vigtig rolle i studier inden for andre områder som videnskab og samfund.

instagram viewer