Frihetsgrader i statistikk (hva de er og hvordan de blir brukt)

  • Jul 26, 2021
click fraud protection

De grader av frihet i moderne statistikk utgjør de et sentralt innhold, men deres definisjon er veldig vagt forklart i bøker om emnet.

Konseptet er lett å forstå fra et geometrisk, algebraisk og intuitivt perspektiv.

Annonser

Geometri angir frihetsgrader som mellomrom som den sammenfattende måleenheten kan variere og vise forskjellige verdier. Fra et algebraisk synspunkt forstås det som antall ligninger som er etablert ved bruk av dataene.

Begge definisjonene er relatert til hjelp i forståelsen av konseptet, siden dets anvendelser strekker seg gjennom all statistikk.

Annonser

I denne artikkelen finner du:

Hva kalles frihetsgrader?

For å forstå emnet litt mer, nedenfor, presenterer jeg noen av definisjonene som finnes i ofte brukte statistiske tekster:

Annonser

Definisjoner av grader av frihet

Ifølge Daniel Wayne "Det er summen av verdiene, avvikene og individuelle verdier, med hensyn til at gjennomsnittet er lik null". n-1-verdier fra gjennomsnittet, n-verdien er kjent, automatisk bestemt ved begrensning av 3 der alle verdiene til n legges sammen null.

For Dawson "Graden av frihet og deres verdi er relatert til antall muligheter som eksemplet på informasjon blir brukt."

Annonser

Sist men ikke minst forstår Pagano "Frihetsgradene som antall data uten variasjon når man beregner en statistisk test".

Hva er gradene av frihet?

De GL (frihetsgrader) er mengden informasjon gitt av dataene som kan brukes til å estimere de ukjente parametrene i befolkningen og beregne variabiliteten til estimatene.

Annonser

Dette bestemmes i henhold til antall parametere i modellen og observasjonene av vise fram. Når prøvestørrelsen øker, oppnås mer informasjon, og følgelig øker frihetsgraden i dataene. I tilfelle parametere legges til modellen, økes for eksempel begrepene i regresjonsligningen, bruke informasjon og redusere mulige frihetsgrader for å estimere variabiliteten i takseringene av parametere.

De brukes også til å definere en spesifikk fordeling, familier av distribusjoner, slik som F, t, chi-firkantbrukes den av GLs til å spesifisere riktig spesifikk fordeling for forskjellige prøvestørrelser og forskjellige mengder parametere i modellen.

For å konkludere, frihetsgrader GL refererer til antall uavhengige verdier som er nødvendig i statistisk beregning, minus antall begrensninger knyttet til observasjonene. Det vil si at det er antall verdier i prøven som kan spesifiseres fritt, etter å ha kjent informasjon om nevnte utvalg.

Bruk av frihetsgrader

De grader av frihet de er nødvendigvis relatert til størrelsen på prøven, derfor brukes de i definisjonen av statistiske distribusjoner for å utføre hypotesetester.

De brukes ved beregning av standardavvik av prøven som gir en representasjon av graden av spredning ved n data rundt gjennomsnittet, og for Å vite gjennomsnittet, blir forholdet mellom dataene etablert ved å legge dem til og dele dem med antallet av dem. dem selv.

De er grunnlaget for studentens t-fordeling, som brukes til å teste hypoteser om likhet mellom midlene mellom to datagrupper.

Bruken er hovedsakelig differensiert mellom statistikk som bruker populasjonsparametere Y Vis dem.

I populasjonsparametere, gitt at n alle verdiene er kjent, er frihetsgrader vil være alle elementene i befolkningen "N ".

For eksempelparametrene er de estimater siden alle prøveverdiene er kjent.

Begge tilfeller tillater at observasjonene av prøvesettet er tilfeldige, og når du estimerer statistikken, kan du oppnå forskjellige resultater. Så observasjonene har full egenskap til å variere som observasjonene av befolkningen.

Forstå grad av frihet

For en bedre forståelse av antall frihetsgrader, anbefales det å se det som antall dimensjoner i rommet der en verdi er fri til å variere eller bevege seg.

Hvert forhold er etablert eller beregnet ut fra dataene som selve prøven gir, hvilke genererer behovet for å endre frihetsgraden GL hvis statistikken vil bli brukt i beregninger futures. I denne forstand, grader av frihet de forblir begrenset til forskjellen som skyldes datamengden og mengden relasjoner som er etablert mellom dem.

De kan estimeres med formelen:

N - r

Der n er lik antall fag som tilhører utvalget, noe som kan slå en verdi.

Hvor r er lik antall fag hvis verdien vil avhenge av verdien av de frie elementene i prøven.

Til slutt er det verdt å nevne at, som andre emner i statistikk, frihetsgrader i statistikk De spiller en viktig rolle i studier innen andre områder som vitenskap og samfunn.

instagram viewer