Normal fordeling i statistikk (formel og bruk)

  • Jul 26, 2021
click fraud protection

Normalfordelingen det er den viktigste sannsynlighetsfordelingen i statistikken, kjent for antall fenomener den forklarer. Det kalles Gaussisk bjelle, siden den representerer sin sannsynlige funksjon, har den en bjelleform.

Det er den mest brukte i applikasjoner statistikk, på grunn av sin omfattende bruk, støttet av frekvensen som noen fenomener har til å ligne deres.

Annonser

For å være presis med hensyn til bruken, kan det henvises til opprinnelsen til dets eget navn, som kommer fra faktum at leger og biologer i lang tid trodde at alle naturlige variabler av interesse fulgte dette modell.

I denne artikkelen finner du:

Viktigheten av normalfordelingen

Det er den viktigste kontinuerlige modellen i statistikk på grunn av følgende årsaker:

Annonser

  • Anvendelsen er direkte og gjør det mulig å observere mange variabler av interesse, som lett kan beskrives med denne modellen.
  • Det tjener til å nærme seg flere diskrete sannsynlighetsfordelinger, inkludert Poisson-fordelingen og Binomial-fordelingen.
  • Dens egenskaper har tillatt utvikling av mange statistiske inferensteknikker. Legge grunnlaget for klassisk inferensiell statistikk, for dets forhold til den sentrale grense-setningen.

Når er en fordeling normal?

Den gaussiske fordelingen eller normal distribusjon er den fordeling fortsetter som vi vanligvis bruker innen statistikk.... Det har som mål i nærheten av forskjellige diskrete sannsynlighetsfordelinger, slik tilfellet er med fordelingPoisson og fordelingen binomial.

Grunnleggende konsepter i normalfordelingen

For å forstå og jobbe ordentlig med normalfordelingen i statistikk, er det nødvendig å vite og være tydelig på visse konsepter som denne modellen er basert på.

Annonser

Kontinuerlig tilfeldig variabel

Det er en som oppnår et uendelig antall verdier innenfor et bestemt område. For eksempel kan vekten til en person basert på nøyaktigheten av skalaen være 80,5, 80,52, etc.

Se mer av kontinuerlige tilfeldige variabler her.

Annonser

Normal distribusjon

Normal sannsynlighetsfordeling

Mange tilfeldige variabler følger en normalfordeling eller i nærheten av den. Vel, den mest fremragende egenskapen er at det store flertallet av sannsynlighetsfordelingen, enten diskret eller kontinuerlig, kan tilnærmes med normal sannsynlighet under visse forhold.

Annonser

Egenskapene til både den normale sannsynlighetsfordelingen og kurven som representerer den er:

  • Kurven er klokkeformet med en topp i midten av fordelingen. Så det aritmetiske gjennomsnittet, modusen og medianen er like og ligger på toppen.
  • Det er symmetrisk rundt gjennomsnittet. Halvparten av arealet under kurven er til høyre for dette midtpunktet og den andre halvparten til venstre.
  • Kurven skråner tamt i begge retninger fra den sentrale verdien.
  • Det er asymptotisk, det vil si at kurven er ganske nær X-aksen, men ikke berører den.

formelSannsynlighetstetthetsfunksjon

Den bruker arbeidskrevende beregninger, det kan demonstreres ved å bruke formelen er

Nevnte tetthetsfunksjon:

  • Du kan bruke hvilken som helst verdi (- ∞, + ∞)
  • Verdier nær sentrum (gjennomsnitt) er mer sannsynlige.
  • Når du beveger deg bort fra µ-verdien, reduseres sannsynligheten på samme måte til høyre og venstre (symmetrisk).
  • Når den beveger seg vekk fra µ-verdien, reduseres sannsynligheten mer eller mindre raskt avhengig av standardavviket (parameter s).
Fordeling av prosenter i normalfordeling

Bruk av distribusjon i statistisk trekk

Begrepene sannsynlighet og prøvefordeling brukes som en introduksjon til metoden Statistical Inference, som består av:

  • Estimering: Som søker å evaluere parametrene for populasjonen basert på et utvalg.
  • Hypotesetester: Prosess relatert til aksept eller avvisning av enhver uttalelse om parametrene til befolkningen.

Når du foretar målinger av noe slag og fordeler resultatene under noen kriterier, er det veldig vanlig å finne ut at dataene er gruppert på en enestående måte, i Noen ganger følger disse distribusjonene et skjema med et større antall observasjoner for en viss verdi, og reduserer observasjonene på begge sider av dette mer hyppig.

Bruken av denne distribusjonen finnes i ulike kunnskapsgrener, den brukes på et bredt spekter av observasjoner innen biologi, astronomi, geografi og økonomi.

Mange fenomener i naturen kan tilnærmes med en normalfordeling. Generelt kan den gjennomgås som et resultat av samspillet mellom mange tilfeldige effekter på variabelen som studeres.

I denne typen distribusjon kan du beregne muligheten for at noen få hendelser vil forekomme innen bestemte intervaller eller områder, men den nøyaktige sannsynligheten for en verdi i en kontinuerlig fordeling, slik som normalfordelingen, er lik null (0). Denne egenskapen skiller kontinuerlige variabler som måles fra diskrete variabler som telles.

For eksempel måles tid (i sekunder, minutter eller timer), ikke telles. Så det er en gjennomførbar variabel å bestemme. Sannsynligheten for at installasjonstiden til et bestemt verktøy stopper på en datamaskin er mellom 8 og 15 sekunder, eller sannsynligheten kan være mellom 8 og 9 sekunder. Imidlertid er sannsynligheten for at installasjonstiden er nøyaktig 9 sekunder null.

instagram viewer