Hopp til innhold

Sannsynlighetsfordeling

Fra Wikipedia, den frie encyklopedi
(Omdirigert fra «Statistisk fordeling»)

Sannsynlighetsfordeling anvendes innen sannsynlighetsteori og statistikk for å beskrive hvordan stokastiske variabler, for eksempel tilfeldige utvalg, fordeler seg. De enkelte utfall av en tilfeldig variabel kan ikke forutsies, men sannsynlighetsfordelingen vil beskrive sannsynligheten for at hvert mulige utfall vil inntre, og hvordan verdiene i et større utvalg normalt vil fordele seg.

Disse forholdene er forskjellige avhengig av den underliggende fysiske prosess eller logiske mekanisme; Utfallet av et terningkast, en lotteritrekning, radioaktiv nedbrytning, en intelligenstest eller ventetider i fergekø vil derfor ha forskjellige sannsynlighetsfordelinger.

Formell definisjon

[rediger | rediger kilde]

En sannsynlighetsfordeling tildeler en sannsynlighet til hvert intervall [a, b] av mulige reelle tall slik at forutsetningene for den aktuelle fordelingen er ivaretatt.

Alle stokastiske variabler har en sannsynlighetsfordeling som inneholder den essensielle informasjonen om denne variabelen. Hvis X er en stokastisk variabel, vil sannsynlighetfordelingen tildele en sannsynlighet P[aXb] til intervallet [a, b] som er sannsynligheten for at X har en verdi i dette intervallet. Sannsynlighetsfordelingen til X kan entydig beskrives av dens (kumulative) fordelingsfunksjon F(x) som er definert som:

for alle x i .

Verdiene vil være i området 0 (ingen sannsynlighet) til 1. Dens deriverte kalles sannsynlighetstettheten til X.

Diskrete sannsynlighetsfordelinger

[rediger | rediger kilde]
Sannsynlighetsfunksjonen til en diskret sannsynlihgetsfordeling. Sannsynlighetene for verdiene {1, {3} og {7} er henholdsvis 0.2, 0.5 og 0.3. Sannsynligheten for alle andre verdier er 0.

En fordeling kalles diskret hvis sumfunksjonen består av en rekke endelige sprang, som betyr at variabelen X er en diskret stokastisk variabel; X kan bare anta verdier fra et endelig, høyst numererbart sett. En diskret fordeling av en variabel er gitt ved en funksjon

for

der

.

Den kumulative fordelingsfunksjonen er gitt ved summen av sannsynlighetene for enkeltutfall:

for .

Støtten for en fordeling er det minste lukkede settet som har sannsynlighet 1. En fordeling har endelig støtte der sannsynlighet 1 oppnås med et endelig, høyst numererbart sett for X.

Sannsynlighetsfordelingen for summen av to uavhengige stokastiske variable er konvolusjonen av deres fordelinger. Sannsynlighetsfordelingen for differansen mellom to uavhengige stokastiske variable er krysskorrelasjonen av deres fordelinger.

Kontinuerlige sannsynlighetsfordelinger

[rediger | rediger kilde]
Normalfordelingen er en kontinuerlig sannsynlighetsfordeling, definert som en kontinuerlig funksjon i alle punkter.

Kontinuerlige sannsynlighetsfordelinger er fordelinger der sumfunksjonen også er kontinuerlig. Dette betyr også at P[ X = x ] = 0 for alle verdier x i . Fra en grenseverdibetraktning: når antallet mulige verdier for X går mot uendelig må sannsynligheten for enkeltutfall X gå mot null. En kontinuerlig sannsynlighetsfordeling av en variabel er gitt ved en funksjon f(x) der

Sannsynligheten for at X er i intervallet [a,b] er:

Liste over viktige sannsynlighetsfordelinger

[rediger | rediger kilde]

Diskrete fordelinger

[rediger | rediger kilde]

Endelig støtte

[rediger | rediger kilde]
  • Bernoulli-fordeling, som har verdi 1 med sannsynlighet p og verdi 0 med sannsynlighet q = 1 − p.
  • Rademacher-fordeling, som har verdi 1 med sannsynlighet 1/2 og verdi −1 sannsynlighet 1/2.
  • Binomisk fordeling som gir antall treff i en rekke uavhengige Ja/Nei-tester.
  • Uniform fordeling der alle elementene i et endelig sett har samme sannsynlighet. Tilnærmet riktig for mynt og terningkast o.l.
  • Hypergeometrisk fordeling, beskriver sannsynligheten for treff i de første m tester på en serie n dersom vi vet at totalt antall treff i m er n. Brukes for eksempel for å vurdere test av produkter ved utvalg fra varepartier.

Uendelig støtte

[rediger | rediger kilde]
  • Boltzmann-fordeling, som brukes innen fysikk for å beskrive diskrete energinivåer i systemer i termisk likevekt.
  • Geometrisk fordeling er en diskret stokastisk sannsynlighetsfordeling hvor den stokastiske variable beskriver antall forsøk til første gang et gitt treff skjer.
  • Poissonfordeling beskriver antaller treff i en fast tidsperiode dersom treffene skjer med en kjent gjennomsnittsverdi og er uavhengig av tiden siden siste hendelse. Kan brukes for eksempel for radioaktiv nedbrytning, fødselsstatistikk og køberegninger.
  • Logaritmisk fordeling

Kontinuerlige fordelinger

[rediger | rediger kilde]

Støtte på et ikke-uendelig intervall

[rediger | rediger kilde]

Støtte på halvt uendelig intervall, vanligvis [0,∞)

[rediger | rediger kilde]
  • Kjikvadratfordeling, som er summen av kvadrater av n uavhengige Gaussiske stokastiske variable. Er en bestemt variant av gammafordelingen som brukes til å måle godhet i tilpasning for eksempel ved minste kvadraters metode
  • Eksponentialfordeling beskriver tid mellom uavhengige på hverandre følgende stokastiske hendelser, for eksempel driftsavbrudd.
  • Gammafordelingen, beskrive tid til n uavhengige på hverandre følgende stokastiske hendelser har intruffet.
  • log-normal fordeling beskriver variable som er satt sammen av produktet av mange uavhengige positive variabler.
  • Weibullfordeling, der eksponentialfordeling er et spesialtilfelle brukes for levetidsforventningsberegninger for utstyr (en: MTBF Mean time Between Failure).

Støtte for alle intervall

[rediger | rediger kilde]
  • Cauchy-fordeling, er en funksjon som ikke har en forventningsverdi eller varians; forbindes med systemer som energifordeling ved resonans.
  • Laplace-fordeling Som er spissere ved forventningsverdien og har bredere skuldre enn normalfordelingen.
  • Normalfordeling kalles også Gauss-fordeling. Gjelder for en rekke naturlige variasjoner som fordeler seg rundt en middelverdi i en populasjon, for eksempel høyde, intelligens, naturlig variasjon i toleranse osv. – modellert som en sum av mange uavhengig variable og gir en velkjent klokkeformet kurve.

Eksterne lenker

[rediger | rediger kilde]