Hajontaluku

tilastotieteessä todennäköisyysjakauman hajonnan eli sen satunnaismuuttujan vaihtelun mitta

Hajontaluku on tilastotieteessä todennäköisyysjakauman hajonnan eli sen satunnaismuuttujan vaihtelun mitta.[1] Yleisimpiä hajontalukuja ovat keskihajonta, varianssi, otoskeskihajonta, otosvarianssi, kvantiili ja variaatiokerroin. [2] Hajontaluvut ovat keskilukujen ohella keskeisimpiä jakaumiin liittyviä käsitteitä.[1]

Keskihajonta normaalijakauman tapauksessa: yhden keskihajonnan etäisyys keskiarvosta rajaa todennäköisyysmassasta 68,27 %, kahden keskihajonnan etäisyys 95,45 % ja kolmen keskihajonnan etäisyys 99,73 %.

Hajonnan mittaaminen

muokkaa

Hajontaluku on reaaliluku, joka saa sitä suuremman arvon mitä enemmän vaihtelua jakauman satunnaismuuttujien arvoissa esiintyy. Yleensä tämä lasketaan mittaamalla havaittujen arvojen etäisyyttä havaintoarvojen odotus- tai keskiarvosta. Käytettävän hajontaluvun valinta riippuu käyttötarkoituksesta; eri hajontaluvut sopivat eri tilanteisiin riippuen, pyritäänkö tarkastelemaan jakauman absoluuttista vaiko suhteellista hajontaa. Jos otannassa ei ole vaihtelua, hajontaluku saa arvon nolla.[1]

Joskus hajontaa kuvattaessa käytetään mittauksen kohteen kanssa samaa yksikköä. Jos mittauksen kohteen yksikkö on esimerkiksi kilogramma, myös hajonnan yksikkönä käytetään kilogrammaa. Tällöin hajontalukua voi käyttää hajonnan absoluuttisten arvojen tarkasteluun. Tällaisia hajonnan mittoja ovat:

Yksiköttömät hajontaluvut kuvaavat suhteellista hajontaa satunnaismuuttujan odotusarvoon nähden. Usein nämä voidaan ilmaista prosentteina. Tällöin on mahdollista vertailla myös eri yksiköissä ilmaistujen jakaumien hajontoja. Yksiköttömiä hajontalukuja ovat:

Muita hajontalukuja ovat:

Yleisimmät hajontaluvut

muokkaa

Varianssi

muokkaa
Pääartikkeli: Varianssi

Varianssi kuvaa, kuinka kaukana satunnaismuuttujan arvot ovat tyypillisesti sen odotusarvosta. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskimomentti. Varianssin neliöjuurta sanotaan keskihajonnaksi.

Diskreetin jakauman varianssi lasketaan kaavalla

 , jossa X on satunnaismuuttuja ja μ on sen odotusarvo tai keskiarvo.[3]

Jatkuvan jakauman varianssi lasketaan kaavalla  .[3][1]

Keskihajonta

muokkaa
Pääartikkeli: Keskihajonta

Satunnaismuuttujan standardipoikkeama eli keskihajonta kuvaa keskimääräistä poikkeamaa odotusarvosta. Keskihajonta on varianssin neliöjuuri:  .[2][3] Etuna varianssiin nähden on tulkinnan helppous, sillä keskihajonnan asteikko vastaa mittausten asteikkoa.

Otosvarianssi

muokkaa

Otosvarianssi on varianssi, joka lasketaan suuremman joukon osajoukosta. Kun n lukuarvon joukko   on suuremman joukon Y osajoukko, tämän otosvarianssi on  , missä   on tutkittavan muuttujan y keskiarvo.[3]

Otoshajonta

muokkaa
Pääartikkeli: Otoshajonta

Otoksen   keskihajonnan harhaton lähde? estimaatti eli otoshajonta on otosvarianssin neliöjuuri:

 .[3]

Kvantiiliväli

muokkaa

Kvantiilit ovat satunnaismuuttujan kertymäfunktiolta säännöllisin välein poimittuja prosenttipisteitä. Satunnaismuuttujan    -kvantiili  ,  , on luku, joka toteuttaa ehdot   ja .[1]

Jakamalla todennäköisyysjakauman kertymäfunktio q kappaleeseen yhtä suuria joukkoja saadaan q-kvantiili. Osalle kvantiileista on vakiintuneet nimet: 100-kvantiilit ovat persentiilejä, 10-kvantiilit ovat desiilejä, 5-kvantiilit ovat kvintiilejä, ja 4-kvantiilit ovat kvartiileja. Kvantiilien avulla on mahdollista muodostaa kvantiiliväli, joka kuvaa todennäköisyyttä, jolla satunnaismuuttuja saa arvot kahden eri kvantiilin välillä.[1]

Variaatiokerroin

muokkaa

Variaatiokerroin on hajontaluku, joka ei ole mittayksikköön sidottu. Variaatiokertoimen avulla on mahdollista vertailla kahden eri mitta-asteikolla mitatun jakauman hajontoja. Variaatiokerroin   on määritelty keskihajonnan   ja keskiarvon   osamääränä:

 .[4][1]

Vaihteluväli

muokkaa

Vaihteluväli on järjestys-, välimatka- ja suhdeasteikon muuttujille sopiva hajontaluku. Se kuvaa pienimmän ja suurimman muuttujan välin  , joka lasketaan näiden arvojen erotuksena  .[2][1]

Käyttötarkoituksia

muokkaa

Hajonnan avulla on mahdollista saada kattavampi käsitys satunnaismuuttujan todennäköisimmistä arvoista. Esimerkiksi joukkojen   ja  lukuja arpomalla saadaan alkioiden arvojen yhtäsuuresta odotusarvosta huolimatta hyvin erilaisia tuloksia. Tunnettujen hajontalukujen avulla onkin mahdollista arvioida erilaisten tapahtumien todennäköisyyksiä, mikä on keskeistä muun muassa riskienhallinnassa.

Fysiikassa, kemiassa ja muissa mitattavissa luonnontieteissä mittaustulosten vaihtelua tarkastelemalla on mahdollista arvioida koetulosten luotettavuutta.

Biologiassa populaation ominaisuuksien määrittämisessä on keskeistä huomioida havaittujen ominaisuuksien vaihtelu.

Rahoitusmatematiikassa portfolion odotetun tuoton varianssi ja keskihajonta kuvaavat sijoitukseen kohdistuvaa riskiä. Mitä pienempi hajonta on, sitä todennäköisemmin sijoituksesta saatu tuotto vastaa sen odotusarvoa ja sitä houkuttelevampi sijoituskohde on.

Taloustieteessä, rahoituksessa ja muissa tieteissä hajontaa pyritään selittämään regressioanalyysillä, joka kuvaa muuttujan saamia arvoja suhteessa toiseen muuttujaan.[5]

Katso myös

muokkaa

Lähteet

muokkaa
  1. a b c d e f g h Milton, J.S., Arnold, J.C.: Introduction to Probability and Statistics. McGraw-Hill Inc., 1995.
  2. a b c Hajontaluvut Yhteiskuntatieteellinen tietoarkisto. 31.08.2003. Tampereen yliopisto. Viitattu 10.4.2015.
  3. a b c d e Ilkka Mellin: Tilastolliset menetelmät: Kaavat. TKK, 2006.
  4. Nummenmaa, Lauri: Käyttäytymistieteiden Tilastolliset Menetelmät. Tammi, 2004. ISBN 951-26-5203-X
  5. Alan O. Sykes: Introduction to Regression Analysis The Inaugural Coase Lecture. Arkistoitu 7.2.2015. Viitattu 10.04.2015.

Aiheesta muualla

muokkaa