Keskiarvo ja keskihajonta

Päivitetty 23.10.2018

Keskiarvo on jakauman keskikohtaa kuvaava tunnusluku, joka lasketaan jakamalla havaintojen summa havaintojen lukumäärällä. Jos lukusuora rinnastetaan keinulautaan, niin keskiarvo on lukusuoran piste, jolla keinulauta saadaan tasapainoon. Esimerkiksi lukujen 1, 2, 3 ja 10 keskiarvo (keinulaudan tasapainopiste) on 4.

average3

Keskiarvo yksinään ei kerro mitään havaintojen vaihtelusta keskiarvon ympärillä. Tämän vuoksi keskiarvon kaveriksi lasketaan yleensä keskihajonta, joka kuvaa arvojen keskimääräistä vaihtelua keskiarvon ympärillä. Mitä isompi keskihajonta sitä enemmän havainnoissa on vaihtelua. Voin pilkkoa keskihajonnan laskennan useaan vaiheeseen:

  • Lasken kunkin havainnon poikkeaman keskiarvosta ja korotan poikkeaman toiseen potenssiin eli lasken poikkeaman neliön.
  • Lasken poikkeamien neliöt yhteen kaikkien havaintojen osalta. Tulosta kutsutaan neliösummaksi.
  • Jaan poikkeamien neliöiden summan havaintojen lukumäärällä (n) eli lasken keskimääräisen poikkeaman neliön. Jos kyseessä on otos laajemmasta joukosta, niin havaintojen lukumäärän sijasta käytän jakajana havaintojen lukumäärää vähennettynä yhdellä (n-1). Tämän teknisen korjauksen ansiosta saan paremman arvion laajemman joukon keskihajonnasta.
  • Edellisen vaiheen tulosta kutsutaan varianssiksi. Keskihajonta on varianssin neliöjuuri.

Excelissä voin laskea keskiarvon ja keskihajonnan funktioilla:

  • AVERAGE (KESKIARVO)
  • STDEV.S (KESKIHAJONTA.S), jos lasken keskihajonnan otoksesta (jakajana n-1)
  • STDEV.P (KESKIHAJONTA.P), jos lasken keskihajonnan perusjoukosta (jakajana n).

Voin laskea keskiarvon ja keskihajonnan myös suoraan pivot-kaavioon ja pivot-taulukkoon.

Tarkastelen pivotista esimerkkinä keskiarvo.xlsx -datan tyytyväisyysmuuttujia:

  • Valitsen täsmälleen yhden solun aineiston alueelta.keskiarvo1
  • Valitsen Insert (Lisää) -välilehdeltä PivotChart & PivotTable.
  • Raahaan tyytyväisyysmuuttujat yksi kerrallaan kenttäluettelon (PivotChart FieldsValues-ruutuun.
  • Vaihdan kunkin Values-ruudun kentän laskentaperusteeksi Average (Keskiarvo). Laskentaperusteen vaihtoon pääsen napsauttamalla kenttää ja valitsemalla avautuvasta valikosta Value Field Settings (Arvokentän asetukset).
  • Lopuksi raahaan Legend-ruudun  Values-palikan Axis (Categories) -ruutuun , jotta saan keskiarvot allekkain.

Pivot-taulukko kaipaa jonkin verran viimeistelyä. Voin lajitella taulukon keskiarvojen mukaiseen järjestykseen napsauttamalla hiiren kakkospainiketta jonkin keskiarvon päällä ja valitsemalla Sort (Lajittele). Viimeistelyn jälkeen taulukko voisi näyttää seuraavalta:

keskiarvo2

Vinkki: Excel ei anna kirjoittaa muuttujien nimiä pivot-taulukkoon täsmälleen samannimisinä kuin datan ylärivillä. Voin kiertää tämän rajoitteen lisäämällä nimen perään välilyönnin.

Pivot-kaavio vaatii enemmän viimeistlyä:

  • Poistan painikkeet (Analyze-välilehdeltä Field Buttons – Hide All).
  • Poistan pääotsikon ja selitteen.
  • Kaaviolajiksi vaihdan vaakapylväät.
  • Keskiarvoakselin katkaisen alkamaan arvon 1 kohdalta, koska 1 on pienin tyytyväisyysasteikon arvo.
  • Otsikoin keskiarvoakselin.
  • Lisään numeroarvot pylväisiin (Data Labels).
  • Pienennän pylväiden väliä esimerkiksi 50 prosenttiin pylvään leveydestä.
  • Muotoilujen jälkeen kaavio voisi näyttää seuraavalta:

average1

Jos kaavion muotoilu ylittää ymmärryksesi, niin kannattaa kerrata kaavioiden muotoilun perusasiat itseopiskelupaketista kaavio.xlsx.

Keskihajonnat voin laskea uuteen pivot-taulukkoon vastaavalla tavalla. Laskentaperusteeksi valitsen tällöin StdDev (Keskihajonta).

Voin kopioida keskiarvot ja keskihajonnat uuteen taulukkoon vierekkäin. Raportoitaessa keskiarvon laskennan perusteena olleiden arvojen lukumäärä (n) täytyy ilmoittaa.

keskiavo4

Taulukosta nähdään, että kaikkein tyytymättömimpiä oltiin palkkaan (keskiarvo=2,1) ja kaikkein tyytyväisimpiä työtovereihin (keskiarvo=4,1). Muiden asioiden kohdalla keskiarvot ovat lähellä mielipideasteikon keskikohtaa. Tyytyväisyys työympäristöön jakoi mielipiteitä eniten (keskihajonta=1,2). Tyytyväisyys työtovereihin jakoi mielipiteitä vähiten (keskihajonta=0,8).

Keskiarvoja ryhmittäin

Keskiarvot ja keskihajonnat voin laskea ryhmittäin ainakin kolmella eri tavalla:

  • Laskemalla tunnusluvut erikseen kullekin ryhmälle Excelin funktioilla (katso video).
  • Laskemalla tunnusluvut AGGREGATE (KOOSTE) -funktion avustuksella siten että tunnusluvut muuttuvat suodatusten mukana. Tästä lisätietoa Excelissä keskiarvo.xlsx.
  • Käyttämällä ryhmittelevää muuttujaa pivotissa. Tätä tarkastelen seuraavassa lähemmin.

Jos olen laskenut tunnuslukuja pivot-taulukkoon, niin voin tarkastella tunnuslukuja ryhmittäin raahaamalla ryhmittelevän muuttujan sarakkeisiin (Columns). Viimeistelyn jälkeen tyytyväisyys-muuttujien keskiarvot sukupuolittain voisivat näyttää seuraavalta:

keskiarvo5

Käytin Ehdollista muotoilua (Conditional Formatting) solujen värikoodaukseen. On tärkeää ilmoittaa keskiarvon perusteena olevien arvojen lukumäärät (n). Jos n-arvoissa on vaihtelua puuttuvien vastausten takia, niin riittää ilmoittaa n vähintään. Esimerkki-taulukossa naisia ei ole kuin 19 kpl. Näin pienen otoksen kohdalla keskiarvoihin täytyy suhtautua varauksella.

Jos haluan graafista havainnollistusta, niin voin käyttää pylväskaaviota:

average2

Tärkeää

Keskiarvo kuvaa hyvin jakauman keskikohtaa jos tarkasteltava muuttuja on

  • välimatka-asteikollinen (asteikko kertoo sekä havaintojen järjestyksen että havaintojen välisen etäisyyden)
  • jakaumaltaan likimain symmetrinen.

Jakauma muoto kannattaa aina tarkistaa esimerkiksi histogrammin avulla (lue Luokiteltu jakauma).

Edellä esimerkkinä käyttämäni tyytyväisyys-muuttujat eivät tarkkaan ottaen ole välimatka-asteikollisia. Tämän takia keskiarvojen käyttö tämän kaltaisten mielipidemuuttujien kohdalla usein kyseenalaistetaan. Keskiarvot kuitenkin tarjoavat kätevän tavan esittää usean mielipidemuuttujan yhteenveto pienessä tilassa. Tämä on kuitenkin vain hyvin karkean tason yhteenveto eikä voi koskaan korvata mielipidejakauman esittämistä lukumäärinä ja/tai prosentteina.

Usein kysyttyä

Miten tulkitsen keskihajonnan?

Keskihajonnasta pitäisi nähdä, onko arvojen vaihtelu keskiarvon ympärillä pientä vai suurta. Keskihajonnan tulkinta on kuitenkin vaikeaa ilman vertailukohtaa. Tulkinta onnistuu kunnolla vasta tuttujen muuttujien ja vertailukohtien myötä kuten seuraavista esimerkeistä ilmenee

  • Pullotuskoneen pullottamien pullojen sisällön määrän keskihajonta on laadunvalvonnan ottamissa otoksissa ollut yleensä likimain 0,03 desilitraa. Jos uusimmassa otoksessa keskihajonta on yllättäen 0,10 desilitraa, niin tämä viittaa pullotuskoneen toimintahäiriöön.
  • Mitattaessa mielipiteitä eri asioihin 5-portaisella mielipideasteikolla, mielipiteiden keskihajontoja voidaan vertailla toisiinsa. Suurempi keskihajonta tarkoittaa suurempaa vaihtelua vastaajien mielipiteissä. Yleensä 5-portaisen mielipideasteikon keskihajonta on melko lähellä arvoa 1.
  • Sijoittajat mittaavat pörssiosakkeiden riskiä päivätuottojen keskihajonnalla. Vuositasolle muutettu keskihajonta (sijoittajat kutsuvat sitä volatiliteetiksi) on yleensä muutamia kymmeniä prosentteja. Jos seuraat päivittäin volatilitetteja niin opit nopeasti erottamaan ison ja pienen volatiliteetin.

Miksi keskihajonta lasketaan niin kuin se lasketaan?

Keskihajonnalla/varianssilla on jatkoanalyysien kannalta hyödyllisiä matemaattisia ominaisuuksia. Keskihajonta/varianssi on tärkeä luku normaalijakaumassa, virhemarginaalien laskennassa, merkitsevyystestauksessa jne.

Lisätietoja

Tämän oppii vain tekemällä itse. Harjoittele työkirjalla  keskiarvo.xlsx.

Mainokset