Virhemarginaali ja luottamusväli

Päivitetty 27.9.2018

Aina ei ole mahdollista tai järkevää kerätä dataa koko kiinnostuksen kohteena olevasta joukosta (perusjoukko). Jos dataa kerätään vain osasta perusjoukkoa, niin tällöin puhutaan otoksesta tai näytteestä:

  • Otos tarkoittaa sattumanvaraisesti, esimerkiksi arpomalla, poimittua perusjoukon osaa. Mitä isompi otos sitä varmemmin otos edustaa koko perusjoukkoa. Epävarmuus seuraa niin kutsutusta otantavirheestä. Mitä pienempi otos sitä suurempi otantavirhe.
  • Näyte on perusjoukon osa, jota ei ole poimittu sattumanvaraisesti. Näyte ei lähtökohtaisesti edusta koko perusjoukkoa. Jos näytteen tuloksia yleistetään perusjoukkoon, niin näytteen edustavuus on erikseen perusteltava. Perustelu tehdään kuvaamalla tarkasti näytteen keruumenetelmä ja selittämällä millä perusteella se tuottaa perusjoukkoa edustavan näytteen.

Virhemarginaali ilmaisee otantavirheestä seuraavan epävarmuuden suuruuden. Virhemarginaalia voidaan varauksin käyttää myös näytteen tapauksessa, jos näytteen voidaan perustellusti olettaa edustavan perusjoukkoa.

Kyselytutkimuksissa kato usein hankaloittaa yleistämistä perusjoukkoon. Kato tarkoittaa otokseen valittuja, jotka syystä tai toisesta eivät vastaakaan kyselyyn. Jos vastaamatta jättäneet ovat kyselytutkimuksen keskeisten kysymysten kannalta erilaisia kuin vastanneet, niin tämä vinouttaa otoksen. Virhemarginaali huomioi otantavirheen aiheuttaman epävarmuuden, mutta ei huomioi kadon aiheuttamaa epävarmuutta. Jos kato on iso, niin virhemarginaaleihin on suhtauduttava varauksella.

Keskiarvon virhemarginaali ja luottamusväli

Otoksesta laskettu keskiarvo ei yleensä ole saman suuruinen kuin perusjoukon keskiarvo. Jos muuta tietoa ei ole, niin otoskeskiarvo on paras arvio perusjoukon keskiarvoksi. Arvion epävarmuuden ilmaisen virhemarginaalina. Lasken keskiarvon virhemarginaalin Excelin CONFIDENCE.T (LUOTTAMUSVÄLI.T) -funktiolla. Annan funktiolle kolme argumenttia

  1. 5 % (jos lasken 95 % virhemarginaalin)
  2. otoksen keskihajonta
  3. otoskoko.

Esimerkki:  Eräästä ammattiryhmästä valittiin 200 henkilön satunnaisotos. Henkilöiltä kysyttiin kesän aikana lomamatkoihin käytettyä rahamäärää. Otoksen keskiarvoksi laskettiin 562 € ja keskihajonnaksi 119 €. Virhemarginaaliksi saan funktiolla =CONFIDENCE.T(5 %;119;200) noin 17 €. Virhemarginaalin avulla voin laskea luottamusvälin alarajan 562-17=545 ja ylärajan 562+17=579. Tämä tarkoittaa sitä, että 95 % varmuudella perusjoukon keskiarvo on välillä 545 € – 579 €. Tuloksen voin raportoida esimerkiksi seuraavasti:

Ammattiryhmän jäsenet (n=200) käyttivät kesän aikana lomamatkoihin keskimäärin 562 € (keskiarvo). Keskiarvon 95 % luottamusväli on 545 € – 579 €.

Voit käyttää laskentaan myös laatimaani laskentapohjaa tiedostossa otantavirhe.xlsx. Laskentapohjaan kopioit otoskoon, keskiarvon ja keskihajonnan.

Lisätietoa artikkeleissa Keskiarvon virhemarginaali ja Keskiarvon virhemarginaali – lisätietoa.

Prosenttiosuuden virhemarginaali ja luottamusväli

Otoksesta laskettuun prosenttiosuuteen pätee vastaava päättely kuin keskiarvoonkin. Prosenttiosuuden 95 % virhemarginaalin lasken kaavalla

luotettavuus1

Kaavassa n tarkoittaa otoskokoa ja p otoksesta laskettua prosenttiosuutta desimaalimuodossa. Jos np>10 ja n(1−p)>10, niin voin pitää kaavan antamaa arviota hyvänä. Jos esimerkiksi otoskoko on 100, niin kaava antaa hyviä arvioita virhemarginaalille prosenttiosuuden ollessa 10 % ja 90 % välillä. Monissa lähteissä ehdosta esitetään lievempi versio np>5 ja n(1-p)>5.

Esimerkki: Uuden ydinvoimalan kannattajien osuus oli 800 henkilön kyselytutkimuksessa 40,8 %. Virhemarginaaliksi lasken

luotettavuus2

Virhemarginaali on siis 3,4 %-yksikköä ja 95 % luottamusväli on 37,4 % – 44,2 %. Tärmä tarkoittaa sitä että 95 % varmuudella todellinen prosenttiosuus sisältyy luottamusväliin 37,4 % – 44,2 %. Tuloksen voin raportoida esimerkiksi seuraavasti:

Otoksen (n=800) perusteella uuden ydinvoimalan kannattajien osuus oli 95 % varmuudella 37,4 % – 44,2 %.

Voit käyttää laskentaan myös laatimaani laskentapohjaa tiedostossa otantavirhe.xlsx. Laskentapohjaan kopioit otoskoon ja prosenttiosuuden.

Lisätietoa artikkelissa Prosenttiosuuden luottamusväli.

Mainokset