Merkitsevyys

Päivitetty 27.9.2018

Aina ei ole mahdollista tai järkevää kerätä dataa koko kiinnostuksen kohteena olevasta joukosta (perusjoukko). Jos dataa kerätään vain osasta perusjoukkoa, niin tällöin puhutaan otoksesta tai näytteestä:

  • Otos tarkoittaa sattumanvaraisesti, esimerkiksi arpomalla, poimittua perusjoukon osaa. Mitä isompi otos sitä varmemmin otos edustaa koko perusjoukkoa. Epävarmuus seuraa niin kutsutusta otantavirheestä. Mitä pienempi otos sitä suurempi otantavirhe.
  • Näyte on perusjoukon osa, jota ei ole poimittu sattumanvaraisesti. Näyte ei lähtökohtaisesti edusta koko perusjoukkoa. Jos näytteen tuloksia yleistetään perusjoukkoon, niin näytteen edustavuus on erikseen perusteltava. Perustelu tehdään kuvaamalla tarkasti näytteen keruumenetelmä ja selittämällä millä perusteella se tuottaa perusjoukkoa edustavan näytteen.

Otoksista lasketut ryhmien väliset erot tai riippuvuudet eivät välttämättä ole yleistettävissä perusjoukkoon, josta otos on poimittu. Yleistäminen perusjoukkoon on perusteltua, jos ero tai riippuvuus on tilastollisesti merkitsevä.

Tilastollinen merkitsevyys selviää p-arvosta.

P-arvo on todennäköisyys sille, että laskettu ero/riippuvuus on pelkästään otantavirhettä. Mitä pienempi p-arvo sitä enemmän eron/riippuvuuden yleistäminen perusjoukkoon saa tukea. Vakiintuneen tavan mukaan alle 0,050 (5,0 %) suuruisia p-arvoja pidetään yleensä riittävän pieninä eron/riippuvuuden yleistämiseksi perusjoukkoon. P-arvo on hyvä raportoida kolmella desimaalilla. Pienet p-arvot raportoidaan p < 0,001.

Lisätietoa artikkelissa p-arvo.

P-arvoa voidaan varauksin käyttää myös näytteen tapauksessa, jos näytteen voidaan olettaa edustavan perusjoukkoa.

Kyselytutkimuksissa kato usein hankaloittaa yleistämistä perusjoukkoon. Kato tarkoittaa otokseen valittuja, jotka syystä tai toisesta eivät vastaakaan kyselyyn. Jos vastaamatta jättäneet ovat kyselytutkimuksen keskeisten kysysysten kannalta erilaisia kuin vastanneet, niin tämä vinouttaa otoksen. P-arvo huomioi otantavirheen vaikutuksen, mutta ei huomioi kadon vaikutusta. Jos p-arvoja käytetään kyselytutkimuksessa, jossa on iso kato, niin p-arvoihin on suhtauduttava varauksella.

Merkitsevyyden selvittämistä p-arvon perusteella kutsutaan merkitsevyyden testaamiseksi. Erilaisiin käyttötilanteisiin liittyville testeille on annettu omat nimet. Seuraavassa luettelen yleisimmät käyttötilanteet ja niihin sopivat testit.

Kahden riippumattoman otoksen t-testi

Kahden riippumattoman otoksen t-testillä testataan onko kahden otoksen/ryhmän keskiarvojen välillä merkitsevä ero. Vertailtavien ryhmien täytyy olla toisistaan riippumattomat.

Esimerkki: Tutkittavana oli kaksi toisistaan riippumatonta koehenkilöotosta. Toiselta otokselta mitattiin reaktioajat raittiina ja toiselta alkoholin vaikutuksen alaisena. Otoksista lasketut reaktioaikojen keskiarvot kertovat, oliko otosten välillä eroa reaktioajoissa. Mahdollisen eron yleistettävyys otosten ulkopuolelle riippuu p-arvosta.

Voit laskea p-arvon käyttäen valmista laskentapohjaa tiedostossa otantavirhe.xlsx. Laskentapohjaan kopioit tai kirjoitat molempien otosten otoskoot, keskiarvot ja keskihajonnat.

Testin tuloksena voisin raportoida esimerkiksi seuraavasti: Raittiiden reaktioajat (keskiarvo = 0,205; keskihajonta = 0,020; n = 15 ) poikkesivat alkoholia nauttineiden reaktioajoista (keskiarvo = 0,237; keskihajonta = 0,035; n = 15). Ero osoittautui merkitseväksi riippumattomien otosten t-testillä: t(22) = -3,045; p = 0,006; 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(22) = -3,045. Testimuuttujan arvon ja vapausasteluvun saat käyttämällä valmista laskentapohjaa tiedostossa otantavirhe.xlsx. Edellä käyttämäni esimerkin datan löydät tiedostosta reaktiodata.xlsx.

Lisätietoa artikkelissa Kahden riippumattoman otoksen vertailu.

Kahden riippuvan otoksen t-testi eli parittainen t-testi

Kahden riippuvan otoksen t-testillä testataan onko kahden toisiaan pareittain vastaavan otoksen/ryhmän välinen ero merkitsevä. Eroa tarkastellaan parien välisten erojen keskiarvona, joka voidaan laskea myös otosten keskiarvojen erotuksena.

Esimerkki: Koehenkilöotokselta mitattiin reaktioajat raittiina ja samoilta koehenkilöiltä reaktioajat alkoholin vaikutuksen alaisena. Jos otoksesta laskettu reaktioaikojen erojen keskiarvo poikkeaa nollasta, niin se osoittaa reaktioaikojen eron raittiina ja alkoholin vaikutuksen alaisena. Mahdollisen eron yleistettävyys otosten ulkopuolelle riippuu p-arvosta.

Voit laskea p-arvon käyttäen valmista laskentapohjaa tiedostossa otantavirhe.xlsx. Laskentapohjaan kopioit  tai kirjoitat molempien otosten otoskoot (riippuvien otosten tapauksessa otoskoot ovat aina samansuuruiset), keskiarvot, keskihajonnat,erojen keskiarvon ja erojen keskihajonnan.

Testin tuloksena voisin raportoida esimerkiksi seuraavasti: Reaktioaikojen keskiarvo ilman alkoholia 0,226 (keskihajonta = 0,025; n = 15) oli pienempi kuin keskiarvo alkoholin vaikutuksen alaisena 0,243 (keskihajonta = 0,023; n = 15). Ero osoittautui riippuvien otosten t-testillä merkitseväksi: t(14) = 5,621; p < 0,001; 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(14) = 5,621. Testimuuttujan arvon ja vapausasteluvun saat käyttämällä valmista laskentapohjaa tiedostossa otantavirhe.xlsx. Edellä käyttämäni esimerkin datan löydät tiedostosta reaktiodata.xlsx.

Lisätietoa artikkelissa Kahden riippuvan otoksen vertailu.

Khiin neliö -testi

Khiin neliö -testillä testataan onko ristiintaulukoitujen muuttujien välillä merkitsevää riippuvuutta.

Esimerkki: Työntekijäkyselyssä miesten joukossa oli suhteessa enemmän työympäristöön tyytymättömiä kuin naisten joukossa. Jos kyseessä oli otos, niin tulos kertoo vain otoksesta. Yleistettävyys otoksen ulkopuolelle riippuu p-arvosta.

merkitsevyys1

Voit laskea p-arvon kopioimalla tai kirjoittamalla otoksesta lasketut lukumäärät valmiiseen laskentapohjaan tiedostossa otantavirhe.xlsx.

Testin tuloksena voisin raportoida esimerkiksi seuraavasti: Miesten (n = 63) ja naisten (n = 19) mielipiteet poikkesivat merkitsevästi toisistaan. Khiin neliö -testin mukaan Χ²(2) = 10,59; p=0,005.

Tieteellisessä tekstissä khiin neliö -testimuuttujan Χ² arvo täytyy ilmoitetaan yhdessä vapausasteluvun df kanssa: Χ²(2) = 10,59. Testimuuttujan arvon ja vapausasteluvun saat käyttämällä valmista laskentapohjaa tiedostossa otantavirhe.xlsx.

Lisätietoa artikkelissa Ristiintaulukointi ja khiin neliö testi.

Korrelaatiokertoimen testaus

Korrelaatiokertoimen testauksella testataan onko kahden muuttujan välinen korrelaatio merkitsevä.

Esimerkki: Yritysasiakkaista poimittiin otos ja kysyttiin yritysasiakkaiden mielikuvia tavarantoimittajasta asteikolla 0 – 10. Mielikuvat eri osa-alueista korreloivat vaihtelevasti yleiseen tyytyväisyyteen. Korrelaatiokertoimet pätevät sellaisenaan vain otokseen. Yleistettävyys kaikkiin yritysasiakkaisiin riippuu kuhunkin korrelaatiokertoimeen liittyvästä p-arvosta.

Voit laskea p-arvoja käyttäen valmista laskentapohjaa tiedostossa otantavirhe.xlsx. Laskentapohjaan kopioit tai kirjoitat otoskoon ja korrelaatiokertoimen.

Testin tuloksena voisin raportoida esimerkiksi seuraavasti: Mielikuva toimitusnopeudesta ja yleinen tyytyväisyys korreloivat keskenään. Korrelaatiokerroin 0,65 (n=100) on tilastollisesti merkitsevä (p < 0,001; 2-suuntainen).

Lisätietoa artikkelissa Korrelaatio – lisätietoa.

Mainokset