Korrelaatio

Päivitetty 18.1.2017

Hajontakaavio

Hajontakaavio on hyvä havainnollistaja kahden määrällisen muuttujan riippuvuudelle. Käytän esimerkkinä dataa, jossa on kolme muuttujaa: opiskelijan läsnäolo lähiopetustunneilla, suoritettujen harjoitustehtävien lukumäärä ja tentin pistemäärä. Löydät datan tiedostosta korrelaatio.xlsx.  Haluan selvittää onko lähiopetustunneille osallistumisella ja suoritettujen harjoitustehtävien lukumäärällä yhteyttä tentin pistemäärään.

Saan havainnollisen kuvan asiasta laatimalla hajontakaaviot. Excelissä hajontakaavio on nimeltään Scatter (Piste). Läsnäolon ja tenttipisteiden välisessä hajontakaaviossa en näe merkittävää yhteyttä, vaan havaintopisteet ovat melko satunnaisesti jakautuneet.

korrelaatio1

Suoritetut harjoitustehtävät sen sijaan näyttävät olevan positiivisessa yhteydessä tenttipistemäärään. Hajontakaaviossa tämä näkyy selvästi nousevana pisteparvena. Alhaiset harjoitustehtävien määrät näyttävät liittyvän alhaisiin tenttipistemääriin ja korkeat harjoitustehtävien määrät näyttävät liittyvän korkeisiin tenttipistemääriin.

korrelaatio2

Pearsonin korrelaatiokerroin

Pearsonin korrelaatiokerroin on tunnusluku suoraviivaisen riippuvuuden voimakkuudelle. Korrelaatiokertoimesta puhuttaessa yleensä tarkoitetaan juuri Pearsonin korrelaatiokerrointa, mutta muulla tavalla laskettavia korrelaatiokertoimiakin on olemassa. Excelissä voin laskea korrelaation CORREL (KORRELAATIO) -funktiolla. Funktion ensimmäiseksi argumentiksi annan viittauksen ensimmäisen muuttujan arvoihin ja toiseksi argumentiksi viittauksen toisen muuttujan arvoihin.

Korrelaatiokertoimen arvo voi olla mitä tahansa -1 ja +1 väliltä. Lähellä nollaa olevat kertoimet liittyvät tilanteisiin, joissa ei ole suoraviivaista riippuvuutta. Lähellä +1 olevat kertoimet viittaavaat positiiviseen riippuvuuteen (nouseva pisteparvi hajontakaaviossa) ja lähellä -1 olevat kertoimet viittaavat negatiiviseen riippuvuuteen (laskeva pisteparvi hajontakaaviossa).

korre

Esimerkkiaineistossa läsnäolon ja tenttipistemäärän välinen korrelaatiokerroin on 0,275 ja harjoitusten ja tenttipistemäärän välinen korrelaatiokerroin on 0,844. Korrelaatiokertoimet siis kertovat samaa kuin hajontakaaviot.

Lisätietoa

Tämän oppii vain tekemällä itse. Harjoittele ja tutustu lisäesimerkkeihin työkirjassa korrelaatio.xlsx.

Korrelaatikertoimen tulkinta vaatii ajatustoimintaa. Lue lisää aiheesta Korrelaatiokertoimen tulkinta.

Mainokset