Me kaikki tiedämme totuuden ”Korrelaatio ei tarkoita syy-yhteyttä”, mutta kun näemme viistoina viistot, palkit nousevat yhdessä tai pisteet hajontapiiriryhmässä, data käytännössä kerjää Haluamme uskoa, että sellainen on olemassa.
Tilastollisesti emme kuitenkaan voi tehdä sitä harppausta. Kaaviot, jotka osoittavat läheistä korrelaatiota, luottavat usein visuaaliseen salin temppuun suhde. Harvard Law Schoolin JD-opiskelija ja väärennettyjen korrelaatioiden kirjoittaja Tyler Vigen on harrastanut tätä urheilua verkkosivustollaan, joka kuvaa farsikorrelaatioita – esimerkiksi Yhdysvaltain asukasta kohden margariinin kulutuksen ja avioeroprosentin välillä Mainen.
Vigen on ohjelmoinut sivustonsa niin, että kuka tahansa voi löytää ja kartoittaa järjettömiä korrelaatioita suurista tietojoukoista. Kokeilimme muutamia omiamme ja keksimme nämä helmet:
Vaikka tällaisten järjettömien esimerkkien löytäminen ja selittäminen on helppoa, kohtaat todennäköisesti väärennettyjä, mutta tavallisia ble kaavioita päivittäisessä työssäsi. Tässä on kolme tyyppiä, joita johtajien tulisi varoa:
Omenat ja appelsiinit vertaamalla erilaisia muuttujia
Y-akseliasteikot, jotka mittaavat eri arvoja, voivat näyttää samanlaisia käyriä, joita ei pidä yhdistää. Tästä tulee haitallista, kun arvot näyttävät liittyvän toisiinsa.
On parasta piirtää ne erikseen.
Vino asteikko Manipuloimalla alueita tietojen tasaamiseksi
Vaikka Y-akselit mittaavat samaa luokkaa, asteikon muuttaminen voi muuttaa viivoja korrelaation ehdottamiseksi. Nämä RetailCon kuukausitulojen Y-akselit eroavat alueittain ja suhteellisesti.