Vi vet alle sannheten «Korrelasjon innebærer ikke årsakssammenheng», men når vi ser linjer som skråner sammen, søyler som stiger sammen eller peker på en klynging av et scatterplot, ber dataene praktisk talt oss til å tildele en grunn. Vi ønsker å tro at en eksisterer.
Statistisk sett kan vi imidlertid ikke ta det spranget. Diagrammer som viser en nær sammenheng er ofte avhengige av et visuelt salongtriks for å antyde et forhold. Tyler Vigen, en JD-student ved Harvard Law School og forfatteren av Spurious Correlations, har gjort sport av dette på sin nettside, som kartlegger farsekorrelasjoner – for eksempel mellom amerikansk margarinforbruk per innbygger og skilsmissesatsen i Maine.
Vigen har programmert nettstedet sitt slik at hvem som helst kan finne og kartlegge absurde korrelasjoner i store datasett. Vi prøvde noen få av våre egne og fant på disse perlene:
Selv om det er lett å få øye på og forklare absurde eksempler som disse, vil du sannsynligvis støte på rigget, men plausi ble diagrammer i ditt daglige arbeid. Her er tre typer ledere som bør passe på:
Epler og appelsiner som sammenligner forskjellige variabler
Y-akseskalaer som måler forskjellige verdier, kan vise lignende kurver som ikke skal sammenkobles. Dette blir skadelig når verdiene ser ut til å være relatert, men ikke er det.
Det er best å kartlegge dem separat.
Skewed Scales Manipulating Ranges to Align Data
Selv når Y-akser måler samme kategori, kan endring av skalaene endre linjene for å foreslå en sammenheng. Disse Y-aksene for RetailCos månedlige inntekt varierer i rekkevidde og proporsjonal økning.