Pas på uhyggelige korrelationer

Vi kender alle sandheden “Korrelation betyder ikke årsagssammenhæng”, men når vi ser linjer, der hælder sammen, søjler stiger sammen eller peger på en scatterplot-klynge, beder dataene næsten os til at tildele en årsag. Vi ønsker at tro, at der findes en.

Statistisk set kan vi dog ikke tage det spring. Diagrammer, der viser en tæt sammenhæng, er ofte afhængige af et visuelt parlor-trick for at antyde et forhold. Tyler Vigen, en JD-studerende ved Harvard Law School og forfatteren af Spurious Correlations, har gjort sport af dette på sin hjemmeside, der viser farciske sammenhænge – for eksempel mellem amerikansk margarinforbrug pr. Indbygger og skilsmissesatsen i Maine.

Vigen har programmeret sit websted, så alle kan finde og kortlægge absurde korrelationer i store datasæt. Vi prøvede et par af vores egne og kom med disse perler:

Selvom det er let at få øje på og forklare absurde eksempler som disse, vil du sandsynligvis støde på rigget men plausi bliv diagrammer i dit daglige arbejde. Her er tre typer, som ledere skal passe på:

Æbler og appelsiner, der sammenligner forskellige variabler

Y-akseskalaer, der måler forskellige værdier, kan vise lignende kurver, som ikke skal parres. Dette bliver skadeligt, når værdierne ser ud til at være relaterede, men ikke er.

Det er bedst at kortlægge dem separat.

Skæve skalaer, der manipulerer områder for at justere data

Selv når Y-akser måler den samme kategori, kan ændring af skalaerne ændre linjerne for at foreslå en sammenhæng. Disse Y-akser for RetailCos månedlige omsætning varierer i rækkevidde og proportional stigning.

Write a Comment

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *