Știm cu toții adevărul „Corelația nu implică cauzalitate”, dar când vedem linii înclinate împreună, bare ridicându-se împreună sau puncte pe un cluster de dispersie, datele practic imploră ne atribuie un motiv. Vrem să credem că există.
Cu toate acestea, statistic, nu putem face acel salt. Diagramele care arată o corelație strânsă se bazează adesea pe un truc vizual pentru a implica o relație. Tyler Vigen, student JD la Harvard Law School și autorul Spurious Correlations, a făcut sport de acest lucru pe site-ul său web, care prezintă corelații farsice – de exemplu, între consumul de margarină SUA pe cap de locuitor și rata divorțului în Maine.
Vigen și-a programat site-ul astfel încât oricine să poată găsi și grafica corelații absurde în seturi mari de date. Am încercat câteva dintre noi și am venit cu aceste pietre prețioase:
Deși este ușor de observat și de explicat exemple absurde de genul acesta, probabil că veți întâlni plăci, dar plăcute diagrame în munca ta de zi cu zi. Iată trei tipuri pe care ar trebui să le aibă grijă managerii:
Mere și portocale Comparând variabile diferite
Scalele axei Y care măsoară valori diferite pot afișa curbe similare care nu ar trebui asociate. Acest lucru devine periculos atunci când valorile par a fi corelate, dar nu sunt.
Cel mai bine este să le graficați separat.
Scale înclinate Manipularea gamelor pentru alinierea datelor
Chiar și atunci când axele Y măsoară aceeași categorie, schimbarea scalelor poate modifica liniile pentru a sugera o corelație. Aceste axe Y pentru veniturile lunare ale RetailCo diferă în ceea ce privește intervalul și creșterea proporțională.