Attenzione alle correlazioni spurie

Conosciamo tutti la verità lapalissiana “La correlazione non implica causalità”, ma quando vediamo linee che si inclinano insieme, barre che si sollevano insieme o punti su un cluster di grafici a dispersione, i dati praticamente chiedono noi per assegnare una ragione. Vogliamo credere che esista.

Statisticamente non possiamo fare questo salto, tuttavia. I grafici che mostrano una stretta correlazione si basano spesso su un trucco visivo da salotto per implicare una relazione. Tyler Vigen, uno studente di laurea magistrale presso la Harvard Law School e autore di Spurious Correlations, ne ha fatto uno scherzo sul suo sito web, che traccia correlazioni farsesche, ad esempio tra il consumo pro capite di margarina negli Stati Uniti e il tasso di divorzi nel Maine.

Vigen ha programmato il suo sito in modo che chiunque possa trovare e tracciare correlazioni assurde in set di dati di grandi dimensioni. Abbiamo provato alcuni dei nostri e abbiamo trovato queste gemme:

Sebbene sia facile individuare e spiegare esempi assurdi come questi, è probabile che ti imbatterai in trucchi ma plausi grafici ble nel tuo lavoro quotidiano. Ecco tre tipi a cui i manager dovrebbero prestare attenzione:

Mele e arance che confrontano variabili dissimili

Le scale dell’asse Y che misurano valori diversi possono mostrare curve simili che non dovrebbero essere accoppiate. Ciò diventa dannoso quando i valori sembrano essere correlati ma non lo sono.

È meglio rappresentarli separatamente.

Scale oblique che manipolano gli intervalli per allineare i dati

Anche quando gli assi Y misurano la stessa categoria, la modifica delle scale può alterare le linee per suggerire una correlazione. Questi assi Y per le entrate mensili di RetailCo differiscono per intervallo e aumento proporzionale.

Write a Comment

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *