Všichni víme, že pravdivost „Korelace neznamená příčinnou souvislost“, ale když vidíme, jak se čáry svažují k sobě, pruhy stoupají společně nebo body na shluku scatterplot, data prakticky prosí nám přiřaďte důvod. Chceme věřit, že jeden existuje.
Statisticky však tento skok nemůžeme udělat. Grafy, které ukazují úzkou korelaci, se často spoléhají na trik vizuálního salónu, který naznačuje vztah. Tyler Vigen, student JD na Harvardské právnické fakultě a autor Spurious Correlations, to udělal na svém webu, který mapuje fraškovité korelace – například mezi spotřebou margarínu na obyvatele v USA a mírou rozvodovosti v Maine.
Vigen naprogramoval svůj web tak, aby kdokoli mohl najít a zmapovat absurdní korelace ve velkých souborech dat. Vyzkoušeli jsme několik vlastních a přišli s těmito skvosty:
I když je snadné najít a vysvětlit absurdní příklady, jako jsou tyto, pravděpodobně narazíte na zmanipulované, ale plausi ble grafy ve vaší každodenní práci. Tady jsou tři typy, na které by si manažeři měli dávat pozor:
Jablka a pomeranče Porovnávání různých proměnných
Váhy osy Y, které měří různé hodnoty, mohou zobrazovat podobné křivky, které by se neměly spárovat. To se stává zhoubným, když se zdá, že hodnoty spolu souvisejí, ale nejsou.
Nejlepší je zmapovat je samostatně.
Šikmé váhy manipulující s rozsahy k zarovnání dat
I když osy Y měří stejnou kategorii, změna měřítka může změnit čáry a navrhnout korelaci. Tyto osy Y pro měsíční tržby RetailCo se liší rozsahem a proporcionálním nárůstem.