Wszyscy wiemy, że truizm „Korelacja nie implikuje związku przyczynowego”, ale kiedy widzimy linie nachylone razem, słupki wznoszące się razem lub punkty na wykresie rozrzutu, dane praktycznie błagają Chcemy wierzyć, że taki istnieje.
Statystycznie nie możemy jednak zrobić takiego skoku. Wykresy, które pokazują bliską korelację, często opierają się na wizualnej sztuczce salonowej, aby zasugerować związek. Tyler Vigen, student JD na Harvard Law School i autor Spurious Correlations, przedstawił to na swojej stronie internetowej, która przedstawia farsowe korelacje – na przykład między konsumpcją margaryny w USA na mieszkańca a wskaźnikiem rozwodów w Maine.
Vigen zaprogramował swoją witrynę tak, aby każdy mógł znaleźć i sporządzić wykres absurdalnych korelacji w dużych zbiorach danych. Wypróbowaliśmy kilka własnych i wymyśliliśmy następujące perełki:
Chociaż łatwo jest znaleźć i wyjaśnić takie absurdalne przykłady, prawdopodobnie napotkasz sfałszowane, ale wiarygodne w codziennej pracy. Oto trzy typy, na które menedżerowie powinni zwrócić uwagę:
Jabłka i Pomarańcze Porównanie różnych zmiennych
Skale osi Y, które mierzą różne wartości, mogą przedstawiać podobne krzywe, których nie należy łączyć. Staje się to zgubne, gdy wartości wydają się być powiązane, ale nie są.
Najlepiej jest je sporządzić osobno.
Wykrzywione skale manipulowanie zakresami w celu wyrównywania danych
Nawet jeśli osie Y mierzą tę samą kategorię, zmiana skali może zmienić linie, sugerując korelację. Te osie Y miesięcznych przychodów RetailCo różnią się zakresem i proporcjonalnym wzrostem.