Vorsicht vor falschen Korrelationen

Wir alle kennen die Binsenweisheit „Korrelation bedeutet keine Kausalität“, aber wenn wir sehen, dass Linien zusammenfallen, Balken zusammen steigen oder Punkte auf einem Streudiagramm-Cluster liegen, betteln die Daten praktisch Wir möchten glauben, dass es einen gibt.

Statistisch gesehen können wir diesen Sprung jedoch nicht machen. Diagramme, die eine enge Korrelation zeigen, stützen sich häufig auf einen visuellen Salon-Trick, um eine Beziehung zu implizieren. Tyler Vigen, ein JD-Student an der Harvard Law School und Autor von Spurious Correlations, hat dies auf seiner Website zum Sport gemacht, auf der farcicale Korrelationen dargestellt werden – zum Beispiel zwischen dem Pro-Kopf-Margarine-Konsum in den USA und der Scheidungsrate in Maine >

Vigen hat seine Site so programmiert, dass jeder absurde Korrelationen in großen Datenmengen finden und grafisch darstellen kann. Wir haben einige unserer eigenen ausprobiert und uns diese Juwelen ausgedacht:

Obwohl es leicht ist, absurde Beispiele wie diese zu erkennen und zu erklären, werden Sie wahrscheinlich auf manipulierte, aber plausible Beispiele stoßen Diagramme in Ihrer täglichen Arbeit. Hier sind drei Typen, auf die Manager achten sollten:

Äpfel und Orangen, die unterschiedliche Variablen vergleichen

Y-Achsenskalen, die unterschiedliche Werte messen, zeigen möglicherweise ähnliche Kurven, die nicht gepaart werden sollten. Dies wird schädlich, wenn die Werte in Beziehung zu stehen scheinen, dies jedoch nicht sind.

Es ist am besten, sie separat zu zeichnen.

Versetzte Skalen Bearbeiten von Bereichen zum Ausrichten von Daten

Selbst wenn Y-Achsen dieselbe Kategorie messen, können durch Ändern der Skalen die Linien geändert werden, um eine Korrelation vorzuschlagen. Diese Y-Achsen für den monatlichen Umsatz von RetailCo unterscheiden sich in Reichweite und proportionaler Steigerung.

Write a Comment

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.