疑似相関に注意してください

「相関は因果関係を意味しない」という真実は誰もが知っていますが、線が一緒に傾斜している、棒が一緒に上昇している、または散布図のクラスタリング上の点を見ると、データは実際に頼みます理由を割り当てます。存在すると信じたいのです。

統計的には、その飛躍はできません。ただし、密接な相関関係を示すグラフは、関係を暗示するために視覚的なパーラーのトリックに依存していることがよくあります。ハーバードロースクールのJD学生であり、SpuriousCorrelationsの著者であるTylerVigenは、彼のWebサイトでこれをスポーツにしています。これは、たとえば、米国の1人あたりのマーガリン消費量とメインの離婚率との相関関係を示しています。

Vigenは、誰もが大規模なデータセットで不条理な相関関係を見つけてグラフ化できるように自分のサイトをプログラムしました。私たちはいくつかの独自の方法を試し、次の宝石を思いつきました。

このようなばかげた例を見つけて説明するのは簡単ですが、不正ではあるがプラウジに遭遇する可能性がありますあなたの毎日の仕事のbleチャート。管理者が注意する必要がある3つのタイプは次のとおりです。

異なる変数を比較するリンゴとオレンジ

異なる値を測定するY軸スケールは、ペアにすべきではない同様の曲線を示す場合があります。これは、値が関連しているように見えても関連していない場合に有害になります。

個別にグラフ化することをお勧めします。

データを整列させるために範囲を操作する歪んだスケール

Y軸が同じカテゴリを測定する場合でも、スケールを変更すると、線が変更されて相関関係が示唆される場合があります。 RetailCoの月間収益のこれらのY軸は、範囲と比例的な増加が異なります。

Write a Comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です