우리는 모두 “상관 관계가 인과 관계를 의미하지 않습니다.”라는 트루 이즘을 알고 있지만 선이 함께 기울어 지거나 막대가 함께 솟아 오르거나 산점도 클러스터링의 점을 볼 때 데이터가 실제로 구걸합니다. 우리는 이유를 지정합니다. 우리는 하나가 존재한다고 믿고 싶습니다.
통계적으로 우리는 그 도약을 할 수 없습니다. 밀접한 상관 관계를 보여주는 차트는 종종 시각적 인 팔러 트릭에 의존하여 관계를 암시합니다. Harvard Law School의 JD 학생이자 Spurious Correlations의 저자 인 Tyler Vigen은 자신의 웹 사이트에서이를 스포츠로 만들었습니다. 예를 들어 미국의 1 인당 마가린 소비량과 메인주의 이혼율 사이의 극적 상관 관계를 차트로 보여줍니다.
Vigen은 누구나 대규모 데이터 세트에서 어리석은 상관 관계를 찾고 차트로 만들 수 있도록 자신의 사이트를 프로그래밍했습니다. 우리는 몇 가지를 시도하여 다음과 같은 보석을 만들었습니다.
이런 터무니없는 예를 찾아서 설명하는 것은 쉽지만, 조작이 가능하지만 그럴듯한 당신의 일상 업무에서 ble 차트. 관리자가주의해야 할 세 가지 유형은 다음과 같습니다.
다른 변수를 비교하는 Apple 및 Oranges
다른 값을 측정하는 Y 축 눈금은 짝을 이루어서는 안되는 유사한 곡선을 표시 할 수 있습니다. 값이 서로 관련이있는 것처럼 보이지만 그렇지 않은 경우 위험합니다.
개별적으로 차트를 작성하는 것이 가장 좋습니다.
데이터를 정렬하기 위해 범위를 조작하는 비뚤어진 척도
Y 축이 동일한 범주를 측정하더라도 척도를 변경하면 상관 관계를 제시하기 위해 선이 변경 될 수 있습니다. RetailCo의 월별 수익에 대한 이러한 Y 축은 범위와 비례 증가에 따라 다릅니다.