비모수 검정과 모수 검정 중에서 선택

통계를 사용하는 대부분의 사람들은 비모수 분석보다 모수 분석에 더 익숙하다고 말할 수 있습니다. 비모수 검정은 데이터가 특정 분포를 따른다고 가정하지 않기 때문에 무 분포 검정이라고도합니다.

데이터가 다음 가정을 충족하지 않을 때 비모수 검정을 사용해야한다고 들었을 것입니다. 모수 테스트, 특히 정규 분포 데이터에 대한 가정. 멋지고 직관적 인 선택 방법처럼 들리지만 추가 고려 사항이 있습니다.

이 게시물에서는 다음을 사용해야하는시기를 결정하도록 도와 드리겠습니다.

  • 테스트 그룹에 대한 모수 분석이란.
  • 그룹 중앙값을 테스트하기위한 비모수 분석입니다.

특히 저는 제가 수행하는 비모수 테스트를 사용하는 중요한 이유에 초점을 맞출 것입니다. 충분히 자주 언급되지는 않습니다.

평균 및 중앙값의 가설 검정

비모수 검정은 모수 검정에 대한 평행 우주와 같습니다.이 표에는 Minitab에서 제공하는 관련 가설 검정 쌍이 나와 있습니다. 통계 소프트웨어 제공.

파라 메트릭 테스트 (평균)

비모수 검정 (중앙값)

1- 표본 t 검정

1- 표본 부호, 1- 표본 Wilcoxon

2- 표본 t 검정

Mann-Whitney 테스트

일원 분산 분석

Kruskal-Wallis, Mood의 중앙값 검정

요인 1 개와 차단 변수 1 개가있는 요인 DOE

Friedman 테스트

파라 메트릭 테스트를 사용하는 이유

이유 1 : 모수 검정은 치우친 분포와 비정규 분포에서 잘 수행 될 수 있습니다.

놀라 울 수 있지만 모수 검정은 다음의 표본 크기 지침을 충족하는 경우 비정규 연속 데이터로 잘 수행 될 수 있습니다. 아래 표. 이 지침은 Minitab에서 통계학자가 수행 한 시뮬레이션 연구를 기반으로합니다. 이러한 연구에 대한 자세한 내용은 기술 문서를 참조하십시오.

파라 메트릭 분석

비정규 데이터에 대한 표본 크기 지침

1- 표본 t 검정

20 초과

2- 표본 t 검정

각 그룹은 15보다 커야합니다.

일원 분산 분석

  • 2-9 개의 그룹이있는 경우 각 그룹은 15보다 커야합니다.
  • 10-12 개의 그룹이있는 경우 각 그룹은 20보다 커야합니다.

이유 2 : 매개 변수 테스트는 각 그룹의 분포가 다음과 같을 때 잘 수행 될 수 있습니다. 다름

비모수 테스트에서는 데이터가 정규 분포를 따른다고 가정하지 않지만 충족하기 어려울 수있는 다른 가정이 있습니다. 그룹을 비교하는 비모수 검정의 경우 일반적인 가정은 모든 그룹의 데이터가 동일한 산포 (분산)를 가져야한다는 것입니다. 그룹의 산포가 다른 경우 비모수 검정이 유효한 결과를 제공하지 못할 수 있습니다.

반면에 2- 표본 t 검정 또는 일원 분산 분석을 사용하는 경우 다음으로 이동하면됩니다. 옵션 하위 대화 상자를 클릭하고 등분 산 가정을 선택 취소합니다. Voilà, 그룹의 스프레드가 다른 경우에도 좋습니다!

이유 3 : 통계적 검정력

모수 적 검정은 일반적으로 비모수 적 검정보다 통계적 검정력이 더 높습니다. 따라서 실제로 존재하는 경우 중요한 효과를 감지 할 가능성이 더 높습니다.

비모수 검정을 사용하는 이유

이유 1 : 연구 영역은 중앙값으로 더 잘 표현됩니다.

p>

이것은 비모수 테스트를 사용하는 가장 좋은 이유이자 충분히 자주 언급되지 않는 이유입니다! 비정규 데이터로 모수 검정을 수행 할 수 있다는 사실이 평균이 검정하려는 통계라는 것을 의미하지는 않습니다.

예를 들어 소득과 같은 치우친 분포의 중심은 다음과 같을 수 있습니다. 50 %가 중앙값보다 높고 50 %가 낮은 중앙값으로 더 잘 측정됩니다. 표본에 억만 장자를 몇 명 추가하면 일반인의 소득이 변하지 않더라도 수학 평균이 크게 증가합니다.

분포가 충분히 치우친 경우 평균은 훨씬 큰 변화의 영향을받습니다. 중앙값은 분포의 중심을 계속해서 더 가깝게 반영하는 반면 분포의 꼬리에 있습니다. 이 두 분포의 경우 각 분포의 무작위 표본 100 개는 의미가 크게 다르지만 중앙값은 크게 다르지 않습니다.

다른 두 개의 블로그 게시물이이 점을 잘 보여줍니다.

  • 데이터 분석에서 평균 사용 : 항상 슬램 덩크는 아닙니다
  • 비모수 적 경제 : 평균은 실제로 무엇을 의미합니까?

이유 2 : 표본 크기가 매우 작습니다.

모수 테스트에 대한 표본 크기 지침을 충족하지 못하고 정규 분포를 따르는 데이터의 경우 비모수 테스트를 사용해야합니다. 샘플이 매우 작 으면 분포 테스트가 의미있는 결과를 제공 할 수있는 충분한 검정력이 부족하기 때문에 데이터 분포를 확인하지 못할 수도 있습니다.

이 시나리오에서는 유효한 대안이없는 어려운 지점. 비모수 테스트는 시작할 수있는 힘이 적고 그 위에 작은 표본 크기를 추가하면 두 배의 문제가됩니다!

이유 3 : 불가능한 순서 데이터, 순위 데이터 또는 이상 값이 있습니다. remove

일반적인 매개 변수 테스트는 연속 데이터 만 평가할 수 있으며 결과는 특이 치의 영향을 크게받을 수 있습니다. 반대로 일부 비모수 테스트는 순서 데이터, 순위 데이터를 처리 할 수 있으며 이상치의 영향을받지 않습니다. 각 테스트에는 고유 한 데이터 요구 사항이 있으므로 비모수 테스트에 대한 가정을 확인해야합니다.

리 커트 데이터가 있고 두 그룹을 비교하려면 저의 게시물 Likert 항목 데이터를 분석하는 가장 좋은 방법 : 두 샘플 T- 테스트 대 Mann-Whitney.

마지막 생각

일반적으로 데이터가 다음 가정을 충족하지 못할 때 매개 변수 테스트와 비모수 테스트 중 하나를 선택해야한다고 생각합니다. 파라 메트릭 테스트. 표본 크기가 작고 비정규 데이터가 모두있는 경우 일 수 있습니다. 그러나 모수 테스트가 종종 비정규 데이터를 처리 할 수 있기 때문에 다른 고려 사항이 종종 역할을합니다. 반대로 비모수 테스트에는 무시할 수없는 엄격한 가정이 있습니다.

결정은 종종 평균 또는 중앙값이 데이터 분포의 중심을 더 정확하게 나타내는 지 여부에 따라 달라집니다.

  • 평균이 분포의 중심을 정확하게 나타내고 표본 크기가 충분히 크면 더 강력하기 때문에 모수 검정을 고려하십시오.
  • 중앙값이 분포의 중심을 더 잘 나타내는 경우 비모수를 고려하십시오. 큰 표본이있는 경우에도 테스트합니다.

마지막으로 표본 크기가 매우 작은 경우 비모수 테스트를 사용하는 데 어려움을 겪을 수 있습니다. 가능하다면 다음에 더 많은 데이터를 수집하십시오! 보시다시피 샘플 크기 가이드 라인은 그렇게 크지 않습니다. 표본 크기가 작고 덜 효율적인 비모수 검정을 사용해야 할 때 중요한 효과가있을 때 탐지 할 가능성은 매우 적을 수 있습니다.

Write a Comment

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다