비모수 통계

From Hidden Wiki
Jump to navigation Jump to search
필독 사항 유닠스 계열 저작물, 성인물, 도박 웹 써버 보안 프로그래밍 그래핔 파싱
필독 사항 고스트BSD 표면 웹 싸이트 제작 리눅스 마스터 파이썬 트킨터 뷰티펄 숲
수학 아이투피 마약, 아청물, 해킹 웹 싸이트 보안 웹 프로그래밍 데이터 분석 게임 제작
통계학 뮤와이어 다크넽 싸이트 제작 정보 보안 기사 쟁고우 팬더즈 파이게임

비모수 통계(非母數統計, Non-parametric statistics)는 통계학에서 모수에 대한 가정을 전제로 하지 않고 모집단의 형태에 관계없이 주어진 데이터에서 직접 확률을 계산하여 통계학적 검정을 하는 분석법이다. 비모수적(Non-parametric), 비모수검정법 혹은 분포무관(Distribution-free)검정법이라고도 한다.


모수 통계 (Parametric statistics)

비모수 통계 (Nonparametric statistics)

비모수 통계법 사용의 조건

  • 자료가 나타내는 모집단의 현상이
 정규분포가 아닐 때
  • 자료가 나타내는 모집단의 현상이
 정규분포로 적절히 변환되지 못할 때
  • 자료의 표본(sample) 수가 적을 때
  • 자료들이 서로 독립적일 때
  • 변인의 척도가 명명척도나 서열척도일 때

비모수 통계의 특징

  • 가정을 만족시키지 못한 상태에서 그대로 모수 통계분석을 함으로써 발생할 수 있는 오류를 줄일 수 있다.
  • 질적척도로 측정된 자료도 분석이 가능하다.
  • 비교적 신속하고 쉽게 통계량을 구할 수 있으며 결과에 대한 해석 및 이해 또한 용이하다.
  • 많은 표본을 추출하기 어려운 경우에 사용하기 적합하다.[1]


중간값을 통한 비모수적 검정법들

모수적 방법과 비모수적 방법

우리가 궁극적으로 알고 싶은 전체 집단을 모집단이라고 한다. 하지만 전체 집단을 모두 조사하는 것은 현실적으로 불가능하다. 고혈압 환자에게 A약을 투여해서 얼마나 효과가 있는지 알고 싶을 때 전세계의 모든 고혈압 환자(모집단)를 대상으로 효과를 파악할 수는 없는 노릇이다. 우리가 할 수 있는 것은 적절한 표본집단을 지정하여 이 표본집단에서 평균, 표준편차와 같은 통계량을 구한 뒤 이를 통해 모평균과 모표준편차를 추정하는 것이다. 이렇게 추출된 표본의 평균, 표준편차, 분산 등을 통계량(statistics)이라고 하며 모집단의 모평균, 모표준편차, 모분산 등을 모수(parameter)라고 한다. 통계적 검정을 위해 표본으로부터 계산된 검정통계량도 통계량의 일종이다.


모수적 방법

우리는 중심극한정리에 의해서 본래의 분포에 상관없이 무작위로 복원추출된 연속형 자료의 평균의 분포는 정규분포를 띤다는 것을 알고 있다. 비교하고자 하는 두 집단이 모두 정규분포를 띤다면 그 두 집단은 평균을 비교함으로써 차이를 밝힐 수 있다. 이렇듯 정규성을 갖는다는 모수적 특성을 이용하는 통계적 방법을 모수적 방법(parametric method)이라고 한다.


그러면 중심극한정리에 의해 정규분포를 가정할 수 있는 최소한의 표본의 크기는 얼마나 될까? 이 질문에 대한 대답은 앞에서 공부했듯이 모집단의 분포에 따라 차이가 있겠지만, 일반적으로 군 당 30명 초과로 구성된 표본의 경우에 정규분포를 따른다고 가정한다. 그리고 군 당 10-30명 규모인 경우에는 따로 정규성 검정을 통해 정규분포임이 확인되면 다음 모수적 방법을 사용할 수 있다.

비모수적 방법

정규성 검정에서 정규분포를 따르지 않는다고 증명되거나 군 당 10명 미만의 소규모 실험에서는 정규분포임을 가정할 수 없으므로 모수적 방법을 사용할 수 없다. 이런 경우에는 자료를 크기 순으로 배열하여 순위를 매긴 다음 순위의 합을 통해 차이를 비교하는 순위합검정을 적용할 수 있는데 이런 방법들은 모수의 특성을 이용하지 않는다고 하여 비모수적 방법(nonparametric method)이라고 한다. 또, 숫자로는 표현되지만 수량화할 수 없고, 평균을 낼 수도 없는 순위 척도의 경우에는 비록 연속형 자료는 아니지만, 순위의 합을 이용하는 비모수적 방법을 적용하는 것은 가능하다.


정리해 보면, 일반적으로 위 그림과 같이 n이 30<n로 충분히 크거나, 10 ≤ n ≤ 30이면서 정규성 검정에서 정규분포로 간주되는 연속형 자료의 경우 모수적 방법을 사용할 수 있으며, 그 외의 경우는 비모수적 방법을 사용한다. 일반적으로 비모수적 방법보다 모수적 방법을 선호하는 이유는 모수적 방법이 검정력이 다소 높고, 두 군 사이에 크기의 차이가 있는 경우 차이의 정도를 함께 제시해 줄 수 있는 장점 때문이다. 비모수적 방법은 검정력이 다소 떨어지고, 크기의 차이를 보여주지 못하는 대신에 표본수가 작은 경우이거나, 순위 척도인 경우를 비롯하여 숫자로 되어 있는 모든 경우에 적용을 할 수 있는 장점이 있다.

참고

  1. 이훈영, 《이훈영교수의 통계학》, 도서출판 청람, 2010, p.455
  2. 2.0 2.1 2.2 이훈영, 《이훈영교수의 통계학》, 도서출판 청람, 2010, p.458-500