피어슨 상관 계수

From Hidden Wiki
Jump to navigation Jump to search

통계학에서 , 피어슨 상관 계수(Pearson Correlation Coefficient ,PCC)란 두 변수 XY 간의 선형 상관 관계를 계량화한 수치다 . 피어슨 상관 계수는 코시-슈바르츠 부등식에 의해 +1과 -1 사이의 값을 가지며, +1은 완벽한 양의 선형 상관 관계, 0은 선형 상관 관계 없음, -1은 완벽한 음의 선형 상관 관계를 의미한다. 일반적으로 상관관계는 피어슨 상관관계를 의미한다. 오른쪽|섬네일|400x400픽셀| 서로 다른 상관 계수 값 (ρ)을 갖는 산포도 다이어그램의 예 오른쪽|섬네일|400x400픽셀| 여러 데이터셋와 각 셋의 xy 의 상관 계수. 상관 관계는 선형 관계의 비선형성 및 방향을 반영하지만 그 관계의 기울기 또는 비선형 관계의 여러 측면을 반영하지 않는다. NB : 중앙의 그림은 기울기가 0이지만이 경우 Y 의 분산이 0이므로 상관 계수가 정의되지 않는다.

정의

피어슨 상관 계수는 등간척도비례척도의 데이타에서 두 변수의 공분산표준 편차 의 곱으로 나눈 이다.

<math> r_{XY}= { { {\sum_{i}^{n} \left( X_i - \overline{X} \right)\left( Y_i - \overline{Y} \right)} \over{n-1} }\over { \sqrt{{\sum_{i}^{n} \left( X_i - \overline{X} \right)^2 } \over{n-1}} \sqrt{ {\sum_{i}^{n} \left( Y_i - \overline{Y} \right)^2}\over{n-1}} }}</math>

따라서

<math> r_{XY}= {{\sum_{i}^{n} \left( X_i - \overline{X} \right)\left( Y_i - \overline{Y} \right)}\over { \sqrt{\sum_{i}^{n} \left( X_i - \overline{X} \right)^2} \sqrt{\sum_{i}^{n} \left( Y_i - \overline{Y} \right)^2} }}</math>


모집단의 경우

피어슨의 상관 계수는 모집단|에 적용될 때 일반적으로 ρ (ρ)로 표시되며 모집단 상관 계수 또는 모집단 피어슨 상관 계수 라고 할 수 있다.

컴퓨팅 계산

컴퓨팅 프로그램에서 일반적인 스프레드 시트에서는 상관관계 분석 함수로서 피어슨 상관계수가 사용되며 함수는 Correl()를 사용할수있다.[1]

같이 보기

참고

Template:각주

분류:가설 검정 분류:통계량

  1. (리브레오피스-스프레드 시트) CORREL(A,B)