Math/Statistic

[통계학] 공분산과 상관계수

Heeseo Cho 2024. 2. 22. 17:24
  • 공분산

: 공분산은 두 확률 변수가 함께 커지거나, 한 변수가 작아질때 다른 변수가 함께 작아지는 것과 같이 크기 변화가 같으면 공분산은 양의 값을 갖는다.

  • 상관계수

: 두 변수 x와 y간의 선형 상관관계를 계량화한 수치
+1에 가까울수록 양의 상관관계
-1에 가까울수로 음의 상관관계
상관계수 r은 -1과 1 사이의 값을 갖는다.
상관계수 =0 은 두 변수가 서로 상관 없다는 것이다.
상관계수가 0.8 이상인 경우 높은 상관관계를 갖는다고 한다.
0.4 미만은 별로 상관관계 없는 것이다.

  • 상관계수의 종류

1. 피어슨 상관계수

-비선형적인 상관관계는 나타내지 못한다.
-자상관 (= 자기와 상관관계) 를 나누고 - 분모를 표준편차 나눈거니까 -1에서 +1 사이의 값으로 나온다.
- +1에 가까운건 양의 상관관계
- -1 에 가까운건 음의 상관관계

 

2. 스피어만 상관계수

-비선형 상관관계도 표기 가능!!
-서열 척도인 두 변수의 상관관계를 측정하는데 사용 (예를들어 1등, 2등, 3등,,)