Math/Statistic

[통계학] 평균, 편차, 분산, 표준편차 그리고 자유도와 불편추정량

Heeseo Cho 2024. 3. 21. 17:08

1. 평균, 편차, 분산, 표준편차

  • 평균: 산술평균, 표본을 모두 더한 후 해당 표본의 수로 나눈 값
  • 편차: 하나의 변량이 평균으로 부터 얼마나 떨어져 있는가르 나타내는 값. 각각의 변량에서 평균을 뺀 값을 의미함.
  • 표준편차: 흩어짐에 대한 정도. 분산을 제곱한 값이다. 분산의 양의 제곱근으로 표준편차가 작은 것은 평균값 주위의 분산의 정도가 작은 것을 나타낸다.

기호는 다음과 같이 나타낸다.

2. 자유도와 불편추정량

자유도와 불편 추정량을 이해하기 위해서 먼저 표본 분포에 대한 개념을 알아야한다.

  • 표본분포 : 표본통계량(sample statistic)의 확률분포 이다. 표본통계량이란 표본평균이나 표본분산처럼 표본의 특성을 나타내는 대표값을 말한다.

모집단의 특성을 나타내는 대푯값인 모수(parameter)는 일정한 값을 갖지만 제대로 알려져 있지 않아 표본통계량을 통해 모수를 추측한다.

다만, 표본통계량은 표본을 추출할때마다 다른 값이 나올 수 있는 불확실한 확률 변수이다.

 

  • 자유도: 통계를 추정할때 표본자료 중 모집단에 대한 정보를 주는 독립적인 자료의 수를 의미한다. 표본이 n개일 때, 자유도는 n-1 이다.
  • 불편추정량(unbiased estimate): 추정량에 편의가 없는 것을 의미한다. 실제값인 모평균과 추정값이 표본평균 사이의 오차가 유의미한 수준이 아니라는 의미이기도하다.
  • 편의(bias): 추정량의 기댓값과 실제 모수와의 차이. 한쪽으로 치우친 경향성이나 추정값의 오차를 의미하기도 함.
  • 추정량 : 미지의 모수의 추정에 사용되는 통계량. 통계량의 일부이다.

  • 대수의 법칙: 표본의 크기가 커질수록 표본평균이 모평균에 근사하게 된다는 법칙

표본평균은 모평균의 불편추정량이다.