Math 4

[통계학] 평균, 편차, 분산, 표준편차 그리고 자유도와 불편추정량

1. 평균, 편차, 분산, 표준편차 평균: 산술평균, 표본을 모두 더한 후 해당 표본의 수로 나눈 값 편차: 하나의 변량이 평균으로 부터 얼마나 떨어져 있는가르 나타내는 값. 각각의 변량에서 평균을 뺀 값을 의미함. 표준편차: 흩어짐에 대한 정도. 분산을 제곱한 값이다. 분산의 양의 제곱근으로 표준편차가 작은 것은 평균값 주위의 분산의 정도가 작은 것을 나타낸다. 기호는 다음과 같이 나타낸다. 2. 자유도와 불편추정량 자유도와 불편 추정량을 이해하기 위해서 먼저 표본 분포에 대한 개념을 알아야한다. 표본분포 : 표본통계량(sample statistic)의 확률분포 이다. 표본통계량이란 표본평균이나 표본분산처럼 표본의 특성을 나타내는 대표값을 말한다. 모집단의 특성을 나타내는 대푯값인 모수(paramete..

Math/Statistic 2024.03.21

[통계학] 공분산과 상관계수

공분산 : 공분산은 두 확률 변수가 함께 커지거나, 한 변수가 작아질때 다른 변수가 함께 작아지는 것과 같이 크기 변화가 같으면 공분산은 양의 값을 갖는다. 상관계수 : 두 변수 x와 y간의 선형 상관관계를 계량화한 수치 +1에 가까울수록 양의 상관관계 -1에 가까울수로 음의 상관관계 상관계수 r은 -1과 1 사이의 값을 갖는다. 상관계수 =0 은 두 변수가 서로 상관 없다는 것이다. 상관계수가 0.8 이상인 경우 높은 상관관계를 갖는다고 한다. 0.4 미만은 별로 상관관계 없는 것이다. 상관계수의 종류 1. 피어슨 상관계수 -비선형적인 상관관계는 나타내지 못한다. -자상관 (= 자기와 상관관계) 를 나누고 - 분모를 표준편차 나눈거니까 -1에서 +1 사이의 값으로 나온다. - +1에 가까운건 양의 상관..

Math/Statistic 2024.02.22

Introduction of statistics :: 3.4강

Other considerations in Regresson Model 1. Qualitative Predictors 예를 들어 신용 데이터는 balance, age, cards, education, income, limit 등과 같은 회원들의 정보들을 포함하고 있다. 이때 gender는 p-value가 높기때문에 상관관계가 별로 없다고 판단된다. 이런것들을 dummy variable이라고 칭한다. 2. Extensions of the Linear model -Non-linear Relationships 3. Potential Porblems two of the most important assumptions state that the relationship between the predictors an..

Math/Statistic 2021.07.31

[통계학]An Introduction of Statistical Learning :: Chapter 2

Introduction 통계학 책을 추천을 받아서 미루다 미루다 결국 드디어 읽어보겠다고 결심을 했다. 책은 Gareth James - 'An Introduction to Statistical Learning' 라는 책이다. 통계학, 머신러닝이나 데이터분석쪽을 공부하는 사람들이라면 알고있을지도 모르겠지만 An Introduction of Statistical Learning이라는 책이다. 책을 훑어보니 R을 이용한 실습도 종종 있어보이고 자세히 설명한거 같아 통계학 기초를 잡기에 좋아보여 선택하게 되었다. 그럼 지금부터 Chapter 2 시작!!(Chapter 1은 introduction이라서 포스팅은 건너뜀) Chapter2. Statistical Learning 우리는 통계를 통해서 어떤 인과관계를 ..

Math/Statistic 2021.07.17