데이터가 주어졌을때 가장 먼저 해야하는 일은 데이터의 전반저 구조를 파악하는 것이다. 분석할 데이터가 확보되면 데이터의 특성을 파악하고 다루기 쉽게 변형하는 작업을 해야한다.
1. 데이터를 파악할 때 사용하는 여러 함수들
함수 | 기능 |
head() | 데이터 앞부분 출력 |
tail() | 데이터 뒷부분 출력 |
View() | 뷰어 창에서 데이터 확인 |
dim() | 데이터 차원 출력 |
str() | 데이터 속성 출력 |
summary() | 요약 통계량 출력 |
2. mpg 데이터 파악하기
먼저 ggplot2 패키지를 설치한다.
install.packages("ggplot2")
ggplot2패키지의 mpg데이터를 불러와 데이터 프레임을 만든다.
mpg<-as.data.frame(ggplot2::mpg)
head(), tail(), View()를 사용해 데이터를 확인하면서 어떤 값들을 지니고 있는지 확인한다.
head(mpg)
tail(mpg)
dim(mpg)
3.변수명 바꾸기
데이터의 특징을 파악하고나서 본격적으로 분석하기 전에 변수명을 수정해야합니다. 변수명을 이해하기 쉬운 단어로 바꾸면 데이터를 수월하게 다룰 수 있습니다.
dplyr패키지의 rename()을 이용해 변수명 바꾸기
rename()을 사용해 변수명을 바꿔준다.(순서에 유의할것)