카테고리 없음

[R]쉽게배우는 R 데이터사이언스 :: 데이터 파악하기

Heeseo Cho 2021. 5. 1. 10:57

데이터가 주어졌을때 가장 먼저 해야하는 일은 데이터의 전반저 구조를 파악하는 것이다. 분석할 데이터가 확보되면 데이터의 특성을 파악하고 다루기 쉽게 변형하는 작업을 해야한다.

 

1. 데이터를 파악할 때 사용하는 여러 함수들

함수 기능
head() 데이터 앞부분 출력
tail() 데이터 뒷부분 출력
View() 뷰어 창에서 데이터 확인
dim() 데이터 차원 출력
str() 데이터 속성 출력
summary() 요약 통계량 출력

 

2. mpg 데이터 파악하기

먼저 ggplot2 패키지를 설치한다.

install.packages("ggplot2")

 

ggplot2패키지의 mpg데이터를 불러와 데이터 프레임을 만든다.

mpg<-as.data.frame(ggplot2::mpg)

 

head(), tail(), View()를 사용해 데이터를 확인하면서 어떤 값들을 지니고 있는지 확인한다.

head(mpg)

tail(mpg)

dim(mpg)

 

3.변수명 바꾸기

데이터의 특징을 파악하고나서 본격적으로 분석하기 전에 변수명을 수정해야합니다. 변수명을 이해하기 쉬운 단어로 바꾸면 데이터를 수월하게 다룰 수 있습니다.

 

dplyr패키지의 rename()을 이용해 변수명 바꾸기

데이터 프레임 생성

 

dplyr설치하기
데이터 프레임 복사본 만들기
변수명 바꾸기

rename()을 사용해 변수명을 바꿔준다.(순서에 유의할것)