1. ๊ฒฐ์ธก์น ์ ์ ํ๊ธฐ
๊ฒฐ์ธก์น(Missing Value)๋ ๋๋ฝ๋ ๊ฐ, ๋น์ด์๋ ๊ฐ์ ์๋ฏธํ๋ค.
ํ์ฅ์์ ๋ง๋ค์ด์ง ์ค์ ๋ฐ์ดํฐ๋ ์์ง ๊ณผ์ ์์ ๋ฐ์ํ ์ค๋ฅ๋ก ์ธํด ๊ฒฐ์ธก์น๋ฅผ ํฌํจํ๊ณ ์์ ๋๊ฐ ๋ง๋ค. ๊ฒฐ์ธก์น๊ฐ ์์ผ๋ฉด ํจ์๊ฐ ์ ์ฉ๋์ง ์๊ฑฐ๋ ๋ถ์ ๊ฒฐ๊ณผ๊ฐ ์๊ณก๋๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ค.
๊ฒฐ์ธก์น ์ ๊ฑฐํ๊ธฐ ์ํด ๊ฒฐ์ธก์น๊ฐ ํฌํจ๋ ๋ฐ์ดํฐ ํ๋ ์์ ์์ฑํด ์ถ๋ ฅํ๋ค. R์์ ๊ฒฐ์ธก์น๋ ๋๋ฌธ์๋ก NA๋ก ํ๊ธฐํ๋ค.
is. na()๋ฅผ ํ์ธํ๋ฉด ๋ฐ์ดํฐ์ ๊ฒฐ์ธก์น๊ฐ ๋ค์ด์๋์ง ์ ์ ์๋ค.
๋ง์ผ ๊ฒฐ์ธก์น๊ฐ ์กด์ฌํ๋ฉด TRUE, ์๋๋ฉด FALSE๋ก ์ถ๋ ฅ๋๋ค.
#๊ฒฐ์ธก์น ํ์ธ
table(is.na(df$score))
#๊ฒฐ์ธก์น ์ ๊ฑฐ
#is.na()๋ฅผ filter()์ ์ ์ฉํ๋ฉด ๊ฒฐ์ธก์น๊ฐ ์๋ ํ์ ์ ๊ฑฐํ ์ ์๋ค.
df_nomiss <- df %>% filter(!is.na(score))
#์ฌ๋ฌ ๋ณ์ ๋์์ ๊ฒฐ์ธก์น ์ ๊ฑฐ
df_nomiss <- df %>% filter(!is.na(score)) & !is.na(sex))