๋จธ์ ๋ฌ๋์ ์์ํ๊ธฐ ์ํด์๋ ํ๋ก๊ทธ๋๋ฐ์ ํ๊ธฐ ์ํ ํ๊ฒฝ์ ์ธํ ํด์ผํ๋ค.
์ผ๋จ ํ์ด์ฌ์ ์ด์ฉํ์ฌ ๋จธ์ ๋ฌ๋์ ํ ์์ ์ด๋ฏ๋ก ํ์ด์ฌ๊ณผ ๊ด๋ จ๋ ํ๊ฒฝ์ ์ธํ ํ๋ ๋ฒ์ ๋ํด ๋งํด๋ณด๊ฒ ๋ค.
๋จธ์ ๋ฌ๋์ ๋ํ์ ์ธ ํจํค์ง์ธ scikit-learn์ ์ฌ์ฉํ ๊ฒ์ด๋ค.
์ด ํจํค์ง ์ด์ธ์๋ ๋จธ์ ๋ฌ๋๊ณผ ๊ด๋ จ๋ ๋ค์ํ ํจํค์ง๊ฐ ์กด์ฌํ๋๋ฐ, ์๋ ํ์์ ๋์ ์ํฉ์ ๋ง๋ ํ๋ก๊ทธ๋จ์ ์ฌ์ฉํ๋ฉด ๋ ๋ฏ์ถ๋ค.
ํจํค์ง ์ฉ๋ | ํจํค์ง ์ด๋ฆ |
๋จธ์ ๋ฌ๋ ํจํค์ง | scikit-learn |
๋ฐฐ์ด/ ์ ํ๋์/ ํต๊ณ ํจํค์ง | numpy, scipy |
๋ฐ์ดํฐ ํธ๋ค๋ง | pandas |
์๊ฐํ | matplotlib, seaborn |
๋ํํ ํ์ด์ฌ tool | jupyter notebook |
๋จธ์ ๋ฌ๋์ ํ๊ธฐ์ํด ์ฃผํผํฐ ๋ ธํธ๋ถ ํ๊ฒฝ์ ์ดํ์ ์ฌ์ฉํ ์์ ์ด๋ฉฐ, ๋ง์ผ ์ฃผํผํฐ ๋ ธํธ๋ถ์ด ์ค์น๋์ด์์ง ์๋ค๋ฉด ์๋ ๊ธ์ ์ฐธ๊ณ ๋ฐ๋๋ค.
## anaconda๋ฅผ ์ด์ฉํ jupyter ํ๊ฒฝ ์ค์นํ๊ธฐ
1. scikit-learn ์ค์นํ๊ธฐ
anaconda Prompt๋ฅผ ๊ด๋ฆฌ์ ๊ถํ์ผ๋ก ์คํํ๋ค (์ฐํด๋ฆญ ํ ๊ด๋ฆฌ์ ๊ถํ ์คํ)
๊ทธ๋ฌ๋ฉด ์๋์ ๊ฐ์ด ํ๋กฌํํธ ์ฐฝ์ด ๋จ๊ฒ ๋๋๋ฐ, pip ์ ์ด์ฉํ์ฌ install ํ๊ฑฐ๋ condaํ๊ฒฝ์ผ๋ก ์ค์น๊ฐ ๊ฐ๋ฅํ๋ค.
<pip ์ด์ฉํด ์ค์น>
python3 -m venv sklearn-env
source sklearn-env/bin/activate # activate
pip3 install -U scikit-learn
<conda ์ด์ฉํด ์ค์น>
conda create -n sklearn-env -c conda-forge scikit-learn
conda activate sklearn-env
2. xgboost ์ค์นํ๊ธฐ
XGBoost๋ "Extreme Gradient Boosting"์ ์ฝ์๋ก, ๋น ๋ฅด๊ณ ํจ์จ์ ์ธ gradient boosting ์๊ณ ๋ฆฌ์ฆ์ ๊ตฌํํ ์คํ์์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ด๋ค. ์ด ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ํ์ต๊ณผ ์์ธก์ ๋น ๋ฅด๊ฒ ์ํํ๋ฉฐ, ํนํ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ๊ณผ ๋ณต์กํ ๋ชจ๋ธ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ธ๋ค.
<pip ์ด์ฉํด ์ค์น>
# Pip 21.3+ is required
pip install xgboost
์ค์น๊ฐ ์๋ฃ๋์๋ค๋ฉด, ์ฃผํผํฐ ๋ ธํธ๋ถ์ ์คํ์ํค๊ณ ์๋์ ๊ฐ์ด import ํด์จ๋ค.
import xgboost
3. visual studio tool ์ค์น
์๋ ๋งํฌ์ ๋ค์ด๊ฐ์ "Visula Studio 2022์ฉ ๋น๋๋๊ตฌ" ๋ฅผ ๋ค์ด๋ฐ๋๋ค.
https://visualstudio.microsoft.com/ko/downloads/
๋์ค๋ ์ค์น ์ฐฝ์์ ๊ณ์ ๋ค์ > ๋ค์ ์ ๋๋ฅด๋ฉด ์ค์น ์๋ฃ๋๋ค.
์ด๋ฐ ์ฐฝ์ด ๋จ๋ฉด ์ค์น ์๋ฃ์ด๋ค.
์์ ์ธ๊ฐ์ง๋ฅผ ๋ชจ๋ ์ค์นํ์์ผ๋ฉด ์ฃผํผํฐ ๋ ธํธ๋ถ์ ๋ค์ด๊ฐ์ ์๋์ ๊ฐ์ด ์ค์ต์ ์งํํด๋ณธ๋ค.
<์ฃผํผํฐ ๋ ธํธ๋ถ ๋ค์ด๊ฐ๋๋ฒ>
์ฃผํฉ์ ๋งํฌ์ธ Jupyter Notebook์ ํด๋ฆญํ๋ฉด ๋ค์๊ณผ ๊ฐ์ ํ๋ฉด์ด ๋์ค๋๋ฐ
์ฐ์ธก ์๋จ์ ์๋ New > Python3 ๋ฅผ ํด๋ฆญํ๋ฉด ์๋ก์ด ๋ํ์ฐฝ์ด ์์ฑ๋๋ค.
์ด๋ฒ์ ํ ์คํธํ ์ฝ๋๋ numpy์ matplotlib์ importํด์์ array1์ ์๊ฐํ ํ๋ ์ฝ๋์ด๋ค.
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
array1=np.array([1,2,3,4])
plt.hist(array1)
%matplotlib inline ์ด๋ Jupyter Notebook์์ ์ฌ์ฉ๋๋ ๋งค์ง ๋ช ๋ น์ด(Magic Command) ์ค ํ๋๋ก, Matplotlib๋ฅผ ์ฌ์ฉํ ๊ทธ๋ํ๋ฅผ Jupyter Notebook์ ์ ์์ ์ธ๋ผ์ธ์ผ๋ก(์ ์๋์) ํ์ํ๋๋ก ์ค์ ํ๋ค.
์ด์ ์ค์ต ์ค๋น ๋!
'ML๐ฉโ๐ป' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] ๋จธ์ ๋ฌ๋ ์ด๋? (0) | 2025.01.20 |
---|