๋จธ์ ๋ฌ๋์ ์์ํ๊ธฐ ์ํด์๋ ํ๋ก๊ทธ๋๋ฐ์ ํ๊ธฐ ์ํ ํ๊ฒฝ์ ์ธํ ํด์ผํ๋ค.
์ผ๋จ ํ์ด์ฌ์ ์ด์ฉํ์ฌ ๋จธ์ ๋ฌ๋์ ํ ์์ ์ด๋ฏ๋ก ํ์ด์ฌ๊ณผ ๊ด๋ จ๋ ํ๊ฒฝ์ ์ธํ ํ๋ ๋ฒ์ ๋ํด ๋งํด๋ณด๊ฒ ๋ค.
๋จธ์ ๋ฌ๋์ ๋ํ์ ์ธ ํจํค์ง์ธ scikit-learn์ ์ฌ์ฉํ ๊ฒ์ด๋ค.
์ด ํจํค์ง ์ด์ธ์๋ ๋จธ์ ๋ฌ๋๊ณผ ๊ด๋ จ๋ ๋ค์ํ ํจํค์ง๊ฐ ์กด์ฌํ๋๋ฐ, ์๋ ํ์์ ๋์ ์ํฉ์ ๋ง๋ ํ๋ก๊ทธ๋จ์ ์ฌ์ฉํ๋ฉด ๋ ๋ฏ์ถ๋ค.
ํจํค์ง ์ฉ๋ | ํจํค์ง ์ด๋ฆ |
๋จธ์ ๋ฌ๋ ํจํค์ง | scikit-learn |
๋ฐฐ์ด/ ์ ํ๋์/ ํต๊ณ ํจํค์ง | numpy, scipy |
๋ฐ์ดํฐ ํธ๋ค๋ง | pandas |
์๊ฐํ | matplotlib, seaborn |
๋ํํ ํ์ด์ฌ tool | jupyter notebook |
๋จธ์ ๋ฌ๋์ ํ๊ธฐ์ํด ์ฃผํผํฐ ๋ ธํธ๋ถ ํ๊ฒฝ์ ์ดํ์ ์ฌ์ฉํ ์์ ์ด๋ฉฐ, ๋ง์ผ ์ฃผํผํฐ ๋ ธํธ๋ถ์ด ์ค์น๋์ด์์ง ์๋ค๋ฉด ์๋ ๊ธ์ ์ฐธ๊ณ ๋ฐ๋๋ค.
## anaconda๋ฅผ ์ด์ฉํ jupyter ํ๊ฒฝ ์ค์นํ๊ธฐ
1. scikit-learn ์ค์นํ๊ธฐ
anaconda Prompt๋ฅผ ๊ด๋ฆฌ์ ๊ถํ์ผ๋ก ์คํํ๋ค (์ฐํด๋ฆญ ํ ๊ด๋ฆฌ์ ๊ถํ ์คํ)

๊ทธ๋ฌ๋ฉด ์๋์ ๊ฐ์ด ํ๋กฌํํธ ์ฐฝ์ด ๋จ๊ฒ ๋๋๋ฐ, pip ์ ์ด์ฉํ์ฌ install ํ๊ฑฐ๋ condaํ๊ฒฝ์ผ๋ก ์ค์น๊ฐ ๊ฐ๋ฅํ๋ค.
<pip ์ด์ฉํด ์ค์น>
python3 -m venv sklearn-env
source sklearn-env/bin/activate # activate
pip3 install -U scikit-learn
<conda ์ด์ฉํด ์ค์น>
conda create -n sklearn-env -c conda-forge scikit-learn
conda activate sklearn-env
2. xgboost ์ค์นํ๊ธฐ
XGBoost๋ "Extreme Gradient Boosting"์ ์ฝ์๋ก, ๋น ๋ฅด๊ณ ํจ์จ์ ์ธ gradient boosting ์๊ณ ๋ฆฌ์ฆ์ ๊ตฌํํ ์คํ์์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ด๋ค. ์ด ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ํ์ต๊ณผ ์์ธก์ ๋น ๋ฅด๊ฒ ์ํํ๋ฉฐ, ํนํ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ๊ณผ ๋ณต์กํ ๋ชจ๋ธ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ธ๋ค.
<pip ์ด์ฉํด ์ค์น>
# Pip 21.3+ is required
pip install xgboost
์ค์น๊ฐ ์๋ฃ๋์๋ค๋ฉด, ์ฃผํผํฐ ๋ ธํธ๋ถ์ ์คํ์ํค๊ณ ์๋์ ๊ฐ์ด import ํด์จ๋ค.
import xgboost
3. visual studio tool ์ค์น
์๋ ๋งํฌ์ ๋ค์ด๊ฐ์ "Visula Studio 2022์ฉ ๋น๋๋๊ตฌ" ๋ฅผ ๋ค์ด๋ฐ๋๋ค.
https://visualstudio.microsoft.com/ko/downloads/
Visual Studio Tools ๋ค์ด๋ก๋ - Windows, Mac, Linux์ฉ ๋ฌด๋ฃ ์ค์น
Visual Studio IDE ๋๋ VS Code๋ฅผ ๋ฌด๋ฃ๋ก ๋ค์ด๋ก๋ํ์ธ์. Windows ๋๋ Mac์์ Visual Studio Professional ๋๋ Enterprise Edition์ ์ฌ์ฉํด ๋ณด์ธ์.
visualstudio.microsoft.com
๋์ค๋ ์ค์น ์ฐฝ์์ ๊ณ์ ๋ค์ > ๋ค์ ์ ๋๋ฅด๋ฉด ์ค์น ์๋ฃ๋๋ค.

์ด๋ฐ ์ฐฝ์ด ๋จ๋ฉด ์ค์น ์๋ฃ์ด๋ค.
์์ ์ธ๊ฐ์ง๋ฅผ ๋ชจ๋ ์ค์นํ์์ผ๋ฉด ์ฃผํผํฐ ๋ ธํธ๋ถ์ ๋ค์ด๊ฐ์ ์๋์ ๊ฐ์ด ์ค์ต์ ์งํํด๋ณธ๋ค.
<์ฃผํผํฐ ๋ ธํธ๋ถ ๋ค์ด๊ฐ๋๋ฒ>

์ฃผํฉ์ ๋งํฌ์ธ Jupyter Notebook์ ํด๋ฆญํ๋ฉด ๋ค์๊ณผ ๊ฐ์ ํ๋ฉด์ด ๋์ค๋๋ฐ

์ฐ์ธก ์๋จ์ ์๋ New > Python3 ๋ฅผ ํด๋ฆญํ๋ฉด ์๋ก์ด ๋ํ์ฐฝ์ด ์์ฑ๋๋ค.

์ด๋ฒ์ ํ ์คํธํ ์ฝ๋๋ numpy์ matplotlib์ importํด์์ array1์ ์๊ฐํ ํ๋ ์ฝ๋์ด๋ค.
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
array1=np.array([1,2,3,4])
plt.hist(array1)
%matplotlib inline ์ด๋ Jupyter Notebook์์ ์ฌ์ฉ๋๋ ๋งค์ง ๋ช ๋ น์ด(Magic Command) ์ค ํ๋๋ก, Matplotlib๋ฅผ ์ฌ์ฉํ ๊ทธ๋ํ๋ฅผ Jupyter Notebook์ ์ ์์ ์ธ๋ผ์ธ์ผ๋ก(์ ์๋์) ํ์ํ๋๋ก ์ค์ ํ๋ค.

์ด์ ์ค์ต ์ค๋น ๋!
'ML๐ฉโ๐ป' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] ๋จธ์ ๋ฌ๋ ์ด๋? (0) | 2025.01.20 |
---|