ML๐Ÿ‘ฉ‍๐Ÿ’ป

[ML] ๋จธ์‹ ๋Ÿฌ๋‹์„ ์œ„ํ•œ ํ™˜๊ฒฝ ์„ธํŒ… ๋ฐฉ๋ฒ•(scikit-learn, xgboost, visual studio, jupyter-notebook)

ํžˆ์Šคํ†ค 2025. 1. 22. 20:00

๋จธ์‹ ๋Ÿฌ๋‹์„ ์‹œ์ž‘ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ํ”„๋กœ๊ทธ๋ž˜๋ฐ์„ ํ•˜๊ธฐ ์œ„ํ•œ ํ™˜๊ฒฝ์„ ์„ธํŒ…ํ•ด์•ผํ•œ๋‹ค.

์ผ๋‹จ ํŒŒ์ด์ฌ์„ ์ด์šฉํ•˜์—ฌ ๋จธ์‹ ๋Ÿฌ๋‹์„ ํ•  ์˜ˆ์ •์ด๋ฏ€๋กœ ํŒŒ์ด์ฌ๊ณผ ๊ด€๋ จ๋œ ํ™˜๊ฒฝ์„ ์„ธํŒ…ํ•˜๋Š” ๋ฒ•์— ๋Œ€ํ•ด ๋งํ•ด๋ณด๊ฒ ๋‹ค.

 

๋จธ์‹ ๋Ÿฌ๋‹์˜ ๋Œ€ํ‘œ์ ์ธ ํŒจํ‚ค์ง€์ธ scikit-learn์„ ์‚ฌ์šฉํ•  ๊ฒƒ์ด๋‹ค.

์ด ํŒจํ‚ค์ง€ ์ด์™ธ์—๋„ ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ๊ด€๋ จ๋œ ๋‹ค์–‘ํ•œ ํŒจํ‚ค์ง€๊ฐ€ ์กด์žฌํ•˜๋Š”๋ฐ, ์•„๋ž˜ ํ‘œ์—์„œ ๋‚˜์˜ ์ƒํ™ฉ์— ๋งž๋Š” ํ”„๋กœ๊ทธ๋žจ์„ ์‚ฌ์šฉํ•˜๋ฉด ๋ ๋“ฏ์‹ถ๋‹ค.

ํŒจํ‚ค์ง€ ์šฉ๋„ ํŒจํ‚ค์ง€ ์ด๋ฆ„
๋จธ์‹ ๋Ÿฌ๋‹ ํŒจํ‚ค์ง€ scikit-learn
๋ฐฐ์—ด/ ์„ ํ˜•๋Œ€์ˆ˜/ ํ†ต๊ณ„ ํŒจํ‚ค์ง€ numpy, scipy
๋ฐ์ดํ„ฐ ํ•ธ๋“ค๋ง pandas
์‹œ๊ฐํ™” matplotlib, seaborn
๋Œ€ํ™”ํ˜• ํŒŒ์ด์ฌ tool jupyter notebook

 

 

๋จธ์‹ ๋Ÿฌ๋‹์„ ํ•˜๊ธฐ์œ„ํ•ด ์ฃผํ”ผํ„ฐ ๋…ธํŠธ๋ถ ํ™˜๊ฒฝ์„ ์ดํ›„์— ์‚ฌ์šฉํ•  ์˜ˆ์ •์ด๋ฉฐ, ๋งŒ์ผ ์ฃผํ”ผํ„ฐ ๋…ธํŠธ๋ถ์ด ์„ค์น˜๋˜์–ด์žˆ์ง€ ์•Š๋‹ค๋ฉด ์•„๋ž˜ ๊ธ€์„ ์ฐธ๊ณ  ๋ฐ”๋ž€๋‹ค.

 ## anaconda๋ฅผ ์ด์šฉํ•œ jupyter ํ™˜๊ฒฝ ์„ค์น˜ํ•˜๊ธฐ

 

1. scikit-learn ์„ค์น˜ํ•˜๊ธฐ

 

anaconda Prompt๋ฅผ ๊ด€๋ฆฌ์ž ๊ถŒํ•œ์œผ๋กœ ์‹คํ–‰ํ•œ๋‹ค (์šฐํด๋ฆญ ํ›„ ๊ด€๋ฆฌ์ž ๊ถŒํ•œ ์‹คํ–‰)

๊ทธ๋Ÿฌ๋ฉด ์•„๋ž˜์™€ ๊ฐ™์ด ํ”„๋กฌํ”„ํŠธ ์ฐฝ์ด ๋œจ๊ฒŒ ๋˜๋Š”๋ฐ, pip ์„ ์ด์šฉํ•˜์—ฌ install ํ•˜๊ฑฐ๋‚˜ condaํ™˜๊ฒฝ์œผ๋กœ ์„ค์น˜๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.

<pip ์ด์šฉํ•ด ์„ค์น˜>

python3 -m venv sklearn-env
source sklearn-env/bin/activate  # activate
pip3 install -U scikit-learn

 

<conda ์ด์šฉํ•ด ์„ค์น˜>

conda create -n sklearn-env -c conda-forge scikit-learn
conda activate sklearn-env

 

 

2. xgboost ์„ค์น˜ํ•˜๊ธฐ

 

XGBoost๋Š” "Extreme Gradient Boosting"์˜ ์•ฝ์ž๋กœ, ๋น ๋ฅด๊ณ  ํšจ์œจ์ ์ธ gradient boosting ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ตฌํ˜„ํ•œ ์˜คํ”ˆ์†Œ์Šค ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ด๋‹ค. ์ด ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ํ•™์Šต๊ณผ ์˜ˆ์ธก์„ ๋น ๋ฅด๊ฒŒ ์ˆ˜ํ–‰ํ•˜๋ฉฐ, ํŠนํžˆ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋ณต์žกํ•œ ๋ชจ๋ธ์—์„œ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค.

 

 

<pip ์ด์šฉํ•ด ์„ค์น˜>

# Pip 21.3+ is required
pip install xgboost

 

 

์„ค์น˜๊ฐ€ ์™„๋ฃŒ๋˜์—ˆ๋‹ค๋ฉด, ์ฃผํ”ผํ„ฐ ๋…ธํŠธ๋ถ์„ ์‹คํ–‰์‹œํ‚ค๊ณ  ์•„๋ž˜์™€ ๊ฐ™์ด import ํ•ด์˜จ๋‹ค.

import xgboost

 

3. visual studio tool ์„ค์น˜

 

์•„๋ž˜ ๋งํฌ์— ๋“ค์–ด๊ฐ€์„œ "Visula Studio 2022์šฉ ๋นŒ๋“œ๋„๊ตฌ" ๋ฅผ ๋‹ค์šด๋ฐ›๋Š”๋‹ค.

https://visualstudio.microsoft.com/ko/downloads/

 

Visual Studio Tools ๋‹ค์šด๋กœ๋“œ - Windows, Mac, Linux์šฉ ๋ฌด๋ฃŒ ์„ค์น˜

Visual Studio IDE ๋˜๋Š” VS Code๋ฅผ ๋ฌด๋ฃŒ๋กœ ๋‹ค์šด๋กœ๋“œํ•˜์„ธ์š”. Windows ๋˜๋Š” Mac์—์„œ Visual Studio Professional ๋˜๋Š” Enterprise Edition์„ ์‚ฌ์šฉํ•ด ๋ณด์„ธ์š”.

visualstudio.microsoft.com

๋‚˜์˜ค๋Š” ์„ค์น˜ ์ฐฝ์—์„œ ๊ณ„์† ๋‹ค์Œ > ๋‹ค์Œ ์„ ๋ˆ„๋ฅด๋ฉด ์„ค์น˜ ์™„๋ฃŒ๋œ๋‹ค.

์ด๋Ÿฐ ์ฐฝ์ด ๋œจ๋ฉด ์„ค์น˜ ์™„๋ฃŒ์ด๋‹ค.

 

 

์œ„์˜ ์„ธ๊ฐ€์ง€๋ฅผ ๋ชจ๋‘ ์„ค์น˜ํ•˜์˜€์œผ๋ฉด ์ฃผํ”ผํ„ฐ ๋…ธํŠธ๋ถ์— ๋“ค์–ด๊ฐ€์„œ ์•„๋ž˜์™€ ๊ฐ™์ด ์‹ค์Šต์„ ์ง„ํ–‰ํ•ด๋ณธ๋‹ค.

<์ฃผํ”ผํ„ฐ ๋…ธํŠธ๋ถ ๋“ค์–ด๊ฐ€๋Š”๋ฒ•>

์ฃผํ™ฉ์ƒ‰ Jupyter Notebook ํด๋ฆญํ•˜๋ฉด ๋œ๋‹ค

์ฃผํ™ฉ์ƒ‰ ๋งˆํฌ์ธ Jupyter Notebook์„ ํด๋ฆญํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํ™”๋ฉด์ด ๋‚˜์˜ค๋Š”๋ฐ

 

 

์šฐ์ธก ์ƒ๋‹จ์— ์žˆ๋Š” New > Python3 ๋ฅผ ํด๋ฆญํ•˜๋ฉด ์ƒˆ๋กœ์šด ๋Œ€ํ™”์ฐฝ์ด ์ƒ์„ฑ๋œ๋‹ค.

 

 

์ด๋ฒˆ์— ํ…Œ์ŠคํŠธํ•  ์ฝ”๋“œ๋Š” numpy์™€ matplotlib์„ importํ•ด์™€์„œ array1์„ ์‹œ๊ฐํ™” ํ•˜๋Š” ์ฝ”๋“œ์ด๋‹ค.

import numpy as np
import matplotlib.pyplot as plt

%matplotlib inline

array1=np.array([1,2,3,4])
plt.hist(array1)

%matplotlib inline ์ด๋ž€ Jupyter Notebook์—์„œ ์‚ฌ์šฉ๋˜๋Š” ๋งค์ง ๋ช…๋ น์–ด(Magic Command) ์ค‘ ํ•˜๋‚˜๋กœ, Matplotlib๋ฅผ ์‚ฌ์šฉํ•œ ๊ทธ๋ž˜ํ”„๋ฅผ Jupyter Notebook์˜ ์…€ ์•ˆ์— ์ธ๋ผ์ธ์œผ๋กœ(์…€ ์•„๋ž˜์—) ํ‘œ์‹œํ•˜๋„๋ก ์„ค์ •ํ•œ๋‹ค.

 

์ด์ œ ์‹ค์Šต ์ค€๋น„ ๋!

'ML๐Ÿ‘ฉโ€๐Ÿ’ป' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[ML] ๋จธ์‹ ๋Ÿฌ๋‹ ์ด๋ž€?  (0) 2025.01.20