RπŸ“Š

[R]μ‰½κ²Œλ°°μš°λŠ” R λ°μ΄ν„°μ‚¬μ΄μ–ΈμŠ€ :: 데이터 ν”„λ ˆμž„ λ§Œλ“€κΈ°

νžˆμŠ€ν†€ 2021. 4. 24. 12:06

1. 데이터 ν”„λ ˆμž„(Data Frame)μ΄λž€?

 

데이터 ν”„λ ˆμž„(Data Frame)은 κ°€μž₯ 많이 μ‚¬μš©λ˜λŠ” 데이터 ν˜•νƒœλ‘œ, ν–‰κ³Ό μ—΄λ‘œ κ΅¬μ„±λœ μ‚¬κ°ν˜• λͺ¨μ–‘μ˜ ν‘œμ²˜λŸΌ μƒκ²ΌμŠ΅λ‹ˆλ‹€.

μ„Έλ‘œλ‘œ λ‚˜μ—΄λ˜λŠ” μ—΄(column)은 속성을 λ‚˜νƒ€λƒ…λ‹ˆλ‹€. 행은 κ°€λ‘œλ‘œ λ‚˜μ—΄λ˜μ–΄ 있으며 Row라고 λΆˆλ¦½λ‹ˆλ‹€. 

 

데이터 ν”„λ ˆμž„μ€ 데이터λ₯Ό 직접 μž…λ ₯ν•΄ λ§Œλ“€ μˆ˜λ„ 있고, μ™ΈλΆ€μ˜ 데이터λ₯Ό 가져와 λ§Œλ“€ μˆ˜λ„ μžˆμŠ΅λ‹ˆλ‹€.

 

2. 데이터 ν”„λ ˆμž„ λ§Œλ“€κΈ° μ‹€μŠ΅

 

  • λ°μ΄ν„°ν”„λ ˆμž„ λ§Œλ“€κΈ°

data.frame() :데이터 ν”„λ ˜μž„μ„ λ§Œλ“€λ•Œ data.frame()을 μ΄μš©ν•œλ‹€. 데이터 ν”„λ ˆμž„μ„ ꡬ성할 λ³€μˆ˜λ₯Ό κ΄„ν˜Έ μ•ˆμ— μ‰Όν‘œλ‘œ λ‚˜μ—΄ν•˜λ©΄ λœλ‹€.

 

  • λ°μ΄ν„°ν”„λ ˆμž„μ— 정보 μΆ”κ°€ν•˜κΈ°

classλΌλŠ” λ³€μˆ˜μ— ν•™μƒμ˜ λ°˜μ— λŒ€ν•œ 정보가 μΆ”κ°€ν•˜μ—¬ 이후 μΆ”κ°€λœ 데이터 ν”„λ ˆμž„μ„ λ§Œλ“ λ‹€.

 

  • λΆ„μ„ν•˜κΈ°

데이터 ν”„λ ˆμž„μ„ μ™„μ„±ν›„ 데이터λ₯Ό λΆ„μ„ν•œλ‹€.

mean()을 μ΄μš©ν•΄ ν•™μƒμ˜ μ˜μ–΄μ μˆ˜μ™€ μˆ˜ν•™μ μˆ˜μ˜ 평균을 κ΅¬ν•œλ‹€.

mean(): κ΄„ν˜Έ μ•ˆμ— λ°μ΄ν„°ν”„λ ˆμž„ μ•ˆμ— μžˆλŠ” λ³€μˆ˜λ₯Ό 각각 μž…λ ₯ν•œ ν•˜μ—¬ 평균을 κ΅¬ν•œλ‹€. μ΄λ•Œ $κΈ°ν˜ΈλŠ” λ°μ΄ν„°ν”„λ ˆμž„ μ•ˆμ— μžˆλŠ” λ³€μˆ˜λ₯Ό 지정할 λ•Œ μ‚¬μš©ν•œλ‹€.