
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(Data Preprocessing)

ยท
Machine Learning
๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ๋ฅผ ์ํด ๊ธฐ๋ณธ์ ์ผ๋ก ์ฌ์ฉ๋๋ ์ฃผ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ ๋ค์๊ณผ ๊ฐ๋ค.numpy๊ณ ์ฑ๋ฅ ์์น ๊ณ์ฐ๊ณผ ๋ฐฐ์ด(ํ๋ ฌ) ์ฐ์ฐ์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ด๋ค.๋จธ์ ๋ฌ๋ ๋ฐ์ดํฐ ๊ตฌ์กฐ์ธ ํน์ง ํ๋ ฌ๊ณผ ํ๊น ๋ฒกํฐ ๊ตฌ์ฑ์ ์์ฃผ ์ฌ์ฉ๋๋ค.matplotlib๋ค์ํ ์ฐจํธ๋ฅผ ์๊ฐํํ ์ ์๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ด๋ค.์ด ์ค์์๋ pyplot ๋ชจ๋์ด ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉ๋๋ค.pandasCSV ํ์ผ ๋ฑ ๋ค์ํ ํ์์ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์ค๊ณ , ์ ๋ฆฌ ๋ฐ ์ ์ฒ๋ฆฌํ๋ ๋ฐ ์ ์ฉํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ด๋ค. ๋ฐ์ดํฐ์
๋ถ๋ฌ์ค๊ธฐ/์ํฐํฐ ์์ฑํ๊ธฐ๋ฐ์ดํฐ์
๋ถ๋ฌ์ค๊ธฐimport pandas as pddataset = pd.read_csv("Data.csv")pandas์ read_csv() ํจ์๋ฅผ ์ฌ์ฉํ๋ฉด CSV ํ์ผ์ ์ฝ๊ฒ ๋ถ๋ฌ์ฌ ์ ์๋ค.์ด ํจ์๋ ํ์ผ์ ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ดํฐํ๋ ์..