< ํฐ๋ฏธ๋์ vscode ์คํํ๊ธฐ >
์ํ๋ ๋ฌด์กฐ๊ฑด ํฐ๋ฏธ๋์์ ์คํํด์ผ ํ๋ค๋ค์.....
์ ๋ ฅ์....
1. cd..
2. cd ํด๋๋ช
3. PYTHON ํ์ผ๋ช
< ์ค๋์ ๋ชฉํ >
1. ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ๋ถ์ผ์ ๋ํด ์ดํดํ๊ธฐ
2. ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์ ์์ฃผ ์ฌ์ฉ๋๋ ํจํค์ง ์ดํดํ๊ธฐ
< ์ค๋์ ์ค์ต >
1. ๊ตฌ๊ธ ์ฃผ์ ๋ฐ์ดํฐ ๋ค์ด๋ฐ๊ธฐ
2. ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์์ ์์ฃผ ์ฌ์ฉ๋๋ ํจํค์ง๋ฅผ ์ฌ์ฉํ์ฌ
3. ์ํ๋ ๋ฐ์ดํฐ๋ง ๋ฝ์๋ด์ ์ฐจํธ๋ก ์ถ๋ ฅ
< ์งํ ์์ >
1. ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ๊ธฐ์ด ํ์ต
2. ๋ฐ์ดํฐ๋ค์ด ๋ชจ์ฌ ์๋ ์บ๊ธ(Kaggle)์ด๋ผ๋ ์ฌ์ดํธ์์, ์ค์ต ๋ฐ์ดํฐ ๋ค์ด๋ก๋(๊ตฌ๊ธ, ๋ทํ๋ฆญ์ค ์ฃผ๊ฐ ๋ฐ์ดํฐ)
3. ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์์ ์์ฃผ ์ฐ์ด๋ ํจํค์ง ํ์ต
< ๊ฐ๋ฐ ๋๊ตฌ>
- Jupyter notebook => python๋ ๊ฐ๋ฅ
- Python 3.9+
< ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค >
- ๋ค์ํ ๋ฐ์ดํฐ๋ก๋ถํฐ ์๋ก์ด ์ง์๊ณผ ์ ๋ณด๋ฅผ ์ถ์ถํ๊ธฐ ์ํด ๊ณผํ์ ๋ฐฉ๋ฒ๋ก , ํ๋ก์ธ์ค, ์๊ณ ๋ฆฌ์ฆ, ์์คํ ์ ๋์ํ๋ ์ตํฉ ๋ถ์ผ
- ์ปดํจํฐ ๊ณผํ, ํต๊ณํ, ์ํ ๋ฑ ๋ค์ํ ํ๋ฌธ์ ์๋ฆฌ์ ๊ธฐ์ ์ ํ์ฉ
< ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ํ๋ก์ธ์ค >
- ํ์ํ ์ ๋ณด๋ฅผ ์ถ์ถํ๋ 5๊ฐ์ง ๋จ๊ณ
- ๋ฌธ์ ์ ์ : ํด๊ฒฐํ๊ณ ์ ํ๋ ๋ฌธ์ ์ ์ (๊ตฌ๊ธ์ ์ฃผ์์ด ์ค๋ฅผ๊น??)
- ๋ฐ์ดํฐ ์์ง : ๋ฌธ์ ํด๊ฒฐ์ ํ์ํ ๋ฐ์ดํฐ ์์ง (๊ณผ๊ฑฐ์ ๊ตฌ๊ธ ์ฃผ๊ฐ)
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(์ ์ ) : ์ค์ง์ ์ธ ๋ถ์์ ์ํํ๊ธฐ ์ํด ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ณตํ๋ ๋จ๊ณ - ์์งํ ๋ฐ์ดํฐ์ ์ค๋ฅ ์ ๊ฑฐ(๊ฑธ์ธก์น, ์ด์์น), ๋ฐ์ดํฐ ํ์ ๋ณํ ๋ฑ
- ๋ฐ์ดํฐ ๋ถ์ : ์ ์ฒ๋ฆฌ๊ฐ ์๋ฃ๋ ๋ฐ์ดํฐ์์ ํ์ํ ์ ๋ณด๋ฅผ ์ถ์ถํ๋ ๋จ๊ณ
- ๊ฒฐ๊ณผ ํด์ ๋ฐ ๊ณต์ : ์์ฌ ๊ฒฐ์ ์ ํ์ฉํ๊ธฐ ์ํด ๊ฒฐ๊ณผ๋ฅผ ํด์ํ๊ณ ์๊ฐํ ํ ๊ณต์ ํ๋ ๋จ๊ณ
< ๋ฐ์ดํฐ๋ฅผ ๊ณต์ ํ๊ณ ํ์ฉํ ์ ์๋ ์จ๋ผ์ธ ํ๋ซํผ >
- ์ข ๋ฅ : ์บ๊ธ, ๋ฐ์ด์ฝ, ๊ณต๊ณต ๋ฐ์ดํฐ ํฌํธ ๋ฑ..
์บ๊ธ(Kaggle)
- ๋ฐ์ดํฐ ๋ถ์ ๊ฒฝ์ง๋ํ ํ๋ซํผ
- ๊ธฐ์ ๋ฐ ๋จ์ฒด์์ ๋ฐ์ดํฐ์ ํด๊ฒฐ ๊ณผ์ ๋ฅผ ๋ฑ๋กํ๋ฉด, ๋ฐ์ดํฐ ๊ณผํ์๋ค์ด ์ด๋ฅผ ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ์ ๊ฐ๋ฐํ๊ณ ๊ฒฝ์ํ ์ ์๋ ํ๋ซํผ
- ๊ฒฝ์ง๋ํ, ๋ฐ์ดํฐ์ ๊ณต์ , ํ ๋ก ๋ฑ์ ๊ธฐ๋ฅ์ด ๊ฐ๋ฅํ๋ฉฐ ๋ง์ ๋ฐ์ดํฐ ๊ณผํ์์ ๋ถ์๊ฐ๋ค์ด ํ์ฉํจ
- ์ค์ต์ ์ํด ์บ๊ธ์ ๊ตฌ๊ธ ์ฃผ๊ฐ ๋ฐ์ดํฐ๋ฅผ ๋ค์ด๋ก๋ ๋ฐ์ ํ์ฉํฉ๋๋ค.
- https://www.kaggle.com/datasets/jainilcoder/netflix-stock-price-prediction
< ์์ฃผ ํ์ฉ๋๋ ํ์ด์ฌ ํจํค์ง >
: Numpy, Pandas, Matplotlib
1. Numpy
- ๋ค์ฐจ์ ๋ฐฐ์ด์ ์ฝ๊ฒ ์ฒ๋ฆฌํ๊ณ ํจ์จ์ ์ผ๋ก ์ฌ์ฉํ ์ ์๋๋ก ์ง์ํ๋ ํ์ด์ฌ ํจํค์ง
- ์ฅ์ : ํ๋ ฌ ์ฐ์ฐ์ ๋ฐ์ดํฐ๊ฐ ๋ง์ ์๋ก ํ์ด์ฌ ๋ฐ๋ณต๋ฌธ์ ๋นํด ํจ์ฌ ๋น ๋ฅด๋ค / ๋ค์ฐจ์ ํ๋ ฌ ์๋ฃ ๊ตฌ์กฐ๋ฅผ ์ ๊ณตํ์ฌ ๊ฐ๋ฐํ๊ธฐ ํธํ๋ค
- ํน์ง : CPython ์์๋ง ์ฌ์ฉ ๊ฐ๋ฅ / ํ๋ ฌ ์ธ๋ฑ์ฑ ๊ธฐ๋ฅ ์ ๊ณต
2. Pandas
- Numpy ์ ํ๊ณ : ์ ์ฐ์ฑ์ด ๋ถ์กฑํจ, ๊ทธ๋ฃนํ, ํผ๋ฒ ๋ฑ ๊ตฌ์กฐํ๊ฐ ๋ถ์กฑํจ
- Pandas๋ ์์ ์ ๋ค๋ฃจ๋ฏ ๊ณ ์ฑ๋ฅ์ ๋ฐ์ดํฐ ๊ตฌ์กฐ๋ฅผ ๋ง๋ ๋ค
- Numpy ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ง ํจํค์ง๋ก 1์ฐจ์ ๋ฐฐ์ด๊ณผ 2์ฐจ์ ๋ฐฐ์ด์ด๋ผ๋ ํจ์จ์ ์ธ ์๋ฃ๊ตฌ์กฐ ์ ๊ณต
3. Matplotlib
- Python ์์ ๋ฐ์ดํฐ ์๊ฐํ๋ฅผ ์ํด ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
- ๋ค์ํ ์ข ๋ฅ์ ๊ทธ๋ํ์ ๋ํ๋ฅผ ์์ฑํ๊ณ ๋ฐ์ดํฐ๋ฅผ ์๊ฐ์ ์ผ๋ก ํํํ ์ ์์ต๋๋ค.
๊ธ์์ผ ๊ดํต ํ๋ก์ ํธ ์๊ฐ์๋ ๋์ค์ ๋ง๋ค ํ๋ก์ ํธ๋ฅผ ๋๋นํด์ ์ฌ๋ฌ๊ฐ์ง๋ ๋ฐฐ์ฐ๋๋ฐ์!!!
์ค๋์ Pandas ์ Matplotlib ๋ฅผ ํตํด์ ๋ทํ๋ฆญ์ค ์ฃผ๊ฐ๋ฅผ ๋ฐ์ดํฐ ๋ถ์ํ์ฌ ๋ณด์์ต๋๋ค~~~~
'SSAFY' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
0807. ์๊ณ ๋ฆฌ์ฆ day06. String (0) | 2023.08.08 |
---|---|
0803. ์๊ณ ๋ฆฌ์ฆ day04. ๋ฐฐ์ด2 (0) | 2023.08.06 |
0802 ์๊ณ ๋ฆฌ์ฆ day03. ๋ฐฐ์ด 2 (0) | 2023.08.03 |
0801 ์๊ณ ๋ฆฌ์ฆ day02 (0) | 2023.08.02 |
0731 ์๊ณ ๋ฆฌ์ฆ day 01 (0) | 2023.08.01 |