EDA(탐색적 데이터 분석)
1. 탐색적 데이터 분석
- 데이터를 분석하기 전에 그래프나 통계적인 방법으로 데이터를 직관적으로 바라보는 과정
- 데이터를 있는 그대로 바라보는데 중점을 맞추어 데이터가 가지고 있는 의미를 다양한 각도로 바라보고 이해
2. 탐색적 데이터 분석 목적
- 데이터 수집 의사를 결정
- 데이터 유형에 맞는 모델을 선택
- 변수들 사이의 관계를 파악
3. 초기 세팅
- 한글 세팅
!pip install koreanize-matplotlib
!pip install koreanize-matplotlib
- 모듈 추가
import koreanize_matplotlib import polars as pl import matplotlib.pyplot as plt import seaborn as sns
import koreanize_matplotlib import polars as pl import matplotlib.pyplot as plt import seaborn as sns
- 경고 무시
import warnings warnings.filterwarnings("ignore")
import warnings warnings.filterwarnings("ignore")
- 모든 컬럼 표시
pl.Config.set_tbl_cols(-1) # -1 : 모든 컬럼을 표시
pl.Config.set_tbl_cols(-1) # -1 : 모든 컬럼을 표시
- 한글 잘 나오는지 확인
plt.figure(figsize=(10,6)) plt.title('가나다') plt.show()
plt.figure(figsize=(10,6)) plt.title('가나다') plt.show()
