WeniVooks

검색

Right Now, Polars

EDA(탐색적 데이터 분석)

1. 탐색적 데이터 분석

  • 데이터를 분석하기 전에 그래프나 통계적인 방법으로 데이터를 직관적으로 바라보는 과정
  • 데이터를 있는 그대로 바라보는데 중점을 맞추어 데이터가 가지고 있는 의미를 다양한 각도로 바라보고 이해

2. 탐색적 데이터 분석 목적

  • 데이터 수집 의사를 결정
  • 데이터 유형에 맞는 모델을 선택
  • 변수들 사이의 관계를 파악

3. 초기 세팅

  • 한글 세팅
    !pip install koreanize-matplotlib
    !pip install koreanize-matplotlib
  • 모듈 추가
    import koreanize_matplotlib
    import polars as pl
    import matplotlib.pyplot as plt
    import seaborn as sns
    import koreanize_matplotlib
    import polars as pl
    import matplotlib.pyplot as plt
    import seaborn as sns
  • 경고 무시
    import warnings
    warnings.filterwarnings("ignore")
    import warnings
    warnings.filterwarnings("ignore")
  • 모든 컬럼 표시
    pl.Config.set_tbl_cols(-1)  # -1 : 모든 컬럼을 표시
    pl.Config.set_tbl_cols(-1)  # -1 : 모든 컬럼을 표시
  • 한글 잘 나오는지 확인
    plt.figure(figsize=(10,6))
    plt.title('가나다')
    plt.show()
    plt.figure(figsize=(10,6))
    plt.title('가나다')
    plt.show()
{"packages":["numpy","pandas","matplotlib","lxml"]}
4장 EDA(탐색적 데이터 분석)4.2 타이타닉 데이터 분석