WeniVooks

검색

basecamp-data-analysis

주가 데이터 분석

1. 데이터 설명 및 불러오기

주가 데이터는 주식 시장에서 발생하는 주가 정보를 의미합니다. 주가 데이터는 주식의 가격, 거래량, 시가, 고가, 저가 등 다양한 정보를 포함하고 있습니다. 주가 데이터는 주식 시장의 흐름을 분석하고 예측하는 데 중요한 역할을 합니다.

아래 데이터는 실제 주가 홈페이지 구성 그대로 가상으로 만든 데이터입니다. 데이터는 날짜, 시가, 고가, 저가, 종가, 거래량으로 구성되어 있습니다. 이 데이터를 활용하여 주가 데이터 분석을 진행해주세요.

크롤링 연습 페이지

페이지를 나가면 코드가 초기화 됩니다. 필요한 코드가 있다면 미리 다른 챕터에서 필요한 코드를 노트에 복사해두세요.

import pandas as pd from pyodide.http import open_url data = open_url('https://paullab.co.kr/stock.html') df = pd.read_html(data) df[0] # 0, 1, 2 등을 차례로 넣어보세요.

시각화를 위해 아래 코드를 실행시켜 주세요.

def show(n): el = js.document.querySelectorAll('py-repl')[n] display(plt.gcf(), target=el.getAttribute('id')+'-1') print('실행 완료')

2. 데이터 확인

과제:

  1. df의 전체 데이터의 구조를 확인하세요. 그 구조가 어떤 데이터인지 설명을 달아주세요.
  2. 캣네생선의 시가총액을 출력하세요.
  3. 연구원 데이터의 상위 10행을 출력하세요.
  4. 연구원 데이터의 하위 5행을 출력하세요.
# 1번 과제 코드를 작성하세요.
# 2번 과제 코드를 작성하세요.
# 3번 과제 코드를 작성하세요.
# 4번 과제 코드를 작성하세요.

3. 데이터 확인 및 기초 통계

과제:

  1. 연구원의 시가, 고가, 저가만 출력하세요.
  2. 연구원의 종가의 평균을 출력하세요.
  3. 연구원의 거래량의 최대값을 출력하세요.
  4. 연구원의 거래량의 최소값을 출력하세요.
  5. 연구원의 거래량의 표준편차를 출력하세요.
  6. 연구원의 거래량의 총합을 출력하세요.
  7. 연구원의 2040.09월 데이터만 출력하세요.
# 1번 과제 코드를 작성하세요.
# 2번 과제 코드를 작성하세요.
# 3번 과제 코드를 작성하세요.
# 4번 과제 코드를 작성하세요.
# 5번 과제 코드를 작성하세요.
# 6번 과제 코드를 작성하세요.
# 7번 과제 코드를 작성하세요.

4. 데이터 전처리

과제:

  1. 연구원의 결측치를 확인하고 결측치가 있다면 결측치가 있는 행을 제거하세요.
  2. 연구원의 날짜 데이터를 datetime 형식으로 변환하세요.
  3. 연구원의 종가와 시가의 차이를 나타내는 '차이' 열을 추가하세요.
  4. 연구원의 고가와 저가의 차이를 나타내는 '고저차이' 열을 추가하세요.
  5. 연구원의 거래량을 천 단위로 나누어 '거래량(천)' 열을 추가하세요.
  6. 연구원의 종가와 거래량을 곱하여 '거래금액' 열을 추가하세요.
# 1번 과제 코드를 작성하세요.
# 2번 과제 코드를 작성하세요.
# 3번 과제 코드를 작성하세요.
# 4번 과제 코드를 작성하세요.
# 5번 과제 코드를 작성하세요.
# 6번 과제 코드를 작성하세요.

5. 데이터 시각화

과제:

  1. 연구원의 종가의 시계열 그래프를 그려주세요.
  2. 연구원의 종가와 거래량의 관계를 나타내는 산점도를 그려주세요.
  3. 연구원의 전일비를 나타내는 막대 그래프를 그려주세요.
# 1번 과제 코드를 작성하세요. # show(19) 입니다. # 위니북스 show(19) plt.close()
# 2번 과제 코드를 작성하세요. # show(20) 입니다. show(20) plt.close()
# 3번 과제 코드를 작성하세요. # show(21) 입니다. show(21) plt.close()

6. 데이터 분석

위 데이터 분석을 통해 얻은 정보를 바탕으로 데이터에 대한 결론을 도출해주세요.

# 데이터 분석을 통해 얻은 정보를 바탕으로 결론을 도출하세요. # 코드가 아니라 텍스트 형태로 작성해주세요.

7. 나아가기

이후 이 데이터를 기반으로 예측 등을 할 수도 있습니다. 아래 삼성전자에 대한 간단한 예측을 해둔 영상이 있습니다. 해당 영상을 통해 연구원에 대한 예측을 코랩에서 진행해보세요.

삼성전자 주가 예측
{"packages":["numpy","pandas","matplotlib","lxml"]}
3장 파이널 프로젝트