주식 시장에서 산업 별로 차지하는 비중 그래프로 보기
* 이전 글의 코드와 이어짐
1. 필요한 데이터가 무엇인지 알고, 해당 파일의 데이터 형태 확인
임시로 정한 날짜 기준으로 모든 종목들의 시가총액 데이터와 종목들의 업종(섹터) 데이터가 필요함.
# 시가 총액 파일
d['mc'].head()
# 종목이름과 섹터 파일
stock_info.head()
- .head()로 상위 몇 개의 데이터를 볼 수 있다. => 데이터 형태 알기
2. 날짜에 해당하는 시가총액 데이터와 업종 데이터를 병합하여 데이터프레임 생성.
# 임시로 가장 최근 날짜 지정
view_date = d['adj_close'].columns[-1]
# stock_info 데이터프레임과 해당 날짜의 시가총액 시리즈 병합
stockinfo_mc_df = pd.concat([stock_info, d['mc'].loc[:, view_Date]], axis=1)
- 병합시 axis=1 이므로 index를 공유하여 column으로 붙는다.
3. 필요한 데이터로 만들기 : 업종별로 묶고, 동일한 업종의 시가총액은 합산한다.
sector_mc_df = stockinfo_mc_df.groupby('Sector').sum()
# 시가총액 내림차순 정렬
# sector_mc_df = stockinfo_mc_df.groupby('Sector').sum().sort_values(view_date, ascending=False)
4. 업종 별로 합산된 시가총액 (시장에서 업종 별 비중) 그래프 그리기
sector_mc_df.plot(kind='pie', y=view_date, figsize=(15,9), legend=False, autopct='%1.1f%%');
'퀀트' 카테고리의 다른 글
12. 전체 산업별, 기간별 수익률 데이터 보기 (0) | 2023.01.03 |
---|---|
11. 최근 수익률이 높았던 종목 보기 (0) | 2023.01.03 |
09. 데이터 파일(CSV) 읽어서 그래프 그리기 + 이동평균선 추가 (0) | 2022.12.28 |
08. 데이터 분석 : EDA (1) | 2022.12.26 |
07. Seaborn (0) | 2022.12.05 |