시각화를 위한 그래프 몇가지
Line Plot
선그래프 (x, y축 ⇒ 함수)
시간의 흐름에 따른 데이터 변화를 표현하기 좋다.
Area Plot
영역 그래프
선그래프와 비슷하나, 아래 영역의 넓이가 어떠한 의미를 가질 때 주로 사용한다.
Histogram 히스토그램
막대그래프
데이터의 값에 따른 분포를 나타낼 때 주로 사용한다.
Bar charts
막대그래프
각 수치 간 비교를 직관적으로 할 수 있는 장점이 있다.
Pie charts
파이 그래프
일반적으로 각 조각의 합을 100%로 그린다.
각 값들이 차지하는 비중을 살펴보기에 적합한 그래프이다.
Scatter plots
산점도 그래프
데이터가 수치적으로 어떠한 곳에 위치하고 있는지 직관적으로 볼 수 있다.
두 변수간의 관계를 볼 때도 많이 사용한다.
Polar plots
극좌표 그래프
위치를 거리와 각도로 나타낸 극 좌표계에서 데이터를 표현할 때 사용한다. (각도, 반지름)
지구과학, 천문학 등에서 주로 사용된다.
Box Plots
박스 그래프
데이터의 통계량을 나타내기 좋은 그래프이다.
박스와 꼬리는 4분위 수를 나타낸다. (0%, 25%, 50%, 75%, 100%)`
Violin Plots
바이올린 그래프
각 데이터의 분포와 쏠림의 정도를 함께 볼 수 있는 그래프이다.
데이터의 분포를 보다 자세히 나타내야 할 때 사용된다.
Heatmaps
히트맵 그래프
두 변수간 관계와 변수들에 대한 결과를 나타낼 때 주로 사용한다.
상관관계를 나타낼 때도 유용하게 사용된다.
목적
무엇을 볼 것인가에 따라 그래프를 그린다.
'퀀트' 카테고리의 다른 글
07. Seaborn (0) | 2022.12.05 |
---|---|
06. Matplotlib / Pandas 에서 plot 생성하기 (0) | 2022.12.01 |
04. DataFrame : 생성, 연산, 정렬, 병합, 그룹, 쿼리 (1) | 2022.11.30 |
03. Pandas : Series, DataFrame (1) | 2022.11.30 |
02. Numpy : 배열 생성, indexing, slicing, 연산, broadcast, aggregation (2) | 2022.11.30 |