[통계학습] 탐색적 데이터 분석(2)
1.5 데이터분포 탐색하기데이터 분포를 탐색할 수 있는 시각화 그래프 : 상자그림(box plot),도수분포표,히스토그램, 밀도그림 1) 백분위수와 상자그림* 백분위수 : 크기가 있는 값들로 이뤄진 자료를 (일반적으로 작은 것부터)순서대로 나열했을 때 백분율로 나타낸 특정 위치의 값 tips['tip'].quantile([0.05,0.25,0.5,0.75,0.95])# tip에 대한 백분위수# 5% 1.44, 25%(Q1) 2, 50%(Q2) 2.9, 75%(Q3) 3.56, 95%(상위5%) 5.19# 백분위수를 boxplot으로 표현하기ax = (tips['tip']).plot.box()ax.set_ylabel('tip')# 약 6보다 크면 이상치 = 3.56+(3.56-2)*1.5 2) 도수분포표..
2024. 5. 13.