크로와상
2024.03.22•
그럼 포지션별 타율 분포를 박스플롯으로 한번 그려볼까요?
중앙값이 박스 내 선으로 표시되어 확인하기가 좀 더 쉬워졌죠?
점으로 표시되는 부분들은 '이상치'로, IQR(3분위수 - 1분위수)의 1.5배를 넘어서는 값들입니다.
완성된 박스플롯을 살펴보면, 포수(C)의 타율이 눈에 띄게 낮은 편이네요. 반대로, 우익수(RF)의 타율이 가장 높습니다.
지금은 경향성을 보기 위해서 이상치 제거 없이 시각화를 해 보았지만, 실제로 분석을 진행할 때는 이상치를 제거하는 전처리 작업을 해주어야겠죠?🤔
다음엔 어떤 주제를 가져와 볼까요 !
💪1
0
답글 0
크로와상 님에게 도움과 영감을 주는 답글을 남겨보세요