<aside> 📌 Task : 연령대에 따른 유의미한 데이터 도출하기

</aside>

https://colab.research.google.com/drive/1oNaitIr0NPBx1-S2jHYD3xPzg53i5Wyi?usp=sharing

  1. 결측치 및 이상치 확인 후 대체하기
  2. 가설 입증을 위한 컬럼 생성
  3. 연령대별 유의미한 차이점 도출하기

<aside> 📌 실행 및 진행 사항 정리

</aside>

image.png

  1. 연령대별 평균 독서 중단 위치

60대 (53.4) → 40대 (51.2) → 30대 (50.9) → 50대 (50.7) → 20대 (50.3) → 10대 (47.9)

###피드백
전체적으로 잘 진행하고 있습니다.
1. dropout_reason_detail 의 결측치 값들을 제거하기 보다 
"해당없음" 과 같이 대체하면 통계 결과가 더 명확해 질 수 있을거 같습니다.
2. 연령대별 비교 등 집단 간 차이는 본격적 시각화 단계 이전에도  
바차트, 히트맵, 박스플롯 등 시각화 추가로 설득력 강화 가능

<aside> 📌 결과

</aside>