컨텐츠의 난이도가 유지율에 미치는 영향 분석

관계 : N:N

‘유저 = 컨텐츠’를 1:1로 요약하는 과정이 필요하다. why? 유저 한 명이 수백 개의 레슨을 듣기 때문에 어떤 시점에 어떤 난이도를 듣는지 기준이 필요함

분석 1. 컨텐츠 난이도에 따른 유저의 초반 생존율 분석

사전 작업: start_content파일 전체를 활용하는 것은 불필요하니, 먼저 start_content 파일의 'content별 난이도' 파일을 추출하여 작업하였음

(파일 업로드 하기)

content_difficulty_mapping.csv

  1. event_type이 complete인 행만 추출
  2. 이 사람들의 첫 lesson을 추출(1개월 구독인 사람만으로 통일)
  3. lesson과 난이도를 결합하여 처음으로 경험하는 콘텐츠의 난이도 기술통계
  4. 난이도에 따른 다음 구독 여부 분석(연달아서 갱신하는 버전과 전체 기간으로 봤을 때 다음 구독이 있는 경우를 구분하여 따로 분석)