통합 개요 표
| 구분 | 전미정 분석 | 조예진 분석 | 공통점/유사점 | 핵심 차이점 |
|---|---|---|---|---|
| 목적 | 유지 vs 이탈 그룹의 첫 결제 이후 학습 행동(시작/완료) 차이 탐색함 | 유지 vs 이탈 그룹의 **첫 구독 이후 학습 행동(시작→완료 매칭)**과 완료율→유지확률 연결함 | 유지/이탈 비교 구조 동일함 | 전미정은 “행동량·품질 점검” 중심, 조예진은 “완료율 기반 예측적 해석” 중심임 |
| 기준 시점 | first_payment_time(첫 결제) 기준 0일 설정함 | first_sub_time(첫 구독 이벤트) 기준 0일 설정함 | 구독 이벤트를 기준점으로 삼음 | 기준 이벤트 정의가 결제 vs 구독으로 다름→ 결과적으로 같음 |
| 기간 윈도우 | 3/7/14일 구간 중심으로 지표 산출함 | 30일 윈도우 설정 후 3/7/14일도 별도 산출함 | 초기 N일 행동을 핵심 신호로 봄 | 전미정은 “N일 구간”이 메인, 조예진은 “30일 전체 + N일 세부” 병행임 |
| 시작/완료 정의 | enter/complete 로그 기반, 고유 lesson 집계(nunique) 중심임 | enter와 complete를 merge_asof로 매칭 후 완료 여부 판단함, 일부는 count 집계도 사용함 | 시작·완료 로그를 지표의 핵으로 사용함 | 전미정은 “고유 기반” 일관성 높음, 조예진은 “매칭 정확도↑ vs 집계 기준 혼재” 리스크 존재함 |
| 핵심 지표 | started/completed(3·7·14일), 완료율(rate) 산출함. 0 포함/제외 비교함 | lessons_started/lessons_completed/completion_rate, “완강 경험 유저 비율”, completion_rate bin별 retention_rate 커브 산출함 | 완료율과 행동량을 함께 봄 | 조예진은 “완료율→유지확률”까지 모델링적 시도를 포함함 |
| 시각화 | 그룹 비교 막대 + 일별 추이 라인 + 0 포함 여부 평균 비교함 | 분포(히스토그램/정규화) + 평균 막대 + 산점도 + retention curve 구성함 | 그룹 비교 시각화 다수 포함함 | 전미정은 “추이·품질 점검” 시각화, 조예진은 “분포·확률 곡선” 시각화 강함 |
| 데이터 품질/이상치 | started 없이 completed 존재, completed>started 케이스 탐지·차단 로직 포함함 | asof 매칭으로 완료 정의를 정교화함, 다만 started/completed를 count로 잡는 구간 존재함 | 계측 이슈 가능성을 인지함 | 전미정은 “이상치 탐지 체계”가 명시적, 조예진은 “매칭 정교화”가 강점임 |
| 결과 해석 포인트 | (추가 반영) 총량 기준 Churn이 더 큼, 완료율은 두 그룹 거의 동일함 → 완료율 단독 분리력 약함 | 완료율 구간화 후 유지확률 곡선으로 관계 확인 시도함 | “완료율만으로는 부족” 가능성 제기됨 | 전미정은 “총량 착시(유저 수 통제 필요)”를 전제로 함, 조예진은 “완료율-유지 관계”를 직접 확인함 |
공통 분석 방향 정리
유지/이탈 라벨을 만들고, 구독 기준 시점 이후 학습 로그를 결합해 행동 차이를 비교하는 구조임
3/7/14일을 “초기 활성 신호”로 간주해 started/completed 및 완료율을 핵심 지표로 삼는 흐름임
결과 해석 시 “총량(합계)”은 유저 수 차이에 의해 쉽게 왜곡될 수 있어 정규화(유저당) 필요성이 내재함
전미정 분석 방향 정리
조예진 분석 방향 정리