통합 개요 표

구분 전미정 분석 조예진 분석 공통점/유사점 핵심 차이점
목적 유지 vs 이탈 그룹의 첫 결제 이후 학습 행동(시작/완료) 차이 탐색함 유지 vs 이탈 그룹의 **첫 구독 이후 학습 행동(시작→완료 매칭)**과 완료율→유지확률 연결함 유지/이탈 비교 구조 동일함 전미정은 “행동량·품질 점검” 중심, 조예진은 “완료율 기반 예측적 해석” 중심임
기준 시점 first_payment_time(첫 결제) 기준 0일 설정함 first_sub_time(첫 구독 이벤트) 기준 0일 설정함 구독 이벤트를 기준점으로 삼음 기준 이벤트 정의가 결제 vs 구독으로 다름→ 결과적으로 같음
기간 윈도우 3/7/14일 구간 중심으로 지표 산출함 30일 윈도우 설정 후 3/7/14일도 별도 산출함 초기 N일 행동을 핵심 신호로 봄 전미정은 “N일 구간”이 메인, 조예진은 “30일 전체 + N일 세부” 병행임
시작/완료 정의 enter/complete 로그 기반, 고유 lesson 집계(nunique) 중심임 enter와 complete를 merge_asof로 매칭 후 완료 여부 판단함, 일부는 count 집계도 사용함 시작·완료 로그를 지표의 핵으로 사용함 전미정은 “고유 기반” 일관성 높음, 조예진은 “매칭 정확도↑ vs 집계 기준 혼재” 리스크 존재함
핵심 지표 started/completed(3·7·14일), 완료율(rate) 산출함. 0 포함/제외 비교함 lessons_started/lessons_completed/completion_rate, “완강 경험 유저 비율”, completion_rate bin별 retention_rate 커브 산출함 완료율과 행동량을 함께 봄 조예진은 “완료율→유지확률”까지 모델링적 시도를 포함함
시각화 그룹 비교 막대 + 일별 추이 라인 + 0 포함 여부 평균 비교함 분포(히스토그램/정규화) + 평균 막대 + 산점도 + retention curve 구성함 그룹 비교 시각화 다수 포함함 전미정은 “추이·품질 점검” 시각화, 조예진은 “분포·확률 곡선” 시각화 강함
데이터 품질/이상치 started 없이 completed 존재, completed>started 케이스 탐지·차단 로직 포함함 asof 매칭으로 완료 정의를 정교화함, 다만 started/completed를 count로 잡는 구간 존재함 계측 이슈 가능성을 인지함 전미정은 “이상치 탐지 체계”가 명시적, 조예진은 “매칭 정교화”가 강점임
결과 해석 포인트 (추가 반영) 총량 기준 Churn이 더 큼, 완료율은 두 그룹 거의 동일함 → 완료율 단독 분리력 약함 완료율 구간화 후 유지확률 곡선으로 관계 확인 시도함 “완료율만으로는 부족” 가능성 제기됨 전미정은 “총량 착시(유저 수 통제 필요)”를 전제로 함, 조예진은 “완료율-유지 관계”를 직접 확인함

공통 분석 방향 정리