<aside>
담당 가설: 잠재 전환형 유저(저가형)
<aside> 📓
내용
조건:
price_band = under_50kuser_type = newtraffic_source = searchreview_clicked = Falsediscount_exposed = True
</aside><aside>
내용 적기
</aside>
해야 할 분석
상품 타입별 전환율 차이 확인
→ 어떤 제품군에서 전환율이 높고 낮은지 파악
PDP 체류시간과 할인 노출의 상관관계
→ 체류 시간이 길수록 할인 영향이 있었는지 파악
# 1. 분석 타겟 필터링
target_users = df[
(df['price_band'] == 'under_50k') &
(df['user_type'] == 'new') &
(df['traffic_source'] == 'search') &
(df['review_clicked'] == False) &
(df['discount_exposed'] == True)
]
# 2. 체류시간 + 상품 카테고리별 분석
summary = target_users.groupby(['duration_group_label', 'product_category']).agg(
total_users=('user_id', 'count'),
avg_pdp_duration=('pdp_duration_sec', 'mean'),
churned_users=('add_to_cart', lambda x: (x == 'No').sum()),
converted_users=('purchase_completed', lambda x: (x == 'Yes').sum())
).reset_index()
# 3. 비율 계산
summary['dropout_rate'] = (summary['churned_users'] / summary['total_users']) * 100
summary['conversion_rate'] = (summary['converted_users'] / summary['total_users']) * 100
# 4. 반올림
summary['avg_pdp_duration'] = summary['avg_pdp_duration'].round(1)
summary['dropout_rate'] = summary['dropout_rate'].round(1)
summary['conversion_rate'] = summary['conversion_rate'].round(1)
# 5. 결과 출력
summary
————————————————
결과 요약
accessory, outlet 카테고리에서만 전환 발생bag, fashion은 전환율 0%