<aside> 💡

생소한 단어

단어 정의
RCE(무작위 통제 실험)
평균 처치 효과(ATE)
개인별 처치 효과(ITE)
</aside>

<aside> 📊

1. 데이터셋

image.png

<aside> 💡

2. EDA - Treatment 효과 (Visit & Conversion에 대한)

****※ ****단, exposure(실제 노출) 여부가 성과에 큰 영향 가능성 확인

→ 처치 그룹 중 실제 노출(exposure) 비율은 3.6% (약 28명 중 1명)

노출된 사용자 방문율: 41%, 노출되지 않은 사용자: 3.5%

노출된 사용자 전환율: 5.3%, 노출되지 않은 사용자: 0.12%

→ 처치 그룹이지만 노출되지 않은 경우, 방문율과 전환율이 treatment 0인 경우보다 오히려 감소



<결과>

image.png

image.png

</aside>

<aside> 💡

3. Resampling (불균형 처리)



<결과>

image.png

</aside>

<aside> 💡

4. 모델: LGWUM (Kane et al., 2014)

구분 집단명 처치(Treatment) 반응(Response) 의미 / 해석
TR Treatment Responders 받음 (1) 반응함 (1) 처치 덕분에 반응한 집단 → 가장 가치 있는 타겟
CN Control Non-responders 안 받음 (0) 반응 안 함 (0) 처치 안 하면 반응 안 함 → 처치 시 반응할 가능성 있는 집단
TN Treatment Non-responders 받음 (1) 반응 안 함 (0) 처치해도 소용없는 집단 → 비용 낭비
CR Control Responders 안 받음 (0) 반응함 (1) 처치 없어도 반응함 → 증분 효과 없음

<aside> 💡

  1. treatment와 visit 조합으로 데이터를 CN/CR/TN/TR 4개 클래스로 라벨링함
  2. XGBoost로 각 클래스에 속할 확률을 예측하고, 이를 이용해 uplift_score를 계산함
  3. 테스트 데이터에 대해 uplift 점수와 실제 클래스를 포함한 결과를 생성함 </aside>

</aside>

<aside> 💡

5. 모델 평가 방법 (Qini Curve)


</aside>

<aside> 💡

6. Uplift 분포 결과 해석 및 모델 평가 결과(Treatment - visit)


</aside>

<aside> 💡

</aside>

<aside> 💡

</aside>