<aside> 📊

업리프트 모델링 (Uplift Modeling)

“광고가 정말로 고객의 행동을 바꿨는가?”를 개인 단위로 추정하여,

마케팅 예산을 가장 효과적인 고객에게 집중하기 위한 분석 방법


고객 유형 의미 조건
🎯 Persuadable 광고 때문에 전환한 고객 (핵심 타겟) uplift ≫ 0
✅ Sure Thing 광고가 없어도 전환했을 고객 uplift ≈ 0 & 전환율 높음
❌ Lost Cause 광고와 무관하게 전환하지 않는 고객 uplift ≈ 0 & 전환율 낮음
⚠️ Do Not Disturb 광고 때문에 오히려 전환하지 않은 고객 uplift < 0

목적: “광고를 본 고객 중, 정말로 광고에 반응한 고객(Persuadable)을 찾아 예산을 가장 효율적으로 집행”


🔧 모델링 방식: Two-Model(T-Learner) 기반 업리프트 추정

업리프트 모델링에서는 두 개의 모델을 각각 따로 학습

그리고 각 고객에 대해 다음과 같이 업리프트 스코어(uplift score) 를 계산

Uplift Score = P(conversion | treatment=1, X) − P(conversion | treatment=0, X)

“이 고객에게 광고를 보냈을 때, 전환 확률이 얼마나 증가(또는 감소)하는가?”

⇒ “고객 X에게 광고를 보냈을 때와 안 보냈을 때의 전환 확률 차이”


※ A/B 테스트의 한계와 업리프트 모델의 보완점

</aside>


<aside> 💡

1. Dataset 설명


image.png

<데이터셋.head()>

</aside>

<aside> 💡

2. EDA: 분포 왜곡(비대칭성) 판단

모델 학습 전, 입력 피처의 분포 특성을 파악하기 위해 두 가지 지표를 사용하였다.

2-1. Mean–Median Relative Difference


image.png

<코드>

image.png

<결과>


2-2. Skewness (왜도)

→ 두 지표를 함께 사용하여, 중앙부는 안정적인지 / 꼬리에 극단치가 존재하는지를 종합적으로 판단하였다.


image.png

image.png

<코드>

<결과>


2-★ 결론

<aside> 💡

3. 광고 노출 여부별 전환율 분석

<aside> 💡

</aside>

<aside> 💡

</aside>