<aside> 📌 Task :
</aside>
대전제 조건
주어진 구매 데이터를 기반으로 다음을 분석합니다
결과 유의사항 등 인사이트 간결하고 명확하게 정리
재웅-고가의 제품을 구매하는 고객이 Add-ons Purchased의 경우가 많을 것이다 >귀무가설 채택!
[x] 가격별/타입별 저중고를 나누었으나 둘다 의미없었음
[x] 짱구- 분기별 매출 급감 구간이 있을것이다. > 그래프로 결론 머신러닝으로 튀는 구간 잡기 >그 전에 품목 다합쳐야됨
[x] 다혜 -스마트폰을 구매한 고객은 헤드폰을 구매한 고객보다 만족도가 높을 것이고 재구매율 또한 높을 것이다.
재구매율은 토탈펄체이스 어마운트기준으로 아이디로 카운트하기!
대립가설채택! >스마트폰구매고객이 헤드폰보다 만족도 높다!! 재구매는 귀무! 연관없음!
본인진행상황코드
[x] 서영 - > 특정 결제 수단으로 결제한 사용자의 이탈률이 높을 것이다. 데이터 이쁨 마치 나같음(차서영) 캐쉬 직불카드 확연하게 높았음, 이건에 관한 해결방한 제시 너~무 명확함, 해당결제수단 방법을 개선한다거나 과정을 경량화 한다거나 직관적으로 알 수 있다. 적극추진요청!
대립가설 채택!
특정 날짜기준 결제타입별 이탈자가 < 이 전제조건이 맞나?
이탈률 기준은 90일 근거 정함 → 하단에 정리 완료
위 기준으로 이탈자를 확인했더니(결제수단별) 유의미한 차이가있었다(통계적으로)
이 결제수단별 이탈율을 감소하는 예측이관건(머신러닝)
결론:
유의미한 차이가 있었다. 차서영이 결국해냈다.
앞으로 이탈률과 결제수단이 서로 얽히는 관계를 찾아봐야한다.
결과 :
재웅 : 90일 초과 구매자 = 이탈자 따라서 계좌이체가 58퍼로 제일높다, 직불카드가 70퍼로 높고 검정시 유의미함 > 대립가설 채택!
혜썬 : 30일 이내 구매 하지않은 고객 = 이탈자, 따라서 이탈율 모두 높았으나 통계적 유의미 하였음
워크플로우 : 머신러닝을 이용한 결제 수단별 이탈율 하락 예측 과 결제수단을 우리가 원하는 수단으로 옮길 수 있는 방안 > 자사몰 포인트 캐쉬백,
[x] 혜선 - 구매 주기와 이탈률 | 가설: 첫 구매 후 30일 이내 재구매한 고객은 재구매 하지 않은 고객 보다 이탈률이 낮다.
1.귀무가설 기각 > 대립가설채택 유의미함.
1-1. > 3,6,90일 단위로 봐도 이탈율이 현저히낮음(30일 이내 재구매자) > 따라서 30일 이내재구매자가 아닌사람과 이탈율이 동등하게 나오는 지점을 마지노선으로 잡고 리마인드 이벤트를 기획 할 수 도있다. 30~마지노선 기간까지를 CLV핫타임으로 정의내릴 수 도 있다. > 이건 이구간대 가격이 얼마나 집중되있는지를 봐야될 수 도있다.
2.타입별 월별 판매량을 쪼개봤더니 2024년 1월부터 판매량 급증 원인분석 시급
[x] 혜선 - 제품군 별 재 구매율 차이 | 가설 : Product Type 별로 재구매율이 유의미하게 다르다.
[x] 다혜 - 2.배송유형에 따라 제품평점의 평균값에 유의미한 차이가 있을 것이다
대립가설채택!

또다른 가설! 2-1고가의 상품은 제일 빠른 배송 방법을 선택했을 가능성이 높을까요????
total purchased amount 컬럼은 = CLV의 척도
멤버십이 의미가 없다는 거니까 멤버쉽을 강화하는게 CLV증진에 키포인트가 될 수 있다.
진행 상황 코드
인사이트
[x] 혜선 - 첫 주문 금액과 고객 생애 주기와의 상관관계 | 가설: 첫 구매 주문 금액이 높은 고객일 수록 고객
[x] 혜선 - 구매 만족도와 CLV의 관계
가설1. 첫 구매 시 Rating이 높은 고객이 재구매율과 고객 생애 가치가 높다.(귀무가설)
가설 2. 총 Rating이 높은 고객이 재구매율과 고객 생애 가치가 높다. (대립가설)
진행 상황 코드
인사이트
# 2) 완료 주문만 필터(필요 시)
SSE = SSE[SSE['Order Status'] == 'Completed']
# 3) 주문 월(order_month) 생성
SSE['order_month'] = SSE['Purchase Date'].dt.to_period('M')
# 4) 제품별 월별 구매 건수 집계
monthly_sales = (
SSE
.groupby(['order_month', 'Product Type'])
.size()
.reset_index(name='sales_count')
)
# 5) pivot: 각 제품을 컬럼으로 펼치기
pivot_SSE = monthly_sales.pivot(
index='order_month',
columns='Product Type',
values='sales_count'
).fillna(0)
# 6) x축에 매월 표시할 datetime 인덱스
x = pivot_SSE.index.to_timestamp()
# 7) 라인 차트 그리기
plt.figure(figsize=(12, 6))
for product in pivot_SSE.columns:
plt.plot(x, pivot_SSE[product], marker='o', label=product)
# 8) xticks를 모든 월로 설정
plt.xticks(x, [d.strftime('%Y-%m') for d in x], rotation=45)
plt.title('Monthly Purchase Volume by Product Type')
plt.xlabel('Month')
plt.ylabel('Number of Purchases')
plt.legend(title='Product Type', loc='upper left', bbox_to_anchor=(1, 1))
plt.tight_layout()
plt.show()

<aside> 📌 실행 및 진행 사항 정리
</aside>
기준 정리
CLV : TOTAL PURCHASED AMOUT 컬럼
이탈기준 : 90일 이상 재구매가 없는 사용자
대립가설 목록