Project Overview

<aside>

프로젝트명: K-뷰티 리테일 인사이트 agent
목표: 해외 고객의 실제 반응 데이터에서 트렌드·니즈·기회를 자동 탐지 및 판단 근거 제시하여 아모레퍼시픽(AP) 브랜드가 바로 실행할 수 있는 인사이트를 매주 지속적으로 제공
진행: 2026 AI Innovation Challenge 공모전 6인팀으로 프로젝트를 시작하여(2025.12) 공모전 제출 이후 개인적으로 개선함(2026.05 ~ 2026.06)
핵심 기술: Python · Claude API (Agentic) · Playwright · SQLite · Chart.js
데이터 : TikTok, YouTube API, OliveYoung Global, Sephora USA
Github: https://github.com/eugenee726/K-beauty-agent-intelligence-Agent- </aside>

⭐ Summary

What : 해외(미국) K-Beauty의 SNS 트렌드 · 리뷰(VOC) · 인기 제품을 AI가 분석해 "글로벌 고객이 기대하는 포인트 + 근거" 를 도출
How : Claude 기반 Agentic 파이프라인(수집 → 통계·LLM 분석 → 의사결정 → 리포트)을 매주 무인 자동 실행
Result : AP 브랜드가 바로 쓰는 3-Tab Interactive report
1. 📈 트렌드 인사이트: SNS에서 통계적으로 급등 중인 키워드를 2개의 독립 축(기회 유형, 트렌드 모양)으로 해석
2. 🛍️ 제품 전략: VOC 모멘텀 중심으로 전략 분류
3. ✈️ 방한 추천: 쇼핑리스트를 미리 작성해 한국을 방문하는 해외 고객을 위한 제품 top 15 제공

단순히 결과만 던지는 블랙박스가 아니라, 모든 판단 기준(수식·임계값)을 직접 설계해 공개하는 화이트박스. "왜 이 인사이트인가"의 근거를 함께 제공해 AP의 후속 기획·전략·개발을 독려합니다.

0. 공모전 소개 및 기존 프로젝트 한계

<aside>

아모레퍼시픽 2026 AI Innovation Challenge 공모전 주제

K-beauty 리테일 플랫폼 상의 트렌드, 고객 리뷰, 인기 제품 및 관련 SNS 반응을 AI가 분석해 '글로벌 고객이 K-beauty 브랜드에 기대하는 포인트'를 자동으로 알려주는 Agent

해외 고객들은 올리브영 글로벌 사이트와 같은 글로벌 K-Beauty 리테일 플랫폼과 SNS를 통해 K- Beauty 트렌드·제품리뷰·인기제품을 확인하고, 쇼핑리스트를 미리 작성해 한국을 방문하고 있음
글로벌 고객의 실제 반응을 기반으로 K-Beauty 트렌드를 예측하고, 아모레퍼시픽 브랜드들이 신속하고 정확하게 대응할 수 있는 Agent 희망
해외 고객 데이터에서 니즈 변화, 성분이나 제형 트렌드 변화, 신규 기회 영역을 AI가 자동으로 분석/탐지해 인사이트와 이슈 알림을 지속적으로 제공하는 기능 희망 </aside>

아모레퍼시픽 2026 AI Innovation Challenge 공모전에서 위의 주제로 6인 팀으로 2025.12 ~ 2026.1.12기간동안 프로젝트를 진행하여 전체 파이프라인을 기획 및 구현하였습니다.

기존 프로젝트는 SNS 선탐지 → 리테일 검증 → VOC GAP 진단의 과정을 거칩니다.

Phase	핵심 설계
0	올리브영 코리아 OCR → VOB(제품 디지털 자산) 기준 제품셋하여 한국 판매 제품을 기준으로 아모레 퍼시픽 카테고리를 통합함
1	듀얼 트렌드: SNS(7일 rolling 성장률) + 리테일(리뷰 증가율 ≥0.5)
2	SNS×리테일 교차 → HOT / SNS_LED / RETAIL_LED / QUIET 분류
3-4	VOC(제품별 100개 고정 샘플) → 규칙 기반 Gap 진단(PERFORMANCE/MARKETING/OPPORTUNITY/ALIGNED)
5	인사이트 카드(HTML)

그러나 실제 인사이트 활용 관점에서 구조적 한계를 발견하며, 이를 출발점으로 개인적으로 프로젝트를 디벨롭을 진행했습니다.

기존	기존의 한계	현재 (재설계)
트렌드 정의가 '단순 성장률'
(최근 7일 - 이전 7일)/이전 7일	베이스가 작으면 비율이 폭발하고, 통계적 유의성 판단이 없음	Z-score(직전 4주 평균 대비 표준편차) + 3주 모멘텀 + weeks_rising → 통계적 이상치 + 지속성 분리
VOC 100개 고정 샘플링	리뷰가 주당 1,000개 늘어난 제품과 10개 늘어난 제품을 똑같이 100개로 취급. 진짜 '리뷰 유입 속도'를 못 잡음	플랫폼 전체 리뷰 수의 주간 증감(velocity) + 별점 추세 → 실제 소비자 활동 측정
제품 매칭이 ‘difflib’ 문자열 유사도	difflib는 시퀀스 매칭이라 토큰 순서·부분집합에 약함	rapidfuzz token_sort/set_ratio + 정규화 6단계 + 임계값 85
의사결정 = '규칙 기반 Gap 분류'	Gap을 4유형으로 분류하나 "수백 개 중 이번 주에 어디에 자원을 집중하나"의 우선순위 정렬이 없음	우선순위 점수 + Agentic Orchestrator(LLM이 상황 보고 단계 판단)
주제의 핵심 '방한 추천' X	쇼핑리스트→방한 구매"를 직접 추천하는 결과물이 없음.	InboundPick 빌더로 방한 추천 Top 15 명시화 (SNS 강도+VOC+한국 랭킹)
OCR 기반 VOB·USA+UK 동시	OCR은 이미지 품질·레이아웃에 민감해 유지보수 비용이 크고, USA+UK 동시 타겟으로 시장 집중도가 분산	OCR 제거(구조화 스크랩+LLM 매칭) / 미국 단일 타겟(AP 미국 전략 정렬)

기존 프로젝트는 SNS·리테일·VOC를 잇는 흐름은 갖췄으나, 트렌드 판단이 단순 성장률에 그치고 의사결정·제품 연결이 약했습니다.

이를 통계 기반 트렌드 탐지(z-score·3주 모멘텀) + 리뷰 유입 속도 중심 VOC + LLM SKU 매핑 + Agentic 자동화로 재설계하고, 방한 추천을 핵심 결과물로 추가했습니다.

Project Overview

⭐ Summary

0. 공모전 소개 및 기존 프로젝트 한계

1. 새로운 배경 설정 및 문제 정의

1.1 시장 배경 : 왜 지금, 왜 미국인가.