<aside>



단순히 결과만 던지는 블랙박스가 아니라, 모든 판단 기준(수식·임계값)을 직접 설계해 공개하는 화이트박스. "왜 이 인사이트인가"의 근거를 함께 제공해 AP의 후속 기획·전략·개발을 독려합니다.
<aside>
아모레퍼시픽 2026 AI Innovation Challenge 공모전 주제
K-beauty 리테일 플랫폼 상의 트렌드, 고객 리뷰, 인기 제품 및 관련 SNS 반응을 AI가 분석해 '글로벌 고객이 K-beauty 브랜드에 기대하는 포인트'를 자동으로 알려주는 Agent
아모레퍼시픽 2026 AI Innovation Challenge 공모전에서 위의 주제로 6인 팀으로 2025.12 ~ 2026.1.12기간동안 프로젝트를 진행하여 전체 파이프라인을 기획 및 구현하였습니다.
기존 프로젝트는 SNS 선탐지 → 리테일 검증 → VOC GAP 진단의 과정을 거칩니다.
| Phase | 핵심 설계 |
|---|---|
| 0 | 올리브영 코리아 OCR → VOB(제품 디지털 자산) 기준 제품셋하여 한국 판매 제품을 기준으로 아모레 퍼시픽 카테고리를 통합함 |
| 1 | 듀얼 트렌드: SNS(7일 rolling 성장률) + 리테일(리뷰 증가율 ≥0.5) |
| 2 | SNS×리테일 교차 → HOT / SNS_LED / RETAIL_LED / QUIET 분류 |
| 3-4 | VOC(제품별 100개 고정 샘플) → 규칙 기반 Gap 진단(PERFORMANCE/MARKETING/OPPORTUNITY/ALIGNED) |
| 5 | 인사이트 카드(HTML) |
그러나 실제 인사이트 활용 관점에서 구조적 한계를 발견하며, 이를 출발점으로 개인적으로 프로젝트를 디벨롭을 진행했습니다.
| 기존 | 기존의 한계 | 현재 (재설계) |
|---|---|---|
| 트렌드 정의가 '단순 성장률' | ||
| (최근 7일 - 이전 7일)/이전 7일 | 베이스가 작으면 비율이 폭발하고, 통계적 유의성 판단이 없음 | Z-score(직전 4주 평균 대비 표준편차) + 3주 모멘텀 + weeks_rising → 통계적 이상치 + 지속성 분리 |
| VOC 100개 고정 샘플링 | 리뷰가 주당 1,000개 늘어난 제품과 10개 늘어난 제품을 똑같이 100개로 취급. 진짜 '리뷰 유입 속도'를 못 잡음 | 플랫폼 전체 리뷰 수의 주간 증감(velocity) + 별점 추세 → 실제 소비자 활동 측정 |
| 제품 매칭이 ‘difflib’ 문자열 유사도 | difflib는 시퀀스 매칭이라 토큰 순서·부분집합에 약함 | rapidfuzz token_sort/set_ratio + 정규화 6단계 + 임계값 85 |
| 의사결정 = '규칙 기반 Gap 분류' | Gap을 4유형으로 분류하나 "수백 개 중 이번 주에 어디에 자원을 집중하나"의 우선순위 정렬이 없음 | 우선순위 점수 + Agentic Orchestrator(LLM이 상황 보고 단계 판단) |
| 주제의 핵심 '방한 추천' X | 쇼핑리스트→방한 구매"를 직접 추천하는 결과물이 없음. | InboundPick 빌더로 방한 추천 Top 15 명시화 (SNS 강도+VOC+한국 랭킹) |
| OCR 기반 VOB·USA+UK 동시 | OCR은 이미지 품질·레이아웃에 민감해 유지보수 비용이 크고, USA+UK 동시 타겟으로 시장 집중도가 분산 | OCR 제거(구조화 스크랩+LLM 매칭) / 미국 단일 타겟(AP 미국 전략 정렬) |
기존 프로젝트는 SNS·리테일·VOC를 잇는 흐름은 갖췄으나, 트렌드 판단이 단순 성장률에 그치고 의사결정·제품 연결이 약했습니다.
이를 통계 기반 트렌드 탐지(z-score·3주 모멘텀) + 리뷰 유입 속도 중심 VOC + LLM SKU 매핑 + Agentic 자동화로 재설계하고, 방한 추천을 핵심 결과물로 추가했습니다.