논문 : https://ojs.aaai.org/index.php/AAAI/article/view/3804
레퍼런스 / 학습 자료
발표 자료
Abstract
- 세션 기반의 추천 (session-based rec) 목적성 : 유저를 특정하기 어려운(anonymous) 세션 데이터 기반 유저의 다음 액션 예측
- 과거 세션 기반 추천 모델
- 특징
- 세션을 시퀀스로 모델링
- 아이템과 함께 사용자 표현을 추정하여 추천을 수행
- 한계
- 세션 내에서 정확한 유저 백터를 얻기는 어려웠으며
- 복잡한 아이템의 트랜지션을 충분히 고려하지 못했음
- 그래서 본 논문에서 새롭게 제안하는 방법은?
- session-based rec with GNN
SR-GNN
알고리즘 활용
- 정확한 아이템 임베딩을 얻고
- GNN을 통해 아이템들 간의 복잡한 transition을 반영하기 위해
- 특징
- attention network를 활용하여 각 세션들의 전역적(global)인 선호도 + 현재 세션의 관심도 계산 (* attention network : 유저의 선호도에 대한 가중치를 동적으로 학습하는 네트워크. 인풋의 상대적인 중요도 학습)
1. Introduction
- 과거 추천 알고리즘 (e.g. MC, RNN, NARM, STAMP)의 한계
- 한 세션에서 충분한 유저의 액션이 없는 경우, 다음 액션을 추정하는 것이 어려웠음. 추가적으로 세션 대부분은 익명이고 한 세션에 많은 유저들이 있으므로 각 세션에서 각 유저들의 표현을 정확하게 추정하는 것이 어려웠음. 그런데 RNN의 핵심인 레이턴트 백터는 유저의 표현을 기반으로 추천을 생성했으므로 한계가 명확했음
- 과거 MC, RNN 기반 알고리즘들은 연속적인 아이템 간 단방향 트랜지션을 모델링했으므로 세션 내 아이템들의 다양하고 복잡한 트랜지션을 고려하지 못했음. 아이템 간의 트랜지션 패턴이 중요하고 이 패턴은 로컬 팩터로 활용되기 때문에 한계가 있었음
- SR-GNN 제안
- 그래서 무엇인가?
- 아이템 간의 다양한 트랜지션을 탐색하고 아이템들의 정확한 잠재 백터(latent vector)를 만드는 알고리즘
- 그래서 뭘하나?
- 과거 세션 시퀀스를 기반으로 그래프 구성
- 세션 그래프 기반으로 아이템들의 트랜지션을 포착하고 아이템들의 정확한 임베딩 백터 생성(기존 MC, RNN 기반 추천 모델에선 어려웠던 부분)함으로써 세션 표현을 보다 신뢰할 수 있게끔 구성하고 다음 아이템 클릭을 추론
- SR-GNN workflow
- 요약하자면,
- 그래프 구조 데이터로 분리된 세션 시퀀스를 모델링하고, (그래프 구조로 세션 구성) 복잡한 아이템 트랜지션을 구성하기 위해 GNN 이용
- 세션 기반 추천을 위해 유저 프로파일에 의존하기 보단, 각각의 단일 세션 관련 아이템들의 잠재 백터를 기반으로 얻을 수 있는 세션 임베딩을 활용
2. Related Work
- Conventional recommendation methods
- Matrix Factorisation(행렬분해)
- 유저와 아이템의 rating 행렬을 두 개의 저차원 행렬로 분해하는 것. 각 행렬은 유저와 아이템의 레이턴트 팩터
- 유저의 선호도가 positive clicks에 의해서만 제공되기 때문에 세션 기반 추천에는 그다지 적합하지 않음
- item-based neighborhood methods
- 세션 내에서 아이템의 동시발생성을 바탕으로 아이템 간의 유사도 계산
- 아이템의 순차적인 순서를 고려하기 어렵고 마지막 클릭에만 의존해서 한계가 있었음
- Markov-chain
- 추천 문제를 순차적인 최적화 문제로 보며, MDPs(Markov decision processes)로 해결
- FPMC
- 유저의 개인화된 확률 전이 행렬 인수분해함으로써 연속된 두 개의 클릭 사이의 순차적인 동작을 모델링하고 각 시퀀스에 대해 보다 정확한 예측 진행
- 이전 구성 요소를 독립적으로 결합하기 때문에 예측 정확도가 제한됨
- Deep-learning-based methods
- RNN 기반 모델들
- NARM : encoder-decoder 아키텍처를 가진 신경망 추천 알고리즘. 세션 내 순차적 동작과 유저의 주요 목적, 유저 특성 모델링
- STAMP : MLP + attention network 활용 모델. 유저의 일반적인 관심사와 현재 관심사를 효과적으로 포착