- [x] Abstract
- [x] 1. INTRODUCTION
- [x] 2. RELATED WORK
- [x] 3. ITEM RECOMMENDATION FROM SEQUENTIAL SET DATA
- [x] 3.1 Sequential vs. General Recommender
- [x] 3.2 Formalization
- [x] 4. FACTORIZING PERSONALIZED MARKOV CHAINS (FPMC)
- [x] 4.1 Personalized Markov Chains for Sets
- [x] 4.1.1 Markov Chains for Sets
- [x] 4.1.2 Estimation of Transition Probabilities
- [x] 4.1.3 Personalized Markov Chains for Sets
- [x] 4.1.4 Limitations of MLE and Full Parametrization
- [ ] 4.2 Factorizing Transition Graphs
- [ ] 4.2.1 Factorization of the Transition Cube
- [ ] 4.2.2 Factorization of the Transition Matrix
- [ ] 4.3 Summary of FPMC
- [ ] 5. ITEM RECOMMENDATION FROM SEQUENTIAL SET DATA WITH FPMC
- [ ] 5.1 Optimization Criterion S-BPR
- [ ] 5.2 Item Recommendation with FPMC
- [ ] 5.3 Learning Algorithm
- [ ] 6. EVALUATION
- [ ] 6.1 Dataset
- [ ] 6.2 Evaluation Metrics
- [ ] 6.3 Results
- [ ] 6.3.1 MC vs. FMC
- [ ] 6.3.2 MF vs. FMC vs. FPMC
- [ ] 7. CONCLUSION
Abstract
가장 잘 알려진 추천 방법은 1) Matrix factorization과 2) Markov chain이다. FPMC는 이 두 가지 방법을 결합한 모델이다!
- Markov chain은 아이템으로 구성된 전이 그래프(transition graph)를 학습하여 sequential 행동을 모델링한다. FPMC도 개인화된 전이 그래프에 기반한다.
- Matrix factorization은 유저-아이템 행렬을 분해하여 유저의 선호도를 학습한다. FPMC도 전이 큐브(transition cube)를 분해한다.
1. Introduction
MC는 개별 유저의 정보는 없고 전이 행렬을 추정한 다음 유저를 적용시켜 다음 아이템을 예측한다. 즉, 모든 유저의 모든 데이터를 사용한다. 반면 MF는 각 유저의 선호도를 행렬분해함으로써 얻기 때문에 개인화이다! 그러나 시간 정보는 학습되지 않는다.
FPMC는 전이 행렬에서 나아가 전이 큐브를 추정한다! 그래서 각 슬라이스가 유저 개별의 행렬이 된다. 그럼 기본적인 MC가 시간정보만 사용했다면 여기에 개인화가 추가되는 것이다!
데이터가 매우 희소하면 Maximum Likelihood Estimation같은 카운팅 기반의 방법을 사용해서는 전이 행렬의 전체 파라미터를 학습할 수 없다! 그래서 FPMC는 분해(factorization) 모델을 사용했다. 그러면 파라미터 수가 줄어들고 일반화 성능이 좋아진다! 높은 희소성 데이터도 다룰 수 있다!
정리하자면 주요 컨트리뷰션은 다음과 같다.
- Markov chain을 전이 행렬에서 전이 큐브로 확대하여 개인화가 가능하게 했다.
- 희소 데이터를 다루기 위해 분해 모델을 도입했다.