대회에서는 implicit feedback 기반의 sequential recommendation 시나리오를 바탕으로 사용자의 time-ordred sequence에서
일부 item이 누락된 (dropout)된 상황을 상정하기 때문에, 마지막 아이템 예측 뿐만아니라 중간 아이템 또한 예측해야 한다.
본 프로젝트는 Movie Recommendation, 즉 유저의 영화 시청 이력 데이터를 바탕으로 유저에게 볼 영화를 추천해주는 대회에서 솔루션을 제시한다.
Timestamp 정보가 들어간 implicit feedback 데이터를 통해 모든 유저에게 10개의 영화를 추천하여 추천 리스트의 정확성을 평가한다.
평가를 위한 정답(ground-truth) 데이터는 sequential recommendation 시나리오를 바탕으로 하는 동시에
복잡한 실제 상황을 가정하여 다음과 같이 원본 데이터에서 추출되었다.
위와 같이 데이터셋이 구성되어 있기 때문에, 단순 sequential한 예측에 최적화된 모델은 static 데이터의 예측에 약점을 보일 수 있고,
반대로 static한 예측에 최적화된 모델은 sequential한 예측에 약점을 보일 수 있다.
Recall@10 - 각 유저에 대해 10개의 영화를 추천하고, 이는 각 유저의 Recall 지표에 대한 평균을 통해 평가된다.
통상적인 Recall 지표는 유저가 관심 있는 모든 아이템 중에서 모델이 추천한 아이템 k개가 얼마나 포함되는지의 비율을 의미한다.
그러나 대회에서는 k와 사용자가 사용한 아이템 수 $|I_u|$ 중 최소값을 분모로 사용함으로써 지표의 값을 최대 1이 되도록 고정하였다.
이는 유저마다 정답 데이터의 갯수가 다르더라도 Recall 지표가 0과 1 사이로 나오도록 정규화(normalize)하는 효과를 가진다.