User Node | Input Corruption | Denoising AutoEncoder |
---|
Collaborative Denoising Auto-Encoders for Top-N Recommender Systems
Denoising Autoencoder를 CF에 적용하여 top-N 추천에 활용한 논문
모델 특징
AutoRec vs. CDAE
AutoRec이 Rating Prediction을 위한 모델이었다면,
CDAE는 Ranking을 통해 유저에게 Top-N 추천을 제공하는 모델
문제 단순화를 위해, 유저-아이템 상호 작용 정보를 이진(0 또는 1) 정보로 바꿔서 학습 데이터로 사용한다.
개별 유저에 대해서 아이템의 rating이 아닌 preference를 학습하게 된다.
문제 정의 및 모델
AutoRec과 다르게 DAE를 사용하여 noise 추가
$$ P\left(\tilde{y}_u=\delta y_u\right)=1-q,\\P\left(\tilde{y}_u=0\right)=q $$
개별 유저에 대해서 $V_u$를 학습(Collaborative)
유저에 따른 특징을 해당 파라미터가 학습하고 Top N 추천에 사용
Input Layer에 User Node를 추가한다.
User bias를 자연스럽게 모델링 할 수 있다.
인코더로 Latent representation $z_u$를 생성하고 디코더로 regenerate
$$ \boldsymbol{z}_u=h\left(\boldsymbol{W}^{\top} \tilde{\boldsymbol{y}}_u+\boldsymbol{V}u+\boldsymbol{b}\right) \quad \hat{y}{u i}=f\left(\boldsymbol{W}_i^{\prime \top} \boldsymbol{z}_u+b_i^{\prime}\right) $$
성능
대체적으로 N에 관계 없이 다른 top-N 추천 모델에 비해 더 높은 MAP와 recall을 보인다.