혹은 Memory Based CF라고 부르기도 한다.
사용자 또는 아이템 간의 similarity 값을 계산하고 이를 rating prediction 또는 top-K ranking에 활용하는 방법
Similarity를 계산하기 위한 Metric으로 Jaccard, Cosine, Pearson 등을 활용한다.
장점
단점
Sparsity(희소성) 문제
NBCF를 적용하려면 적어도 sparsity ratio가 99.5%를 넘지 않는 것이 좋다.
데이터가 충분하지 않다면 유사도 계산이 부정확해진다. ⇒ 성능 저하
Cold Start
데이터가 부족하거나 혹은 아예 없는 유저, 아이템의 경우 추천이 불가능하다.
Scalability(확장성) 문제
유저와 아이템이 늘어날수록 유사도 계산이 늘어난다.
추론을 위한 많은 양의 Offline 계산이 요구된다.
유저, 아이템이 많아야 정확한 예측을 하지만 반대로 시간이 오래 걸린다.
이웃 데이터를 학습한다.
특정 주변 이웃에 의해 크게 영향을 받을 수 있다.
공통의 유저 / 아이템을 많이 공유해야만 유사도 값이 정확해진다.
유사도 값이 정확하지 않은 경우 이웃의 효과를 보기 어렵다.
대상 유저와 유사도가 높은 유저들이 선호하는 아이템을 추천하는 방식
평점 산출 방식
타겟 아이템과 유사도가 높은 아이템 중 선호도가 큰 아이템을 추천하는 방식
장점
시간에 따라 유사도 변화가 적다.
User based CF에 비해 계산량이 적다.
평점 산출 방식
Absolute Rating
Average — 평균내기
모든 아이템의 평점을 평균내서 평점을 예측한다.
Weighted Average — 아이템의 유사도를 반영하여 평점 예측
아이템 간의 유사도를 반영하여 평점을 예측한다.
이 때, 일부 아이템만 활용하여 평점을 예측하기도 한다.
Relative Rating
아이템의 평점을 그대로 사용하지 않고, 아이템의 평균 평점에서의 편차를 이용한다.
Top-N Recommendation
대상 유저에 대한 아이템 예측 평점 계산이 완료되면, 평점순으로 정렬하여 상위 N개만 추천하기