NBCF: Neighborhood-based CF(이웃 기반 협업 필터링)

혹은 Memory Based CF라고 부르기도 한다.

사용자 또는 아이템 간의 similarity 값을 계산하고 이를 rating prediction 또는 top-K ranking에 활용하는 방법

Similarity를 계산하기 위한 Metric으로 Jaccard, Cosine, Pearson 등을 활용한다.

장점

단점

Sparsity(희소성) 문제

NBCF를 적용하려면 적어도 sparsity ratio가 99.5%를 넘지 않는 것이 좋다.

데이터가 충분하지 않다면 유사도 계산이 부정확해진다. ⇒ 성능 저하

Cold Start

데이터가 부족하거나 혹은 아예 없는 유저, 아이템의 경우 추천이 불가능하다.
Scalability(확장성) 문제
- 유저와 아이템이 늘어날수록 유사도 계산이 늘어난다.
  
  추론을 위한 많은 양의 Offline 계산이 요구된다.
- 유저, 아이템이 많아야 정확한 예측을 하지만 반대로 시간이 오래 걸린다.

대상 유저와 유사도가 높은 유저들이 선호하는 아이템을 추천하는 방식

평점 산출 방식

타겟 아이템과 유사도가 높은 아이템 중 선호도가 큰 아이템을 추천하는 방식

장점

시간에 따라 유사도 변화가 적다.

User based CF에 비해 계산량이 적다.

평점 산출 방식

Absolute Rating
- Average — 평균내기
  
  모든 아이템의 평점을 평균내서 평점을 예측한다.
- Weighted Average — 아이템의 유사도를 반영하여 평점 예측
  
  아이템 간의 유사도를 반영하여 평점을 예측한다.
  
  이 때, 일부 아이템만 활용하여 평점을 예측하기도 한다.
Relative Rating

아이템의 평점을 그대로 사용하지 않고, 아이템의 평균 평점에서의 편차를 이용한다.
- ex) 유저 B의 스타워즈에 대한 예측 평점

Top-N Recommendation

대상 유저에 대한 아이템 예측 평점 계산이 완료되면, 평점순으로 정렬하여 상위 N개만 추천하기