혹은 Memory Based CF라고 부르기도 한다.

사용자 또는 아이템 간의 similarity 값을 계산하고 이를 rating prediction 또는 top-K ranking에 활용하는 방법

Similarity를 계산하기 위한 Metric으로 Jaccard, Cosine, Pearson 등을 활용한다.

장점

단점

  1. Sparsity(희소성) 문제

    NBCF를 적용하려면 적어도 sparsity ratio가 99.5%를 넘지 않는 것이 좋다.

    데이터가 충분하지 않다면 유사도 계산이 부정확해진다. ⇒ 성능 저하

    Cold Start

    데이터가 부족하거나 혹은 아예 없는 유저, 아이템의 경우 추천이 불가능하다.

  2. Scalability(확장성) 문제


  1. 이웃 데이터를 학습한다.

    특정 주변 이웃에 의해 크게 영향을 받을 수 있다.

  2. 공통의 유저 / 아이템을 많이 공유해야만 유사도 값이 정확해진다.

  3. 유사도 값이 정확하지 않은 경우 이웃의 효과를 보기 어렵다.

UBCF: User-based CF(유저 기반 협업 필터링)

대상 유저와 유사도가 높은 유저들이 선호하는 아이템을 추천하는 방식

평점 산출 방식

IBCF: Item-based CF(아이템 기반 협업 필터링)

타겟 아이템과 유사도가 높은 아이템 중 선호도가 큰 아이템을 추천하는 방식

장점

시간에 따라 유사도 변화가 적다.

User based CF에 비해 계산량이 적다.

평점 산출 방식

Top-N Recommendation

대상 유저에 대한 아이템 예측 평점 계산이 완료되면, 평점순으로 정렬하여 상위 N개만 추천하기