항목 간 유사성을 단순 비교하는 것에서 벗어나 데이터에 내재한 패턴을 이용해 추천하는 CF 기법
Parametric Machine Learning
유저, 아이템 벡터를 학습을 통해 파라미터로 저장한다.
데이터에 숨겨진 유저-아이템 관계의 잠재적 특성/패턴을 찾아 파라미터에 반영한다.
MBCF vs. NBCF
NBCF는 유저/아이템 벡터를 데이터를 통해 계산된 형태로 저장한다.
Memory-based CF라고 부르기도 한다.
현업에서 Matrix Factorization 기법이 많이 사용된다.
최근 MF 원리를 DL모델에 응용하는 기법이 높은 성능을 내고 있다.
MBCF 장점
데이터 패턴 학습
항목간 유사성을 단순 비교하는 것이 아니다.
빠른 서빙 속도
유저-아이템 데이터는 학습에만 사용되고 학습된 모델은 압축된 형태(파라미터)로 저장된다.
이미 학습된 모델을 통해 추천하기 때문에 빠르다.
Sparsity 문제 개선
Sparsity Ratio가 99.5%가 넘을 경우에도 사용할 수 있다.
Scalability 문제 개선
사용자, 아이템 개수가 많이 늘어나도 좋은 추천 성능을 보인다.
Overfitting 방지
전체 데이터의 패턴을 학습한다.
특정 이웃에 Overfitting되지 않고, Generalization 성능이 높다.
Limited Coverage 극복
MBCF 단점