첫 Collaborative Filtering 모델은 1990년대에 등장하였습니다! 그 이후로 추천시스템은 다양한 분야에서 활발하게 연구되고 적용되고 확장되어 왔습니다. 추천시스템이란 정보를 필터링 하는 일입니다. 정보 필터링은 유저의 implicit 또는 explicit 데이터가 저장되는 환경안에서 유저의 선호도에 맞게 조정되어 유저에게 유용하다고 판단되는 아이템을 제안하는 일입니다.

출처 : https://www.sciencedirect.com/science/article/pii/S1110866515000341/

출처 : https://www.sciencedirect.com/science/article/pii/S1110866515000341/

2.1.1. Content-Based Filtering

CBF는 1990년대부터 시작된 추천 시스템 모델 내에서 가장 기본적인 모델이며, 초기 추천 시스템에서 주로 사용되었습니다. 바로 유저가 과거에 소비한 아이템의 정보를 사용해 가장 유사한 아이템을 추천해주는 방식입니다. CBF는 아이템의 속성 정보에 의존합니다.

CBF는 소비한 아이템과 속성이 가장 유사한 아이템을 추천하는 모델이다. 유저 A는 딸기를 소비했으므로 같은 과일 속성의 사과를, 유저 B에게도 같은 방식으로 빵을 추천한다.

CBF는 소비한 아이템과 속성이 가장 유사한 아이템을 추천하는 모델이다. 유저 A는 딸기를 소비했으므로 같은 과일 속성의 사과를, 유저 B에게도 같은 방식으로 빵을 추천한다.

CBF는 이전에 소비한 아이템과 가장 유사한 아이템을 추천하기 때문에, 정보가 없는 새로운 아이템을 추천할 수 없다는 한계를 갖고 있습니다. 이러한 한계 때문에 음악, 영화, 이커머스 등 아이템 정보에 기반해 쉽게 추천할 수 있는 분야에서 사용되어 왔습니다. 예를 들어, 음악의 속성에 따른 추천 [21], 영화의 속성에 따른 추천 [20], 전자 상거래 추천 [22], 교육 자료 추천 [23] 등입니다.

2012년부터 하이브리드 모델이 등장하면서 CBF 단일 추천모델의 사용빈도는 꾸준히 줄어들었습니다.

2.1.2. Collaborative Filtering

filtering = 추천

CF 역시 1990년대에 처음 등장하여 이후에 등장한 모델들의 발판이 되었습니다.

CF는 선호도 구축 방식에 따라 Memory-Based CF와 Model-Based CF로 나뉩니다. Memory-Based CF는 다시 User-Based CF와 Item-Based CF로 나뉩니다.

Untitled

Untitled

→ Memory : 추천 상품이 이미, 모두 계산되어 있다는 뜻

User-Based CF는 같은 아이템을 평가한 유저들의 평가 정보를 비교하여 유저간의 유사도를 측정하는 방식입니다. 그 후 가장 유사한 유저 그룹에서 평가한 아이템들 중에서 타겟유저에게 top N개의 아이템을 추천합니다.

Item-Based CF는 마찬가지의 방법으로 아이템 사이의 유사도를 구합니다.

이처럼 Memory-Based CF는 피어슨 유사도, 벡터 코사인 유사도, KNN(K-Nearest Neighbors) 등을 이용해 유사도를 구하는 것이 핵심입니다. 그러나 충분한 데이터가 없을 경우 다음과 같은 문제가 발생합니다.

→ CF의 고질적인 문제!