Background

같은 차원의 두 벡터에서 계산할 수 있다.

추천 시스템에서 가장 많이 사용한다.

직관적으로 두 벡터가 가리키는 방향이 얼마나 유사한지를 의미한다.

Cosine(query,document)

문서벡터의 크기를 1로 정규화한다음, 내적을 구하면 cos값이 된다.

$$ cos(\vec q,\vec d)={\vec q⋅\vec d\over|\vec q||\vec d|}={\vec q\over|\vec q|}⋅{\vec d\over|\vec d|}={∑^{|V|}{i=1}q_id_i\over \sqrt{∑{i=1}^{|v|}q^2_i}\sqrt{∑^{|v|}_{i=1}d^2_i}} $$

cos값이 나타나는 범위를 항상 떠올리며 계산실수에 유의하자.

ex — 문서 3개의 Cosine Similarity

Cosine Scores