TF-IDF의 변형

$$ \operatorname{score}(D, Q)=\sum_{i=1}^n \operatorname{IDF}\left(q_i\right) \cdot \frac{TF\cdot\left(k_1+1\right)}{TF+k_1 \cdot\left(1-b+b \cdot \frac{|D|}{\text { avgdl }}\right)} $$

$$ \operatorname{score}(D, Q)=\sum_{i=1}^n TF(q_i)\cdot IDF(q_i)\cdot\frac{\left(k_1+1\right)}{1+\frac{k_1}{TF(q_i)} \cdot\left(1-b+b \cdot \frac{|D|}{\text { avgdl }}\right)} $$

TF-IDF 대비 장점

실용적인 BM25 - 제2부: BM25 알고리즘과 변수

BM25

Elasticsearch 유사도 알고리즘 (TF/IDF, BM25 비교)