두 데이터 세트 간의 유사성을 측정하는 데 사용되는 Metric
유사성을 파악하기 위해 두 집합 사이의 교집합의 크기(심수, 원소의 수 등)를 계산한다.
하지만 공통 요소의 수만으로는 집합의 크기와 비교하여 얼마나 상대적인지 알 수 없다.
따라서 유사성을 측정하기 위해 교집합의 크기를 두 데이터 집합의 합집합의 크기로 나눈다.
JD는 Jaccard 계수를 보완하여 유사성을 측정한다.
JD는 다음과 같이 나타난다.
$$ JD(x,y) = 1 - J(x,y) = {|x\cup y| - |x\cap y|\over |x\cup y|} $$
$$ ⁍ $$
For binary attributes, the Jaccard similarity is calculated as
$$ ⁍ $$