Manhattan Distance의 Weighted 버전.
전체 크기에 따라 Weight를 조정해준다.
표준화 개념이 포함되어있다.
퍼지 클러스터링, 분류, 컴퓨터 보안 및 스팸 탐지 시스템 등.
ManD에 비해 Outlier에 좀 더 Robust하다.
r차원 공간에서의 CanD는 다음과 같이 정의된다.
$$ CanD(x,y) = \sum^r_{i=1}{|x_i-y_i|\over|x_i+y_i|},\\ \text{where } x=(x_1,...,x_r)^T\text{ and } y=(y_1,...,y_r)^T. $$
0과 1사이의 값으로 변환된다.
통계적 용어
robust하다
이상치에 영향을 적게 받는다.
Smoothing하다
미분가능하고, 연속이고, 부드러운 느낌
sparse하다
드물게 존재한다.
0이 많은 데이터, 고차원 데이터, 결측 데이터 등등