길이가 같은 두 개의 이진 데이터간의 거리
HD는 동일한 길이의 두 binary data 사이의 서로 다른 비트 수에 해당한다.
길이가 같은 두 문자열 사이의 HD는 문자가 다른 위치의 개수에 해당한다.
범주형 데이터에 ManD를 적용하는 것과 흡사하다.
두 data 사이의 HD는 다음과 같이 계산한다.
$$ HD(x,y) = \sum^r_{i=1}|x_i - y_i| $$
$$ HD(x,y) = \sum^r_{i=1}I(x_i \ne y_i) $$
HD를 계산하는 방법을 설명하는 예:
$\tt HD(100001,010001) = 2$
$\tt HD(110,111) = 1$
$\tt HD("Integration", "Interaction")=3$
HW(Hamming Weight)
두 개의 binary data 중 하나에 0이 모두 포함된 경우에서의 HD
대상 data의 1의 개수와 동일하다.
$\tt HD(110111,00000) = HW(110111) = 5$
HD는 통신에서 송수신 데이터에 노이즈가 자주 발생하여 신뢰할 수 없는 경우 수신된 데이터의 오류를 감지하고 수정하는 데 사용된다.
전달된 데이터의 노이즈를 확인할 수 있다.