길이가 같은 두 개의 이진 데이터간의 거리

HD는 동일한 길이의 두 binary data 사이의 서로 다른 비트 수에 해당한다.

길이가 같은 두 문자열 사이의 HD는 문자가 다른 위치의 개수에 해당한다.

범주형 데이터에 ManD를 적용하는 것과 흡사하다.

두 data 사이의 HD는 다음과 같이 계산한다.

$$ HD(x,y) = \sum^r_{i=1}|x_i - y_i| $$

$$ HD(x,y) = \sum^r_{i=1}I(x_i \ne y_i) $$

Untitled

Untitled

HW(Hamming Weight)

두 개의 binary data 중 하나에 0이 모두 포함된 경우에서의 HD

대상 data의 1의 개수와 동일하다.

$\tt HD(110111,00000) = HW(110111) = 5$

HD는 통신에서 송수신 데이터에 노이즈가 자주 발생하여 신뢰할 수 없는 경우 수신된 데이터의 오류를 감지하고 수정하는 데 사용된다.

전달된 데이터의 노이즈를 확인할 수 있다.