기존 방식 (KNN, Linear Regression, Logistic Regression, D.T, R.F, SVM, Navie Bayesian)
: 2개의 task (regression, classification)에만 해당됐다.
Clustering : New task ! 에 해당한다.

종종 Distance(거리)에 기반해 측정된다.
숫자형 데이터의 거리를 측정하는 방법은 여러가지가 있다.
⇒ Euclidian distance, Manhattan distance, Minkowski distance, Chebyshev distance, etc.
범주형 데이터의 거리를 측정하는 방법은 여러가지가 있다.
⇒ Hamming Distance, Simple Matching, Jaccard Distance, etc
🎯 해밍턴 거리 예시


