지도학습 vs 비지도 학습
-훈련 데이터에 이미 타깃값(정답)이 있는지 유무
-비지도 학습은 학습을 통해 패턴을 찾아 타깃값을 만든다
-샘플에 계속 직접 라벨링 해줄 필요 x
9.1 군집
-비슷한 샘플을 구별해 비슷한 샘플의 그룹으로 할당하는 작업

-오른쪽 비지도 학습의 경우, 오른쪽 위 클러스터는 두 개의 종류의 꽃으로 이루어져있다는 것을 분류 알고리즘으론 구분 절대 불가, 추가적인 특성들을 활용하여 군집 알고리즘을 통해 해결할 수 있다.
군집의 주요 애플리케이션
- 고객 분류: 구매 이력이나 행동 기반으로 고객을 그룹화하여 마케팅 전략을 수립하거나 콘텐츠를 추천함.
- 데이터 분석: 새로운 데이터셋을 분석할 때, 데이터들의 클러스터별로 나누어 분석.
- 차원 축소: 각 샘플이 클러스터에 얼마나 잘 맞는지를 나타내는 친화성 벡터를 새로운 특성으로 사용하여 차원을 축소.
- 이상치 탐지: 모든 클러스터에 친화성이 낮은 샘플은 이상치일 가능성이 높다.
- 준지도 학습: 레이블이 적을 때, 군집을 수행하고 동일 클러스터 내 샘플들에게 레이블을 전파하여 학습 데이터를 늘릴 수 있음.
- 검색 엔진: 이미지 검색 시, 비슷한 이미지를 동일 클러스터로 묶어 검색 결과를 제공함.
- 이미지 분할: 픽셀을 색상 기반으로 클러스터링하여 이미지 내 객체의 윤곽을 감지하는 데 사용됨.