Linear Support Vector Machine


- 많은 Not bad boundares 가 존재함 ⇒ 하지만 난 최고를 찾고 싶어!
❓ 무엇이 더 좋은 경계선일까?

- 경계선을 위로 움직이다가 Data에 닿으면 stop, 아래로 가다가 또 닿으면 stop했을때 그 사이의 부분을 margin이라한다.
- 마진이 넓은게 좋을까? 좁은게 좋을까?

- 마진이 좁다 = 데이터가 경계에 더 가깝다 = 잘못된 예측을 할 확률이 높다.(오측할 기회가 많다.)
- 마진이 넓다 = 데이터가 경계와 거리가 있다 = 잘못된 예측을 할 확률이 낮다.(오측할 기회가 적다.)
⭐ Best ⇒ “Largest Margin”
Let’s find the maximum margin boundary


- 경계선 주변에서 margin을 이루고 있는 경계선을 각각 wx+b=1, -1로 가정
Margin
