모델의 성능을 측정하고 싶다. → Train 데이터에 100% 정확한 모델이 있지만 이는 의미없다.
바로, Test 데이터(Unknown new data)를 사용하여 성능을 측정할 필요가 있다.
방법은 2가지가 존재한다.
새로운 데이터를 사용하여 성능을 측정할 필요가 있다고 했는데
→ 또다른 새로운 데이터 셋을 모아야하는 것인가? No! 바로 기존의 Train 데이터를 나누어
Train / Test로 나누어 Train데이터는 훈련에만, Test데이터는 테스트에만 사용하자!
⇒ Hold-out 방법!
Hold-out : 주어진 데이터를 Training set / Test set으로 나누어 Training set은 모델을 설정하는데 사용, Test set은 모델을 평가하는데 사용하자

❗❗특징
통계적 분산을 위해서(성능이 일정하지 않은 현상, Hold-out에서 발생함)
→ k-fold cross validation이 널리 사용된다.
2단계로 진행된다.
