Decision Tree

📌 basic idea

전체 input을 고려하지 않는다.

  1. 단지 중요한 input 1개만을 고른다. ⇒ Decision의 의미 !
  2. 골라진 input에 기반하여 예측한다.

🎯 예시 (A vs B vs C)

⚡ A의 값을 기준으로 Play label을 나눠봄

image.png

⚡ B의 값을 기준으로 Play label을 나눠봄

image.png

⚡ C의 값을 기준으로 Play label을 나눠봄

image.png

⇒ pure한 정도가 중요하다 ! (집합이 모두 같은 label을 도출하는 정도)

⭐ Split 예시

image.png

Attribute Selection for Split

image.png

📌 총 4단계로 Split 기준이 되는 input을 결정한다.

  1. split된 각 부분 집합에 대한 Impurity를 계산한다.