[예측]회귀(sklearn) -DecisionTreeRegressor(의사결정 트리)

1. DecisionTreeRegressor란?

결정트리(Decision Tree)를 이용한 회귀(숫자 예측) 모델데이터의 특성(입력값)을 기준으로 반복적으로 분기(split)하여 각 리프노드에서 평균값(또는 중앙값)을 예측값으로 사용

구분	설명
비선형 모델	입력과 출력이 복잡한 관계(직선 아닌 곡선, 계단, 조건 등)도 잘 모델링 가능
규칙기반 분할	데이터의 특성값(조건)으로 반복 분할 → 예측값 도출 (예: "x1 > 3.5면 왼쪽, 아니면 오른쪽")
해석 쉬움	분기 규칙을 그대로 보여줌(설명 쉬움), 변수 중요도도 자동 계산
전처리 거의 불필요	스케일링, 정규화, 결측치 처리 등 대부분 필요 없음
이상치(Outlier)에 민감	분할 기준이 한쪽에 이상치 있으면 트리가 과도하게 쏠릴 수 있음
과적합 위험	트리의 깊이가 깊어질수록 훈련 데이터에 "완전히" 맞추려는 경향(복잡해짐)
조절 가능	트리 깊이, 분할 샘플 수 등 파라미터로 과적합 방지 가능