1. DecisionTreeRegressor란?


2. 특징

구분 설명
비선형 모델 입력과 출력이 복잡한 관계(직선 아닌 곡선, 계단, 조건 등)도 잘 모델링 가능
규칙기반 분할 데이터의 특성값(조건)으로 반복 분할 → 예측값 도출 (예: "x1 > 3.5면 왼쪽, 아니면 오른쪽")
해석 쉬움 분기 규칙을 그대로 보여줌(설명 쉬움), 변수 중요도도 자동 계산
전처리 거의 불필요 스케일링, 정규화, 결측치 처리 등 대부분 필요 없음
이상치(Outlier)에 민감 분할 기준이 한쪽에 이상치 있으면 트리가 과도하게 쏠릴 수 있음
과적합 위험 트리의 깊이가 깊어질수록 훈련 데이터에 "완전히" 맞추려는 경향(복잡해짐)
조절 가능 트리 깊이, 분할 샘플 수 등 파라미터로 과적합 방지 가능

3. 언제 사용하면 좋은가?


4. 언제 비추천?


5. 주요 파라미터

파라미터 의미
max_depth 트리의 최대 깊이(복잡도 제한)
min_samples_split 노드 분할 위한 최소 샘플 수
min_samples_leaf 리프노드 최소 샘플 수
max_features 분할에 사용할 특성 수(무작위성 부여)
random_state 결과 일관성 위한 시드