모델에서 각 특성(변수)이 예측이나 분류에 얼마나 영향을 미치는지 나타내는 지표입니다
이를 통해 데이터 분석가는 모델의 예측에 가장 큰 영향을 미치는 변수들을 식별하고, 모델 개선이나 특성 선택에 활용할 수 있다.
여러 개의 머신러닝 모델을 조합하여 더 좋은 성능을 내는 기법입니다
Bootstrap Aggregating의 줄임말
여러 개의 같은 종류 모델이 예측한 결과를 투표 혹은 평균을 통해 최종 선정
데이터를 무작위로 여러 번 샘플링하여 각각 모델 학습
대표적 예: 랜덤 포레스트
<aside>
배깅 기반 앙상블
특성 무작위 선택
장점
단점
활용
예시 코드
***이전 모델(같은 종류 모델이)***이 잘못 예측한 데이터에 가중치를 두어 순차적으로 학습,예측한다
약한 학습기들을 결합하여 강한 학습기를 만듦
대표적 예: XGBoost, LightGBM, AdaBoost
<aside>
1️⃣ XGBoost (eXtreme Gradient Boosting)
학습률이 높을수록 오차률 보정
2️⃣ LightGBM
수직 방향 비대칭 트리 성장 스킴
수평방향 깊이 다운, 대칭 보다 오류 적다
속도와 안정성을 동시에 상승 시킨다
</aside>
그레디언트 부스팅 (Gradient Boosting Machine)
경사 하강법를 이용하여 최적의 가중치 파라미터를 찾아냄
느리고 과대 적합문제가 발생