프로젝트: KOSPI 200 주가 예측 AI 파이프라인

브랜치: feature/ai/stock-integration-packet


전체 아키텍처 개요

[데이터 수집]  →  [피처 엔지니어링]  →  [3개 모델 병렬 학습]  →  [앙상블]  →  [패킷 생성]  →  [AI 에이전트]
                                          │
                                ┌─────────┼─────────┐
                                ▼         ▼         ▼
                            LightGBM    LSTM     GARCH
                            (방향성)   (패턴)   (변동성)
                                └─────────┼─────────┘
                                          ▼
                                      앙상블 (스태킹)
                                          ▼
                                     통합 패킷 JSON

핵심 설계 철학: 단일 모델의 한계를 극복하기 위해, 서로 다른 관점에서 시장을 분석하는 3개 모델을 조합합니다.


1. LightGBM — 방향성 분류 모델

모델 개요

항목 내용
역할 5일 후 주가 방향 3-class 분류 (상승/횡보/하락)
알고리즘 LightGBM (Gradient Boosted Decision Tree)
입력 피처 기술적 지표 14개 + 수급 5개 + 매크로 7개 + 메타 2개 = 28개
출력 상승/횡보/하락 확률 (합=1.0), 예측 클래스, 확신도

주요 피처

채택 근거

  1. 정형 데이터(tabular data)에서 최강의 성능 — 주가 관련 수치 데이터(거래량, 이평선, 수급 등)는 트리 기반 모델이 딥러닝보다 일관되게 높은 성능을 보임 (Kaggle 금융 대회에서도 검증)
  2. 피처 중요도 해석 가능 — 어떤 피처가 예측에 기여했는지 투명하게 확인 가능 → AI 에이전트가 "왜 상승인지" 설명 근거로 활용
  3. 학습 속도 — XGBoost 대비 2~5배 빠른 학습 (히스토그램 기반 분할)
  4. 3-class 분류 — 단순 상승/하락이 아닌 "횡보" 구간을 식별하여, 무의미한 매매 신호를 줄임

LightGBM이 잘하는 것