- 회의 날짜: 2022/07/07 (토)
- 회의 장소: 디스코드
- 참석자:
[이번 스터디 공부한 내용]
🦕이의훈
『퀀트 전략을 위한 인공지능 트레이딩』 CHAPTER 1~3 중심
- 금융 머신러닝 활용: 알고리즘 트레이딩, 포트폴리오 관리, 위험 관리, 이상 거래 탐지, 감정 분석 등
- 파이썬: 금융 데이터 분석 최적 언어, 주요 패키지(pandas, scikit-learn, keras 등) 활용
- 실습: AAPL 데이터 기반 선형 회귀 예측, 데이터 수집 → 전처리 → 학습 → 평가 과정 수행
- 인공신경망(ANN): 입력층-은닉층-출력층 구조, 순전파·역전파 훈련 방식
- 하이퍼파라미터: 은닉층 수, 노드 수, 학습률, 활성화 함수 등이 성능에 핵심적 영향
정민성
1장 데이터 처리 프로세스
- ETL(Extraction, Transformation, Load)
- 개념: 데이터 추출 → 변형 → 적재
- 특징: 대용량(MPP) 지원, 클렌징·표준화·통합 과정 포함
- 단계: Interface → Staging → Profiling → Cleaning → Integration → Denormalizing
- ODS(Operational Data Store)
- 개념: 여러 원천 데이터 추출·통합, 무결성 점검, 실시간 트랜잭션 저장
- 단계: 인터페이스 → 스테이징 → 프로파일링 → 클렌징 → 통합 적재 → 익스포트
- 데이터 웨어하우스
- 특징: 주제 중심, 영속성·비휘발성, 통합성, 시계열성
- 모델링 기법: 스타 스키마(단순, 쿼리 용이) / 스노우플레이크 스키마(정규화, 적재 효율)
- CDC(Change Data Capture)
- 개념: DB 내 변경 사항을 실시간/근접 실시간으로 식별·처리
- 특징: 다양한 계층·기술로 구현, 데이터 통합에 활용
- 구현 기법: 타임스탬프, 버전 넘버, 상태 값, 트리거, 이벤트 프로그래밍, 로그 스캐너
- 구현 방식: 푸시(push) / 풀(pull)