1장. 7개 모델 학습

다양한 백본 실험
- ResNet, EfficientNet, MobileNet-V3, ConvNeXt, ViT 등 7개 모델로 동일 파이프라인 학습
- 학습 속도, GPU 메모리 사용량, 검증 F1을 비교
클래스 편향 이슈
- 초반엔 단일 CrossEntropy로 학습했더니 “happy” 클래스에 과도하게 치중
- MixUp, CutMix, WeightedSampler를 도입해 균형 개선 시도
하이퍼파라미터 튜닝
- Label Smoothing, OneCycleLR, Dropout(0.5) 레이어 추가
- 각 모델마다 Best Val F1을 기록하며 최적 설정 확인
성능 비교 결과
- EfficientNet-B0가 Val Acc≈0.75, Val F1≈0.75 로 가장 우수
- 그 다음으로 EfficientNet-B2, MobileNet-V3 순으로 뒤를 이음
- ResNet101, ConvNeXt, ViT는 크고 느리지만 F1 개선 폭 미미
EfficientNet-B0 선택 이유
- 모델 크기 대비 성능 최상
- 학습·추론 속도 우수, GPU 메모리 효율적
- 앙상블 없이 단일 모델로도 충분한 베이스라인 확보

2장. 학습결과 분석