경구약제 이미지 객체 탐지 프로젝트 보고서

- 2팀: 박지윤, 손원후, 이민규, 최귀빈 -

1. 프로젝트 개요

가. 목표 및 과제 본 프로젝트의 목표는 AI Hub의 '경구약제 이미지 데이터'를 활용하여 객체 탐지 모델을 개발하고, Kaggle 리더보드를 통해 성능을 객관적으로 평가받는 것이었습니다. 프로젝트 초기, 전체 데이터의 약 2/3에서 라벨이 누락된 심각한 품질 문제를 발견했으며, 이를 해결하고 모델 성능을 개선하며 다양한 시도를 하며 경험을 쌓는 것을 핵심 과제로 설정했습니다.

나. 주요 적용 기술

Baseline Model: YOLOv8
Advanced Models: Faster R-CNN, RetinaNet, SSD, VGGNet, ResNet
Data Improvement Techniques: 수도 라벨링(Pseudo-Labeling), 앙상블(Ensemble), 데이터 증강

2. 프로젝트 수행 과정

가. 1주차: 문제 발견 및 전략 수립

초기 단계: 팀 구성 후 개발 환경(Google Colab, Github)을 통일하고 데이터 EDA에 착수했습니다.
핵심 문제 발견: EDA 과정에서 이미지 속 실제 객체 수와 라벨 수가 불일치하는 '라벨 누락' 문제를 발견했습니다. 이는 모델 성능에 치명적일 것으로 판단했습니다.
전략 수립: 멘토의 조언에 따라, '개선 과정'을 명확히 보여주는 방향으로 전략을 세웠습니다. 먼저 불완전한 데이터로 베이스라인 성능을 측정한 뒤, 데이터 정제 후 성능이 얼마나 향상되는지 비교하기로 했습니다.

나. 2주차: 실험, 난관, 그리고 방향 전환

기술적 난관: 초기 모델 학습 시 긴 학습 시간과 싸워야 했고, Kaggle 제출 시 계속해서 **'0점'**을 받는 심각한 오류에 직면했습니다. 끈질긴 디버깅 끝에 제출 파일의 ID 불일치 등 형식 오류를 해결했습니다.
방향성 탐색: 단순히 높은 점수를 얻기보다, '성장'이라는 주제에 맞춰 다양한 모델을 실험하고 그 과정을 기록하는 데 집중했습니다. 강사님의 조언에 따라 '수도 라벨링' 등 고급 기법을 도입하여 라벨 누락 문제 해결을 시도했습니다.

다. 3주차: 돌파구 마련 및 최종 분석

돌파구: 제출 오류 해결 후, YOLOv8n 모델로 0.974점이라는 높은 베이스라인 점수를 확보하며 프로젝트의 전환점을 맞이했습니다.
최종 전략 수립: 확보된 고성능 베이스라인을 기준으로, 중간 발표 피드백을 반영하여 수도 라벨링, 앙상블 등 2-Stage 고급 기법을 적용해 추가적인 성능 개선을 시도했습니다.

3. 개별 모델 심층 실험 및 분석

최종 전략을 수립하기에 앞서, 팀원들은 다양한 모델 아키텍처의 가능성을 탐색하기 위해 개별적으로 심층 실험을 진행했습니다.