맡은 역할과 수행한 작업
<aside>
프로젝트 PM으로서 베이스라인 모델 성능 검증 및 캐글 첫 제출을 주도하고, 팀원들의 성능 개선 실험 과정을 모니터링 및 피드백했습니다.
캐글 제출 파일 디버깅 및 첫 제출 : 1, 2차 제출에서 0점이 나온 원인을 분석하여 바운딩 박스(bbox) 자료형과 category_id 매핑 오류를 수정했습니다. 팀원들과 교차 검증 후 3차 제출을 진행하여 드디어 0.27264점이라는 유의미한 Public Score를 기록하며 프로젝트의 1차 목표를 달성했습니다. 또한, 팀원들이 발견한 가중치 파일 경로 에러를 함께 확인하고 수정사항을 머지하였습니다.
실험 가이드라인 확립 : 점수가 나온 이후부터는 각자 W&B 로그를 분석하여 스코어가 낮은 원인을 파악하도록 가이드했습니다. 또한, 실험 공유 프로세스(W&B 링크 공유 -> 수정 사항 및 Before/After 기록 -> PR 작성 -> 합의 후 캐글 제출)를 확립하여 팀원들이 무분별하게 실험을 섞지 않도록 체계를 잡았습니다.
추가 데이터 조사 : 주어진 데이터셋이 클래스가 불균형한 상태이기 때문에, 추가로 학습시킬만한 데이터가 있을지에 대해 조사하였습니다. EDA 때 조사하였던 식품의약품안전처_인공지능 개발을 위한 알약 이미지 데이터와 AI 허브의 단일경구약제 이미지에 주목하였습니다.
Kaggle 전략 수립 : 무사히 캐글 제출을 마친 후, 본격적으로 높은 스코어를 얻기 위한 전략을 수립하고 공유사항 문서에 정리하였습니다. 각 팀원들의 역할마다 해봄직한 전략을 제안하고 저 역시 실험을 진행하였습니다. </aside>
오늘 작업 완료도 체크
🟢 100% (완료 및 점검까지 완료)
<aside>
가장 큰 목표였던 베이스라인 코드를 통한 캐글 정상 제출 및 점수 획득을 달성했고, 이후 성능 고도화를 위한 실험 공유 프로세스까지 세팅했습니다.
</aside>
오늘 협업 중 제안하거나 피드백한 내용
<aside>
mixup 파라미터만 우선 적용하여 단일 변인으로 다시 실험해 볼 것을 제안했습니다.team5pj1/HealthEat-Pill-Detection/runs 내부의 정확한 Run 링크를 공유하도록 안내했습니다.오늘 분석/실험 중 얻은 인사이트나 발견한 문제점
<aside>
category_id가 실제 클래스가 아닌 idx로 들어간 문제를 잡으면서 후처리의 중요성을 다시 한번 깨달았습니다.일정 지연이나 협업 중 어려웠던 점
<aside>
베이스라인 제출 파일에서 0점이 나오면서 디버깅에 시간이 소요되어 캐글 제출이 예상보다 늦어졌으나, 팀원들과 함께 코드를 대조하며 원인을 찾아내어 일정 내에 목표를 달성할 수 있었습니다. 또한 W&B step warning 에러가 있었으나, 김범수 님이 학습 성능에 영향을 주지 않는 단순 로그 문제임을 확인해 주어 원활히 넘어갔습니다.
</aside>