[1] 오늘 날짜 / 이름 / 팀명
- 날짜: 2026-04-08
- 이름: 뜰에봄
- 팀명: 1팀
[2] 오늘 맡은 역할 및 구체적인 작업 내용
✍️ 답변:
<aside>
- 데이터 무결성 확보 및 전처리 자동화: EDA를 통해 발견한 중복 데이터와 결측치를 기술적으로 해결하기 위한 파이프라인 구축 및 서버 업로드를 담당했습니다.
- 중복 제거 로직 구현: 파일명과 본문 내 기관명 등장 빈도를 대조해 실제 원본 문서를 판별하는
data_cleaner.py를 제작했습니다.
- 데이터 복구 및 정제: 메타데이터의
#NAME? 오류를 GPT-4o-mini로 자동 요약하여 복구하는 summary_fixer.py를 구현했습니다.
- 검색 성능 최적화 실험: 리트리벌의 Top-K 성능 이슈 해결을 위해 리랭킹(Flashrank) 및 멀티 쿼리 로직을
advanced_retriever.py로 모듈화했습니다.
</aside>
[3] 오늘 작업 완료도 체크 (하나만 체크)
- [ ] 🔴 0%
- [ ] 🟠 25%
- [ ] 🟡 50%
- [ ] 🔵 75%
- [x] 🟢 100%
📌 간단한 근거:
수동 보정 데이터의 서버 업로드와 이를 자동화한 모듈 3종의 PR 및 코드 푸시를 모두 완료했습니다.
[4] 오늘 협업 중 제안하거나 피드백한 내용
✍️ 답변: