[1] 오늘 날짜 / 이름 / 팀명
- 날짜: 26.02.11
- 이름: 김상엽
- 팀명: 4팀
[2] 오늘 맡은 역할 및 구체적인 작업 내용
문서 30개 실험
[3] 오늘 작업 완료도 체크
- [ ] 🔴 0%
- [ ] 🟠 25%
- [ ] 🟡 50%
- [ ] 🔵 75%
- [x] 🟢 100%
📌 간단한 근거:
30개 문서로 대량실험 성공
[4] 인사이트
생각보다 낮던 점수는 gen_match / gen_sim 이었는데
이는 우리가 작성한 gold와 모델의 답변이 뜻은 같지만 글자가 달라 일어난 일임을 확인