[1] 오늘 날짜 / 이름 / 팀명


[2] 오늘 맡은 역할 및 구체적인 작업 내용

rag 성능 개선이 잘 안되는 문제점 찾기 / 문제해결

[3] 오늘 작업 완료도 체크

📌 간단한 근거:

지금까지 각 30개의 문서 / 문서당 21개의 질문을 모델 1회 호출에 전부 질문해왔었음
이걸 호출 1회에 3문제씩 총 7회 호출 하는 방식으로 바꾸니 성능이 많이 올랐음

[4] 인사이트

한번에 많은 질문을 하면 성능이 많이 떨어진다
(max_context 제한에 걸리고 21개의 질문을 top_k = 20 이었으니 근거 청크가 21개 필요한데 20개만 들어감)
-> 적게 질문을 하니 top_k 도 낮게 잡을수 있고 max_context도 낮게 잡을수 있게 됨
-> 모델 간소화