{2026.02.24} | Notion

작성자: 이소윤

1. 오늘의 목표 (Plan)

재청킹 이후 점수 저하 원인이 재청킹 보다는 ‘생성 품질’에 있음을 정성적으로 확인
llm 답변 프롬프트 변경(불용어 정규화, 질문자에게 안내하는 멘트로 수정)
rich_pdf_extract.py에 _is_rendered_on_page()를 추가하고, 실제 렌더된 이미지(xref)만 asset으로 저장하도록 수정
eval_dataset_sy.yaml의 ground_truth.page를 문항별로 원문/이미지 확인 후 대거 교정
multi_doc/comparison 문항이 sources 2건으로 평가되도록 확인하고, 리포트에서 ground_truth_sources 기반 표시가 유지되도록 확인
공통 작업을 위해 파싱 파트 작업 내용을 기반으로 dev 브런치에 푸시할 리트리버 부분 미리 만들어 둠