작성자: 이소윤
1. 오늘의 목표 (Plan)
- [x] short 질의 병목 개선 실험을 이어간다(가중치/neighbor 확장 중심, topk 증가는 우선순위 낮춤).
- [x] alpha 의미 혼선을 막기 위해 결합식 표현/변수명 정리 또는 주석 강화 여부를 결정
- [x] 표/이미지 데이터를 어떻게 활용할지 고민
2. 오늘 내가 한 일 (Work Done)
- short 질의 병목 개선 실험을 진행
- clean_v1 기준으로 org_hard/adaptive, qrw, mmr 조합을 비교했고, 결과 파일을 results/에 정리
- q012 단건 디버깅을 수행 (short 병목의 대표 실패 케이스로 판단)
- debug_q012_candidates.csv, debug_q012_ablation.csv를 생성해 후보/랭킹 원인을 분해
- money 질의 조건부 보정 패치를 rag_answer.py에 적용
- 금액 느슨 패턴, 예산 키워드 신호, money 질의 전용 노이즈 페널티 강화, source 내 인접 청크 확장 로직을 추가
- q20 기준 회귀를 실행해 부작용을 점검
- node_report_chroma_q20_moneyfix.csv 생성
- alpha 의미 혼선 관련해서는 코드 변경보다 현재 파라미터 체계(chroma_score_weight, lexical_score_weight) 기준으로 정리
- Chroma 실험 결과를 실제로 여러 조합으로 재실행하고 산출물을 남김
- 생성 품질 리포트도 각 실험별로 생성/비교
- 문서/스킬 측면에서는 시나리오B 정렬 및 협업일지 스킬 규칙 최신화를 커밋 단위로 반영
- 최근 커밋: 2eeba07, 2d80002, f988dc7, 43202e0, 64030fb
🌟 오늘 팀에 기여한 부분
3. 오늘의 인사이트 / 배운 점 (Insights)
- 현재 병목은 “문서(source) 미스”보다 “정답 청크(rank) 미스”다.