✍️ 답변:
RAG 시스템의 Retrieval 단계에서 게이트를 통과하지 못하는 문제를 해결하기 위해
원인 분석 및 디버깅을 진행하였다.
검색 결과 이상 현상을 확인하고,
VectorDB 검색 결과, 메타데이터 필터 조건, 인덱싱 데이터 상태를 점검하였다.
분석 과정에서 메타데이터 CSV 파일의 셀 단위 텍스트 저장 한계가 약 8,000자임을 확인하였고,
이로 인해 원문 전체가 아닌 일부 텍스트만 저장되고 있음을 파악하였다.
해당 구조적 한계로 인해 RAG의 검색 대상 데이터 자체가 축소되었을 가능성을 확인하였다.
📌 간단한 근거:
Retrieval 문제의 직접적인 원인은 찾지 못했지만,
데이터 저장 구조(CSV 텍스트 길이 제한)에서 발생하는 근본적인 문제 가능성을 확인하였다.
✍️ 답변: