어떻게 하면 수많은 문서 중 내가 원하는 문서를 정확하게 가져올 수 있을까?
나는 노션 페이지 / 문서 페이지 단위의 청킹을 이미 해 뒀다.
어쨌든, 주요하지 않은 데이터가 많은 청크는 벡터 검색에서 노이즈를 일으킬 수 있다.
따라서 주요한 정보를 가진 청크를 만들고 → 가중치를 줘서, 인덱싱을 하기로 했다.