Untitled

트랙 : Ⅱ. Research Reproduction Track

선정 논문

[Main] Hybrid RAG: 벡터 유사도 기반 탐색을 통해 증강 된 그래프 검색 및 생성

S. Cha, K. Seo, and D. Kim, “Hybrid RAG: Enhancing Graph Retrieval-Augmented Generation through Vector Similarity-based Search,” in 2024 Korean Institute of Broadcast and Media Engineers Fall Conference, 2024.

image.png

[Sub] HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction

B. Sarmah, B. Hall, R. Rao, S. Patel, S. Pasquali, and D. Mehta, “HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction,” arXiv preprint arXiv:2408.04948v1, Aug. 2024.

연구 문제 정의

RAG는 대개 두가지 방식으로 나눌 수 있다 Vector DB를 활용한 Vector RAG와 Graph DB를 활용한 Graph RAG.

종류 장점 한계점
Vector RAG 대량의 비구조화된 텍스트 데이터에서 문맥적 유사성을 잘 포착할 수 있다 글로벌 질문이나 다단계 추론에 대해서는 한계를 보인다 (여러 개체 간의 상호 관계나 문서 전반에 걸친 분석이 필요한 경우)
Graph RAG 복잡한 관계를 이해하고 추론할 수 있다 검색을 위해 사용자의 요청으로부터 정확한 쿼리를 작성하는데 제약이 있다

논문 핵심 아이디어 요약

둘을 합치면 성능이 더 나오지 않을까?

벡터 기반의 유사도그래프 데이터베이스 검색 프로세스에 적용한 Hybrid RAG 모델

→ Hybrid RAG 는 벡터 기반의 유사도 검색과 그래프 기반의 관계 추론을 통합하여, 복잡한 질문에 대한 보다 정확한 검색 및 답변이 가능할 것으로 기대

→ 벡터 검색과 그래프 검색을 마지막에 단순 결합하는 것이 아니라, 그래프 탐색의 시작점 선정 자체에 벡터 유사도를 활용한다

Reproduction 계획

image.png

활용 데이터셋

  1. 재현용 데이터셋 ARAGOG (Advanced RAG Output Grading) 벤치마크 데이터셋
  2. 확장 실험용 데이터셋 서울과학기술대학교 규정