트랙 : Ⅱ. Research Reproduction Track
[Main] Hybrid RAG: 벡터 유사도 기반 탐색을 통해 증강 된 그래프 검색 및 생성
S. Cha, K. Seo, and D. Kim, “Hybrid RAG: Enhancing Graph Retrieval-Augmented Generation through Vector Similarity-based Search,” in 2024 Korean Institute of Broadcast and Media Engineers Fall Conference, 2024.
[Sub] HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction
B. Sarmah, B. Hall, R. Rao, S. Patel, S. Pasquali, and D. Mehta, “HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction,” arXiv preprint arXiv:2408.04948v1, Aug. 2024.
RAG는 대개 두가지 방식으로 나눌 수 있다 Vector DB를 활용한 Vector RAG와 Graph DB를 활용한 Graph RAG.
| 종류 | 장점 | 한계점 |
|---|---|---|
| Vector RAG | 대량의 비구조화된 텍스트 데이터에서 문맥적 유사성을 잘 포착할 수 있다 | 글로벌 질문이나 다단계 추론에 대해서는 한계를 보인다 (여러 개체 간의 상호 관계나 문서 전반에 걸친 분석이 필요한 경우) |
| Graph RAG | 복잡한 관계를 이해하고 추론할 수 있다 | 검색을 위해 사용자의 요청으로부터 정확한 쿼리를 작성하는데 제약이 있다 |
둘을 합치면 성능이 더 나오지 않을까?
→ 벡터 기반의 유사도를 그래프 데이터베이스 검색 프로세스에 적용한 Hybrid RAG 모델
→ Hybrid RAG 는 벡터 기반의 유사도 검색과 그래프 기반의 관계 추론을 통합하여, 복잡한 질문에 대한 보다 정확한 검색 및 답변이 가능할 것으로 기대
→ 벡터 검색과 그래프 검색을 마지막에 단순 결합하는 것이 아니라, 그래프 탐색의 시작점 선정 자체에 벡터 유사도를 활용한다
구현 범위 (Implementation Scope)
HybridRAG 시스템을 구축하기 위해 개발해야 할 기능적 단계들입니다.

실험 구성 (Experimental Setup)
개발된 시스템의 객관적인 성능을 측정하기 위한 실험 환경 정의입니다.
재현용 데이터셋 ARAGOG (Advanced RAG Output Grading) 벤치마크 데이터셋
확장 실험용 데이터셋 서울과학기술대학교 규정