외부 지식(DB, 문서 등)을 검색(Retrieval)해서, 그 정보를 바탕으로 생성(Generation)하는 구조
Query 입력
→ 사용자가 질문 입력
Retrieval (검색)
→ Vector DB나 문서에서 관련 정보 검색 (예: Chroma, Weaviate, Pinecone)
Augmentation (보강)
→ 검색된 내용을 프롬프트에 포함시킴
Generation (생성)
→ LLM(GPT 등)이 해당 내용을 기반으로 응답 생성
[사용자 질문] ↓ [문서 검색: 벡터 DB] ↓ [검색된 문서 + 질문 → 프롬프트 생성] ↓ [LLM이 최종 응답 생성]


쉽게 말해서 기존에 알고 있던거 + 검색해서 찾는다 이 말임.