WaterDoc (RAG + MCP)

프로젝트 개요

환경부 하수처리 설계 기준 PDF를 로컬 RAG로 임베딩하고, MCP 서버를 통해 Claude Desktop에서 자연어로 문서를 검색하는 로컬 에이전트 프로젝트.

한 줄 요약: PDF 문서를 AI가 읽을 수 있게 만들고, Claude에서 바로 질문하는 시스템

학습 목표

[PDF 문서]
    ↓ ingest.py (청크 분할 + 임베딩)
[ChromaDB] ← 벡터로 저장
    ↓ rag.py (유사도 검색)
[MCP 서버] ← search_docs 툴
    ↓
[Claude Desktop] ← 자연어 질문

사용자가 Claude Desktop에서 질문하면 → MCP 서버가 search_docs 툴 호출 → ChromaDB에서 관련 청크 검색 → 결과를 Claude에게 전달 → 최종 답변 생성

LLM이 학습하지 않은 특정 문서의 내용을 검색해서 답변 근거로 활용하는 기법.

왜 필요한가?