환경부 하수처리 설계 기준 PDF를 로컬 RAG로 임베딩하고, MCP 서버를 통해 Claude Desktop에서 자연어로 문서를 검색하는 로컬 에이전트 프로젝트.
한 줄 요약: PDF 문서를 AI가 읽을 수 있게 만들고, Claude에서 바로 질문하는 시스템
학습 목표
[PDF 문서]
↓ ingest.py (청크 분할 + 임베딩)
[ChromaDB] ← 벡터로 저장
↓ rag.py (유사도 검색)
[MCP 서버] ← search_docs 툴
↓
[Claude Desktop] ← 자연어 질문
사용자가 Claude Desktop에서 질문하면 → MCP 서버가 search_docs 툴 호출 → ChromaDB에서 관련 청크 검색 → 결과를 Claude에게 전달 → 최종 답변 생성
LLM이 학습하지 않은 특정 문서의 내용을 검색해서 답변 근거로 활용하는 기법.
왜 필요한가?