技术点

RAG(Retrieval-Augmented Generation)技术已成为连接通用语言模型与垂直领域知识的关键桥梁 。它不仅能够显著提升模型在特定任务中的表现,还能有效解决模型幻觉、知识更新滞后、生成内容不准确等问题。

深入理解文本摘要、机器翻译、向量数据库、相似度检索等关键技术,并熟练使用 LangChain、LlamIndex、GraphRAG 等主流工具。 覆盖语义切片、术语库构建、向量引擎选型、混合召回、LoRA 微调、Agentic 架构设计、多模态扩展与工程化部署,结合 LangChain 技术栈与 Python 实战,深入解析 OCR 纠错、查询扩写、动态规划等真实场景难题。

介绍

检索增强生成(Retrieval Augmented Generation),简称 RAG,已经成为当前最火热的LLM应用方案。经历今年年初那一波大模型潮,想必大家对大模型的能力有了一定的了解,但是当我们将大模型应用于实际业务场景时会发现,通用的基础大模型基本无法满足我们的实际业务需求,主要有以下几方面原因:

流程

Untitled

Untitled

完整的RAG应用流程主要包含两个阶段:

image.png

向量数据存储召回

数据库分块具体数据

向量库存一份,查到 ID 去数据库拿数据

更新的时候删除掉插入