检索增强生成(Retrieval Augmented Generation, RAG)已从一个相对简单的"检索-生成"范式,演变为一个包含众多专业技术的复杂生态系统。2025年的发展趋势表明,RAG 的重点在于通过更高级的智能、适应性和上下文感知能力,来增强其流水线中的每一个组成部分。
一、RAG 的演进历程
最初的 RAG 系统采用固定的流水线作业:切块 → 向量化 → TopK检索 → 生成。然而实际应用中暴露了诸多问题,促使研究者将更复杂的推理能力嵌入 RAG 的各个阶段。
2025年的演进可以概括为:
- Naive RAG:基础检索-生成两阶段
- Advanced RAG:引入查询重写、重排序、上下文压缩
- Self-RAG:系统评估自身中间步骤,动态调整策略
- Agentic RAG:LLM 作为主动参与组件,自主规划检索策略
二、现代 RAG 的核心挑战
1. 幻觉减少(Hallucination Reduction)
确保 LLM 忠实地利用检索到的上下文进行生成仍是核心目标。CiteFix 和 DRAG 等技术专门针对这一问题,通过强制引用检索文档来约束生成行为。
2. 知识陈旧性
RAG 提供了无需完全重训练 LLM 即可注入最新知识的机制,但知识库的时效性管理成为了新的挑战。
3. "Lost in the Middle" 问题
LLM 倾向于关注文档的开头和结尾而忽略中间内容。先进的分块、重排序和上下文压缩技术致力于解决这一问题。
三、先进的分块与嵌入策略
语义分块:基于嵌入向量的语义相似性对句子进行分组,创建上下文感知的分块,取代传统的固定大小分块方法。
文档结构感知分块:利用 Markdown 标题、章节、代码结构等确定分块边界,保留逻辑单元的完整性。
Agentic 分块:让 LLM 自身根据语义含义和内容结构来决定最佳分块方式,最具实验性但也最有前景。
四、鲁棒性 RAG:面向现实世界的设计
2025年 RAG 研究的一个重要趋势是"面向鲁棒性的设计"。研究者正推动 RAG 从在干净数据集上追求准确率,转向在噪声数据、对抗性攻击、信息冲突等复杂条件下保持可靠性。
代表性工作包括处理冲突信息的 Madam-RAG 和应对知识库投毒的 EcoSafeRAG。这种"防御性设计"对于企业采纳和高风险应用至关重要。
五、总结与展望
2025年的 RAG 正从简单的"检索-生成"管道演变为具备元学习能力的智能系统。未来的发展方向包括更强的自我适应能力、多模态检索集成以及更低的部署门槛。
评论