2025年检索增强生成(RAG)最新进展与前沿技术

2025年检索增强生成(RAG)最新进展与前沿技术

Ethan
2025-06-04 发布 / 正在检测是否收录...

检索增强生成(Retrieval Augmented Generation, RAG)已从一个相对简单的"检索-生成"范式,演变为一个包含众多专业技术的复杂生态系统。2025年的发展趋势表明,RAG 的重点在于通过更高级的智能、适应性和上下文感知能力,来增强其流水线中的每一个组成部分。

一、RAG 的演进历程

最初的 RAG 系统采用固定的流水线作业:切块 → 向量化 → TopK检索 → 生成。然而实际应用中暴露了诸多问题,促使研究者将更复杂的推理能力嵌入 RAG 的各个阶段。

2025年的演进可以概括为:

  • Naive RAG:基础检索-生成两阶段
  • Advanced RAG:引入查询重写、重排序、上下文压缩
  • Self-RAG:系统评估自身中间步骤,动态调整策略
  • Agentic RAG:LLM 作为主动参与组件,自主规划检索策略

二、现代 RAG 的核心挑战

1. 幻觉减少(Hallucination Reduction)

确保 LLM 忠实地利用检索到的上下文进行生成仍是核心目标。CiteFix 和 DRAG 等技术专门针对这一问题,通过强制引用检索文档来约束生成行为。

2. 知识陈旧性

RAG 提供了无需完全重训练 LLM 即可注入最新知识的机制,但知识库的时效性管理成为了新的挑战。

3. "Lost in the Middle" 问题

LLM 倾向于关注文档的开头和结尾而忽略中间内容。先进的分块、重排序和上下文压缩技术致力于解决这一问题。

三、先进的分块与嵌入策略

语义分块:基于嵌入向量的语义相似性对句子进行分组,创建上下文感知的分块,取代传统的固定大小分块方法。

文档结构感知分块:利用 Markdown 标题、章节、代码结构等确定分块边界,保留逻辑单元的完整性。

Agentic 分块:让 LLM 自身根据语义含义和内容结构来决定最佳分块方式,最具实验性但也最有前景。

四、鲁棒性 RAG:面向现实世界的设计

2025年 RAG 研究的一个重要趋势是"面向鲁棒性的设计"。研究者正推动 RAG 从在干净数据集上追求准确率,转向在噪声数据、对抗性攻击、信息冲突等复杂条件下保持可靠性。

代表性工作包括处理冲突信息的 Madam-RAG 和应对知识库投毒的 EcoSafeRAG。这种"防御性设计"对于企业采纳和高风险应用至关重要。

五、总结与展望

2025年的 RAG 正从简单的"检索-生成"管道演变为具备元学习能力的智能系统。未来的发展方向包括更强的自我适应能力、多模态检索集成以及更低的部署门槛。

© 版权声明
THE END
喜欢就支持一下吧
点赞 1 分享 收藏

评论

博主关闭了当前页面的评论

Warning: file_put_contents(/var/www/html/usr/cache/pagecache/19/1919d49147428e8e77b18d0ea147b6b5.cache): failed to open stream: No such file or directory in /var/www/html/usr/plugins/PageCache/Plugin.php on line 188