You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

1.7 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

一、基本原理

RAG是一种结合了信息检索Retrieval和文本生成Generation的混合架构它允许大模型在回答问题时不仅依赖于自身训练时获得的知识还能动态地从外部知识库中检索相关信息以提高生成内容的准确性和可信度。简而言之RAG可以被理解为“先查资料,再回答问题”的智能问答系统。

RAG通常由两个主要模块组成

  1. 检索模块Retriever:从外部数据库或文档集合中提取与输入查询最相关的信息。
  2. 生成模块Generator:基于检索到的内容,结合大模型已有的语言能力,生成最终的回答。 这种方法的优势在于它可以让大模型具备“短期记忆”能力使其能够处理时效性强、知识更新频繁或需要引用外部文献的任务。例如在金融、医疗、法律等领域RAG可以帮助模型提供更具权威性的答案而不是仅凭预训练数据“猜测”答案。
  • RAG技术通过检索外部知识库避免了幻觉问题的困扰。相较于单纯依赖大型语言模型对海量文本数据的学习RAG允许模型在生成文本时从事实丰富的外部知识库中检索相关信息。
  • RAG技术的时效性优势使其在处理实效性较强的问题时更为可靠。通过与外部知识库的连接RAG确保了模型可以获取最新的信息及时适应当前的事件和知识。
  • 与传统的知识库问答KBQA相比RAG技术在知识检索方面更加灵活不仅能够从结构化的知识库中检索信息还能够应对非结构化的自然语言文本。

二、实现原理

!Pasted image 20250326091615.png