You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.
## 一、基本原理
RAG是一种结合了信息检索( Retrieval) 和文本生成( Generation) 的混合架构, 它允许大模型在回答问题时, 不仅依赖于自身训练时获得的知识, 还能动态地从外部知识库中检索相关信息, 以提高生成内容的准确性和可信度。简而言之, RAG可以被理解为“**先查资料,再回答问题**”的智能问答系统。
RAG通常由两个主要模块组成:
1. ** 检索模块( Retriever) **:从外部数据库或文档集合中提取与输入查询最相关的信息。
2. ** 生成模块( Generator) **:基于检索到的内容,结合大模型已有的语言能力,生成最终的回答。
这种方法的优势在于, 它可以让大模型具备“短期记忆”能力, 使其能够处理时效性强、知识更新频繁或需要引用外部文献的任务。例如, 在金融、医疗、法律等领域, RAG可以帮助模型提供更具权威性的答案, 而不是仅凭预训练数据“猜测”答案。
- RAG技术通过检索外部知识库, 避免了幻觉问题的困扰。相较于单纯依赖大型语言模型对海量文本数据的学习, RAG允许模型在生成文本时从事实丰富的外部知识库中检索相关信息。
- RAG技术的时效性优势使其在处理实效性较强的问题时更为可靠。通过与外部知识库的连接, RAG确保了模型可以获取最新的信息, 及时适应当前的事件和知识。
- 与传统的知识库问答( KBQA) 相比, RAG技术在知识检索方面更加灵活, 不仅能够从结构化的知识库中检索信息, 还能够应对非结构化的自然语言文本。
## 二、实现原理
![[Pasted image 20250326091615.png]]