You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
|
|
|
|
## 一、基本原理
|
|
|
|
|
RAG是一种结合了信息检索(Retrieval)和文本生成(Generation)的混合架构,它允许大模型在回答问题时,不仅依赖于自身训练时获得的知识,还能动态地从外部知识库中检索相关信息,以提高生成内容的准确性和可信度。简而言之,RAG可以被理解为“**先查资料,再回答问题**”的智能问答系统。
|
|
|
|
|
|
|
|
|
|
RAG通常由两个主要模块组成:
|
|
|
|
|
1. **检索模块(Retriever)**:从外部数据库或文档集合中提取与输入查询最相关的信息。
|
|
|
|
|
2. **生成模块(Generator)**:基于检索到的内容,结合大模型已有的语言能力,生成最终的回答。
|
|
|
|
|
这种方法的优势在于,它可以让大模型具备“短期记忆”能力,使其能够处理时效性强、知识更新频繁或需要引用外部文献的任务。例如,在金融、医疗、法律等领域,RAG可以帮助模型提供更具权威性的答案,而不是仅凭预训练数据“猜测”答案。
|
|
|
|
|
- RAG技术通过检索外部知识库,避免了幻觉问题的困扰。相较于单纯依赖大型语言模型对海量文本数据的学习,RAG允许模型在生成文本时从事实丰富的外部知识库中检索相关信息。
|
|
|
|
|
- RAG技术的时效性优势使其在处理实效性较强的问题时更为可靠。通过与外部知识库的连接,RAG确保了模型可以获取最新的信息,及时适应当前的事件和知识。
|
|
|
|
|
- 与传统的知识库问答(KBQA)相比,RAG技术在知识检索方面更加灵活,不仅能够从结构化的知识库中检索信息,还能够应对非结构化的自然语言文本。
|
|
|
|
|
## 二、实现原理
|
|
|
|
|
|
|
|
|
|
![[Pasted image 20250326091615.png]]
|
|
|
|
|
|