diff --git a/Pasted image 20250326091615.png b/Pasted image 20250326091615.png new file mode 100644 index 0000000..833d67d Binary files /dev/null and b/Pasted image 20250326091615.png differ diff --git a/Pasted image 20250326165958.png b/Pasted image 20250326165958.png new file mode 100644 index 0000000..2a809fb Binary files /dev/null and b/Pasted image 20250326165958.png differ diff --git a/Pasted image 20250327190433.png b/Pasted image 20250327190433.png new file mode 100644 index 0000000..6f59121 Binary files /dev/null and b/Pasted image 20250327190433.png differ diff --git a/日常学习/大模型/Deepseek/部署显存要求.md b/日常学习/大模型/Deepseek/部署显存要求.md new file mode 100644 index 0000000..68b81a4 --- /dev/null +++ b/日常学习/大模型/Deepseek/部署显存要求.md @@ -0,0 +1,3 @@ +![[Pasted image 20250326165958.png]] + + diff --git a/日常学习/大模型/RAG/RAG 概述.md b/日常学习/大模型/RAG/RAG 概述.md new file mode 100644 index 0000000..9cf0084 --- /dev/null +++ b/日常学习/大模型/RAG/RAG 概述.md @@ -0,0 +1,14 @@ +## 一、基本原理 +RAG是一种结合了信息检索(Retrieval)和文本生成(Generation)的混合架构,它允许大模型在回答问题时,不仅依赖于自身训练时获得的知识,还能动态地从外部知识库中检索相关信息,以提高生成内容的准确性和可信度。简而言之,RAG可以被理解为“**先查资料,再回答问题**”的智能问答系统。 + +RAG通常由两个主要模块组成: +1. **检索模块(Retriever)**:从外部数据库或文档集合中提取与输入查询最相关的信息。 +2. **生成模块(Generator)**:基于检索到的内容,结合大模型已有的语言能力,生成最终的回答。 +这种方法的优势在于,它可以让大模型具备“短期记忆”能力,使其能够处理时效性强、知识更新频繁或需要引用外部文献的任务。例如,在金融、医疗、法律等领域,RAG可以帮助模型提供更具权威性的答案,而不是仅凭预训练数据“猜测”答案。 +- RAG技术通过检索外部知识库,避免了幻觉问题的困扰。相较于单纯依赖大型语言模型对海量文本数据的学习,RAG允许模型在生成文本时从事实丰富的外部知识库中检索相关信息。 +- RAG技术的时效性优势使其在处理实效性较强的问题时更为可靠。通过与外部知识库的连接,RAG确保了模型可以获取最新的信息,及时适应当前的事件和知识。 +- 与传统的知识库问答(KBQA)相比,RAG技术在知识检索方面更加灵活,不仅能够从结构化的知识库中检索信息,还能够应对非结构化的自然语言文本。 +## 二、实现原理 + +![[Pasted image 20250326091615.png]] + diff --git a/日常学习/大模型/function calling.md b/日常学习/大模型/function calling.md index a4796c2..16381cf 100644 --- a/日常学习/大模型/function calling.md +++ b/日常学习/大模型/function calling.md @@ -12,6 +12,10 @@ function Calling 是一种机制,允许大语言模型[动态调用](https://z # 二、Deepseek function calling +`仅限于火山引擎,Deepseek-r1 原版不支持function calling` + +``` + 1. tools定义 deepseek 官方定义的格式(最多支持 128 个 function),参考 https://api-docs.deepseek.com/zh-cn/guides/function_calling ```json diff --git a/日常学习/大模型/提示词工程/Cline提示词工程分析.md b/日常学习/大模型/提示词工程/Cline提示词工程分析.md new file mode 100644 index 0000000..66ebea2 --- /dev/null +++ b/日常学习/大模型/提示词工程/Cline提示词工程分析.md @@ -0,0 +1,5 @@ +https://www.ruanx.net/prompt-engineering/ + +![[Pasted image 20250327190433.png]] + +如图,cline将tool 描述加到上下文中,可以实现不使用LLM API执行function call(比如DeepSeek-r1不支持function calling功能),但缺点在于会上下文token会很长 \ No newline at end of file diff --git a/项目/盛视科技/北京智能建模.md b/项目/盛视科技/北京智能建模.md index 293d65f..5067fd5 100644 --- a/项目/盛视科技/北京智能建模.md +++ b/项目/盛视科技/北京智能建模.md @@ -3,7 +3,6 @@ 【数据服务UI原型:https://js.design/f/r6o7Iw?p=-06pdY2y4F&mode=design】【金山文档:智能建模开发计划表https://kdocs.cn/l/cqRud3cgOctf】【禅道地址:http://172.31.51.246:81/zentao/bug-browse-104-0-unclosed-0-id_desc.html】【测试环境系统地址:http://172.31.51.134:8080?oauth=YWRtaW58fE1heHZpc2lvbkAxMjM】【测试环境管理员账号:admin/Maxvision@123】 - 北京智能建模系统的请求地址和方式为: liuhai这个账号: [http://172.31.51.134:8080?oauth=bGl1aGFpfHxNYXh2aXNpb25AMTIz](http://172.31.51.134:8080?oauth=bGl1aGFpfHxNYXh2aXNpb25AMTIz)