RAG技术:私有大模型知识更新的最佳实践

article/2025/8/20 14:49:05

 大模型的知识主要是在预训练阶段学习的,更新大模型的固化知识是非常困难的,需要通过特定数据集的微调再训练实现。通过RAG实现私有知识库与私有化部署大模型相融合,就变得容易得多,但需要根据私有知识库的数据结构特点进行选型。”

 

相信很多政企单位都已尝鲜部署了私有大模型问答系统,而且基本思路是一致的,即本地部署大模型如DeepSeek 32B或70B+私有知识库+前端智能问答系统。它可以不依赖于大模型的预训练或者再训练即可实现知识私有定制化,这是私有化大模型部署进行内容定制化开发的成本最低效果最好的方式。本文将陈述RAG的常用实现方式,以及他们各自的优缺点及使用场景。

为什么需要RAG

RAG是基于外挂知识库建立的,具有可实时更新、确定性输出、隐私性好等特点,可以解决大模型使用过程中遇到的以下问题:

一、大模型的知识更新问题

大模型的知识源于预训练,将大量的知识压缩到参数之中,训练完成之后大模型的所掌握的知识也就固定不变了。然而随着时间的推移,人们在应用过程中,需要大模型不断”学习“新知识。这就需要一种便捷、廉价的方式让大模型不断”掌握“新知识。

在使用RAG系统之后,可以随时更新外挂私有数据库,实现知识的实时更新。

二、大模型的生成结果的不可解释性问题

大模型表现出了不可思议的“意识”能力,而且出现了不可解释的“涌现”现象(当数据量和参数超过阈值,如千亿级,模型会突然具备小模型没有的能力),但其本质仍是模仿人类语言的“拼图游戏”。

因此,大模型的输出的结果也可能是不可解释的灾难性的失败(幻觉):模型可能生成看似合理但错误的答案(如“9.11比9.9大”),因为其本质是基于概率的“随机鹦鹉”;用户误以为模型“有意识”,实则是数据模式的“概率组合”。

正是因为大模型天然的这种不可解释性问题,在非常严肃的应用场景下,例如"我站在二楼楼顶,跳下去会不会失去生命”,我们需要一种手段(RAG)确保大模型输出的答案具有确定性,以增强用户对大模型的”信心“,以防止灾难性情景的发生。

三、大模型的数据安全问题

私有化训练专用大模型资金成本和时间成本都很高,然而公用大模型的所包含的所有数据,通过一定的提示词引导,均可输出其掌握的信息,不具备隐私保护功能。

在使用RAG系统之后,由于模型组织答案所用到的知识来源于预先提供的知识库信息,利用个人私有数据不仅可以使得模型的答案具有个性化,同时能让整个系统的数据更加安全,防止隐私数据被诱导泄露。

RAG本质上是一种大模型“外挂数据库”,为提升数据的检索速度和数据命中率,不同的数据类型需要不同的组织形式,需要不同类型的数据库进行存储。实现RAG的数据库主要有:向量数据库(最常用)、图数据库、知识图谱(一般基于图数据库)、混合架构数据库(一般基于搜索引擎如Elasticsearch)等。下面一一介绍:

向量数据库

向量数据库代表产品:LanceDB、Chroma、Pinecone。

适用数据类型:

1. 非结构化数据:文本、图像、音频等,并根据语义相似性搜索数据。向量模型用于为数据库中存储的数据生成向量嵌入。根据数据类型、任务和向量模型的不同,数据需要被切分成更小的块。例如,如果要存储文本数据,则可以将数据切分成句子或段落。

2. 高维语义特征数据:如语义相似度匹配的问答对、商品描述向量等。

典型应用场景:

1. 实时语义搜索(电商商品推荐、聊天记录分析)。

2. 多模态内容匹配(图片搜索、跨语言文档检索)。

3. 大模型上下文增强(RAG中的Top-K片段召回)。

核心优势:    

1. 高效相似性检索:支持ANN算法(如HNSW、IVF),实现毫秒级响应。

2. 多模态兼容:统一处理文本、图像、音视频的向量表示。

3. 横向扩展:支持百亿级向量分布式存储,如Milvus的自动分片机制。

图数据库

图数据库以节点和边的形式存储数据。它适用于存储结构化数据,如表格、文档等,并使用数据之间的关系搜索数据。例如,如果你正在存储有关人员的数据,可以为每个人创建节点,并在彼此相识的人之间创建边。当对图数据库进行查询时,图数据库返回与查询节点相连的节点。这种使用知识图谱的检索对于完成像问题回答这样的任务非常有用,其中答案是人或实体。

图数据库代表产品:Neo4j、Nebula Graph、HugeGraph

适用数据类型:

1. 结构化关系数据:实体(如人物、产品)及其关联关系(如“推出”“属于”)。

2. 知识网络:企业组织架构、产品技术图谱。

典型应用场景:

1. 复杂逻辑推理(如“饺子导演的电影有哪些”)。

2. 跨实体关系查询(如供应链上下游分析)。

核心优势:

多跳推理:通过图遍历实现复杂关系查询(如3度人脉挖掘)。

动态权重:支持边属性动态调整(如社交网络影响力计算)。

可视化分析:直观展示实体关系网络。

知识图谱

知识图谱通常与图数据库结合存储,并集成向量检索模。知识图谱与图数据库在RAG中形成“语义层+存储层”的协同架构:

知识图谱解决“为什么”(推理依据)的问题,例如法律咨询中引用法规条款的合法性验证;

图数据库解决“是什么”(数据存储)的问题,例如实时查询社交网络中的用户关系链。

两者结合可覆盖从数据管理到知识推理的全链路需求,例如油气行业RAG系统常采用Neo4j(图数据库) + 领域知识图谱 + 向量数据库的混合架构,兼顾精准检索与语义理解。

知识图谱代表产品:AWS Neptune(全托管知识图谱服务)、Stardog(企业级语义推理引擎)、Apache Jena(开源RDF框架)。

适用数据类型:

混合型数据:结构化实体属性(如电影票房)+非结构化文本描述。

多源异构数据:跨数据库、API和文档整合的知识体系。

典型应用场景:

1. 动态知识扩展(如实时更新行业标准)。

2. 增强答案可解释性(提供推理路径)。

核心优势:

语义理解:通过本体建模实现上下文精准捕捉。

可解释性:答案生成附带证据链(如法规条款引用)。

动态更新:支持增量知识注入与版本管理。

混合架构数据库

在RAG系统中,可以从通用搜索引擎(如百度、Bing等)或内部搜索引擎(如Elasticsearch、Solr等)中检索数据。在RAG架构的检索阶段,使用问题/任务详细信息查询搜索引擎,搜索引擎返回最相关的文档。搜索引擎对于从网络中检索数据和使用关键字搜索数据非常有用。可以将来自搜索引擎的数据与来自其他数据库(如向量存储库、图数据库等)的数据结合起来,以提高输出的质量,因此可以称之为混合架构数据库。

混合架构数据库代表产品:

Elasticsearch + Neo4j(全文检索+图推理)。

Milvus + TigerGraph(向量+图联合查询)。

Azure Cognitive Search(内置多模态混合检索)。

适用数据类型:

混合数据:非结构化文本+结构化关系数据。

动态场景:需同时处理模糊语义与精确规则。

核心优势:

灵活检索策略:向量相似度与图遍历联合优化。

成本平衡:热数据向量化+冷数据图谱化分级存储。

准确性提升:通过多源结果交叉验证减少幻觉。

典型应用场景:

企业级智能客服(政策查询+流程审批推理)。

科研文献分析(论文相似性检索+作者合作网络)。

金融投研(行情数据匹配+产业链关联分析。

 


http://www.hkcw.cn/article/ejpYtbOcQQ.shtml

相关文章

Cesium 报错:自定义材质报‘texture2D‘ : no matching overloaded function found错误

文章目录 问题分析解决 问题 Ceisum 加载自定义材质时报错如下: 自定义材质报‘texture2D‘ : no matching overloaded function found错误 分析 cesium1.102 及以上的版本会报错:原因是从1.102版本开始默认使用的是WebGL2上下文渲染。WebGL2 在所有平…

vue3项目 前端文件下载的两种工具函数

1、Blob 流下载 Blob 表示不可变的原始数据的类文件对象,通常用于处理文件或大块二进制数据。 注意:js中还有一个二进制数据类型ArrayBuffer,它们的区别如下 Blob 可以位于磁盘、高速缓存内存和其他不可用的位置;ArrayBuffer 是存…

信号量的应用:利用信号量实现进程同步

进程同步与信号量 进程同步是指在多进程环境下,为了保证程序的正确性,协调多个进程按一定顺序执行。信号量是实现进程同步的重要工具,它本质上是一个特殊变量,通过对其进行 wait(P 操作)和 signal&#xf…

常规个人信息安全设置(windwos一)

windows操作系统 1、修改个人电脑密码,修改为安全密码,打开安全策略。2、确定关闭远程访问功能3、打开病毒防护 最近无意识的一些操作导致了电脑被病毒攻击,表现就是所有文件夹下都会自动生成一个READMIN.TXT文件,内容如下&#x…

C#回调函数深度解析

文章目录 前言什么是回调函数C#中实现回调的方式委托(Delegate)事件(Event)Action和FuncPredicateAsyncCallback匿名方法和Lambda表达式 回调函数实际应用场景异步编程事件处理策略模式LINQ查询 回调函数的优缺点优点缺点 最佳实践与注意事项总结相关资源 前言 在现代软件开发…

一男子发多条视频怀念亡妻:相恋12年,会照顾好两个老人

5月29日(报道),山东一男子发布多条视频怀念亡妻,二人相恋十二年,28岁妻子死于心脏停搏,去世前一天还晒了老公送的花。当事人:“我会带着思念好好活下去,照顾好两个老人。”责任编辑:zx0002

在supermap idesktop中两块影像设置背景透明后,拼接处会有一条明显的黑线,但是放大后又没有,这个怎么处理

1.将数据集的影像数据先添加到一个新的地图; 2.去数据集将影像数据的金字塔删除; 3.重新创建影像金字塔;选择【创建影像数据金字塔】 4.将栅格数据添加到图层里 点击属性进行设置,勾选【无值透明】、背景值设置为0 0 0&#xff…

女子误扔40多万黄金到第二天才发觉 民警经过近1小时排查成功找到

近日在天津,民警接到市民求助,称不慎将价值40万元的黄金当作垃圾丢弃。报警人是天津一家经营金店的夫妇,店主称,当晚闭店后,他的妻子照例去扔垃圾,却不慎将装有500多克价值40万元的黄金首饰及金料的塑料袋当作垃圾丢弃。等他们发现时已是第二天,此时垃圾早已被环卫部门收…

工业智能网关在柔性制造系统中的动态产线切换实践

一、项目背景 在电子制造行业,某企业拥有数百台生产设备,包括西门子品牌的PLC设备、欧姆龙品牌的传感器以及基恩士品牌的条码读取器等。这些设备分布在多个车间,传统的监控方式需要工作人员到现场逐一查看设备运行状态,不仅效率低…

Facebook 的隐私保护为何备受争议?

Facebook,这个全球最大的社交网络平台,拥有数十亿用户,其隐私保护问题一直是公众关注的焦点。从数据收集到隐私政策的复杂性,再到第三方数据共享和隐私设置的不直观性,Facebook 在隐私保护方面面临着重重挑战。本文将深…

lesson04-简单回归案例实战(理论+代码)

理解线性回归及梯度下降优化 引言 在机器学习的基础课程中,我们经常遇到的一个重要概念就是线性回归。今天,我们将深入探讨这一主题,并通过具体的例子来了解如何利用梯度下降方法对模型进行优化。 线性回归简介 线性回归是一种统计方法&a…

孙颖莎被邱贻可踩脚当场告状 师徒情深趣事多

孙颖莎被邱贻可踩脚当场告状 师徒情深趣事多!昨天,央视体育发布了《体坛零距离》预告片,其中展示了孙颖莎和她的教练邱贻可在巴黎奥运会女单决赛失利后的艰难心路历程。邱贻可提到那时看到乒乓球都会感到不适。在谈到未来是否继续追梦时,孙颖莎坚定表示:“必须的!感谢邱指…

女子称按摩时遭医生猥亵 警方调查

长沙的刘女士因为腰部不舒服,前几天,她找到了位于雨花区城南路附近的高飞林中医诊所进行正骨按摩,可是,接下来发生的事情让她情绪差点崩溃。“5月20号的时候,我去长沙高飞林诊所,因为我的腰椎盘突出,去进行正骨检查,但是医生以腰椎盘突出压迫神经为由,他需要对我进行盆…

leetcode hot100刷题日记——27.对称二叉树

方法一:递归法 class Solution { public:bool check(TreeNode *left,TreeNode *right){//左子树和右子树的节点同时是空的是对称的if(leftnullptr&&rightnullptr){return true;}if(leftnullptr||rightnullptr){return false;}//检查左右子树的值相不相等&a…

接口自动化测试(六)

一、pytest参数化 pytest: pytest.mark.parametrize(argnames,argvalues) 参数化DDT:把对应的数据去进行提取出来进行统一维护 ---- 多组数据pytest.mark.parametrize(argnames,argvalues) pytest.mark.parametrize("参数名",参数数据) 参数数据格式&…

LangChain【1】之认识框架和简单体验

文章目录 参考文章LangChain框架概述LangChain分层结构LangChain环境配置简单案例体验方式1:Api key单独文件配置方法2:直接设置Api KeyLangSmith的添加和使用 参考文章 通过类比, 十分钟快速掌握LangChain的架构LangChain入门教程,基本案例…

ESP8266-12S配置信息保存到文件SPIFFS示例

一、前言 利用SPIFFS保存参数(加载,读取,修改) vscodePlatformIO 二、代码片段 头文件引用 定义结构体 读取、保存、修改配置文件 初始化setup(),利用配置文件中的账号密码连接WIFI 循环体loop(),读取串口…

90后作家刘楚昕获奖后追忆病故女友 未竟的承诺

近日,90后作家刘楚昕的小说《泥潭》荣获第二届漓江文学奖虚构类奖。颁奖现场上,作家余华公布了这个好消息。而获奖者刘楚昕的感言因格外催泪动人在朋友圈里刷了屏。2017年,刘楚昕在武汉大学读博期间遇到了他的初恋女友。当时,他正朝着自己的文学梦马不停蹄地赶路。“每次我…

WPS 免登录解锁编辑

遇到 WPS 需要登录才能启用编辑功能? 如何免登录使用编辑功能? 方法一 解锁方法 1、关闭 WPS; 2、桌面右键→ “新建”→“文本文档”,粘贴以下内容(见最下面);编码保持默认(ANSI …

破局传统采购!采购文件编制审核系统为烟草行业数智化加速

在烟草行业错综复杂的商业生态系统中,采购环节扮演着至关重要的战略枢纽角色。它如同驱动精密机械运转的核心齿轮,其每一次高效的“啮合”都深刻影响着整条价值链的协同运作。卓越的采购效能不仅是提升企业整体运营效率的基石,更是实现精细化…