Agentic RAG 的技术演进详解

article/2025/6/10 6:49:37

一、从被动检索到主动决策:Agentic RAG的核心突破

在人工智能领域,检索增强生成(RAG)技术的诞生标志着大语言模型(LLM)从“内部知识闭环”迈向“外部数据互联”的关键一步。传统RAG通过检索外部文档为生成过程提供上下文,显著降低了模型幻觉问题,但在面对动态复杂场景时,其静态检索逻辑、单一数据源依赖和被动响应模式逐渐成为瓶颈。例如,当用户询问“如何优化新能源汽车电池在低温环境下的续航表现”时,传统RAG只能基于预定义查询匹配固定知识库内容,无法动态整合最新研究论文、厂商技术公告和用户实测数据,导致回答缺乏时效性和深度。

Agentic RAG的出现彻底改变了这一局面。它将“智能代理(Agent)”的自主决策能力注入RAG框架,构建了具备“思考-行动-观察”循环的动态系统。这里的智能代理并非简单的工具调用模块,而是一个集认知推理、工具交互、记忆学习于一体的智能体:它能够像人类一样分析问题本质,自主规划检索路径,根据实时反馈调整策略,并将经验沉淀为可复用的知识。这种革新使得RAG系统从“检索-生成”的机械执行者,进化为能够主动探索知识、解决复杂问题的“智能助手”。

(一)智能代理的三维能力架构

  1. 认知决策层:大语言模型的“思维引擎”大语言模型是智能代理的核心大脑,负责执行三大核心功能:

    • 问题拆解

      :通过思维链(Chain-of-Thought)技术将复杂问题分解为可执行的子任务。例如,处理“预测某地区未来一周流感发病率”的查询时,LLM会先确定需要检索历史病例数据、气象指标、人口流动数据等子任务。

    • 策略生成

      :基于ReAct(推理+行动)框架生成具体操作指令,如“调用CDC流感监测API获取过去一年数据”“使用XGBoost模型建立预测模型”。

    • 结果评估

      :运用置信度评分机制判断检索结果是否充分,若发现数据缺口(如缺乏当前季节的特殊病毒株信息),则触发新一轮检索。

  2. 工具交互层:连接物理世界的“数字触手”代理通过标准化工具接口实现与外部系统的交互,工具类型涵盖:

    • 数据检索类

      :向量数据库(如Milvus)、搜索引擎(如Bing API)、实时数据流(如Twitter Streaming API);

    • 数据处理类

      :Python脚本引擎(支持自定义数据分析逻辑)、SQL查询工具、机器学习模型推理服务;

    • 行动执行类

      :邮件发送API、自动化机器人(RPA)、物联网设备控制接口。这种模块化设计使得代理能够根据任务需求动态组装工具链,例如在电商推荐场景中,代理可依次调用用户行为数据库(检索历史购买记录)、协同过滤算法(生成推荐列表)、营销系统API(发送个性化优惠券)。

  3. 记忆学习层:经验沉淀的“数字大脑皮层”记忆模块是代理实现持续优化的关键,包含两类存储机制:

    • 短期工作记忆

      :存储当前任务的上下文信息,如用户对话历史、中间检索结果、工具调用参数,采用时序注意力机制(Temporal Attention)实现动态遗忘,避免信息过载;

    • 长期知识库

      :通过知识图谱(Knowledge Graph)存储经过验证的领域知识、成功案例和最佳实践。例如,客服代理在解决某类复杂故障后,会将处理流程和关键数据点自动提炼为知识节点,供未来同类问题参考。

(二)Agentic RAG vs 传统RAG:范式革命的本质差异

维度传统RAGAgentic RAG
决策主体

依赖人工预设的检索逻辑

智能代理自主决策检索路径

任务处理

单次检索+单轮生成,适合简单查询

多轮迭代检索+分层推理,支持复杂问题分解

数据利用

静态知识库,缺乏实时数据整合能力

动态融合多源数据(文本/图像/实时流),支持在线学习

用户交互

被动响应用户查询

主动追问澄清需求,提供个性化解决方案

系统进化

依赖人工更新知识库

自主沉淀经验,持续优化检索-生成策略

这种差异的本质在于Agentic RAG引入了“自主性”和“适应性”。传统RAG如同按固定剧本表演的演员,而Agentic RAG则像具备即兴创作能力的导演——它能够根据现场环境变化调整策略,在未知领域中自主探索最优解。

二、智能代理的三大核心能力:重新定义知识处理流程

Agentic RAG通过三大核心能力重构了知识检索与生成的全链条,使其在效率、准确性和灵活性上实现指数级提升。

(一)智能路由:多源数据的动态导航系统

在企业级应用中,数据通常分布在内部知识库、第三方API、公开网页等多个孤岛。传统RAG的“一刀切”检索方式常导致关键信息遗漏,而Agentic RAG的智能路由能力如同智能交通枢纽,能够根据查询特性动态选择最优数据源组合。

工作机制解析

  1. 数据源画像建模

    :代理通过元数据(如数据更新频率、领域覆盖度、访问延迟)为每个数据源建立多维画像。例如,将企业ERP系统标注为“高时效性、强业务相关性、低访问成本”,将学术数据库标注为“高权威性、弱实时性、高检索成本”。

  2. 查询意图深度解析

    :利用命名实体识别(NER)和意图分类模型,将用户查询拆解为“核心实体+属性约束+时效要求”。例如,“2024年Q3华北地区新能源汽车销售趋势”可解析为:时间=2024Q3,地域=华北,领域=新能源汽车,任务类型=趋势分析。

  3. 动态路由策略

    :基于强化学习(RL)算法,代理根据历史路由效果(如检索结果相关性、响应时间)优化数据源选择策略。例如,当处理“紧急故障排查”类查询时,代理会优先调用内部故障案例库(响应快但覆盖度有限),若未找到答案则触发外部技术论坛检索(响应慢但内容丰富)。

典型应用场景

  • 跨境电商客服

    :用户询问“某品牌羽绒服在欧盟的关税政策”时,代理自动调用欧盟海关官网(获取政策文本)、企业内部合规文档(查询商品HS编码)、实时汇率API(计算税费),生成包含税率、申报流程和注意事项的综合回答。

  • 医疗诊断辅助

    :医生输入“患者咳嗽伴发热3天”的症状,代理同时检索临床指南(如《成人社区获得性肺炎诊疗规范》)、医院检验系统(获取血常规结果)、药品数据库(查询抗生素配伍禁忌),为诊断提供多维度支持。

(二)查询增强:从自然语言到精准指令的语义升华

用户的自然语言查询往往存在模糊性,如“推荐性价比高的笔记本电脑”中,“性价比高”缺乏明确量化标准。传统RAG直接将此类查询转换为关键词搜索,容易导致结果偏离预期。Agentic RAG的查询增强能力通过三层处理,实现从“意图理解”到“精准检索”的跨越:

技术实现路径

  1. 语义消歧与参数补全

    • 利用预训练模型(如BERT)识别查询中的隐含需求。例如,“查找附近的咖啡店”自动补充用户当前地理位置(基于IP地址或GPS)、营业时间、人均消费等约束条件;

    • 结合领域知识图谱(如电商产品图谱)解析模糊概念。例如,将“性价比高”映射为“价格≤5000元且用户评分≥4.5星且销量≥1000件”的结构化条件。

  2. 跨模态查询生成在多模态场景中,代理可将非文本输入转换为检索指令。例如:

    • 用户上传一张模糊的植物叶片照片,代理通过计算机视觉模型(如ResNet)识别植物类别,生成“查询XX科植物的养护方法”的文本查询;

    • 用户录制一段语音提问“如何设置路由器”,代理通过语音识别(ASR)转换为文本,并进一步解析为“TP-Link路由器WiFi设置步骤”的精准查询。

  3. 动态查询迭代代理根据首轮检索结果调整查询策略:

    • 若结果过多(如返回1000篇相关文献),自动添加“近三年”“核心期刊”等过滤条件;

    • 若结果过少(如无匹配产品),放宽约束条件(如将“华为手机”改为“安卓手机”)或触发近义词检索(如“性价比”→“性能价格比”)。

效果验证:在某电商搜索场景中,引入查询增强后,用户查询与检索结果的语义匹配度提升38%,长尾查询(如口语化表达)的有效响应率从52%提升至89%,显著降低了“用户输入与系统理解错位”导致的流失率。

(三)数据分析:从数据堆砌到洞察生成的价值跃迁

传统RAG的生成阶段仅将检索结果拼接后输入LLM,导致回答常停留在“信息罗列”层面。Agentic RAG则通过数据清洗-分析-蒸馏-可视化的完整链路,将原始数据转化为 actionable 洞察。

深度处理流程

  1. 自动化数据治理

    • 清洗:去除重复记录、纠正格式错误(如统一日期格式)、填充缺失值(如用均值插补法处理空缺数值);

    • 标准化:将多源数据转换为统一格式,例如将不同电商平台的商品规格(如“英寸”与“厘米”)转换为一致单位。

  2. 智能分析引擎

    • 统计分析:执行描述性统计(如计算平均增长率、标准差)、假设检验(如T检验判断两组数据差异显著性);

    • 机器学习建模:自动调用预训练模型(如随机森林、LSTM)进行预测或分类。例如,根据历史销售数据预测某商品下个月的销量;

    • 知识发现:利用关联规则挖掘(如Apriori算法)识别数据中的隐藏模式,如“购买纸尿裤的用户80%同时购买奶粉”。

  3. 多模态结果呈现

    • 自然语言生成(NLG):将分析结果转化为结构化报告,如“本季度销售额环比增长12%,主要得益于华东地区新客户数量增加25%”;

    • 可视化生成:自动生成折线图、热力图、桑基图等,例如用地理热力图展示各区域产品渗透率;

    • 交互式输出:在对话界面提供可点击的“数据钻取”按钮,用户可逐层查看细分维度数据(如从“全国销量”下钻至“省/市销量”)。

行业应用案例

  • 金融投研场景

    :代理检索某上市公司财报、行业研报、新闻舆情等数据,自动计算市盈率(PE)、市净率(PB)等指标,生成“投资风险-收益分析矩阵”,并标注关键风险点(如应收账款周转率下降);

  • 智能制造场景

    :代理实时采集生产线传感器数据,运用异常检测算法(如Isolation Forest)识别设备潜在故障,提前3小时发出预警,并自动生成维修工单派发给维护团队。

三、架构设计:从单兵作战到兵团协同的系统进化

Agentic RAG的架构设计直接决定其处理任务的复杂度和扩展性。根据代理数量和协作模式,可分为单代理系统和多代理系统两大体系。

(一)单代理系统:轻量级场景的高效引擎

单代理系统由一个智能代理独立完成“检索-分析-生成”全流程,适用于业务逻辑简单、数据规模较小的场景。其核心优势在于部署便捷性响应实时性,典型应用包括:

架构组成与工作流程

  • 核心组件

    :包含LLM模块、工具池(集成5-10个常用工具)、短期记忆缓冲区;

  • 工作循环

    1. 用户提问:“查询北京至上海的高铁时刻表”;

    2. 代理解析:识别需求为“获取指定区间、当天的高铁班次信息”;

    3. 工具调用:调用12306官方API检索实时数据;

    4. 结果处理:过滤掉已发车班次,按时间排序生成列表;

    5. 回答生成:以自然语言+表格形式返回结果,并提示“如需购票可点击链接跳转”。

适用场景特征

  • 任务单一性

    :无需多步骤推理或多数据源协作,如天气查询、快递跟踪;

  • 实时性要求高

    :需在1秒内响应的场景,如智能手表上的即时问答;

  • 资源受限环境

    :边缘设备或低算力平台(如嵌入式系统)。

(二)多代理系统:复杂场景的协同作战网络

当任务涉及多领域知识、需要并行处理或分层决策时,单代理系统的局限性凸显,需采用多代理架构。根据协作模式不同,可分为四种典型类型:

1. 分层模式(集中式指挥体系)
  • 架构特点

    • 存在“主代理”作为任务总指挥,负责拆解子任务、分配资源和汇总结果;

    • 子代理专注于特定领域,如检索代理(负责数据获取)、分析代理(负责建模计算)、生成代理(负责内容输出)。

  • 典型场景

    :企业级智能报告生成系统

    • 主代理接收“生成2024年Q3市场分析报告”的请求,拆解为“销售数据检索”“竞品动态分析”“用户调研汇总”三个子任务;

    • 检索代理调用ERP系统获取销售数据,竞品分析代理爬取电商平台和社交媒体数据,用户调研代理解析问卷结果;

    • 分析代理对三类数据进行联合建模,生成市场趋势预测;

    • 生成代理根据预设模板整合数据、图表和文字,输出最终报告。

2. 顺序模式(流水线作业体系)
  • 架构特点

    • 代理按固定顺序执行任务,前一代理的输出直接作为后一代理的输入;

    • 适用于具有明确流程步骤的场景,如学术论文撰写辅助。

  • 典型工作流程

    1. 选题代理:根据用户研究方向检索高影响力期刊最新论文,生成选题建议;

    2. 文献检索代理:基于选定题目,从PubMed、Web of Science等数据库获取相关文献;

    3. 摘要提取代理:运用NLP技术自动生成每篇文献的核心论点和实验结论;

    4. 综述生成代理:按照“研究背景-方法对比-未来展望”结构整合摘要,生成综述初稿;

    5. 格式优化代理:自动调整参考文献格式、图表编号和段落间距,符合目标期刊要求。

3. 并行模式(分布式计算体系)
  • 架构特点

    • 多个代理同时处理独立子任务,结果通过主代理并行汇总;

    • 显著提升处理效率,适用于数据密集型任务。

  • 典型应用

    :自然灾害损失评估

    • 图像分析代理:通过卫星遥感图像识别受灾区域边界;

    • 人口代理:检索当地人口分布数据,估算受影响人数;

    • 经济代理:调用企业数据库和房产记录,评估基础设施和资产损失;

    • 主代理融合三类数据,生成实时损失报告并标注高风险区域。

4. 分布式模式(去中心化自治体系)
  • 架构特点

    • 无中心节点,代理通过消息队列自主协商协作;

    • 具备高容错性和扩展性,适用于动态变化的复杂环境。

  • 典型场景

    :供应链智能协同

    • 供应商代理:实时监控原材料库存,当低于阈值时触发采购请求;

    • 物流代理:根据仓库位置和运输成本,自主选择最优物流公司并预订运力;

    • 销售代理:分析市场需求预测,动态调整生产计划并通知制造代理;

    • 各代理通过区块链技术实现数据不可篡改和信任传递,确保供应链透明化。

四、技术挑战与破局路径

尽管Agentic RAG展现出巨大潜力,其大规模落地仍面临四大核心挑战,相应解决方案正在成为学术界和产业界的研发焦点:

(一)可解释性瓶颈:从黑箱到白箱的信任构建

挑战表现:代理的决策依赖LLM的隐性推理,难以向用户或监管机构解释“为何选择此数据源”“为何生成此结论”,这在医疗、金融等合规敏感领域构成障碍。解决方案

  • 因果追溯技术

    :开发“决策日志追踪系统”,记录代理在每个环节的推理依据(如“因用户信用分低于600分,触发补充检索央行征信报告”),形成可追溯的因果链条;

  • 可视化解释框架

    :设计交互式界面,以流程图形式展示代理的检索路径、工具调用顺序和数据融合逻辑,用户可点击节点查看详细参数(如数据源置信度评分、查询优化规则);

  • 自然语言解释生成模型

    :训练专门的解释生成器(如T5-Explainer),将代理的内部决策逻辑转换为通俗易懂的自然语言说明,例如“由于当前检索结果的冲突率超过30%,系统自动触发了第二数据源验证”。

(二)资源消耗难题:从高算力依赖到轻量化部署

挑战表现:多代理系统的并行检索和复杂推理需要大量GPU/TPU资源,在实时交互场景中可能导致响应延迟超过用户容忍阈值(通常为2秒)。解决方案

  • 模型压缩与量化

    :采用知识蒸馏技术将大模型压缩为轻量级版本(如将GPT-4蒸馏为T5-Base),结合8位量化技术减少显存占用,使代理能在边缘设备运行;

  • 联邦学习与去中心化推理

    :在分布式多代理系统中,采用联邦学习协议使代理无需上传原始数据即可协同训练,降低数据传输成本;同时,利用边缘计算节点分担部分推理任务,减少对云端的依赖;

  • 自适应算力调度

    :开发动态资源分配算法,根据任务复杂度实时调整代理的算力配置。例如,在处理简单查询时使用单核CPU运行单代理,在应对复杂分析时自动唤醒GPU集群支持多代理并行计算。

(三)多模态融合困境:从单一文本到全模态认知

挑战表现:现有Agentic RAG主要针对文本数据设计,对图像、音频、视频等多模态信息的检索与推理能力不足,难以应对日益增长的富媒体交互需求。解决方案

  • 统一多模态表征模型

    :研发“文本-图像-语音”联合嵌入模型(如FLAVA、ALBEF),使代理能够将不同模态数据映射到同一语义空间,实现跨模态检索与生成。例如,用户上传维修设备的故障视频,代理可自动提取关键帧特征,生成对应的故障代码查询;

  • 具身智能(Embodied AI)集成

    :将代理与物理世界交互设备(如机械臂、无人机)结合,通过强化学习训练代理完成“视觉感知-语言理解-动作执行”的闭环任务。例如,在仓储场景中,代理通过摄像头识别货物位置,调用自然语言指令控制AGV小车完成分拣;

  • 跨模态生成技术

    :利用扩散模型(Diffusion Model)实现从文本到图像/视频的生成,例如代理根据用户的产品设计描述自动生成三维模型图,并调用渲染工具制作演示动画。

五、Agentic RAG的技术演进路线图

(一)短期(1-3年):垂直领域深度落地

  • 行业解决方案标准化

    :针对医疗、金融、制造等核心领域,推出预训练的Agentic RAG模型,内置行业专属工具链和知识库(如医疗领域的ICD-11编码库、金融领域的ISIN代码解析工具);

  • 低代码/无代码平台

    :开发可视化的代理编排工具,允许企业通过拖放组件快速构建定制化Agentic RAG应用,降低技术门槛。

(二)中期(3-5年):通用智能代理雏形显现

  • 跨领域迁移学习突破

    :通过元学习(Meta-Learning)技术,使代理能够快速适应新领域任务,例如从客服场景无缝迁移至法务合规场景,无需重新训练;

  • 情感认知与社交能力

    :集成情感分析(Affective Computing)和社交推理模型,使代理能够理解用户情绪(如焦虑、困惑),并生成富有同理心的回应,提升人机交互体验。

(三)长期(5年以上):具身智能与通用人工智能衔接

  • 物理世界自主交互

    :代理通过人形机器人或无人机实现线下场景的自主行动,例如在医院中巡逻的智能护理机器人,可自主检索患者病历、采集生命体征并提供护理服务;

  • 群体智能涌现

    :多代理系统通过自组织协作形成“智能体社会”,能够解决单一个体无法完成的超复杂任务(如全球气候变化模拟、星际探索任务规划),标志着从“弱人工智能”向“强人工智能”的跨越。

Agentic RAG的出现,不仅是技术的革新,更是人机关系的重新定义。它让机器从“按指令行事的工具”进化为“理解需求、自主决策、持续进化的伙伴”,人类得以从重复性知识工作中解放,专注于创造力、战略思维和情感连接等机器难以替代的领域。


http://www.hkcw.cn/article/swoBjDkXui.shtml

相关文章

2025-05-31 Python深度学习9——网络模型的加载与保存

文章目录 1 使用现有网络2 修改网络结构2.1 添加新层2.2 替换现有层 3 保存网络模型3.1 完整保存3.2 参数保存(推荐) 4 加载网络模型4.1 加载完整模型文件4.2 加载参数文件 5 Checkpoint5.1 保存 Checkpoint5.2 加载 Checkpoint 本文环境: Py…

智能测试新范式:GenAI 与 Playwright MCP 如何重塑 QA 流程

文章简介 在敏捷开发背景下,传统测试自动化面临动态 UI 适配难、脚本维护成本高等挑战。本文深度解析 ** 生成式 AI(GenAI)与Playwright MCP(模型上下文协议)** 的协同机制,展示如何通过自然语言驱动测试创…

孙颖莎全红婵们等比例长大 体育名将童心未泯

显示图片孙颖莎全红婵们等比例长大-今日头条-手机光明网今天是六一儿童节,祝大家儿童节快乐!来看看体育圈那些等比例长大的名将们吧!2025-06-01 10:05:46责任编辑:zx0176

赛龙舟快得千篇一律沉得五花八门 各地龙舟赛“名场面”

端午节到了,又是一年一度观看“水上F1”的时刻。作为端午节的传统节目,全国各地的龙舟大赛已经激烈打响,各地画风确实有所不同。快得千篇一律,沉得五花八门。有人划龙舟是为了纪念屈原,有人则是去救屈原,还有人是屈原救我。广东佛山的叠滘龙舟队是龙舟界公认最具实力的队…

AI预测3D新模型百十个定位预测+胆码预测+去和尾2025年5月31日第94弹

从今天开始,咱们还是暂时基于旧的模型进行预测,好了,废话不多说,按照老办法,重点8-9码定位,配合三胆下1或下2,杀1-2个和尾,再杀4-5个和值,可以做到100-300注左右。 (1)定…

HackMyVM-First

信息搜集 主机发现 ┌──(kali㉿kali)-[~] └─$ nmap -sn 192.168.43.0/24 Starting Nmap 7.95 ( https://nmap.org ) at 2025-05-31 06:13 EDT Nmap scan report for 192.168.43.1 Host is up (0.0080s latency). MAC Address: C6:45:66:05:91:88 (Unknown) …

【赵渝强老师】数据库不适合Docker容器化部署的原因

在Docker的容器中可以部署运行一个MySQL数据库,并通过数据卷将运行在容器中的MySQL数据库的数据进行持久化。如果这时候运行MySQL的容器被销毁了,数据也将会发生丢失。因此在Docker中部署数据库服务时,一定要考虑数据持久化的问题。但数据库并…

“婚内强奸”被羁押285天当事人发声 申请33万赔偿

5月30日,尹某向河南省濮阳县人民检察院递交了《国家赔偿申请书》,申请国家赔偿33万元,并要求追责相关办案人员。濮阳县人民检察院接受了相关的申请材料。尹某表示,当时以强奸罪对他提起公诉,量刑为4年,但一年前决定不起诉,他被错误羁押了285天,希望获得应有的国家赔偿。…

美计划大幅增加对台军售,外交部回应 坚决反对售台武器

中国外交部发言人林剑在例行记者会上表示,中方坚决反对美国向中国台湾地区出售武器,敦促美方恪守一个中国原则和中美三个联合公报,特别是“八一七”公报的规定,停止售台武器,停止制造台海局势紧张因素。有记者在会上提问,据报道,美国特朗普政府正计划扩大对台军售规模,…

事关志愿填报!这些核心信息必看

随着高考临近,各高校陆续公布2025年招生章程,它是考生了解高校招生信息、录取规则的重要渠道,也是填报志愿的关键依据,怎么吃透招生章程?需要重点关注哪些信息?一起来听听高校招办主任的解读。高校招生章程必看的核心信息高校招生章程包含招生计划分配原则、招生录取规则…

Labubu冲破关税打压美国卖断货,中国智造雄起 原创设计赢得全球认可

美国摩根大通CEO杰米戴蒙最近访问了中国,他表示,面对美国的关税打压,中国人并不害怕,想让中国对美国卑躬屈膝的想法是不现实的。中国能够昂首挺胸,因为有越来越多的中国公司能生产出让美国消费者喜欢的产品。近期,一个来自中国的娃娃Labubu成为了世界顶流。从最初被部分人…

AR测量工具:精准测量,多功能集成

在日常生活中,我们常常会遇到需要测量物体长度、距离或角度的情况。无论是装修房屋、制作家具,还是进行户外活动,一个精准的测量工具都能大大提高我们的工作效率。AR测量工具就是这样一款集多种功能于一体的实用测量软件,它利用增…

LiquiGen流体导入UE

导出ABC 导出贴图 ABC导入Houdini UE安装SideFX_Labs插件 C:\Users\Star\Documents\houdini20.5\SideFXLabs\unreal\5.5 参考: LiquiGenHoudiniUE血液流程_哔哩哔哩_bilibili

Unity3D仿星露谷物语开发57之保存库存信息到文件

1、目标 保存下面库存栏中信息到文件中。 2、修改SceneSave.cs脚本 添加2行代码: 3、修改InventoryManager对象 添加Generate GUID组件。 4、修改InventoryManager.cs脚本 添加继承自ISaveable 添加属性信息: private string _iSaveableUniqueID;pub…

港大NVMIT开源Fast-dLLM:无需重新训练模型,直接提升扩散语言模型的推理效率

作者:吴成岳,香港大学博士生 原文:https://mp.weixin.qq.com/s/o0a-swHZOplknnNxpqlsaA 最近的Gemini Diffusion语言模型展现了惊人的throughput和效果,但是开源的扩散语言模型由于缺少kv cache以及在并行解码的时候性能严重下降等…

【AGI】Qwen3混合推理模型微调数据集

【AGI】Qwen3混合推理模型微调数据集 (1)OpenMathReasoning 数据集(AIMO-2)(2)FineTome-100k 数据集(Maxime Labonne) ​ 搭建好基础环境后,开始准备Qwen3混合推理模型微…

联邦学习与深度学习结合

联邦学习(Federated Learning)与深度学习(Deep Learning)的结合,是当前人工智能领域的研究热点之一。这种结合既发挥了深度学习在复杂数据建模中的强大能力,又通过联邦学习的分布式框架解决了数据隐私、安全…

特朗普送马斯克白宫钥匙 马斯克将任总统顾问

当地时间30日,美国总统特朗普在白宫举行新闻发布会“欢送”“政府效率部(DOGE)”负责人马斯克。发布会上,两人互道临别感言,特朗普向马斯克赠送了一把金色的白宫钥匙,而马斯克则表示,在从DOGE离职后,将成为特朗普的顾问,继续为其提供建议。当天,在椭圆形办公室举行的新…

日方请求恢复水产品入华,外交部回应 坚持科学安全原则

5月30日,外交部发言人林剑主持例行记者会。会上,日本广播协会的记者提问,询问发言人提到的关于日本水产品安全问题的新一轮技术交流取得实质性进展具体指哪些方面。记者还提到,日方表示双方已就恢复进口日本水产品所需的技术性条件达成一致,并询问中方是否也持有相同的看法…

探索DeepSeek提示词:关键策略与实用场景

在人工智能飞速发展的时代,DeepSeek作为一款备受关注的AI工具,其强大的功能为用户提供了高效便捷的服务。然而,要充分发挥DeepSeek的潜力,掌握提示词的使用策略至关重要。本文将深入探讨DeepSeek提示词的关键策略,并结…