前言
本文聚焦基于华为云平台部署的智慧水果分析助手 AI Agent,通过
Dify 平台集成 Embedding、Rerank 及 DeepSeek 模型
,构建工作流,实现提问内容驱动的 “知识库 + 大模型” 与 “联网搜索 + 大模型” 智能切换。
- ECS控制台:https://console.huaweicloud.com/hecsx/
- 华为云ModelArts Studio平台:https://console.huaweicloud.com/hecsx/
- Dify-LLM应用开发平台部署文档:https://support.huaweicloud.com/dify-aislt/dify_05.html
- Embedding及Rerank模型部署文档:https://support.huaweicloud.com/derm-aislt/derm_05.html
Dify平台部署(单机)
介绍
在华为云平台部署 Dify 平台可以依托其解决方案市场的一键式模板,10 分钟内即可完成单机部署,流程简单高效,且基于 Flexus 云服务实现算力优化(依托擎天架构提升性能)、成本可控(月均费用低)、安全合规(VPC 隔离、数据加密)。部署后可快速搭建智能应用,如结合知识库与大模型的 “智慧水果分析助手”,灵活实现 “知识库检索 + 大模型解析” 或 “联网搜索 + 大模型生成” 的双模式响应,大幅提升业务场景的智能化效率。
官方文档:https://support.huaweicloud.com/dify-aislt/dify_05.html
部署流程
登录华为云解决方案实践页面,在方案列表中找到 “快速搭建 Dify-LLM 应用开发平台” 或 点击此处跳转 “快速搭建 Dify-LLM 应用开发平台”,根据需求
选择部署版本
(以单击部署为例),选择“可用区
”,点击 “一键部署(云服务器单机部署)
” 按钮,系统将跳转至解决方案的 “资源栈创建界面”。
进行模板选择操作,保持默认配置不变,然后点击页面右下角的“下一步”按钮。
在该步骤中,对云服务器密码进行设置(必填项),保持其他配置为默认状态,完成后点击页面右下角的 “下一步” 按钮。
进行资源栈设置,开启“回滚设置”开关,完成后点击 “下一步” 按钮。(不做权限委派操作)
进入配置确认环节,仔细核对所有设置无误后,点击页面右下角的 “创建执行任务” 按钮启动部署流程。
当系统弹出创建执行计划对话框时,自行设置执行计划名称(支持自定义内容),确认无误后点击 “确定” 按钮。
此时可观察到执行计划正在创建中,待其创建成功后,点击 “部署” 按钮启动部署流程。
可以看到执行计划创建成功,点击“部署”按钮,
点击 “部署” 按钮后,系统将弹出执行计划确认对话框,此时请点击对话框中的 “执行” 选项完成操作。
点击 “事件” 标签,可查看当前创建任务的状态详情,了解是否完成创建。
待“事件”中出现“
Apply required resource success
”,表示该解决方案已经部署完成。
手动刷新页面,在 “输出” 区域中查看 Dify-LLM 应用开发平台的访问说明。当堆栈部署状态显示成功后,Dify 应用搭建脚本将自动开始执行,请耐心等待 5 至 10 分钟(具体耗时可能因网络波动而略有差异)。
部署成功之后,可以再ECS控制台查看到所创建出的ECS云主机,通过公网IP来进行DIfy平台的访问
登录注册:在浏览器输入该地址,进入 Dify 界面后,点击 “注册” 按钮,依次填写邮箱、账号(自定义用户名)、密码(需符合复杂度要求),完成管理员账号创建后即可登录。
打开浏览器并访问您部署的 Dify 平台地址(可在堆栈 “输出” 中查询),进入登录界面后,依次输入前序步骤中注册的邮箱和密码,点击 “登录” 按钮即可进入 Dify 平台。
如下图,我们已经成功在华为云平台部署了Dify-LLM平台,接下来就可以进行各种开发操作了。
导入工作流
进入Dify平台,点击页面中的“工作室”选项,即可进入工作室页面。
在工作室页面点击 “导入 DSL 文件”,选择 “URL” 后复制指定地址并粘贴到 DSL URL 路径中
https://documentation-samples.obs.cn-north-4.myhuaweicloud.com/solution-as-code-publicbucket/solution-as-code-moudle/building-a-dify-llm-application-development-platform/workflow/DeepSeek_%E8%81%94%E7%BD%91%E6%90%9C%E7%B4%A2_%E7%9F%A5%E8%AF%86%E5%BA%93.yml
导入后系统提示安装工作流所需插件,勾选插件列表后点击 “安装” 按钮即可。
- OpenAI-API-compatible 插件通过标准化接口兼容 OpenAI 及第三方大模型(如 GPT、DeepSeek),支持多模型灵活调用与 Function Calling,实现高效低成本的 AI 交互;
- SearXNG 插件是基于开源技术的元搜索引擎,整合多引擎搜索结果并提供隐私保护,支持本地化部署以动态补充实时信息。
导入成功并完成创建后,如下图
点击联网“搜索插件”,右侧弹出界面,点击“授权”
- 如果显示没有授权,重新进入 工作流进行查看即可。
点击授权后显示添加 URL,URL为dify平台的内网地址,填写之后点击保存。
- URL为dify平台的私网地址(点击ECS控制台查看主机IP)
- URL格式:http://{内网 IP}:8080
如下图配置成功,即可进行测试访问
创建经济知识库
在 Dify 平台顶部导航栏点击 “知识库” 后选择 “创建知识库”。
选择 “导入已有文本” 数据源,点击 “上传文件” 后点击下一步。
- 需根据自身应用需求来进行准备对应的知识库
保持文本分段与清洗的默认配置(分段设置为 “通用”、索引方式为 “经济”、检索设置为 “Top 3”),直接点击 “保存并处理” 即可(也可按需调整配置)。
- 此时我们可以看到索引类型只能选择默认的经济性(Dfy平台需要对接Embedding及Rerank模型之后才可以选择高质量知识库)
稍作等待,待嵌入完成后点击 “前往文档” 即可查看。
可以看到导入的知识库文档当前为可用状态(也可以点击设置对知识库进行修改配置操作)
Embedding及Rerank模型部署
介绍
Embedding 模型
可将文本转化为语义向量以支持快速语义检索,Rerank 模型
则对检索结果进行二次排序以提升 LLM 生成准确性;高质量知识库需预先创建这两类模型,依托专业数据与高性能模型,借助向量检索的召回与重排能力优化检索精准度,实现精准语义检索,而普通经济性知识库以通用数据和轻量级模型为基础,检索精度与深度相对有限。
- 官方部署文档: https://support.huaweicloud.com/derm-aislt/derm_05.html
- 该解决方案自动放通Ollama API网络端口 11434,xinference 服务端口9997。
部署流程
访问华为云官网,依次点击**【解决方案】→【解决方案实践】→【查看解决方案实践】**进入专栏
搜索 “Embedding” 关键词,选择“快速部署 Embedding 及 Reranker 模型”
点击 查看部署指南,进行查看安装流程
在 “快速部署 Embedding 及 Rerank 模型” 中,往下翻,通过支持区域下拉菜单选择部署区域(如贵阳一),点击 “一键部署”,系统将跳转至解决方案创建资源栈界面。
- 部署地址:https://www.huaweicloud.com/solution/implementations/deploying-embedding-and-reranker-models.html
在选择模板界面保持所有默认配置,直接单击 “下一步” 即可。
在配置参数界面,参考 “参数填写说明” 完成所有自定义参数填写(部分参数自动填充默认值),需修改时删除文本框内默认值后输入新值,全部参数填完后单击 “下一步”。
- 在此步我们我们只填写密码信息,其余配置均默认
首次部署时系统会提示是否开启加密,点击“确定”即可。
勾选回滚设置,其余参数保留默认配置不做修改。
核查参数列表配置,确认无误后点击 “创建执行计划”。
可自行设定执行计划的名称与描述,完成配置后点击 “确定”。
待执行计划创建完成后,点击 “部署” 按钮。
出现是否执行计划任务的提示时,点击“确定”即可。
当 “事件” 中显示 “
Apply required resource success
” 时,表明堆栈部署成功。
单击 “资源” 查看已创建的资源(参考图示),点击 “蓝色资源名称” 进入弹性云服务器详情页,查看其绑定的
弹性公网 IP
。
跳转到ECS基本信息页面,查看弹性公网IP并进行保存
dify配置向量检索模型
通过公网IP访问Dify平台,登录后点击右上角的账户图标,在弹出的菜单中选择“设置”选项。
点击 “模型供应商” 选项,在列表里找到 Ollama 模型,然后点击其对应的 “安装” 按钮。
在 Ollama 配置界面中,找到并点击 “添加模型” 按钮以开始配置新模型。
在 Ollama 模型配置界面进行以下操作:
- 模型类型选择 “Text Embedding”
- 模型名称输入 “bge-m3”
- 基础 URL : http://ECS公网IP:11434
- 端口号保持默认 11434(部署解决方案默认放行安全组)
- 点击右下角 “保存” 完成配置
点击 “模型供应商” 选项,在列表里找到
Xorbits Inference
模型,然后点击其对应的 “安装” 按钮。
在
Xorbits Inference
配置界面中,找到并点击 “添加模型” 按钮以开始配置新模型。
在 Xorbits Inference模型配置界面进行以下操作:
- 选择模型类型为 Rerank
- 模型名称填写 “bge-reranker-v2-m3”
- 模型 UID 同步填写 “bge-reranker-v2-m3”
- 基础 URL : http://ECS公网IP:9997
- 端口号设置为 9997(部署解决方案默认放行安全组)
- 点击右下角 “保存” 完成配置
如下图dify平台已经成功介入配置了Embedding(bge-m3)]及Reranker(bge-reranker-v2-m3)模型,接下来可以进行创建高质量数据库操作
两款模型已配置好,接下来配置高级知识库
创建高质量知识库
在
Dify 平台
顶部导航栏点击 “知识库” 后选择 “创建知识库”。
选择 “导入已有文本” 数据源,点击 “上传文件” 后点击**下一步(**数据源可自定义提供方式)。
- 需根据自身应用需求来进行准备对应的知识库
进入知识库选择索引方式选择高质量,配置
Embedding模型为bge-m3
启用混合检索模式(向量+关键词检索,可调节权重),选择
bge-reranker-v2-m3
模型进行结果重排,开启Score阈值(推荐0.5)并设置TOP K文档分片数量(控制最大调用量)。
在检索权重设置中,将语义(向量检索)和关键词(关键词检索)的权重滑块均调至 0.5,以平衡语义理解和关键词匹配的效果。开启Score阈值(推荐0.5)并设置TOP K文档分片数量(控制最大调用量)。点击保存后,高质量知识库即创建完成。
当界面显示嵌入完成时,点击 “前往文档”,即可查看处于可用状态的导入知识库文档。
可以看到导入的知识库文档当前为可用状态(也可以点击设置对知识库进行修改配置操作)
调整配置工作流
登录部署的Dify平台,在顶部导航栏点击 “工作室” 后选择 “之前导入的工作流”。
找到 “知识索引” 节点,点击 “知识库” 选项中的 “+” 号添加知识库。
选中已创建的高质量知识库,点击 “添加” 按钮完成操作。
Dify平台对接DeepSeek
创建秘钥
点击“此处跳转” 链接进入华为云ModelArts Studio平台,然后点击“
API KEY模型
”选项,点击右上角 创建API key
。
输入
API key
的标签和描述(自定义),点击确定,即可创建成功
点击确定之后会弹出创建的秘钥,创建出的
API key
仅会在创建时显示一次,所以当页面显示 API key 时,需及时进行保存。
在平台左侧导航栏点击“在线模型”,选中此前已开通的
DeepSeek
商用服务(以R1-32k
为例),接着点击“调度说明”查看相关信息。
切换至
OpenAI SDK
接口类型,查看对应的接口信息,包括 API 地址和模型名称(进行保存)。
Dify对接MASS
点击右侧“用户名称”下拉菜单,选择并点击“设置”选项。
点击左侧模型供应商,通过右上角搜索按钮选择“OpenAI-API-compatible”插件,点击“添加模型”。
模型显示名称可以自定义,输入我们之前创建的秘钥和保存的接口信息
- "模型名称":“在业务环境中调用模型服务的API进行推理”服务信息中的模型名称
- “API Key”: 请填入之前创建的API Key
- “API endpoint URL”: 在业务环境中调用模型服务的API进行推理”的API地址
- “Completion mode:” 请选择对话
如图所示,已在 Dify 平台成功完成 DeepSeek 商用服务的对接。
切换工作流中的大模型
在 Dify 工作流页面点击 “大模型服务 + 内部知识 RAG” 节点,切换模型为
DeepSeek-R1-32k
。
支持自定义工作流中的大模型参数配置,灵活适配业务需求。
测试工作流
在 Dify 平台输入知识库相关内容,测试检索功能是否正常触发并返回结果。
- 问题:帮我推荐几中好吃的水果
- 可以看到回复的内容来源于知识库
在 Dify 平台上,通过输入不在知识库内的相关内容,来检验能否触发联网搜索以获取信息。
- 问题:今天北京的天气怎么样
- 可以看到是通过联网搜索之后进行输出内容
发布Agent
当工作流测试无误后,可点击界面右上角的 “发布” 按钮,然后按提示点击 “发布更新”,即可将工作流正式上线。
调用Agent
发布完成后,可通过以下三种方式使用该 Agent 应用:
- 直接对话交互:在平台对话窗口输入问题,系统自动调用工作流逻辑生成回答;
使用对比联网搜索和知识库检索
-
API 接口调用:通过平台提供的 API 接口,将 Agent 集成至第三方系统或应用中使用;
-
嵌入网页 / 小程序:获取嵌入代码后,将 Agent 功能集成到自有网页或小程序界面,供用户直接访问。
资源清理
访问华为云资源编排服务(RFS)控制台,在资源栈列表中定位到通过该解决方案创建的资源栈,点击资源栈名称右侧的 “删除” 按钮执行删除操作。
在弹出的删除资源栈确认弹窗中,将删除方式选取为 “删除资源”,在确认输入框中键入 “Delete”,点击 “确定” 按钮,即可完成该解决方案的卸载操作。
注意: 本文使用编排工具部署两个业务,需要找到分别所对应的可用区下进行删除操作
总结
本次我深度体验了基于华为云与 Dify 平台的企业级 AI 应用开发路径,通过构建 “高质量知识库 + 联网搜索助手” 双模式智能系统,展现大模型时代企业数字化转型新可能。依托
Embedding 与 Rerank 模型
实现企业知识库精准语义检索,结合SearXNG
插件动态补充网络信息,形成 “内知外搜” 智能响应闭环。华为云 Flexus 实例
以擎天架构赋能卓越算力(性能提升 1.6 倍、成本降低 30%),搭配企业级安全防护,保障系统稳定运行;对接 MASS 平台 DeepSeek 商用服务模型,为专业领域分析注入深度推理能力。该方案以低代码编排、高性能算力、全场景兼容的优势,助力企业快速落地智能问答、数据分析等应用(如 “智慧水果分析助手”),无需复杂开发即可实现从数据整合到智能生成的全流程自动化。无论是传统行业的知识管理升级,还是新兴领域的动态信息洞察,这套架构都能提供高效、低成本、安全可靠的解决方案。
欢迎各位开发者小伙伴前来体验交流,感受华为云与 Dify 携手打造的智能应用开发范式,在 “精准知识赋能 + 实时数据拓展” 的双重价值探索中,携手挖掘 AI 技术在垂直场景的多元可能,共同为业务决策的智能化、高效化升级注入新动能。