华为云Flexus+DeepSeek征文|华为云 Dify 打造智慧水果分析助手,实现“知识库 + 大模型”精准赋能

article/2025/6/29 12:59:55

前言

本文聚焦基于华为云平台部署的智慧水果分析助手 AI Agent,通过 Dify 平台集成 Embedding、Rerank 及 DeepSeek 模型,构建工作流,实现提问内容驱动的 “知识库 + 大模型” 与 “联网搜索 + 大模型” 智能切换。

  • ECS控制台:https://console.huaweicloud.com/hecsx/
  • 华为云ModelArts Studio平台:https://console.huaweicloud.com/hecsx/
  • Dify-LLM应用开发平台部署文档:https://support.huaweicloud.com/dify-aislt/dify_05.html
  • Embedding及Rerank模型部署文档:https://support.huaweicloud.com/derm-aislt/derm_05.html

Dify平台部署(单机)

介绍

华为云平台部署 Dify 平台可以依托其解决方案市场的一键式模板,10 分钟内即可完成单机部署,流程简单高效,且基于 Flexus 云服务实现算力优化(依托擎天架构提升性能)、成本可控(月均费用低)、安全合规(VPC 隔离、数据加密)。部署后可快速搭建智能应用,如结合知识库与大模型的 “智慧水果分析助手”,灵活实现 “知识库检索 + 大模型解析” 或 “联网搜索 + 大模型生成” 的双模式响应,大幅提升业务场景的智能化效率。

官方文档:https://support.huaweicloud.com/dify-aislt/dify_05.html

部署流程

登录华为云解决方案实践页面,在方案列表中找到 “快速搭建 Dify-LLM 应用开发平台” 或 点击此处跳转 “快速搭建 Dify-LLM 应用开发平台”,根据需求选择部署版本以单击部署为例),选择“可用区”,点击 “一键部署(云服务器单机部署)” 按钮,系统将跳转至解决方案的 “资源栈创建界面”

在这里插入图片描述

进行模板选择操作,保持默认配置不变,然后点击页面右下角的“下一步”按钮。

在这里插入图片描述

在该步骤中,对云服务器密码进行设置(必填项),保持其他配置为默认状态,完成后点击页面右下角的 “下一步” 按钮。

在这里插入图片描述

进行资源栈设置,开启“回滚设置”开关,完成后点击 “下一步” 按钮。(不做权限委派操作)

在这里插入图片描述

进入配置确认环节,仔细核对所有设置无误后,点击页面右下角的 “创建执行任务” 按钮启动部署流程。

在这里插入图片描述

当系统弹出创建执行计划对话框时,自行设置执行计划名称(支持自定义内容),确认无误后点击 “确定” 按钮。

在这里插入图片描述

此时可观察到执行计划正在创建中,待其创建成功后,点击 “部署” 按钮启动部署流程。

在这里插入图片描述

可以看到执行计划创建成功,点击“部署”按钮,

在这里插入图片描述

点击 “部署” 按钮后,系统将弹出执行计划确认对话框,此时请点击对话框中的 “执行” 选项完成操作。

在这里插入图片描述

点击 “事件” 标签,可查看当前创建任务的状态详情,了解是否完成创建。

待“事件”中出现“Apply required resource success”,表示该解决方案已经部署完成

在这里插入图片描述

手动刷新页面,在 “输出” 区域中查看 Dify-LLM 应用开发平台的访问说明。当堆栈部署状态显示成功后,Dify 应用搭建脚本将自动开始执行,请耐心等待 5 至 10 分钟(具体耗时可能因网络波动而略有差异)。

在这里插入图片描述

部署成功之后,可以再ECS控制台查看到所创建出的ECS云主机,通过公网IP来进行DIfy平台的访问

在这里插入图片描述

登录注册:在浏览器输入该地址,进入 Dify 界面后,点击 “注册” 按钮,依次填写邮箱账号(自定义用户名)、密码(需符合复杂度要求),完成管理员账号创建后即可登录。

在这里插入图片描述

打开浏览器并访问您部署的 Dify 平台地址(可在堆栈 “输出” 中查询),进入登录界面后,依次输入前序步骤中注册的邮箱密码,点击 “登录” 按钮即可进入 Dify 平台。

在这里插入图片描述

如下图,我们已经成功在华为云平台部署了Dify-LLM平台,接下来就可以进行各种开发操作了。

在这里插入图片描述

导入工作流

进入Dify平台,点击页面中的“工作室”选项,即可进入工作室页面。

在这里插入图片描述

在工作室页面点击 “导入 DSL 文件”,选择 “URL” 后复制指定地址并粘贴到 DSL URL 路径

https://documentation-samples.obs.cn-north-4.myhuaweicloud.com/solution-as-code-publicbucket/solution-as-code-moudle/building-a-dify-llm-application-development-platform/workflow/DeepSeek_%E8%81%94%E7%BD%91%E6%90%9C%E7%B4%A2_%E7%9F%A5%E8%AF%86%E5%BA%93.yml

在这里插入图片描述

导入后系统提示安装工作流所需插件,勾选插件列表后点击 “安装” 按钮即可。

  • OpenAI-API-compatible 插件通过标准化接口兼容 OpenAI 及第三方大模型(如 GPT、DeepSeek),支持多模型灵活调用与 Function Calling,实现高效低成本的 AI 交互;
  • SearXNG 插件是基于开源技术的元搜索引擎,整合多引擎搜索结果并提供隐私保护,支持本地化部署以动态补充实时信息。

在这里插入图片描述

导入成功并完成创建后,如下图

在这里插入图片描述

点击联网“搜索插件”,右侧弹出界面,点击“授权

  • 如果显示没有授权重新进入 工作流进行查看即可。

在这里插入图片描述

点击授权后显示添加 URL,URL为dify平台的内网地址,填写之后点击保存

  • URL为dify平台的私网地址(点击ECS控制台查看主机IP)
  • URL格式:http://{内网 IP}:8080

在这里插入图片描述

如下图配置成功,即可进行测试访问

在这里插入图片描述

创建经济知识库

在 Dify 平台顶部导航栏点击 “知识库” 后选择 “创建知识库”。

在这里插入图片描述

选择 “导入已有文本” 数据源,点击 “上传文件” 后点击下一步。

  • 根据自身应用需求来进行准备对应的知识库

在这里插入图片描述

保持文本分段与清洗的默认配置(分段设置为 “通用”、索引方式为 “经济”、检索设置为 “Top 3”),直接点击 “保存并处理” 即可(也可按需调整配置)。

  • 此时我们可以看到索引类型只能选择默认的经济性Dfy平台需要对接Embedding及Rerank模型之后才可以选择高质量知识库

在这里插入图片描述

稍作等待,待嵌入完成后点击 “前往文档” 即可查看。

在这里插入图片描述

可以看到导入的知识库文档当前为可用状态(也可以点击设置对知识库进行修改配置操作)

在这里插入图片描述

Embedding及Rerank模型部署

介绍

Embedding 模型可将文本转化为语义向量以支持快速语义检索Rerank 模型则对检索结果进行二次排序以提升 LLM 生成准确性;高质量知识库需预先创建这两类模型,依托专业数据与高性能模型,借助向量检索的召回与重排能力优化检索精准度,实现精准语义检索,而普通经济性知识库以通用数据和轻量级模型为基础,检索精度与深度相对有限。

  • 官方部署文档: https://support.huaweicloud.com/derm-aislt/derm_05.html
  • 该解决方案自动放通Ollama API网络端口 11434,xinference 服务端口9997

部署流程

访问华为云官网,依次点击**【解决方案】→【解决方案实践】→【查看解决方案实践】**进入专栏

在这里插入图片描述

搜索 “Embedding” 关键词,选择“快速部署 Embedding 及 Reranker 模型

在这里插入图片描述

点击 查看部署指南,进行查看安装流程

在这里插入图片描述

在 “快速部署 Embedding 及 Rerank 模型” 中,往下翻,通过支持区域下拉菜单选择部署区域(如贵阳一),点击 “一键部署”,系统将跳转至解决方案创建资源栈界面

  • 部署地址:https://www.huaweicloud.com/solution/implementations/deploying-embedding-and-reranker-models.html

在这里插入图片描述

在选择模板界面保持所有默认配置,直接单击 “下一步” 即可。

在这里插入图片描述

在配置参数界面,参考 “参数填写说明” 完成所有自定义参数填写(部分参数自动填充默认值),需修改时删除文本框内默认值后输入新值,全部参数填完后单击 “下一步”。

  • 在此步我们我们只填写密码信息其余配置均默认

在这里插入图片描述

首次部署时系统会提示是否开启加密,点击“确定”即可。

在这里插入图片描述

勾选回滚设置,其余参数保留默认配置不做修改

在这里插入图片描述

核查参数列表配置,确认无误后点击 “创建执行计划”。

在这里插入图片描述

可自行设定执行计划的名称与描述,完成配置后点击 “确定”。

在这里插入图片描述

待执行计划创建完成后,点击 “部署” 按钮。

在这里插入图片描述

在这里插入图片描述

出现是否执行计划任务的提示时,点击“确定”即可。

在这里插入图片描述

当 “事件” 中显示 “Apply required resource success” 时,表明堆栈部署成功。

在这里插入图片描述

单击 “资源” 查看已创建的资源(参考图示),点击 “蓝色资源名称” 进入弹性云服务器详情页,查看其绑定的弹性公网 IP

在这里插入图片描述

跳转到ECS基本信息页面,查看弹性公网IP并进行保存

在这里插入图片描述

dify配置向量检索模型

通过公网IP访问Dify平台,登录后点击右上角的账户图标,在弹出的菜单中选择“设置”选项。

在这里插入图片描述

点击 “模型供应商” 选项,在列表里找到 Ollama 模型,然后点击其对应的 “安装” 按钮。

在这里插入图片描述

Ollama 配置界面中,找到并点击 “添加模型” 按钮以开始配置新模型。

在这里插入图片描述

在 Ollama 模型配置界面进行以下操作:

  1. 模型类型选择 “Text Embedding”
  2. 模型名称输入 “bge-m3”
  3. 基础 URL : http://ECS公网IP:11434
  4. 端口号保持默认 11434(部署解决方案默认放行安全组)
  5. 点击右下角 “保存” 完成配置

在这里插入图片描述

点击 “模型供应商” 选项,在列表里找到 Xorbits Inference 模型,然后点击其对应的 “安装” 按钮。

在这里插入图片描述

Xorbits Inference 配置界面中,找到并点击 “添加模型” 按钮以开始配置新模型。

在这里插入图片描述

在 Xorbits Inference模型配置界面进行以下操作:

  1. 选择模型类型为 Rerank
  2. 模型名称填写 “bge-reranker-v2-m3”
  3. 模型 UID 同步填写 “bge-reranker-v2-m3”
  4. 基础 URL : http://ECS公网IP:9997
  5. 端口号设置为 9997(部署解决方案默认放行安全组)
  6. 点击右下角 “保存” 完成配置

在这里插入图片描述

如下图dify平台已经成功介入配置了Embedding(bge-m3)]及Reranker(bge-reranker-v2-m3)模型,接下来可以进行创建高质量数据库操作

两款模型已配置好,接下来配置高级知识库

在这里插入图片描述

创建高质量知识库

Dify 平台顶部导航栏点击 “知识库” 后选择 “创建知识库”。

在这里插入图片描述

选择 “导入已有文本” 数据源,点击 “上传文件” 后点击**下一步(**数据源可自定义提供方式)。

  • 根据自身应用需求来进行准备对应的知识库

在这里插入图片描述

进入知识库选择索引方式选择高质量,配置Embedding模型为bge-m3

在这里插入图片描述

启用混合检索模式(向量+关键词检索,可调节权重),选择bge-reranker-v2-m3模型进行结果重排,开启Score阈值(推荐0.5)并设置TOP K文档分片数量(控制最大调用量)

在这里插入图片描述

在检索权重设置中,将语义(向量检索)和关键词(关键词检索)的权重滑块均调至 0.5,以平衡语义理解和关键词匹配的效果。开启Score阈值(推荐0.5)并设置TOP K文档分片数量(控制最大调用量)。点击保存后,高质量知识库即创建完成

在这里插入图片描述

当界面显示嵌入完成时,点击 “前往文档”,即可查看处于可用状态的导入知识库文档。

在这里插入图片描述

可以看到导入的知识库文档当前为可用状态(也可以点击设置对知识库进行修改配置操作)

在这里插入图片描述

调整配置工作流

登录部署的Dify平台,在顶部导航栏点击 “工作室” 后选择 “之前导入的工作流”。

在这里插入图片描述

找到 “知识索引” 节点,点击 “知识库” 选项中的 “+” 号添加知识库

在这里插入图片描述

选中已创建的高质量知识库,点击 “添加” 按钮完成操作。

在这里插入图片描述

Dify平台对接DeepSeek

创建秘钥

点击“此处跳转” 链接进入华为云ModelArts Studio平台,然后点击“API KEY模型”选项,点击右上角 创建API key

在这里插入图片描述

输入 API key标签和描述(自定义),点击确定,即可创建成功

在这里插入图片描述

点击确定之后会弹出创建的秘钥,创建出的 API key 仅会在创建时显示一次,所以当页面显示 API key 时,需及时进行保存

在这里插入图片描述

在平台左侧导航栏点击“在线模型”,选中此前已开通的DeepSeek商用服务(以R1-32k为例),接着点击“调度说明”查看相关信息。

在这里插入图片描述

切换至 OpenAI SDK 接口类型,查看对应的接口信息,包括 API 地址和模型名称(进行保存)。

在这里插入图片描述

Dify对接MASS

点击右侧“用户名称”下拉菜单,选择并点击“设置”选项。

在这里插入图片描述

点击左侧模型供应商,通过右上角搜索按钮选择“OpenAI-API-compatible”插件,点击“添加模型”。

在这里插入图片描述

模型显示名称可以自定义,输入我们之前创建的秘钥和保存的接口信息

  • "模型名称":“在业务环境中调用模型服务的API进行推理”服务信息中的模型名称
  • “API Key”: 请填入之前创建的API Key
  • “API endpoint URL”: 在业务环境中调用模型服务的API进行推理”的API地址
  • “Completion mode:” 请选择对话

在这里插入图片描述

如图所示,已在 Dify 平台成功完成 DeepSeek 商用服务的对接。

在这里插入图片描述

切换工作流中的大模型

在 Dify 工作流页面点击 “大模型服务 + 内部知识 RAG” 节点,切换模型为 DeepSeek-R1-32k

在这里插入图片描述

支持自定义工作流中的大模型参数配置,灵活适配业务需求。

在这里插入图片描述

测试工作流

在 Dify 平台输入知识库相关内容,测试检索功能是否正常触发并返回结果。

  • 问题:帮我推荐几中好吃的水果
  • 可以看到回复的内容来源于知识库

在这里插入图片描述

在 Dify 平台上,通过输入不在知识库内的相关内容,来检验能否触发联网搜索以获取信息。

  • 问题:今天北京的天气怎么样
  • 可以看到是通过联网搜索之后进行输出内容

在这里插入图片描述

发布Agent

当工作流测试无误后,可点击界面右上角的 “发布” 按钮,然后按提示点击 “发布更新”,即可将工作流正式上线。
在这里插入图片描述

调用Agent

发布完成后,可通过以下三种方式使用该 Agent 应用:

  1. 直接对话交互:在平台对话窗口输入问题,系统自动调用工作流逻辑生成回答;
    在这里插入图片描述
    在这里插入图片描述

使用对比联网搜索和知识库检索
在这里插入图片描述
在这里插入图片描述

  1. API 接口调用:通过平台提供的 API 接口,将 Agent 集成至第三方系统或应用中使用;
    在这里插入图片描述
    在这里插入图片描述

  2. 嵌入网页 / 小程序:获取嵌入代码后,将 Agent 功能集成到自有网页或小程序界面,供用户直接访问。

在这里插入图片描述
在这里插入图片描述

资源清理

访问华为云资源编排服务(RFS)控制台,在资源栈列表中定位到通过该解决方案创建的资源栈,点击资源栈名称右侧的 “删除” 按钮执行删除操作。

在这里插入图片描述

在弹出的删除资源栈确认弹窗中,将删除方式选取为 “删除资源”,在确认输入框中键入 “Delete”,点击 “确定” 按钮,即可完成该解决方案的卸载操作。

在这里插入图片描述

注意: 本文使用编排工具部署两个业务,需要找到分别所对应的可用区下进行删除操作

总结

本次我深度体验了基于华为云与 Dify 平台的企业级 AI 应用开发路径,通过构建 “高质量知识库 + 联网搜索助手” 双模式智能系统,展现大模型时代企业数字化转型新可能。依托 Embedding 与 Rerank 模型实现企业知识库精准语义检索,结合 SearXNG 插件动态补充网络信息,形成 “内知外搜” 智能响应闭环华为云 Flexus 实例以擎天架构赋能卓越算力(性能提升 1.6 倍、成本降低 30%),搭配企业级安全防护,保障系统稳定运行;对接 MASS 平台 DeepSeek 商用服务模型,为专业领域分析注入深度推理能力。

该方案以低代码编排、高性能算力、全场景兼容的优势,助力企业快速落地智能问答、数据分析等应用(如 “智慧水果分析助手”),无需复杂开发即可实现从数据整合到智能生成的全流程自动化。无论是传统行业的知识管理升级,还是新兴领域的动态信息洞察,这套架构都能提供高效、低成本、安全可靠的解决方案。

欢迎各位开发者小伙伴前来体验交流,感受华为云与 Dify 携手打造的智能应用开发范式,在 “精准知识赋能 + 实时数据拓展” 的双重价值探索中,携手挖掘 AI 技术在垂直场景的多元可能,共同为业务决策的智能化、高效化升级注入新动能。


http://www.hkcw.cn/article/fTvhPbCSBA.shtml

相关文章

【算法设计与分析】实验——改写二分搜索算法,众数问题(算法分析:主要算法思路),有重复元素的排列问题,整数因子分解问题(算法实现:过程,分析,小结)

说明:博主是大学生,有一门课是算法设计与分析,这是博主记录课程实验报告的内容,题目是老师给的,其他内容和代码均为原创,可以参考学习,转载和搬运需评论吱声并注明出处哦。 要求:2.…

MCP协议学习

MCP协议出现的背景 MCP(Model Context Protocol,模型上下文协议)由Anthropic公司于2024年11月推出,旨在解决大语言模型(LLM)与外部数据源、工具和服务之间的标准化交互问题。例如某金融科技公司需开发一款…

【笔记】Windows 部署 Suna 开源项目完整流程记录

#工作记录 因篇幅有限,所有涉及处理步骤的详细处理办法请参考文末资料。 Microsoft Windows [Version 10.0.27868.1000] (c) Microsoft Corporation. All rights reserved.(suna-py3.12) F:\PythonProjects\suna>python setup.py --admin███████╗██╗…

SQL Views(视图)

目录 Views Declaring Views Example: View Definition Example: Accessing a View Advantages of Views Triggers on Views Interpreting a View Insertion(视图插入操作的解释) The Trigger Views A view is a relation defined in terms of…

MySQL指令个人笔记

MySQL学习,SQL语言笔记 一、MySQL 1.1 启动、停止 启动 net start mysql83停止 net stop mysql831.2 连接、断开 连接 mysql -h localhost -P 3306 -u root -p断开 exit或者ctrlc 二、DDL 2.1 库管理 2.1.1 直接创建库 使用默认字符集和排序方式&#xf…

【redis实战篇】第七天

摘要: 本文介绍了黑马点评中点赞、关注和推送功能的实现方案。点赞功能采用Redis的ZSET结构存储用户点赞数据,实现点赞状态查询、热门博客排行和点赞用户展示。关注功能通过关系表和Redis集合实现用户关注关系管理,包含共同关注查询。推送功能…

[yolov11改进系列]基于yolov11引入特征融合注意网络FFA-Net的python源码+训练源码

【FFA-Net介绍】 北大和北航联合提出的FFA-net: Feature Fusion Attention Network for Single Image Dehazing图像增强去雾网络,该网络的主要思想是利用特征融合注意力网络(Feature Fusion Attention Network)直接恢复无雾图像,…

Baklib领跑三强:知识管理高效优选

Baklib技术架构解析 Baklib的技术底座基于全链路数字化管理理念,通过知识中台的三层架构实现企业级知识资产的深度整合。核心层采用分布式存储引擎与多模态数据处理技术,支持文档、音视频、代码等20格式的智能化解析,确保非结构化数据的精准…

零基础学习计算机网络编程----socket实现UDP协议

本章将会详细的介绍如何使用 socket 实现 UDP 协议的传送数据。有了前面基础知识的铺垫。对于本章的理解将会变得简单。将会从基础的 Serve 的初始化,进阶到 Client 的初始化,以及 run。最后实现一个简陋的小型的网络聊天室。 目录 1.UdpSever.h 1.1 构造…

深入了解linux系统—— 进程间通信之管道

前言 本篇博客所涉及到的代码一同步到本人gitee:testfifo 迟来的grown/linux - 码云 - 开源中国 一、进程间通信 什么是进程间通信 在之前的学习中,我们了解到了进程具有独立性,就算是父子进程,在修改数据时也会进行写时拷贝&…

电脑使用VPN后直接关机,再次打开后无法上网的问题

出现这种问题,都是在使用VPN后,以前自己都是通过杀毒软件的网络修复工具进行解决的。 但现在有了一个更简单的方法: 打开设置,找到网络中的代理,然后关闭即可。

【Linux】线程控制

📝前言: 这篇文章我们来讲讲Linux——线程控制 🎬个人简介:努力学习ing 📋个人专栏:Linux 🎀CSDN主页 愚润求学 🌄其他专栏:C学习笔记,C语言入门基础&#xf…

CppCon 2014 学习:Hardening Your Code

“Hardening Your Code” 是指增强代码的健壮性、安全性、可维护性和可测试性,确保在各种边界条件、错误场景甚至恶意输入下,代码依然稳定运行,不崩溃、不泄露资源,也不产生未定义行为。 什么是“Hardening Your Code”&#xff…

【js逆向_AES】某专业技术人员继续教育平台登录分析及模拟实践

目标:account,password加密 网址:aHR0cHM6Ly93d3cuZ3N6eGp5cHguY24vd2ViL2luZGV4 请求载荷加密方式 账号加密: 网页调试输出: python代码: from Cryptodome.Cipher import AES import base64 from Crypto…

《信号与系统》--期末总结V1.0

《信号与系统》–期末总结V1.0 学习链接 入门:【拯救期末】期末必备!8小时速成信号与系统!【拯救期末】期末必备!8小时速成信号与系统!_哔哩哔哩_bilibili 精通:2022浙江大学信号与系统(含配…

可视化大屏通用模板Axure原型设计案例

本文将介绍一款基于Axure设计的可视化大屏通用模板,适用于城市、网络安全、园区、交通、社区、工业、医疗、能源等多个领域。 模板概述 这款Axure可视化大屏通用模板集成了多种数据展示模块和组件,旨在为用户提供一个灵活、可定制的数据展示平台。无论…

AI来敲门:我们该如何与焦虑共舞

最近一份覆盖国内上万职场人的调研报告像一颗深水炸弹,在职场圈激起层层涟漪——85.53%的人担心AI会抢走自己的饭碗,67.57%的人认为这会在五年内发生。更令人意外的是,这些焦虑的职场人中,高达34.13%出现了抑郁症状,这…

单调栈(打卡)

本篇基于b站灵茶山艾府。 下面是灵神上课讲解的题目与课后作业,课后作业还有三道实在写不下去了,下次再写。 739. 每日温度 给定一个整数数组 temperatures ,表示每天的温度,返回一个数组 answer ,其中 answer[i] 是…

【C语言入门级教学】冒泡排序和指针数组

文章目录 1.冒泡排序2.⼆级指针3.指针数组4.指针数组模拟⼆维数组 1.冒泡排序 冒泡排序的核⼼思想:两两相邻的元素进⾏⽐较。 //⽅法1 void bubble_sort(int arr[], int sz)//参数接收数组元素个数 { int i 0;for(i0; i-1; i) { int j 0; for(j0; j-1; j) { …

源码解析(三):Stable Diffusion

原文 技术博客 😀 Stable Diffusion是一种基于扩散模型(Diffusion Model)的生成式AI技术,通过逐步去噪过程将随机噪声转化为高质量图像。其核心优势在于开源免费、支持本地部署,且能通过文本提示(prompt&am…