华为云Flexus+DeepSeek征文 | 初探华为云ModelArts Studio:部署DeepSeek-V3/R1商用服务的详细步骤

article/2025/8/29 4:01:53

华为云Flexus+DeepSeek征文 | 初探华为云ModelArts Studio:部署DeepSeek-V3/R1商用服务的详细步骤

  • 前言
  • 一、华为云ModelArts Studio平台介绍
    • 1.1 ModelArts Studio介绍
    • 1.2 ModelArts Studio主要特点
    • 1.3 ModelArts Studio使用场景
    • 1.4 ModelArts Studio产品架构
  • 二、访问ModelArts Studio大模型即服务平台
    • 2.1 登录华为云
    • 2.2 进入ModelArts Studio介绍页
    • 2.3 进入ModelArts Studio控制台
    • 2.4 配置ModelArts委托授权
    • 2.5 华为云账号充值
  • 三、开通DeepSeek-V3/R1商用服务
    • 3.1 预置服务介绍
    • 3.2 开通商用服务DeepSeek-V3-32K
    • 3.3 开通商用服务DeepSeek-R1-32K
  • 四、商用服务DeepSeek-V3/R1对比
  • 五、商用服务DeepSeek-V3/R1在线体验
    • 5.1 DeepSeek-V3-32K在线体验
    • 5.2 DeepSeek-R1-32K在线体验
    • 5.3 DeepSeek-V3/R1调用统计功能
  • 六、使用体验与总结

前言


华为云ModelArts Studio作为一站式大模型即服务平台,凭借其强大的模型管理能力和简洁易用的操作界面,为企业和开发者提供了高效、稳定的AI服务部署体验。平台全面支持主流大模型的快速接入与商用服务开通,显著降低了AI应用开发的技术门槛。通过集成自动调优、资源按需分配、API调用监控等智能功能,ModelArts Studio实现了从模型训练到生产落地的无缝衔接。本文将以部署DeepSeek-V3和DeepSeek-R1商用服务为例,带您深入了解这一平台的强大能力与实际应用价值。


一、华为云ModelArts Studio平台介绍

1.1 ModelArts Studio介绍

🌟 平台介绍

ModelArts Studio是华为云提供的一个大模型即服务平台(MaaS服务),旨在简化模型开发流程,支持定制化大模型的开发,并使这些模型能够无缝集成到业务系统中。通过降低企业AI应用的成本和难度,ModelArts Studio助力企业快速实现AI技术落地。

📌 核心价值图谱

维度价值体现
技术门槛零代码开发,免调优,降低90%技术投入
成本效率按需付费,资源利用率提升60%,成本下降50%
开发效率开发周期缩短至传统方案的1/3
业务创新聚焦业务逻辑,快速落地差异化AI应用

👉 立即体验:通过ModelArts Studio,让大模型成为企业数字化转型的核心驱动力,解锁智能未来!

在这里插入图片描述

1.2 ModelArts Studio主要特点

  1. 全栈模型生态,性能卓越
    主流模型全覆盖:集成Llama、Baichuan、Yi、Qwen、DeepSeek等99%业界SOTA开源模型,预适配昇腾算力底座,精度与推理性能显著提升。
    零代码自动化开发:沉淀100+行业调优经验,提供一键训练、自动超参优化、标准化流水线,无需手动调参,开发周期缩短50%+。
    昇腾深度优化:基于昇腾算子与显存优化技术,训练/推理效率大幅提升,预置最优超参配置,开箱即用。

  2. 资源灵活可控,成本优化
    💡 按需付费,弹性扩缩:分钟级获取算力资源,按实际使用收费,避免闲置浪费,降低AI入门门槛。
    💡 高可用性保障:多数据中心部署,支持故障快速恢复(快恢)断点续训,确保训练任务不中断,保护项目连续性。

  3. 智能应用快速构建
    🤖 Agent开发加速器:提供优质Prompt模板与智能Agent沉淀,支持复杂任务拆解(如多系统协同决策),快速生成业务专属智能体。
    🤝 组件化生态集成:即插即用MCP Server、LangChain、RAG、Guard等工具,一站式构建智能问答、知识管理、流程自动化等应用。

  4. 一站式全生命周期服务
    📦 全流程工具链:覆盖模型调优、压缩、部署、评测等环节,支持「即开即用」,无需跨平台切换。
    ⚙️ 标准化流水线:内置性能与精度评价体系,自动化完成模型优化,确保全场景高性能表现。

1.3 ModelArts Studio使用场景

  1. 行业大模型定制开发
    🔹 金融/医疗/制造:基于开源模型微调,快速构建风控分析、智能诊断、供应链优化等垂直领域大模型。
    🔹 优势:无需从头训练,依托昇腾优化提升行业数据适配性,降低定制成本。

  2. 复杂业务流程自动化
    🔹 企业级决策支持:拆解项目级任务(如跨部门协作、多系统调用),通过智能Agent实现自动化决策与执行。
    🔹 典型场景:智能客服(多轮对话+知识库检索)、工单自动化处理、数据分析报告生成。

  3. 低成本AI创新探索
    🔹 中小企业/初创团队:通过按需付费模式,零门槛试用大模型能力,快速验证业务场景(如营销文案生成、智能质检)。
    🔹 优势:分钟级启动开发,无需预置算力资源,试错成本降低80%。

  4. 高性能实时推理场景
    🔹 实时交互应用:智能问答、推荐系统、工业实时监控等,依托昇腾优化保障低延迟、高并发推理。
    🔹 技术支撑:多数据中心容灾架构,确保7×24小时稳定服务。

  5. 多模态应用集成
    🔹 智能内容生成:结合RAG(检索增强生成)与Guard(安全防护),构建企业级知识中台、数字人交互等多模态应用。
    🔹 组件化优势:快速集成LangChain等工具,实现「数据-模型-应用」闭环。

1.4 ModelArts Studio产品架构

华为云ModelArts Studio产品架构集成了模型服务、应用服务和资源管理等多个模块,支持从模型调优、压缩到部署的全生命周期管理,并提供丰富的插件和应用体验。其底层依托于ModelArts Standard平台,涵盖模型开发、数据工程、训练和推理等核心功能,确保高效灵活的AI开发流程。通过统一资源调度和AI专属资源池,ModelArts Studio实现了资源的按需使用和快速扩展,助力企业轻松应对复杂多变的业务需求。

在这里插入图片描述

二、访问ModelArts Studio大模型即服务平台

2.1 登录华为云

华为云官网:https://www.huaweicloud.com/,在电脑浏览器打开华为云官网后,点击“登录”选项,输入自己的华为云账号和密码,登录华为云官网。

在这里插入图片描述

2.2 进入ModelArts Studio介绍页

在华为云首页的产品——查看所有产品,搜索框内输入ModelArts Studio,即可看到ModelArts Studio大模型即服务平台,点击进去即可。

在这里插入图片描述

同时,可以直接输入ModelArts Studio的地址:https://www.huaweicloud.com/product/modelarts/studio.html,进入ModelArts Studio的介绍页。

在这里插入图片描述

2.3 进入ModelArts Studio控制台

在ModelArts Studio介绍页中,我们点击“ModelArts Studio控制台”。

在这里插入图片描述

刚开始进入时,会提示我们勾选“ModelArts Studio服务声明”,勾选后,选择“确定”选项即可。

在这里插入图片描述

2.4 配置ModelArts委托授权

在ModelArts Studio控制台首页中,在页面上方我们看到依赖服务的授权提醒,我们按照提示点击“此处”,配置相关授权即可。

在这里插入图片描述

快速添加授权:选择新增委托,权限配置则选择普通模式。将服务列表全选后,选择创建即可。

在这里插入图片描述

回到ModelArts Studio控制台首页后,可以看到授权提示已经消失。

在这里插入图片描述

2.5 华为云账号充值

为避免测试过程中出现部署失败等问题,请确保自己的华为云账号余额充足,建议保持账户余额大于10元。

  • 华为云充值地址:https://account.huaweicloud.com/usercenter/?region=cn-north-4&locale=zh-cn#/userindex/allview

在这里插入图片描述

三、开通DeepSeek-V3/R1商用服务

3.1 预置服务介绍

在ModelArts Studio控制台首页中。我们依次选择模型推理—在线推理——预置服务,可以看到商用服务和免费服务列表。预置服务为平台已部署好的服务,无等待时间,按token计费、适合快速测试

在这里插入图片描述

  • 服务类型与计费规则
类别描述说明
服务类型免费服务 / 商用服务
免费服务- 仅限用于模型体验
- 受严格的速率限制
- 平台可能不定期调整支持的模型、免费额度及有效期等信息
商用服务- 提供商用级别的推理 API 服务
- 开通后可获取付费 API 使用权限
  • 推理额度与使用方式
项目说明
免费额度单个模型提供 200万 token 推理额度
额度耗尽后处理方式- 可开通商用级别推理 API(仅限区域:贵阳一)
- 或前往“我的服务”部署为自定义服务后按需付费使用
优惠折扣相关信息有关模型服务的优惠折扣发放与使用情况,请前往 费用中心查看

备注:如果需了解更多详情,建议访问华为云官方文档或费用中心页面。

3.2 开通商用服务DeepSeek-V3-32K

我们选择开通商用服务DeepSeek-V3-32K,其专注于内容生成、代码辅助与多轮对话,在长文本处理与逻辑连贯性方面表现出色。

在这里插入图片描述

注意保证华为云账户余额充足,确认开通DeepSeek-V3-32K服务。

在这里插入图片描述

查看DeepSeek-V3-32K服务开通状态,可以看到已经成功开通。

在这里插入图片描述

3.3 开通商用服务DeepSeek-R1-32K

我们选择开通商用服务DeepSeek-R1-32K,它聚焦于检索增强生成(RAG),适用于企业知识库问答、文档分析等强调准确性和可溯源性的场景。

在这里插入图片描述

查看DeepSeek-R1-32K服务开通状态,可以看到已经成功开通。

在这里插入图片描述

四、商用服务DeepSeek-V3/R1对比

  • 📊 模型功能与适用场景对比
对比维度DeepSeek-V3-32KDeepSeek-R1-32K
核心能力内容创作、代码生成、多轮对话、逻辑推理检索增强生成(RAG)、知识库问答、文档分析
输入价格¥0.002 / 千 tokens¥0.004 / 千 tokens
输出价格¥0.008 / 千 tokens¥0.016 / 千 tokens
典型应用场景技术文档撰写、自动化内容生成、智能客服、编程辅助企业内部知识库查询、法律/金融文档解析、精准问答服务
响应速度快速响应,适合实时交互略慢(因涉及外部数据检索),但准确性高
优势特点结构清晰、逻辑连贯、长文本记忆能力强可溯源、精准回答、支持超长文本(如100K+)处理
局限性对实时性知识依赖训练数据,可能存在滞后响应时间较长,不适合极高时效性要求的场景

✅ 使用建议总结

  • 如果业务侧重于内容生成、代码编写或对话理解,推荐使用 DeepSeek-V3-32K,性价比高且响应迅速。
  • 如果应用更注重知识检索、答案可追溯性及超长文本处理,例如在企业知识库、法律合同分析等场景中,DeepSeek-R1-32K 更为合适。

💡 提示:结合具体业务需求测试两种模型的实际表现,将有助于选择最优方案。

五、商用服务DeepSeek-V3/R1在线体验

5.1 DeepSeek-V3-32K在线体验

在已开通的商用服务列表中,我们选择DeepSeek-V3-32K的在线体验选项。

在这里插入图片描述

在DeepSeek-V3-32K的对话框中,我们对其简单提问,让其介绍下自己,如下所示:

在这里插入图片描述

我们让DeepSeek-V3-32K编写一段以端午节祝福为主题的简单静态 HTML 网页代码。

  • 我们在对话框内,输入以下提示词:
请生成一段简单且美观的静态 HTML 代码,用于展示一个以 “端午节祝福” 为主题的网页。具体要求如下:
页面整体风格温馨、传统,体现浓厚的节日气氛;
使用柔和的中国传统色系(如红色、金色、浅绿、粽叶绿等);
包含标题(如“端午安康,粽情祝福!”)、正文祝福语、背景图片或图案(可使用CSS模拟背景图或渐变);
添加字体动画或淡入效果,使页面更具观赏性;
使用 Google 字体(如 "Noto Serif CJK""Ma Shan Zheng" 等书法/手写字体)提升美感;
不使用外部 JS 和图片资源,所有样式通过内联 CSS 实现;
页面适配移动端,结构简洁,加载快速。

在这里插入图片描述

将生成的代码保存到本地电脑并命名为 .html 文件后,用浏览器打开即可查看页面效果,整体呈现非常美观、节日氛围浓厚。

在这里插入图片描述

5.2 DeepSeek-R1-32K在线体验

在已开通的商用服务列表中,我们选择DeepSeek-R1-32K的在线体验选项。

在这里插入图片描述

在 DeepSeek-R1-32K的对话框中,我们对其简单提问,让其介绍下自己,如下所示:

在这里插入图片描述

在DeepSeek-R1-32K对话框内,要求也一首现代诗,要求赞美夏天,要求质量高。给出的提示词如下所示:

请以“夏天”为主题,创作一首现代诗。要求如下:语言优美,富有画面感和情感表达;
运用丰富的意象,如阳光、蝉鸣、荷花、雷雨、西瓜、微风等元素;
表达对夏天的喜爱与赞美,可融入自然之美、生命之力或时光之美的描写;
结构清晰,段落之间有节奏感和层次感;
风格清新自然或深沉热烈均可,避免陈词滥调,追求诗意创新。

生成的现代诗效果如下,整体质量还是令人非常满意得。

在这里插入图片描述

5.3 DeepSeek-V3/R1调用统计功能

ModelArts Studio 平台(MaaS服务)为 DeepSeek-V3 和 R1 模型提供了调用统计功能,可实时监控并记录模型服务的使用情况。 目前,调用统计数据仅针对通过 API 接口调用 产生的请求进行统计,页面体验等前端操作所触发的调用暂未纳入统计范围。

在这里插入图片描述

六、使用体验与总结

🌟 使用体验

在本次部署 DeepSeek-V3 与 DeepSeek-R1 商用服务的过程中,ModelArts Studio 展现出极高的易用性与稳定性。平台界面清晰直观,操作流程简洁流畅,即使是首次使用也能快速上手。从模型选择、服务开通到API调用,每一步都提供了详细的指引和实时反馈,极大提升了部署效率。整体体验下来,不仅感受到华为云在AI工程化落地方面的深厚技术积累,也对企业级AI服务平台的成熟度有了更深认知。

📈 总结展望

ModelArts Studio 凭借其强大的功能集成和灵活的资源调度能力,为企业大模型应用提供了坚实的技术底座。通过本次实践,我们验证了其在实际业务场景中的高效支持能力,特别是在模型性能、计费透明和调用监控方面的表现尤为突出。未来,随着更多大模型的接入和功能的持续优化,ModelArts Studio 将成为推动企业智能化转型的重要引擎。相信在华为云的持续赋能下,AI技术将更加快速、深入地融入各行各业的发展之中。



http://www.hkcw.cn/article/NVinYhTdNs.shtml

相关文章

【Redis】string 类型

string 一. string 类型介绍二. string 命令set、getmget、msetsetnx、setex、psetexincr、incrby、decr、decrby、incrbyfloatappend、getrange、setrange、strlen 三. string 命令小结四. string 内部编码方式五. string 的应用场景缓存功能计数功能共享会话手机验证码 六. 什…

字体查看器

为了快速找到0不带点、斜杠的等宽字体,我做了个软件! sonichy/HTYFontViewer

Java与Python优劣分析及两者联姻收奇功

Python 和 Java 作为两种广泛使用的编程语言,在大多数场景下都能实现相似的功能。但由于语言设计初衷、生态系统以及社区偏好的不同,Python 在某些特定领域确实具有 Java 难以比拟的天然优势。 一、以下是几个典型场景优劣分析 1. 快速原型开发与脚本化…

6.OpenFeign服务接口调用

目录 OpenFeign服务接口调用 一、openFeign简介 二、、OpenFeign 通用步骤 接口注解 流程步骤 1. 建Module 2. 添加POM依赖 3. 编写YML文件 4. 主启动(修改类名为MainOpenFeign80) 5.OpenFeign业务类编写 测试(远程调用) 三、OpenFeign高级特…

新能源汽车电控系统的精准守护者PKDV5355高压差分探头

在新能源汽车的"心脏"——电控系统中,每一次电流的精准切换都关乎车辆的性能与安全。PRBTEK PKDV5355高压差分探头就像一位经验丰富的"汽车医生",帮助工程师们精准捕捉IGBT模块的每一次"心跳",确保电驱系统健康…

资产生命周期管理:动态监控 + 精准管理

在数字化高度发展的当下,企业资产的范畴早已突破传统固定资产的局限,网络设备、服务器、软件系统等数字化资产在企业的日常运营与战略布局中扮演着越来越重要的角色。高效的资产管理体系对于优化资源配置、降低运营成本、确保业务不间断运行至关重要。 北…

MonoPCC:用于内窥镜图像单目深度估计的光度不变循环约束|文献速递-深度学习医疗AI最新文献

Title 题目 MonoPCC: Photometric-invariant cycle constraint for monocular depth estimation of endoscopic images MonoPCC:用于内窥镜图像单目深度估计的光度不变循环约束 01 文献速递介绍 单目内窥镜是胃肠诊断和手术的关键医学成像工具,但其…

华为OD机试真题——找终点(2025A卷:100分)Java/python/JavaScript/C/C++/GO最佳实现

2025 A卷 100分 题型 本专栏内全部题目均提供Java、python、JavaScript、C、C++、GO六种语言的最佳实现方式; 并且每种语言均涵盖详细的问题分析、解题思路、代码实现、代码详解、3个测试用例以及综合分析; 本文收录于专栏:《2025华为OD真题目录+全流程解析+备考攻略+经验分…

电路图识图基础知识-电路接线图(八)

识读电路接线图常识 1 电路接线图与电气原理图之间的关系 电气接线图是表示电气设备、元器件或装置等项目之间的连接关系,用来进行安装接线、 线路检查、线路检修和故障处理的一种简图。 在绘制电路接线图时必须依据相应的电气原理图,电路接线后必须达到…

基于python脚本进行Maxwell自动化仿真

本文为博主进行Maxwell自动化研究过程的学习记录,同时对Maxwell自动化脚本(pythonIron)实现方法进行分享。 文章目录 脚本使用方法脚本录制与查看常用脚本代码通用开头定义项目调整设计变量软件内对应位置脚本 设置求解器软件内对应位置脚本…

车载通信网络 --- CAN FD与CAN XL

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 做到欲望极简,了解自己的真实欲望,不受外在潮流的影响,不盲从,不跟风。把自己的精力全部用在自己。一是去掉多余,凡事找规律,基础是诚信;二是…

Shell 脚本基础笔记

一 shell脚本概述 Shell 脚本是一种用 Shell 命令编写的脚本程序,用于在 Unix/Linux 系统的命令行环境中自动化执行任务。 它由一系列命令、逻辑控制语句(如条件判断、循环)和函数组成,保存为文本文件(通常以 .sh 为扩…

sudo apt-get update错误解决

1.尝试sudo apt-get update发现很多无法命中且报错 首先使用 sudo vi /etc/resolv.conf 进入该文件后 代码如下: nameserver 8.8.4.4 nameserver 8.8.8.8然后按两次esc键,然后输入:wq 先输入 (:)再输…

管程机制 基本讲解

管程定义 构成要素:管程定义了一个数据结构,以及能为并发进程在该数据结构上执行的一组操作。 数据结构:例如在多进程共享资源场景中,可代表共享资源状态的变量集合,像共享文件读写状态、共享缓冲区占用情况等。一组操…

c#基础09(类与对象)

文章目录 类与对象面向对象概念封装访问修饰符 类如何定义类字段与属性 类的对象构造方法this关键字 类与对象 面向对象概念 并不是一个技术,而是一种编程指导思想。把现实世界的具体事物全部看出一个一个的对象来解决实际问题。 面向对象编程共同三大特性&#…

ai工具集:AI材料星ppt生成,让你的演示更出彩

在当今快节奏的工作环境中,制作一份专业、美观的 PPT 是展示工作成果、传递信息的重要方式。与此同时,制作PPT简直各行各业的“职场噩梦”,很多人常常熬夜到凌晨3点才能完成,累到怀疑人生。 现在?完全不一样了&#x…

高速连接器设计的真相

在高速连接器设计领域,有两种相反的想法。对于某些人来说,如果你简单地将塑料和金属碎片放在一起,最终你会得到信号传输。这个过程非常简单。另一方面,有一种观点认为,可靠的连接器设计需要对电磁理论有深入的理解&…

计算机视觉---YOLOv4

YOLOv4(You Only Look Once v4)于2020年由Alexey Bochkovskiy等人提出,是YOLO系列的重要里程碑。它在YOLOv3的基础上整合了当时最先进的计算机视觉技术,实现了检测速度与精度的显著提升。以下从主干网络、颈部网络、头部检测、训练…

IP地址交换如何让车联网效率翻倍?

在车辆移动过程中实现稳定可靠的网络连接,是智能交通系统发展的关键技术之一。车辆行动通讯网络(VANET)通过车载设备和路边基础设施的配合,使车辆在行驶中能够接入互联网。要实现这一目标,每辆车都需要获得唯一的IP地址…

DexWild:野外机器人策略的灵巧人机交互

25年5月来自 CMU 的论文“DexWild: Dexterous Human Interactions for In-the-Wild Robot Policies”。 大规模、多样化的机器人数据集已成为将灵巧操作策略泛化到新环境的一条有效途径,但获取此类数据集面临诸多挑战。虽然遥操作可以提供高保真度的数据集&#xf…