0Day适配!Qwen3一发布昇腾即全系列支持并上线魔乐社区

article/2025/8/17 13:12:47

Qwen3于2025年4月29日发布并开源,作为 Qwen 系列中的最新一代大型语言模型,提供了一系列密集型和混合专家(MoE)模型。

本次Qwen发布多个尺寸模型,覆盖235B/32B/30B/14B/8B/4B/1.7B/0.6B。此前昇腾MindSpeed和MindIE一直同步支持Qwen系列模型,此次Qwen3系列一经发布开源,即在MindSpeed和MindIE中开箱即用,实现Qwen3的0Day适配。
 

目前,Qwen3各版本模型已全部上线魔乐社区,可以在魔乐Qwen3专区一站式获取,欢迎广大开发者下载体验!

🔗模型链接:

https://modelers.cn/topics/qwen3

Image

Qwen3模型介绍

Qwen3是 Qwen 系列大型语言模型的最新成员。其中的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

Qwen3 模型支持两种思考模式:

思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法适合需要深入思考的复杂问题。

非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。

多语言:

Qwen3 模型支持 119 种语言和方言。这一广泛的多语言能力为国际应用开辟了新的可能性。

预训练:

在预训练方面,Qwen3 的数据集相比 Qwen2.5 有了显著扩展。Qwen2.5是在 18 万亿个 token 上进行预训练的,而 Qwen3 使用的数据量几乎是其两倍,达到了约 36 万亿个 token,涵盖了 119 种语言和方言。

后训练:

Qwen3实施了一个四阶段的训练流程。该流程包括:(1)长思维链冷启动,(2)长思维链强化学习,(3)思维模式融合,以及(4)通用强化学习。

 基于昇腾快速上手Qwen3模型训练和推理 

昇腾MindSpeed训练、MindIE推理支持Qwen2.5、兼容主流生态的分布式并行接口等,Qwen3系列模型一发布即实现低代码无缝迁移,欢迎广大开发者下载体验,以下为手把手教程:

MindSpeed训练上手指导

环境配置

1. 硬件要求

qwen3的参考硬件配置如下,本文将以Atlas 800 A2系列单机8卡训练和推理为例进行介绍:

2. MindSpeed-LLM仓库部署

MindSpeed-LLM的主要依赖配套如下表,安装步骤参考安装指导:https://gitee.com/ascend/MindSpeed-LLM/blob/master/docs/features/install_guide.md

(1)仓库拉取

git clone https://gitee.com/ascend/MindSpeed-LLM.gitgit clone https://github.com/NVIDIA/Megatron-LM.gitcd Megatron-LMgit checkout core_r0.8.0cp -r megatron ../MindSpeed-LLM/cd ..cd MindSpeed-LLMmkdir logsmkdir datasetmkdir ckpt

(2)环境搭建

torch npu 与 CANN包参考链接:https://support.huawei.com/enterprise/zh/ascend-computing/cann-pid-251168373/software

# python3.10conda create -n test python=3.10conda activate test# 安装 torch 和 torch_npu,注意要选择对应python版本、x86或arm的torch、torch_npu及apex包pip install torch-2.1.0-cp310-cp310m-manylinux2014_aarch64.whlpip install torch_npu-2.1.0*-cp310-cp310m-linux_aarch64.whl# apex for Ascend 参考 https://gitee.com/ascend/apex# 建议从原仓编译安装# 安装加速库git clone https://gitee.com/ascend/MindSpeed.gitcd MindSpeed# checkout commit from MindSpeed core_r0.8.0git checkout 2c085cc9pip install -r requirements.txtpip3 install -e .cd ../MindSpeed-LLM# 安装其余依赖库pip install -r requirements.txt

权重转换

1. 权重下载

从huggingface或者魔乐社区下载权重和配置文件

2. 权重转换

MindSpeed-LLM提供脚本将huggingface开源权重转换为mcore权重,用于训练、推理、评估等任务。

使用方法如下,请根据实际需要的TP/PP等切分策略和权重路径修改权重转换脚本​​​​​​​

cd MindSpeed-LLMbash tests/0day/qwen3/ckpt_convert_qwen3_hf2mcore.sh

数据预处理

MindSpeed-LLM提供脚本进行数据集处理,使用方法如下,请根据实际需要修改以下参数​​​​​​​

cd MindSpeed-LLMbash tests/0day/qwen3/data_convert_qwen3_pretrain.sh

训练

MindSpeed-LLM提供脚本进行数据集处理,使用方法如下,请根据实际需要修改以下参数​​​​​​​

cd MindSpeed-LLMbash tests/0day/qwen3/pretrain_qwen3_8k_ptd.sh

推理

cd MindSpeed-LLMbash tests/0day/qwen3/generate_qwen3_ptd.sh

评估​​​​​​​

cd MindSpeed-LLMbash tests/0day/qwen3/evaluate_qwen3_ptd.sh

更多详细信息请见各模型适配指导链接

https://gitee.com/ascend/MindSpeed-LLM/blob/master/tests/0day/qwen3/README.md
https://modelers.cn/MindSpeed

MindIE推理上手指导

硬件要求

部署Qwen3-30B-A3B-250425模型进行推理使用1台Atlas 800I A2(8*64G)服务器

权重

权重下载:BF16原始权重下载,见文末链接

推理前置准备

修改模型文件夹属组为1001 -HwHiAiUser属组(容器为Root权限可忽视)

执行权限为750:​​​​​​​

chown -R 1001:1001 {/path-to-weights/Qwen3-30B-A3B-250425}chmod -R 750 {/path-to-weights/Qwen3-30B-A3B-250425}

加载镜像

前往昇腾社区/开发资源下载适配,下载镜像前需要申请权限,耐心等待权限申请通过后,根据指南下载对应镜像文件。

完成之后,请使用docker images命令确认查找具体镜像名称与标签。

docker images

容器启动

启动容器:执行以下命令启动容器(参考)​​​​​​​

docker run -itd --privileged  --name= {容器名称}  --net=host \   --shm-size 500g \   --device=/dev/davinci0 \   --device=/dev/davinci1 \   --device=/dev/davinci2 \   --device=/dev/davinci3 \   --device=/dev/davinci4 \   --device=/dev/davinci5 \   --device=/dev/davinci6 \   --device=/dev/davinci7 \   --device=/dev/davinci_manager \   --device=/dev/hisi_hdc \   --device /dev/devmm_svm \   -v /usr/local/Ascend/driver:/usr/local/Ascend/driver \   -v /usr/local/Ascend/firmware:/usr/local/Ascend/firmware \   -v /usr/local/sbin/npu-smi:/usr/local/sbin/npu-smi \   -v /usr/local/sbin:/usr/local/sbin \   -v /etc/hccn.conf:/etc/hccn.conf \   -v  {/权重路径:/权重路径}  \    {swr.cn-south-1.myhuaweicloud.com/ascendhub/mindie:1.0.0-XXX-800I-A2-arm64-py3.11(根据加载的镜像名称修改)}  \   bash

进入容器:执行以下命令进入容器(参考)

docker exec -it {容器名称} bash

设置基础环境变量​​​​​​​

source /usr/local/Ascend/ascend-toolkit/set_env.shsource /usr/local/Ascend/nnal/atb/set_env.shsource /usr/local/Ascend/atb-models/set_env.shsource /usr/local/Ascend/mindie/set_env.sh

纯模型推理

【使用场景】使用相同输入长度和相同输出长度,构造多Batch去测试纯模型性能

1.精度测试

进入modeltest路径

cd /usr/local/Ascend/atb-models/tests/modeltest/

运行测试脚本

Step1.清理残余进程:

pkill -9 -f 'mindie|python'

Step2.执行以下命令:​​​​​​​

bash run.sh pa_[data_type] [dataset] ([shots]) [batch_size] [model_name] ([is_chat_model]) [weight_dir] [world_size] ([parallel_params]) 

测试脚本运行如下,以双机为例:

样例 -CEval 带shot

bash run.sh pa_bf16 full_CEval 5 1 qwen {/path/to/weights/Qwen3-30B-A3B-250425} 16

样例 -GSM8K 不带shot

bash run.sh pa_bf16 full_GSM8K 8 qwen {/path/to/weights/Qwen3-30B-A3B-250425} 16

2.性能测试

进入modeltest路径:

cd /usr/local/Ascend/atb-models/tests/modeltest/

Step1.清理残余进程:

pkill -9 -f 'mindie|python'

Step2.执行以下命令:

测试脚本运行如下,以双机为例:

bash run.sh pa_bf16 performance [[256,256]] 1 qwen {/path/to/weights/Qwen3-30B-A3B-250425} 16

测试脚本运行如下,以双机为例:

bash run.sh pa_bf16 performance [[256,256]] 1 qwen {/path/to/weights/Qwen3-30B-A3B-250425} 16

服务化推理

【使用场景】对标真实客户上线场景,使用不同并发、不同发送频率、不同输入长度和输出长度分布,去测试服务化性能

1. 配置服务化环境变量

变量含义:expandable_segments-使能内存池扩展段功能,即虚拟内存特性。更多详情请查看昇腾环境变量参考。

export PYTORCH_NPU_ALLOC_CONF=expandable_segments:True

2. 修改服务化参数​​​​​​​

cd /usr/local/Ascend/mindie/latest/mindie-service/vim conf/config.json

修改以下参数​​​​​​​

..."httpsEnabled" : false, # 如果网络环境不安全,不开启HTTPS通信,即“httpsEnabled”=“false”时,会存在较高的网络安全风险..."npudeviceIds" : [[0,1,2,3,4,5,6,7]],..."modelName" : "Qwen-MoE" # 不影响服务化拉起"modelWeightPath" : "权重路径","worldSize":8,

Example:仅供参考,请根据实际情况修改,详见文末链接

3. 拉起服务化​​​​​​​

解决权重加载过慢问题export OMP_NUM_THREADS=1# 拉起服务化cd /usr/local/Ascend/mindie/latest/mindie-service/./bin/mindieservice_daemon

执行命令后,首先会打印本次启动所用的所有参数,然后直到出现以下输出:

Daemon start success!

则认为服务成功启动。

4. 另起客户端

进入相同容器,向服务端发送请求。

更多信息可参考官网信息:https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0285.html

更多详细信息请见各模型适配指导链接

https://modelers.cn/MindIE

结语

更多Qwen3相关信息请见Qwen3专区:
https://modelers.cn/topics/qwen3


http://www.hkcw.cn/article/vwZOmvxsEZ.shtml

相关文章

【C++】String的语法及常用接口底层模拟实现

【C】String的语法及常用接口底层模拟实现 一、string类(了解)二、string类的常用接口2.1 string类对象的常见构造2.2 string类对象的容量操作2.3 string类对象的访问及遍历操作2.4 string类对象的修改操作2.5 string类非成员函数 三、string类常用接口的模拟实现3.1 初建构造3…

【C++庖丁解牛】C++11---统一的列表初始化 | auto | decltype | nullptr | STL中一些变化

🍁你好,我是 RO-BERRY 📗 致力于C、C、数据结构、TCP/IP、数据库等等一系列知识 🎄感谢你的陪伴与支持 ,故事既有了开头,就要画上一个完美的句号,让我们一起加油 目录 1. C11简介2. 统一的列表…

STL:位图和布隆过滤器

一,位图 1.1 位图的概念 究竟什么是位图呢??我们用一道问题来引入 问题:给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在 这40亿个数中。【腾讯】 根据这个问题&#x…

【C++高阶】:智能指针的全面解析

✨ 落絮无声春堕泪,行云有影月含羞 🌏 📃个人主页:island1314 🔥个人专栏:C学习 🚀 欢迎关注:👍点赞 👂&a…

【C++对于C语言的扩充】函数重载、引用以及内联函数

文章目录 🚀前言🚀函数重载注意:✈️为什么C可以实现函数重载,而C语言却不行呢? 🚀引用✈️引用的特性✈️C中为什么要引入引用✈️引用与指针的区别 🚀内联函数✈️内联函数特性 🚀…

【C++指南】STL容器的安全革命:如何封装Vector杜绝越界访问与迭代器失效?

🌟 各位看官好,我是egoist2023! 🌍 种一棵树最好是十年前,其次是现在! 🚀 使用STL的三个境界:能用,明理,能扩展 👍 如果觉得这篇文章有帮助&#…

C++ 异常处理机制与自定义异常体系

目录 1.C语言传统的处理错误的方式 😊 1. 终止程序 2. 返回错误码 3.实际使用中的情况 2. C异常概念🌼 2.1 C异常的基本概念 2.2异常的抛出和匹配原则 2.3 异常的重新抛出 2.4 异常安全 2.5 异常规范 3. 自定义异常体系 💕&#x…

C++入门看这一篇就够了——超详细讲解(120000多字详细讲解,涵盖C++大量知识)

目录 一、面向对象的思想 二、类的使用 1.类的构成 2.类的设计 三、对象的基本使用 四、类的构造函数 1.构造函数的作用 2.构造函数的特点 3.默认构造函数 3.1.合成的默认构造函数 3.2.手动定义的默认构造函数 四、自定义的重载构造函数 五、拷贝构造函数 1.手动…

【第53节】Windows编程必学之使用C++写exe压缩加密壳

目录 一、实现背景 1.1 前言 1.2 前置知识 1.3 达到目标 二、壳的实现要点 2.1 写壳怎么做 2.2 写壳的困难点 2.3 如何写壳代码 2.4 API函数的调用问题 2.5 重定位问题 2.6 信息交互问题 2.7 调试问题 2.8 关于目标程序的随机基址 2.9 关于目标程序的导入表 2.1…

C++离线查询

前言 C算法与数据结构 打开打包代码的方法兼述单元测试 概念及原理 离线算法( offline algorithms),离线计算就是在计算开始前已知所有输入数据,输入数据不会产生变化,且在解决一个问题后就要立即得出结果的前提下进行的计算。 通俗的说&a…

金价又涨了!金饰克价涨至1018元,一夜涨14元

美东时间5月23日,国际贵金属期货普遍收涨,COMEX黄金期货涨1.90%,报3357.70美元/盎司,本周累计上涨4.75%。5月24日,国内金饰价格跟涨。周生生足金饰品标价1018元/克,较前一日1004元/克的价格上涨14元/克。责任编辑:zx0002

日本人准备开始吃饲料了?

日本农业水产大臣小泉进次郎十分骄傲地宣布政府将要拿出2021年所产陈米以每5公斤1800日元的价格进行售卖(合人民币差不多1斤大米9块钱)。当地专家吹捧此举将有效缓解日本米荒,并放话越是陈米吃着越香,这下日本人有口福了结果评论区直接翻车了,有网友直接贴出往年饲料米价格…

国际乒联发声明回应选举争议 谴责扰乱行为并重启会议

当地时间29日,国际乒联发布了关于2025年度代表大会期间选举事宜的声明。5月27日,在卡塔尔多哈举行的国际乒联年度股东大会上,因主席选举争议引发混乱,会议最终宣布临时暂停。声明中提到,主席选举结束后,一些既不是会员协会代表也不是执行委员会、理事会、委员会成员或受邀…

胖东来红内裤案宣判:“段某”赔偿40万元 名誉权获法院支持

2025年5月28日,许昌市魏都区人民法院公开审理了许昌市胖东来商贸集团有限公司与段某之间的名誉权纠纷案。法院判决段某在其个人抖音账号“两个小段(小)”发布书面道歉信的视频,并赔偿胖东来公司40万元经济损失。部分人大代表、政协委员、媒体记者、律师代表和企业代表旁听了…

市监总局就毕井泉被查表态 再度引发市场关注

六年多前,毕井泉因长春长生疫苗案从原国家食品药品监督管理总局局长位置引咎辞职的消息震惊了市场;六年多后,他被查的消息再次引发市场的强烈关注。据中央纪委国家监委网站5月29日消息,十四届全国政协常委、经济委员会副主任毕井泉涉嫌严重违纪违法,目前正接受中央纪委国家…

高芙评职业生涯最经典三胜 荣耀时刻回顾

近日,美国网球运动员高芙在法网接受记者采访时,回顾了自己职业生涯中的三场经典胜利。这三场比赛分别是2024年终总决赛争冠战对阵郑钦文、2019年温网第一轮对阵大威廉姆斯以及2023年美网决赛对阵萨巴伦卡。她还特别提到了此前罗马半决赛与郑钦文的那场长达三个半小时的大战,…

女子露营归来脖子惨遭“毁容” 提醒:夏季蚊虫活跃,如遇皮肤瘙痒红肿不能拖

近日,浙江30岁女子小妍露营归来后,颈部便出现刺痛和瘙痒,起初她并未在意。两天后,症状急剧加重——皮肤红肿成片,冒出红色丘疹和水疱,还伴随灼热疼痛。无独有偶,小学生骏骏在户外骑车后,小腿处的皮肤上也出现了个大包。两人来浙江省皮肤病医院就医后,均被确诊为“虫咬…

男子乘火车旅行刷新吉尼斯纪录:24小时内乘火车旅行5887.76公里

近日,吉尼斯世界纪录官网公布了一项纪录——中国男子王冬成功以24小时内5887.76公里的火车旅行距离,刷新了“24小时内乘坐火车旅行最远距离”的吉尼斯世界纪录。▲王冬刷新吉尼斯世界纪录今年39岁的王冬是四川德阳人,12年前在上海求学时的他,就曾因换乘8趟列车回家而走红网…

从外卖APP到网络协议:深入解析UDP及应用层协议

目录 1. 应用层和传输层1.1 开发中常见的自定义协议格式 2. UDP2.1 源端口号及目的端口号2.2 UDP报文长度2.3 UDP校验和(checksum) 3. 基于UDP的应用层协议 关注我,学习更多企业开发和面试内容~ 1. 应用层和传输层 应用层和程序员接触最密切,应用程序&a…

【JavaWeb】基本概念、web服务器、Tomcat、HTTP协议

目录 1. 基本概念1.1 基本概念1.2 web应用程序1.3 静态web1.4 动态web 2. web服务器3. tomcat详解3.1 安装3.2 启动3.3 配置3.3.1 配置启动的端口号3.3.2 配置主机的名称3.3.3 其他常用配置项日志配置数据源配置安全配置 3.4 发布一个网站 4. Http协议4.1 什么是http4.2 http的…