鲲鹏服务器+昇腾卡(Atlas 300I pro)搭建DeepSeek-R1-Distill-Qwen-7B(自己存档详细版)

article/2025/6/25 21:37:55

参考文章:https://modelers.cn/models?name=deepseek&page=1&size=16
https://www.hiascend.com/software/modelzoo/models/detail/11aa2a48479d4d229a9830b8e41fc011
当前服务器配置为:2 * 鲲鹏920 + 2 * Atlas 300I pro
系统:open Euler 22.03-LTS (AArch64)


1.前期环境准备

(1)安装驱动

驱动下载:昇腾社区固件和驱动下载列表
在这里插入图片描述
Atlas 300I pro和Atlas 300I duo都是一样的芯片,310P哈

groupadd HwHiAiUser
useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash
./驱动或固件 --full  ##第一次先安装驱动

安装完后重启,然后输入:

npu-smi info

在这里插入图片描述
就安装成功了

(2)安装docker和docker-compose

yum -y install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

注意:如果你想安装其他版本的docker和docker-compose,可以参考我另一篇文章:
openEuler 22.03 LTS (aarch64)系统上离线安装 Docker 27.5(或指定版本)和 Docker Compose

2.部署

镜像准备:1.0.0-300I-Duo-py311-openeuler24.03-lts
完成加载镜像后,请使用docker images命令确认查找具体镜像名称与标签。

docker load -i mindie:1.0.0-300I-Duo-py311-openeuler24.03-lts

注:因为昇腾Atlas 300I PRO和Atlas 300 Duo都是310B芯片,我就直接用这个镜像了,现在昇腾官网已经下载不了该镜像了,下载地址如下:
mindie:1.0.0-300I-Duo-py311-openeuler24.03-lts以及其他mindie镜像下载列表【昇腾社区】

(1)新建容器

docker run -it -d --net=host --shm-size=1g \--name deepseek-7b \--device=/dev/davinci_manager \--device=/dev/hisi_hdc \--device=/dev/devmm_svm \--device=/dev/davinci0 \--device=/dev/davinci1 \--device=/dev/davinci2 \--device=/dev/davinci3 \--device=/dev/davinci4 \--device=/dev/davinci5 \--device=/dev/davinci6 \--device=/dev/davinci7 \-v /usr/local/Ascend/driver:/usr/local/Ascend/driver:ro \-v /usr/local/sbin:/usr/local/sbin:ro \-v /root/:/root/ \mindie:1.0.0-300I-Duo-py311-openeuler24.03-lts bash

注:name 参数后是名称,device=/dev/davinci0,这是指你的第一张卡,剩下就是驱动和命令文件等等。

(2)进入容器

docker exec -it deepseek-7b bash

(3)下载模型DeepSeek-R1-Distill-Qwen-7B

请先通过如下命令安装ModelScope

pip install modelscope

下载完整模型repo

modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

或者你自己下载再放进系统里
在这里插入图片描述
魔塔社区下载蛮快的

(4)修改模型路径下的config.json文件

在这里插入图片描述
修改模型权重config.json中torch_dtype字段为float16
在这里插入图片描述

(5)服务化推理

打开配置文件

vim /usr/local/Ascend/mindie/latest/mindie-service/conf/config.json

修改配置文件
在这里插入图片描述
修改的参数为:
npuDeviceIds:我是两张卡所以[0,1]
truncation:false
modelName:你的模型名称,随便取
modelWeightPath:模型的路径
worldSize:2
httpsEnabled" : false

启动服务

cd /usr/local/Ascend/mindie/latest/mindie-service/bin
./mindieservice_daemon

在这里插入图片描述

(6)新建窗口测试

curl 127.0.0.1:1040/generate -d '{
"prompt": "What is deep learning?",
"max_tokens": 32,
"stream": false,
"do_sample":true,
"repetition_penalty": 1.00,
"temperature": 0.01,
"top_p": 0.001,
"top_k": 1,
"model": "qwen"
}'

注:默认是1025端口,可以在/usr/local/Ascend/mindie/latest/mindie-service/conf/config.json这个文件找到,IP配置也是。
答非所问,调整回答相关参数我不熟
在这里插入图片描述

DeepSeek-R1-Distill-Qwen-7B,QWen是比较擅长中文,所以
在这里插入图片描述
在这里插入图片描述

curl 127.0.0.1:1025/generate -d '{"prompt": "深度学习是什么?","maxtokens": 150,"stream": false,"dosample": true,"repetitionpenalty": 1.5,"temperature": 0.7,"topp": 0.95,"topk": 100,"model": "qwen"
}'

2025年2月13日11:18:48,目前我这个参数问就稍微正常点- -

注意
1.回复会乱回复,字数限制
解决方法:maxIterTimes:5210
在这里插入图片描述


http://www.hkcw.cn/article/hwDHVqfCqp.shtml

相关文章

Tongweb7049M4有关SSL/TLS 服务器瞬时 Diffie-Hellman 公共密钥过弱的处理方案(by lqw)

前提条件:Tongweb7049M4已在http通道里配置了https(如何配置https可以参考这个帖子:东方通TongWEB添加Https证书,开启SSL) 遇到客户在配置了https后,扫描漏洞提示: 有关SSL/TLS 服务器瞬时 Dif…

[原因和较为完美的解决方法]远程主机可能不符合 glibc 和 libstdc++ Vs code 服务器的先决条件

省流:把vscode降低到1.98版本并关闭自动更新 今天打开vscode,突然发现连接不了本地的虚拟主机ubuntu了,并且报了本文标题所示的错误。 vscode的具体报错如下: 原因是:(从别人的文章摘过来的) 通…

金蝶K3服务器安装与配置方法详细图解手册

金蝶K3服务器安装与配置方法详细图解手册 【下载地址】金蝶K3服务器安装与配置方法详细图解手册 本开源项目提供了一份详尽的《金蝶K3服务器安装与配置方法》图文教程,帮助用户轻松掌握金蝶K3系统的安装与配置。教程涵盖了服务器硬件配置、K3中间件、客户端以及数据…

物理服务器紧急救援:CentOS系统密码重置全流程实战指南

前言 在企业IT运维实践中,物理服务器密码丢失是典型的"低概率高风险"事件。某金融科技公司曾因核心服务器密码遗失导致业务中断36小时,直接损失超过800万元。这起真实案例揭示了系统密码管理的关键性——当承载重要业务的物理服务器遭遇密码丢…

arm内核架构服务器本地离线安装nginx服务

一、下载nginx安装包 nginx下载地址:https://nginx.org/en/download.html 二、解压并编译nginx应用 (1)解压安装包 首先将第一步下载的安装包上传到服务器上,然后执行以下指令: sudo tar -zxvf nginx-1.26.3.tar.gz…

华为RH2288服务器LSISAS2308SAS阵列卡Windows驱动安装指南:快速上手与稳定运行

华为RH2288服务器LSISAS2308SAS阵列卡Windows驱动安装指南:快速上手与稳定运行 【下载地址】华为RH2288服务器LSISAS2308SAS阵列卡Windows驱动安装指南 本开源项目为华为RH2288服务器用户提供了LSISAS2308 SAS阵列卡在Windows系统下的驱动程序及详细安装指南。通过清…

银河麒麟服务器操作系统V10 系统升级操作

原系统版本: Kylin-Server-10-SP1-Release-Build04-20200711-x86_64.iso 更新系统版本: Kylin-Server-V10-SP3-General-Release-2212-X86_64.iso 备注:在系统升级前,如系统有数据的,请务必做好数据备份! 1…

【AI非常道】二零二五年四月,AI非常道

经常在社区看到一些非常有启发或者有收获的话语,但是,往往看过就成为过眼云烟,有时再想去找又找不到。索性,今年开始,看到好的言语,就记录下来,一月一发布,亦供大家参考。 前面的记…

胖东来红内裤案当事人道歉 承认未核实质量问题

5月30日,段某通过其短视频账号“两个小段(小)”发布视频向胖东来道歉,这标志着胖东来“红内裤”事件告一段落。次日,许昌生活广场的胖东来门店内,富妮来的内衣产品仍在销售,但没有该品牌的红内裤。5月28日,河南许昌市魏都区人民法院公开审理了胖东来与段某之间的名誉权…

美15岁女孩练车误踩油门致父亲身亡 悲剧震惊社区

近日,美国洛杉矶一名15岁少女在练车时发生意外,导致指导她学车的父亲当场身亡,她自己也受了伤。据警方透露,5月26日下午接到报案称当地发生了一起车祸。初步调查显示,当时这名少女正在超市上层停车场练车,她的64岁父亲坐在副驾驶座上指导。不幸的是,少女误踩油门,车辆失…

网络犯罪分子利用虚假ChatGPT安装程序实施攻击

网络安全研究人员发现,攻击者正利用OpenAI ChatGPT和InVideo AI等流行人工智能(AI)工具的虚假安装程序作为诱饵,传播包括CyberLock和Lucky_Gh0$t勒索软件家族以及名为Numero的新型恶意软件在内的多种威胁。 恶意软件技术分析 思科Talos研究员Chetan Ra…

vmware虚拟机在物理机重启的情况下经常上不去网的情况处理

vmware虚拟机在物理机重启的情况下经常上不去网的情况处理 现状:物理机 winserver 2019 vmware 15.5 虚拟机是linux 7.2 和 winserver 2019 现象:物理机能正常上网,两个虚拟机不能上网,ping不通任何ip (每次重…

学习LINUX第3天

今日任务: 基本文件属性、文件与目录管理、用户和用户组管理 [rootlocalhost ~]# 分别代表: 1、用户名:root 2、主机名:localhost 3、当前路径:~当前用户的home目录 4、权限源标志位: #代表root&#x…

JavaScript实现备忘录的增删改操作

最终实现目标效果: ​添加任务​:用户输入内容后点击“add”,创建包含任务和操作按钮的新行。每个任务分配唯一index标识(通过flag自增实现)。标记完成/未完成​:点击“mark”切换任务文本的中划线样式和颜…

从认识AI开始-----卷积神经网络(CNN)

前言 在上一篇文章里,我们手写了多层感知机,细心地小伙伴们可能会发现一个问题,对于MLP,有两个突出的问题,尤其是处理图像任务时: 参数太多:例如一个28*28的图像扁平化为784维后,连…

从“固定“到“流动“:移动充电如何重塑用户体验?

在传统充电模式中,"固定"不仅是技术的特征,更成为用户行为的枷锁——人们需要规划行程、寻找插座、等待电量填满,这种被动适配正在被移动充电技术颠覆。当充电设备从墙面解放,化身可携带的能源胶囊,甚至嵌入…

π0基于自己的数据集微调,convert_libero_data_to_lerobot.py 各种报错的解决方法

π0 github地址 在做:π0基于自己的数据集微调 Fine-Tuning Base Models on Your Own Data 的时候遇到各种报错,记录一下。 推荐教程:π0的微调——如何基于各种开源数据集、以及私有数据集微调通用VLA π0(含我司七月的微调实践及在机械臂上…

在哈佛演讲25岁中国女生发声 签证不确定性影响未来规划

5月30日,哈佛大学毕业典礼上,中国学生蒋雨融身穿中国传统服饰发表了一段动情演讲。25岁的蒋雨融来自中国青岛,获得了哈佛大学国际发展方向的公共行政硕士学位。她提到,特朗普政府威胁遣返学生签证持有者,这给她的未来规划带来了极大的不确定性。蒋雨融表示自己也开始考虑去…

半导体B2B分销中台如何与ERP集成

在半导体B2B分销领域,高效的销售链管理和精准的数据流转是企业竞争力的核心。随着市场需求的快速变化和业务规模的持续扩张,传统的人工下单销售模式已难以满足实时协同、动态定价、库存优化等关键需求。如何将半导体B2B分销中台与企业核心ERP系统深度集成…

普通遥控器竟牵出10亿元大案 27名嫌疑人落网

涉及河南、四川、浙江等16省市,涉案交易金额达10.3亿元。随着最后一名境外逃犯投案,内蒙古自治区鄂尔多斯市杭锦旗这起利用流量计调节流量、篡改数据非法牟利的合同诈骗案成功告破,27名犯罪嫌疑人全部落网。2024年3月,一封匿名举报信打破了平静:某石油工程有限公司通过更改…