DeepSeek本地化部署实践:Xinference框架+OpenWebUI实现DeepSeek-r1推理跑在国产GPU之上

article/2025/8/14 22:50:56

近日,我部门从供应商那儿借来一台高算力服务器,用来尝试本地化部署DeepSeek。该服务器型号为ASUS ESC8000A-E11,具体配置如下:

CPU:AMD EPYC 7702(64核)* 2

GPU:(天数智芯)智凯100 * 8

RAM:512G

HDD:n/a

SSD:1T

以下是具体安装步骤:

1. 操作系统安装

操作系统选择的是openEuler 22.03 (LTS-SP3),其内核版本为5.10.0;未选择最新版本的openEuler的原因是因为在安装GPU厂商提供的驱动时对linux内核版本有限制,具体哪些内核版本符合要求需参考GPU厂商的技术文档。

# uname -r
5.10.0-182.0.0.95.oe2203sp3.x86_64

配置主机IP为:172.19.250.1/24

2. 安装GPU驱动

从GPU厂商那儿获得以下2个文件:

partial_install_cuda_header.zip

corex-installer-linux64-4.2.0_x86_64_10.2.run

2.1 安装CUDA头文件

# unzip partial_install_cuda_header.zip

# cd partial_install_cuda_header/

# bash install-cuda-header.sh

2.2 安装(corex)gpu驱动

# bash corex-installer-linux64-4.2.0_x86_64_10.2.run

第一步,输入 accept , 回车 (同意EULA继续)

第二步,同时选上 "Driver" 和 "Toolkit" 组件后,继续安装

安装之后,export环境变量如下:

# export LD_LIBRARY_PATH=/usr/local/corex-4.2.0/lib:$LD_LIBRARY_PATH

# export PATH=/usr/local/corex-4.2.0/bin:$PATH

2.3 输入以下命令,检查一下gpu驱动及工具是否正确安装上了:

# ixsmi

正确安装的情况下,输出如下:

3. 安装Xinference框架

3.1 安装Xinference

此处,我们完全参考了以下博文

有道云笔记

来安装Xinference框架的。

进入容器,执行bash startup.sh启动Xinference服务。

打开浏览器,输入下面地址进入图形界面启动模型

http://172.19.250.1:9997/ui/

如下:

3.2 启动模型

点按左侧导航栏的"启动模型",在右侧"语言模型"下"搜索模型名称和描述"栏内,输入"deepseek-r1"进行过滤,如下:

点击靠左侧的"deepseek-r1-distill-llama"模型,在弹出窗口中做如下配置:

最后,点按左下的小火箭图标,等待Xinference框架下载、启动deepseek-r1-distill-llama

3.3 检查正在运行的模型

经过漫长的等待,上图中的小火箭图标“嗖”的一下发射了,说明咱们的模型已经在本地跑起来了。

点按左侧导航栏的"运行模型",此时页面显示如下:

4. 安装open-webui,提供相对友好的对话接口

4.1 安装open-webui

# conda create -n webui python=3.11

# conda activate webui

(webui) [root@deepseek ~]# git clone https://github.com/open-webui/open-webui.git

(webui) [root@deepseek ~]# cd open-webui

(webui) [root@deepseek ~]# pip install -r backend/requirements.txt

(webui) [root@deepseek ~]# pip install open-webui

4.2 启动open-webui

(webui) [root@deepseek ~]# nohup open-webui serve > /dev/null &

4.3 对接Xinference框架

打开浏览器,访问open-webui

http://172.19.250.1:8080/

注册第一个用户,即为系统管理员。

进入管理员面板,修改OpenAI API连接为本机的Xinference接口(全面兼容OpenAI API):

下一步,还需要修改当前模型的属性为public(对普通用户可见):

至此,咱们就可以跟本地化部署的deepseek进行对话了:


http://www.hkcw.cn/article/nakFFIigSD.shtml

相关文章

Android WebRTC集成及JNI性能优化实战指南

本文还有配套的精品资源,点击获取 简介:WebRTC是一个开源项目,旨在实现浏览器间无需插件的实时通信,包括音频、视频通话及数据共享。在Android平台上,其实施涉及使用JNI接口进行Java与C/C代码的交互。本压缩包内容预…

【前端】超链接标签(a标签)之href属性、target属性

文章目录 一、a标签1、href属性(1)跳转至网络链接页面(2)跳转至其它工程页面(3)跳转至本界面 2、target属性 二、感谢观看! 一、a标签 a标签即超链接标签,根据名字我们就能知道它是…

【前端开发】一文带你快速入门JavaScript(下)Web 前端必备程序语言 | 条件语句与循环结构

💯 欢迎光临清流君的博客小天地,这里是我分享技术与心得的温馨角落 💯 🔥 个人主页:【清流君】🔥 📚 系列专栏: 运动控制 | 决策规划 | 机器人数值优化 📚 🌟始终保持好奇心&…

教你在.Net8.0的WinForm中使用WebView2,实现C#和JavaScript的实时双向互操作

1. 前言 随着 Web 技术的发展,使用网页内容(HTML、JavaScript、CSS 等)作为桌面应用程序的一部分变得越来越常见。在 C# WinForm 中,Microsoft 提供的 WebView2 控件让我们可以轻松地嵌入 Chromium 浏览器,并实现 C# …

【多线程初阶】synchronized锁

文章目录 🌅synchronized关键字🌊 synchronized 的互斥🌊 synchronized 的变种写法🏄‍♂️synchronized 修饰代码块 :明确指定锁哪个对象🏄‍♂️synchronized 修饰方法 🌊 synchronized 的可重入性&#…

使用 Cython 编译将.py文件加密成.so文件

文章目录 1. .so文件的核心意义和优势2. 使用 Cython 编译,将.py文件加密成.so文件 最近在学习在服务器上如何部署Python模型,不学不知道,一学吓一跳,要学好多啊,最近看到什么就记录一下什么吧。 1. .so文件的核心意义…

环赛里木湖公路自行车赛开赛 速度与激情点燃丝路热土

5月31日上午10时,中国新疆第十七届环赛里木湖(国际)公路自行车赛在精河县鸣枪开赛。首段比赛全长83.1公里,以速度与激情点燃了“中国枸杞之乡”精河县的丝路热土。骑手们从精河县出发,沿精阿高速疾驰,穿越艾比湖湿地和甘家湖梭梭林国家级自然保护区。开赛后仅10分钟,在顺…

南京大学通报施工方偷窃物品 施工单位被罚2000元

5月29日,南京大学基本建设处发布了一份关于对南京诚善科技有限公司执行合同违约金的通报。通报指出,南京大学三校区公共区域饮水机采购及安装项目的施工单位南京诚善科技有限公司的一名员工于5月13日在学校宿舍楼内偷窃学生物品。根据施工合同相关规定并经处办公会研究确认,…

java 反射 枚举与lambda表达式

目录 一.反射 1.概念:在运⾏时检查、访问和修改类、接⼝、字段和⽅法的机制 2.Class类 3.反射相关的类型 4.各类型对应的方法 ​编辑 5.代码示例 (1).class类方法 (2).Field类方法 (3).Constructor类方法 (4).Method类方法 6.总结 二.枚举 1.概念&#x…

【AI大模型】Ollama部署本地大模型DeepSeek-R1,交互界面Open-WebUI,RagFlow构建私有知识库

文章目录 DeepSeek介绍公司背景核心技术产品与服务应用场景优势与特点访问与体验各个DeepSeek-R系列模型的硬件需求和适用场景 Ollama主要特点优势应用场景安装和使用配置环境变量总结 安装open-webui下载和安装docker desktop配置镜像源安装open-webui运行和使用 RagFlow介绍主…

DeepSeek:全栈开发者视角下的AI革命者

无论是想要学习人工智能当做主业营收,还是像我一样作为开发工程师但依然要了解这个颠覆开发的时代宠儿,都有必要了解、学习一下人工智能。 近期发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,入行门槛低&#x…

什么是贝叶斯优化(Bayesian Optimization)?

贝叶斯最优化(Bayesian Optimization)是一种用于函数全局最优化的策略,特别适用于那些计算代价昂贵的黑箱函数(如机器学习模型的超参数调优)。其核心思想是通过构建一个代理模型(通常是高斯过程或随机森林&…

Spring AI+DeepSeek快速构建AI智能机器人

引言 在AI技术蓬勃发展的当下,Spring生态推出了Spring AI项目,为Java开发者提供了便捷的AI集成方案。本文将演示如何用Spring AIDeepSeek V3 快速搭建一个具备自然语言处理能力的智能对话机器人。 一、环境准备 JDK 17 Maven/Gradle构建工具 DeepSe…

【大模型科普】大模型:人工智能的前沿(一文读懂大模型)

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈人工智能与大模型应用 ⌋ ⌋ ⌋ 人工智能(AI)通过算法模拟人类智能,利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络(如ChatGPT&…

借用AI工具(cursor/vscode) 调试matlab代码(2025.4最新实测)

本文实测环境:MATLAB 2025a Windows 11 本文亮点:无需重写Python!用AI直接优化现有MATLAB工程 一、AI调试MATLAB的紧迫性 因为matlab无法内置ai 工具 ,别人都有的不能out了 另外说一声matlba2025a已经很改版很多了,与…

5 分钟用满血 DeepSeek R1 搭建个人 AI 知识库(含本地部署)

最近很多朋友都在问:怎么本地部署 DeepSeek 搭建个人知识库。 老实说,如果你不是为了研究技术,或者确实需要保护涉密数据,我真不建议去折腾本地部署。 为什么呢? 目前 Ollama 从 1.5B 到 70B 都只是把 R1 的推理能力提炼到 Qwen 和 Llama 的蒸馏版本上。 虽说性能是提升…

灰狼优化算法(GWO)(含ai创作)

GWO简介 灰狼优化算法(Grey Wolf Optimizer,GWO)是一种模仿灰狼狩猎行为的群体智能优化算法,由Seyedali Mirjalili等人在2014年提出。这种算法主要模拟了灰狼的社会等级结构和狩猎策略,用于解决各种优化问题。 在灰狼…

5步掌握MCP HTTP模式部署:从零开始搭建你的AI“邮局”!

🔥关注墨瑾轩,带你探索编程的奥秘!🚀 🔥超萌技术攻略,轻松晋级编程高手🚀 🔥技术宝库已备好,就等你来挖掘🚀 🔥订阅墨瑾轩,智趣学习不…

基于DeepSeek-Coder,实现Microi吾码低代码平台AI代码辅助生成的思路设想【辅助代码生成】

文章目录 引言一、整体架构设计二、实现流程与关键技术1. 构建领域数据集2. 模型训练与微调3. 生成代码的安全控制4. 平台集成与交互设计 三、效果优化与评估1. 效果展示2. 评估指标 四、未来优化方向结语 引言 低代码开发平台(Microi吾码)通过可视化交…

【DeepSeek+即梦AI:零基础生成专业级AI图片全流程指南(2025实战版)】

第一部分:工具认知篇——认识你的数字画笔 1.1 工具定位与核心价值 (讲师开场白)各位同学好,今天我们要解锁的是AI创作领域最具生产力的组合工具——DeepSeek+即梦AI。就像画家需要画笔与颜料,这对组合就是你的数字创作套装: • DeepSeek:国内顶尖的智能提示词工程师 …