进阶日记(一)大模型的本地部署与运行

article/2025/7/16 18:30:01

目录

一、背景知识

为什么要在本地部署大模型?

在本地部署大模型需要做哪些准备工作?

(1)硬件配置

(2)软件环境

有哪些部署工具可供选择?

二、Ollma安装

Ollama安装完之后,还需要进行环境变量的配置

配置完环境变量后,就可以从Ollama上下载模型到本地了


接上一篇(非科班大模型工程师进阶日记(〇)),这次我们来试试本地部署一个大模型。

开门见山,要想在本地部署自己的大模型,大致可以分以下几步:

  1. 下载Ollama,通过Ollama将DeepSeek模型下载到本地运行;
  2. 下载RAGflow源代码和Docker,通过Docker来本地部署RAGflow;
  3. 在RAGflow中构建个人知识库并实现基于个人知识库的对话问答。

But,光了解操作步骤是不够的,下面我们先从背景知识开始进行一些简单的介绍。

一、背景知识

注:不了解以下背景知识并不会对后续的安装部署产生决定性影响,但是授人以鱼不如授人以渔,大家各取所需就好。

为什么要在本地部署大模型?

本地部署的核心价值在于自主性安全性,尤其适合对数据隐私、响应速度或定制化有高需求的场景:

  1. 数据主权保障

    • 敏感数据(如企业文档、个人隐私)无需上传云端,避免第三方泄露风险。例如扬州环境监测中心部署DeepSeek-R1,就是因环境数据涉及国家安全,必须本地处理5。

  2. 性能与响应优化

    • 本地推理消除网络延迟,实现毫秒级响应(如实时数据分析、边缘计算场景)16。

  3. 长期成本可控

    • 云端模型按Token计费,高频使用成本高昂;本地部署一次性投入硬件,后续近乎零成本67。

  4. 高度定制化能力

    • 支持模型微调(如LoRA、P-Tuning)、知识库集成(上传私有文档训练),突破公版模型的功能限制18。

💡 典型场景:企业机密数据处理、离线环境应用(野外监测)、个性化AI助手开发。

在本地部署大模型需要做哪些准备工作?

(1)硬件配置

根据模型规模选择硬件,显存是关键瓶颈:

模型规模最低配置推荐配置适用工具
7B参数16GB内存 + RTX 3060 (6GB)32GB内存 + RTX 3070 (8GB)Ollama, LM Studio
13B参数32GB内存 + RTX 3090 (24GB)64GB内存 + 双RTX 4090vLLM, LLaMA.cpp
70B参数64GB内存 + 多A100显卡服务器级CPU+128GB内存+8×A100 GPUvLLM(企业级)37

⚠️ 注意:若无独立显卡,可用CPU+大内存运行量化模型(但速度显著下降)。

(2)软件环境
  • 操作系统:Linux(最佳兼容性)、Windows/MacOS

  • 基础依赖

    • Python 3.8+、CUDA工具包(NVIDIA显卡必需)

    • 深度学习框架:PyTorch或TensorFlow6

  • 虚拟环境:建议用Conda隔离依赖(避免版本冲突)


有哪些部署工具可供选择?

在进行大模型本地部署时,需要根据自己的技术背景和需求,选择合适工具。

工具特点适用场景安装复杂度
Ollama命令行操作,一键运行模型,支持多平台快速体验、轻量测试
LM Studio图形界面,可视化下载/运行模型(Hugging Face集成)非技术用户、隐私敏感场景⭐⭐
vLLM高性能推理框架,支持分布式部署、API服务化企业级高并发需求⭐⭐⭐⭐
LLaMA.cppCPU/GPU通用,资源占用低(C++编写)老旧硬件或低显存设备⭐⭐⭐
GPT4All开源轻量化,自动调用GPU加速个人开发者、跨平台应用⭐⭐

示例:Ollama部署DeepSeek-R1(适合新手,也是本次教程的选用方案)

# 安装Ollama(Linux一键命令)
curl -fsSL https://ollama.com/install.sh | sh# 运行7B参数模型
ollama run deepseek-r1:7b

OK,了解完以上知识,开展下面的工作就不会云里雾里,知其然而不知其所以然了。

二、Ollma安装

Ollama是一个用于本地运行和管理大语言模型(LLM)的工具。

Ollama的安装,直接上官网Download即可,不放心的可以看这篇教程:Ollama 安装。

Ollama安装完之后,还需要进行环境变量的配置:

(必选)OLLAMA_HOST - 0.0.0.0:11434

  • 作用:默认条件下,Ollma只能通过本机访问,但出于便捷性考虑,我们这次部署是通过Docker进行,配置这一环境变量就是为了让虚拟机里的RAGFlow能够访问到本机上的 Ollama;(具体原理参见:配置Ollama环境变量,实现远程访问
  • 如果配置后虚拟机无法访问,可能是你的本机防火墙拦截了端口11434;
  • 不想直接暴露 11434 端口则可通过SSH 端口转发来实现虚拟机访问。

(可选)OLLAMA_MODELS - 自定义位置

  • 作用:Ollama 默认会把模型下载到C盘,如果希望下载到其他盘需要进行这一配置。

更新完两个环境变量记得重启,不然无法立即生效。

配置完环境变量后,就可以从Ollama上下载模型到本地了:

这次我们以Deepseek-R1:8b为例,需要注意的是,模型越大对本地机器配置要求越高,一般来说deepseek 32b就能达到不错的效果,更高的不一定能跑的起来。

 配置及模型选择可参考:个人用户进行LLMs本地部署前如何自查和筛选

下载方式就是复制Ollama官网提供的相应指令,通过电脑命令行进行下载(Windows+R、cmd)

ollama run deepseek-r1:8b

下载完成后,可以直接在命令行窗口进行问答,至此,你就成功完成了大模型的本地化部署!

Congrats!

本地化部署虽然是很简单的一步,却为未来打开了更多可能性。但是,做到这里还不算完全拥有了自己的大模型,下一篇我会讲如何结合RAGFlow来构建自己的本地知识库,从而让DeepSeek更懂你的需求。

祝大家玩儿的开心!

See you next time!:)


http://www.hkcw.cn/article/kvLLbTwXLd.shtml

相关文章

网易游戏转型能否突破天花板 端游接棒成新增长点

2024年对网易游戏来说是充满挑战与变革的一年。这一年,网易游戏经历了业务调整、人事变动以及市场竞争的多重压力,业绩增速放缓,多款游戏停服。这些现象背后,反映出网易游戏在复杂多变的游戏市场中为适应新环境、寻求新突破而做出的艰难抉择。从业绩数据来看,2024年是网易…

韩大选冲刺 四位前总统“出手” 各阵营使出浑身解数

6月3日,韩国将迎来新一届总统选举。距离大选仅剩最后一天,共同民主党总统候选人李在明、国民力量党总统候选人金文洙和改革新党总统候选人李俊锡基本形成“三分”格局。候选人们都在全力冲刺。除了参选的候选人,四位韩国前总统也纷纷表达对各自阵营候选人的支持。据韩联社报…

【速通RAG实战:进阶】19、如何有效评估与改进RAG应用

一、RAG应用评估的核心体系构建 (一)三维度量化评估框架 RAG(检索增强生成)系统的性能评估需从检索、生成、系统级三个维度切入,建立覆盖全链路的量化指标体系,避免单一维度优化导致的系统失衡。 1. 检索模块:精准性与效率双驱动 指标名称定义计算方式健康阈值工具链…

乌克兰这次将特洛伊木马玩明白了 无人机战术震撼亮相

在俄乌第二轮停火谈判即将举行之际,乌克兰突然宣布了一项名为“蛛网”的特别行动,声称袭击了俄罗斯境内的5座战略轰炸机基地,摧毁了41架图-95MS和图-22M3等主力机型,给俄罗斯造成了70亿美元的损失。这一消息震惊了世界。特约评论员石宏认为,乌克兰公布的数字明显夸大,但保…

“涨工资”又一次出现在中央文件 推动居民收入增长

5月26日,中办、国办联合印发文件提出推动企业健全工资合理增长机制。此前,2025年开年的第一场国务院常务会议上,总理李强在部署工作时也提到要提高居民收入,包括支持居民增收,促进工资性收入合理增长,拓宽财产性收入渠道。这些措施针对的是不同群体,既惠及打工人,也考虑…

deepseek api密钥用于其它软件接口调用deepseek

例如这个软件是deepmat,可以调用deepseek,首先需要下载至少MATLAB2024B版本,相关安装详见网站介绍,不愿意花钱的话,这个大家都懂的。接着,是配置相关API接口,需要用到API KEY.有以下几种: (1&am…

律师回应女子为4只宠物狗立遗嘱 专款专用引发热议

近日,广州一名52岁女子立遗嘱,将10多万元留给家中的四只宠物狗,此事引发热议。这名陈姓女子离异后与儿子相依为命近20年。她在中华遗嘱库订立遗嘱,将主要财产指定由儿子继承,并从存款中划出专项份额给家中的四只宠物犬,指定儿子作为遗产管理人,负责爱宠生活的费用支出。…

95后手工达人手搓“歼-20”模型 创意飞行器点亮蓝天梦

刘祥强是一位95后手工达人,今年28岁,来自江西赣州。他从小就喜欢发明创造,从科幻飞行器到歼-20模型,都被他亲手制作出来,并成功飞向蓝天。刘祥强的老家在南康区龙华镇的一栋民房里,现在也是他的专职航模工作室。楼下是裁切和生产车间,楼上是设计和测试区域。这段时间,他…

河北秦皇岛市卢龙县发生地震 2.5级震源深10公里

据中国地震台网正式测定,6月2日17时35分在河北秦皇岛市卢龙县发生2.5级地震,震源深度10公里,震中位于北纬39.96度,东经118.88度。震中5公里范围内平均海拔约50米。根据中国地震台网速报目录,震中周边200公里内近5年来共发生3级以上地震14次,其中最大一次是2020年7月12日在…

外卖员不用办健康证了?网友吵翻 食安封签普及引发争议

点外卖已成为很多人的生活习惯,而网络订餐配送过程中的食品安全问题也备受关注。去年底,四川省卫生健康委与市场监管局联合发布新规,明确外卖送餐人员及预包装食品销售从业者无须办理传统健康证即可上岗,并要求体检机构停止为外卖员提供健康证服务。这一消息得到不少外卖小…

重庆和赵丽颖《在人间》适配度超高 首播成绩惨淡引发热议

5月28日,赵丽颖领衔主演的《在人间》上线播出。这部剧没有避开风头正劲的《藏海传》,而是选择正面PK,这也是肖战和赵丽颖两大顶流的巅峰对决。《在人间》上线首日的成绩单出炉,可以用“惨败”来形容。专业平台给出的网播热度显示,《在人间》首日开播并没有太大声响,热度不…

湖南机场撤下邱继兴职务信息 新领导已上任

今年4月,湖南省机场管理集团党委书记、董事长,湖南省机场管理局局长邱继兴因涉嫌性侵一女子被警方刑拘一事引发广泛关注。6月2日,该集团官网已撤下邱继兴的职务信息,集团官方微信公众号中大量关于他的内容也已消失。邱继兴案发源于一次饭局。知情者透露,2025年4月11日,邱…

男子将放学女童拖进小巷被拘,现场视频曝光

太吓人了!湖南娄底,6岁小女孩在放学的路上,被一位强壮的陌生男子强行拉拽进小巷。女孩吓得撕心裂肺的哭喊着一边喊着爸爸救命,一边挣扎着不愿意进小巷。庆幸的是,楼上的一位爷爷听到了孩子的哭喊声,于是下楼看一看发生了什么?还侥幸的救下了这个小女孩。事后,孩子的妈妈…

免陪照护服务6月起全国推广 缓解家庭陪护压力

俗话说“久病床前无孝子”,这句话反映了家庭在面对病人陪护时面临的无奈与压力。尤其是在老龄化社会背景下,独生子女家庭中父母住院时的陪护问题更加突出。如果医院能提供标准化的照护服务,许多人会感到轻松许多。国家卫健委等三部委已印发方案,将在全国范围内开展免陪照护…

18万人口德国小城为何吸引樊振东加盟 乒乓热浪再起

2016年,19岁的樊振东在德国小镇萨尔布吕肯赢得男子世界杯乒乓球赛男单冠军,这是他职业生涯的首个三大赛世界冠军。九年后的这个夏天,萨尔布吕肯再次掀起“乒乓热浪”。俱乐部宣布中国乒乓球运动员樊振东正式加盟,新赛季将代表俱乐部参加德国乒乓球甲级联赛和欧冠的比赛。中…

男子开着收割机冲进起火麦田抢收 新时代青年的责任担当

当20多亩麦田被大火包围时,湖北天门的一位00后收割机司机小王给出了最好的答案——他毫不犹豫地驾驶收割机冲进火海,在浓烟滚滚中抢收小麦。这一幕比任何超级英雄电影都要震撼人心。这不仅是一个救火的故事,更是新时代年轻人责任担当的真实写照。那天下午,湖北天门某村庄发…

地磁暴是否会给人们的身体健康带来困扰?专家提醒 影响微乎其微

未来三天,特别是今明两天,地球可能经历一场显著的地磁暴。这不是科幻情节,而是太阳释放的能量带来的真实影响。5月31日清晨,太阳上的活跃区14100爆发了一次中等强度的耀斑(M8.1级),并释放了大量带电粒子组成的日冕物质抛射(CME)。这些带电粒子正以每秒几百公里的速度向…

“苏超”足球联赛让球迷玩梗不断 比赛第一,友谊第十四

“友谊第一,比赛第二”这句话在球迷中流传已久。近日,“苏超”足球联赛火出圈,成为热议话题。“苏超”即江苏省首届城市足球联赛,由江苏省体育局与各设区市政府联合主办,13个设区市各派一队参加。这个联赛以城市命名,打破了传统准入的边界,参赛队伍中既有职业球员也有业…

美断供民航发动机换稀土?专家解读 稀土之争再升级

在中美贸易休战不足20天时,特朗普再次对中国采取了具有歧视性的措施。美国商务部于5月28日宣布暂停向中国商飞提供LEAP-1C发动机技术出口许可证,目的是限制中国大飞机产业的发展。然而,文件的附加说明中透露了真正的动机——报复中国对七类中重稀土的出口管制。五年前的同一…

尽显“国际范儿” 龙舟已划向全世界 全球多地共庆端午

端午节期间,划龙舟这一传统民俗在海外多个国家和地区吸引了众多爱好者。西班牙巴达洛纳、英国曼彻斯特、南非开普敦、阿根廷布宜诺斯艾利斯等地纷纷举办了龙舟赛,展现了团结拼搏的精神和四海同舟的友谊。在西班牙加泰罗尼亚自治区巴达洛纳市港口,第七届西华龙舟文化节龙舟赛…