【AI大模型】Ollama部署本地大模型DeepSeek-R1,交互界面Open-WebUI,RagFlow构建私有知识库

article/2025/8/14 12:52:52

文章目录

  • DeepSeek介绍
    • 公司背景
    • 核心技术
    • 产品与服务
    • 应用场景
    • 优势与特点
    • 访问与体验
    • 各个DeepSeek-R系列模型的硬件需求和适用场景
  • Ollama
    • 主要特点
    • 优势
    • 应用场景
    • 安装和使用
    • 配置环境变量
    • 总结
  • 安装open-webui
    • 下载和安装docker desktop
    • 配置镜像源
    • 安装open-webui
    • 运行和使用
  • RagFlow介绍
    • 主要功能
    • 适用场景
    • 优势
    • 下载及安装
    • 私有知识库
      • 1. 模型供应商配置
      • 2. 创建知识库
      • 3. 创建数据集
      • 4. 创建助理和对话

在这里插入图片描述

个人主页:道友老李
欢迎加入社区:道友老李的学习社区

DeepSeek介绍

DeepSeek官网

DeepSeek(深度求索)是一家专注于实现通用人工智能(AGI)的中国科技公司,致力于通过技术探索与创新,推动智能技术的广泛应用。以下是其核心信息的概述:


公司背景

  • 成立时间:2023年(具体时间未公开披露)
  • 总部:中国杭州
  • 使命:通过AGI技术提升人类生产力,推动社会进步。
  • 愿景:成为全球AGI领域的领导者。

核心技术

  1. 大语言模型(LLM)

    • 自主研发高性能基座模型(如DeepSeek-R1、DeepSeek-R2),支持长文本理解、复杂推理和多语言处理。
    • 模型参数量覆盖数十亿至千亿级,平衡性能与计算效率。
  2. 多模态AI

    • 整合文本、图像、语音等多模态数据,开发跨模态理解与生成能力。
  3. 搜索增强技术

    • 结合搜索引擎实时数据,提升模型在知识更新与事实准确性上的表现。

产品与服务

  • 通用大模型:面向开发者的开放API(如DeepSeek API),支持文本生成、代码编写等任务。
  • 行业定制模型:针对金融、医疗、教育等领域提供垂直场景优化方案。
  • 企业级平台:提供模型训练、部署及管理的全流程工具链(如Fine-tuning平台)。
  • 开源社区:部分模型和技术开源,促进开发者协作(如发布轻量版模型)。

应用场景

  • 智能客服:自动化应答与客户意图分析。
  • 内容生成:营销文案、代码、报告等自动化创作。
  • 数据分析:从非结构化数据中提取洞察,辅助决策。
  • 教育:个性化学习助手与智能题库生成。

优势与特点

  • 技术领先:模型性能在多项基准测试(如MMLU、HumanEval)中位居前列。
  • 场景深耕:聚焦企业级需求,提供高可用的行业解决方案。
  • 生态合作:与云计算厂商、硬件供应商及高校建立联合实验室。

访问与体验

  • 官网提供在线体验入口(如Chat界面)和开发者文档。
  • 部分模型可通过Hugging Face、GitHub等平台获取。

如需更详细的技术参数、商业合作或最新动态,建议访问其官方网站或查阅官方发布的白皮书。

各个DeepSeek-R系列模型的硬件需求和适用场景

在这里插入图片描述
我的电脑配置:
在这里插入图片描述
可以跑7b和14b

Ollama

ollama search

Ollama 是一个开源的 AI 推理框架,专注于模型压缩和部署。它的目标是帮助用户在本地或边缘设备上高效运行大型语言模型(LLM),通过量化和其他技术显著减少模型大小,同时保持高性能。

主要特点

  1. 模型压缩与优化

    • Ollama 提供了多种模型压缩技术,如 4-bit 和 8-bit 量化,使大模型能够在低资源环境下运行。
    • 支持主流语言模型(如 LLaMA、Vicuna 等)的适配和部署。
  2. 高性能推理

    • Ollama 能够在本地设备上实现低延迟、高吞吐量的推理,适合实时应用。
  3. 易于部署

    • 提供简洁的命令行界面(CLI),用户可以轻松下载模型、调整参数并运行推理服务。
    • 支持 Docker 部署,便于在云服务器或边缘设备上快速搭建。
  4. 社区驱动

    • Ollama 是一个开源项目,依赖于活跃的社区支持,用户可以根据需求贡献和改进功能。

优势

  • 轻量化:通过量化技术显著降低模型大小,适合资源受限的环境。
  • 高性能:优化了推理速度,能够在本地快速响应。
  • 灵活性:支持多种模型格式和后端(如 GGML、TensorRT 等)。
  • 易于上手:用户无需复杂的配置即可开始使用。

应用场景

  1. 本地开发与实验

    • 开发者可以轻松在本地运行 LLM,用于快速测试和原型设计。
  2. 边缘计算

    • 在边缘设备(如 Raspberry Pi)上部署轻量级 AI 服务。
  3. 实时推理服务

    • 快速搭建支持多语言模型的推理服务器,满足企业或个人需求。
  4. 教育与研究

    • 提供了一个易于使用的工具,适合教学和研究场景。

安装和使用

国内下载:Ollama下载

  1. 打开cmd控制台,输入:

    ollama
    

    可以看到帮助命令
    在这里插入图片描述

  2. 下载模型(以 DeepSeek-R系列为例):

    ollama pull deepseek-r1:1.5b
    
  3. 启动推理服务:

    ollama serve --port 11434
    
  4. 运行模型:

     ollama run deepseek-r1:1.5b
    

可以开始对话了。

配置环境变量

在这里插入图片描述
OLLAMA_MODELS 是修改OLLAMA下载的模型存储位置,默认是在C盘

总结

Ollama 是一个强大的工具,旨在简化大型语言模型的部署和推理过程。它通过模型压缩和优化技术,使得在本地或边缘设备上运行 AI 模型变得高效且易于管理。无论是开发者、研究人员还是企业用户,Ollama 都能提供灵活和支持,满足多种应用场景的需求。

安装open-webui

下载和安装docker desktop

官网地址:Docker Desktop
在这里插入图片描述

GitHub地址:Docker Desktop

在这里插入图片描述

配置镜像源

在这里插入图片描述
第一个是阿里云的镜像源,可登录阿里云平台查看

"registry-mirrors": ["https://${阿里云的}.mirror.aliyuncs.com","https://docker.m.daocloud.io","https://mirror.baidubce.com","https://docker.nju.edu.cn","https://mirror.iscas.ac.cn"]

安装open-webui

搜索open-webui
在这里插入图片描述
在这里插入图片描述
我这里已经安装过了。

运行和使用

在容器中运行open-webui,然后浏览器输入http://localhost:3000
在这里插入图片描述
进入设置
在这里插入图片描述
配置Ollama地址
在这里插入图片描述
配置好后,保存,正常的情况下,界面就会显示Ollama中已下载好的模型了
在这里插入图片描述
完成!可以开始对话了!

RagFlow介绍

RagFlow 是一个基于大语言模型的流程自动化工具,旨在帮助用户通过自然语言处理(NLP)技术来自动化和优化工作流程。它结合了先进的AI技术和直观的用户界面,使得非技术人员也能轻松实现流程自动化。

主要功能

  1. 智能对话交互:用户可以通过与RagFlow进行自然语言对话,定义、管理和优化各种工作流程。
  2. 任务自动化:支持多种任务类型,如数据处理、信息提取、报告生成等,帮助用户自动完成重复性工作。
  3. 跨系统集成:能够与主流的第三方服务(如Slack、Jira、Google Drive等)无缝集成,实现不同系统的数据流动和协同工作。
  4. 动态流程调整:根据实时数据和上下文环境,智能调整工作流程,确保流程始终高效运行。
  5. 可扩展性:支持大规模业务需求,适用于从个人到企业的各种场景。

适用场景

  • 企业流程优化:帮助企业在销售、 marketing、客服等环节实现自动化,提升效率。
  • 个人任务管理:用户可以通过RagFlow自动化个人日常任务,如行程安排、邮件处理等。
  • 数据整合与分析:通过自动化数据收集和处理,支持更高效的决策制定。

优势

  • 易用性:无需编程知识,用户即可快速上手。
  • 灵活性:支持定制化需求,满足不同用户的个性化要求。
  • 高效性:利用AI技术提升流程执行效率,减少人工干预。

RagFlow 通过将复杂的流程自动化转化为简单的对话交互,极大地提升了工作效率和用户体验。如果你有具体的使用场景或问题,可以进一步探讨如何利用RagFlow来优化你的工作流程!

下载及安装

  1. 从github上下载 ragflow或直接:
git clone https://github.com/infiniflow/ragflow.git
  1. 运行脚本:进入docker 文件夹,利用提前编译好的 Docker 镜像启动服务器
docker compose -f docker-compose-CN.yml up -d

这个过程会很慢,成功后,会自动运行容器中的服务:
在这里插入图片描述
浏览器上输入:http://localhost
在这里插入图片描述
第一个注册的账号就是管理员,登录成功
在这里插入图片描述

私有知识库

1. 模型供应商配置

点击头像,进入模型供应商配置
在这里插入图片描述
选择下面列表中的Ollama,然后进行模型配置
在这里插入图片描述
模型名称就是Ollama中下载的模型名称

2. 创建知识库

在这里插入图片描述
解析方法改成General,其他默认即可
在这里插入图片描述

3. 创建数据集

在这里插入图片描述
新增本地文件
在这里插入图片描述
执行解析,等待解析完成
在这里插入图片描述
在这里插入图片描述

4. 创建助理和对话

切换到聊天页,新建助理,选择知识库
在这里插入图片描述

切换到模型设置,调整一下最大token数
在这里插入图片描述
新建聊天,开始对话
在这里插入图片描述


http://www.hkcw.cn/article/OoCTkoPJyy.shtml

相关文章

DeepSeek:全栈开发者视角下的AI革命者

无论是想要学习人工智能当做主业营收,还是像我一样作为开发工程师但依然要了解这个颠覆开发的时代宠儿,都有必要了解、学习一下人工智能。 近期发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,入行门槛低&#x…

什么是贝叶斯优化(Bayesian Optimization)?

贝叶斯最优化(Bayesian Optimization)是一种用于函数全局最优化的策略,特别适用于那些计算代价昂贵的黑箱函数(如机器学习模型的超参数调优)。其核心思想是通过构建一个代理模型(通常是高斯过程或随机森林&…

Spring AI+DeepSeek快速构建AI智能机器人

引言 在AI技术蓬勃发展的当下,Spring生态推出了Spring AI项目,为Java开发者提供了便捷的AI集成方案。本文将演示如何用Spring AIDeepSeek V3 快速搭建一个具备自然语言处理能力的智能对话机器人。 一、环境准备 JDK 17 Maven/Gradle构建工具 DeepSe…

【大模型科普】大模型:人工智能的前沿(一文读懂大模型)

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈人工智能与大模型应用 ⌋ ⌋ ⌋ 人工智能(AI)通过算法模拟人类智能,利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络(如ChatGPT&…

借用AI工具(cursor/vscode) 调试matlab代码(2025.4最新实测)

本文实测环境:MATLAB 2025a Windows 11 本文亮点:无需重写Python!用AI直接优化现有MATLAB工程 一、AI调试MATLAB的紧迫性 因为matlab无法内置ai 工具 ,别人都有的不能out了 另外说一声matlba2025a已经很改版很多了,与…

5 分钟用满血 DeepSeek R1 搭建个人 AI 知识库(含本地部署)

最近很多朋友都在问:怎么本地部署 DeepSeek 搭建个人知识库。 老实说,如果你不是为了研究技术,或者确实需要保护涉密数据,我真不建议去折腾本地部署。 为什么呢? 目前 Ollama 从 1.5B 到 70B 都只是把 R1 的推理能力提炼到 Qwen 和 Llama 的蒸馏版本上。 虽说性能是提升…

灰狼优化算法(GWO)(含ai创作)

GWO简介 灰狼优化算法(Grey Wolf Optimizer,GWO)是一种模仿灰狼狩猎行为的群体智能优化算法,由Seyedali Mirjalili等人在2014年提出。这种算法主要模拟了灰狼的社会等级结构和狩猎策略,用于解决各种优化问题。 在灰狼…

5步掌握MCP HTTP模式部署:从零开始搭建你的AI“邮局”!

🔥关注墨瑾轩,带你探索编程的奥秘!🚀 🔥超萌技术攻略,轻松晋级编程高手🚀 🔥技术宝库已备好,就等你来挖掘🚀 🔥订阅墨瑾轩,智趣学习不…

基于DeepSeek-Coder,实现Microi吾码低代码平台AI代码辅助生成的思路设想【辅助代码生成】

文章目录 引言一、整体架构设计二、实现流程与关键技术1. 构建领域数据集2. 模型训练与微调3. 生成代码的安全控制4. 平台集成与交互设计 三、效果优化与评估1. 效果展示2. 评估指标 四、未来优化方向结语 引言 低代码开发平台(Microi吾码)通过可视化交…

【DeepSeek+即梦AI:零基础生成专业级AI图片全流程指南(2025实战版)】

第一部分:工具认知篇——认识你的数字画笔 1.1 工具定位与核心价值 (讲师开场白)各位同学好,今天我们要解锁的是AI创作领域最具生产力的组合工具——DeepSeek+即梦AI。就像画家需要画笔与颜料,这对组合就是你的数字创作套装: • DeepSeek:国内顶尖的智能提示词工程师 …

【Ai学习】利用扣子(Coze)简单搭建图像生成工作流(小白初学版)

开始之前我们先了解一下我们准备使用的工具。 什么是扣子(Coze)? 官网链接:扣子 扣子(Coze)是一个开源的AI工具开发平台,提供了丰富的API和简单易用的界面,帮助用户快速搭建各种A…

AIGC时代——语义化AI驱动器:提示词的未来图景与技术深潜

文章目录 一、技术范式重构:从指令集到语义认知网络1.1 多模态语义解析器的进化路径1.2 提示词工程的认知分层 二、交互革命:从提示词到意图理解2.1 自然语言交互的认知进化2.2 专业领域的认知增强 三、未来技术图谱:2025-2030演进路线3.1 20…

【AI 大模型】LlamaIndex 大模型开发框架 ② ( LlamaIndex 可配置的 LLM 类型 | LlamaIndex 可配置的 文本向量模型 类型 )

文章目录 一、LlamaIndex 可配置的 LLM 类型1、云端 API 类型 LLM2、本地部署 类型 LLM3、混合部署 LLM4、错误示例 - 设置 云端 DeepSeek 大模型 二、LlamaIndex 可配置的 文本向量模型 类型1、云端 文本向量模型2、本地部署 文本向量模型3、适配器微调模型 AdapterEmbeddingM…

云端微光,AI启航:低代码开发的智造未来

文章目录 前言一、引言:技术浪潮中的个人视角初次体验腾讯云开发 Copilot1.1 低代码的时代机遇1.1.1 为什么低代码如此重要? 1.2 AI 的引入:革新的力量1.1.2 Copilot 的亮点 1.3 初学者的视角1.3.1 Copilot 带来的改变 二、体验记录&#xff…

OCR+AI双引擎驱动:手把手教学构建智能财报分析系统

在金融行业中,财报分析是帮助企业和投资者做出决策的关键环节。随着科技的快速发展,自动化、智能化的财报分析变得越来越重要。传统的人工财报分析不仅费时费力,而且容易受到人为错误的影响,因此企业急需借助先进的技术来提高效率…

秒杀系统—4.第二版升级优化的技术文档二

大纲 7.秒杀系统的秒杀活动服务实现 (1)数据库表设计 (2)秒杀活动状态机 (3)添加秒杀活动 (4)删除秒杀活动 (5)修改秒杀活动 (6)后台查询秒杀活动 (7)前台查询秒杀活动 (8)查询秒杀商品的销售进度 (9)秒杀活动添加秒杀商品 (10)秒杀活动删除秒杀商品 (11)触发渲染秒…

“苏超”10元门票被炒到500元 散装江苏的足球狂热

端午假期,当全球球迷的目光聚焦在欧冠决赛时,江苏人正为自己的“苏超”联赛沸腾。尽管没有大牌外援和全网转播,但场均上座率接近万人,比赛门票一票难求,这场江苏省内的业余联赛迅速走红。“苏超”有多火?10元的门票被炒到500元,上座率甚至超过了一些职业联赛。实际上,“…

【Leetcode】vector刷题

🔥个人主页:Quitecoder 🔥专栏:Leetcode刷题 目录 1.只出现一次的数字2.杨辉三角3.删除有序数组中的重复项4.只出现一次的数字II5.只出现一次的数字III6.电话号码的字母组合 1.只出现一次的数字 题目链接:136.只出现一…

深入解析yolov5,为什么算法都是基于yolov5做改进的?(一)

YOLOv5简介 YOLOv5是一种单阶段目标检测算法,它在YOLOv4的基础上引入了多项改进,显著提升了检测的速度和精度。YOLOv5的设计哲学是简洁高效,它有四个版本:YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,分别对应不同的模型大小…

【数据结构】手撕AVL树(万字详解)

目录 AVL树的概念为啥要有AVL树?概念 AVL树节点的定义AVL树的插入AVL树的旋转左单旋右单旋左右双旋右左双旋 AVL树的查找AVL树的验证end AVL树的概念 为啥要有AVL树? 在上一章节的二叉搜索树中,我们在插入节点的操作中。有可能一直往一边插…