解决RAGFlow(v0.19.0)有部分PDF无法解析成功的问题。

article/2025/7/13 7:55:32

ragflow版本为:v0.19.0


1.解析的时候报错:Internal server error while chunking: Coordinate lower is less than upper。
看报错怀疑是分片的问题,于是把文档的切片方法中的“建议文本块大小”数值(默认512)调小,比如300,发现有些原来不能解析的PDF文档能成功解析了。


2.但是还是有些PDF解析的时候报错如下图:


看报错怀疑是内存不足,实际查看了下CPU的使用情况,发现解析文档的时候CPU已经使用到了99%。但是我使用的启动容器命令是:docker compose -p ragflow -f docker-compose-gpu.yml up -d 。按理说应该使用GPU的,无解。于是想着怎么精简内存,考虑到我们的嵌入模型是自己部署的,于是决定不在使用v0.19.0版本, 遂将docker/.env 文件内的 RAGFLOW_IMAGE 变量改成使用v0.19.0-slim,这样可以减少使用的内存。

重启,发现能成功解析文档。

如果您有其他更好的解决方法,欢迎一起留言讨论。


http://www.hkcw.cn/article/gTAqOAFyTg.shtml

相关文章

IoTDB 集成 DBeaver,简易操作实现时序数据清晰管理

数据结构一目了然,跨库分析轻松实现,方便 IoTDB “内部构造”管理! 随着物联网场景对时序数据处理需求激增,时序数据库与数据库管理工具的集成尤为关键。作为数据资产的 “智能管家”,借助数据库管理工具的可视化操作界…

比较二维结构的尺寸分布

在行列可自由变换的平面上5点结构有34个 其中尺寸在3*3范围内的有7个 在4*4范围内的有14个 在5*5范围内的有13个 现在假设平面上有5个不可分辨的点在随机的运动,这5个点可能的位置关系就只有这34种。现在假设点与点之间的距离是稳定不变的的,且每个状态只出现一次。…

WSL里执行python深度学习的一些方法记录

安装anaconda3: 可以直接从 Download Now | Anaconda 中下载,然后拷贝到WSL环境的某个目录,执行 bash xxxxxxx.sh 即可安装。 启动jupyter notebook: 先conda activate 当前环境,然后pip install jupyter 此时&am…

防爆组合式智能全温振荡防爆培养箱,守护安全场所

品牌:宇晶峰 型号:BGZ-929PY-03ZC 使用温度:4~60C 温度分辨率/波动度/分布精度:0.1C/0.5C/1C(38C时) 回旋幅度/回旋频率范围(r/min):Φ26mm(选配Φ50mm)/30~300(选配5~400) 回旋频率…

如何选择适合的冲压件清洗机?冲压件清洗机的选购指南

冲压件清洗机是工业生产中不可或缺的设备之一,主要用于去除冲压过程中产生的油污、灰尘、碎屑等污染物,确保冲压件的清洁度和质量。适当选择合适的冲压件清洗机对于提高生产效率、降低成本以及保证产品质量都具有重要意义。以下是一份关于如何选择适合的…

2023-2024-2-《移动机器人设计与实践》上机测评

2022-2023-2-移动机器人设计与实践-期末A-CSDN博客 2022-2023-2-移动机器人设计与实践-期末B-CSDN博客 理论和实践分开测评,如下是实践部分 摘要: 《移动机器人设计与实践》期末上机测评要求学生完成配置题和实践题两部分。配置题(30分&am…

[HNCTF 2022 Week1]silly_zip

下载附件 解压发现需要密码 用010打开看看,发现是伪加密 改成00点击保存 解压后得到图片 感觉图片看着怪怪的,修改一下高度看看有没有其他线索 把47改成78 最后得到flag

QSS 的选择器

1. 样式表规则 样式表包含了一系列的样式规则,每个样式规则由选择器(selector)和声明(declaration)组成。     选择器:指定了受该规则影响的部件。     声明:指定了这个部件上要设置的属性。…

Python 训练营打卡 Day 30-模块和库的导入

模块和库的导入 1.1标准导入 import mathprint("方式1: 使用 import math") print(f"圆周率π的值: {math.pi}") print(f"2的平方根: {math.sqrt(2)}\n") 1.2从库中导入特定项 from math import pi, sqrtprint("方式2:使用 f…

ToolsSet之:渐变色生成工具

ToolsSet是微软商店中的一款包含数十种实用工具数百种细分功能的工具集合应用,应用基本功能介绍可以查看以下文章: Windows应用ToolsSet介绍https://blog.csdn.net/BinField/article/details/145898264 ToolsSet中Media菜单下的Gradient Color工具是一…

智能守护电网安全:探秘输电线路测温装置的科技力量

在现代电力网络的庞大版图中,输电线路如同一条条 “电力血管”,日夜不息地输送着能量。然而,随着电网负荷不断增加,长期暴露在户外的线路,其线夹与导线在电流热效应影响下,极易出现温度异常。每年因线路过热…

云服务器如何自动更新系统并保持安全?

云服务器自动更新系统是保障安全、修补漏洞的重要措施。下面是常见 Linux 系统(如 Ubuntu、Debian、CentOS)和 Windows 服务器自动更新的做法和建议: 1. Linux 云服务器自动更新及安全维护 Ubuntu / Debian 系统 手动更新命令 sudo apt up…

Spring Advisor增强规则实现原理介绍

Spring Advisor增强规则实现原理介绍 一、什么是 Advisor?1. Advisor 的定义与本质接口定义: 2. Advisor 的核心作用统一封装切点与通知构建拦截器链的基础实现增强逻辑的灵活组合 二. Sprin当中的实现逻辑1 Advisor 接口定义2 PointcutAdvisor 接口定义…

vscode实时预览编辑markdown

vscode实时预览编辑markdown 点击vsode界面,实现快捷键如下: 按下快捷键 CtrlShiftV(Windows/Linux)或 CommandShiftV(Mac)即可在侧边栏打开 Markdown 预览。 效果如下:

为什么建立 TCP 连接时,初始序列号不固定?

主要原因有两个方面: 很大程度上避免历史报文被下一个相同四元组的 TCP 连接接收问题(主要方面)防止黑客伪造相同序列号的 TCP 报文被接收 接下来,详细说说第一点 假设每次建立 TCP 连接时,客户端和服务端的初始序列…

偏序集、哈斯图、Dilworth

标题 偏序哈斯图Dilworth最少的不上升子序列与最长上升子序列P1020 偏序 偏序关系满足&#xff1a;自反性、反对称性和传递性 便于理解引入哈斯图 哈斯图 对于元素 x&#xff0c;如果 x<y 且不存在 z 使得 x<z<y&#xff0c;那么 y 就是 x 的覆盖元素&#xff0c;在…

企业知识库问答系统避坑指南:检索优化与生成一致性解决方案

本文较长&#xff0c;建议点赞收藏&#xff0c;以免遗失。更多AI大模型应用开发学习视频及资料&#xff0c;尽在聚客AI学院。 一、智能问答系统架构设计 1.1 整体系统架构 graph LR A[用户输入] --> B(前端界面) B --> C{查询类型} C -->|文本| D[文本处理模块] C -…

2025年全国青少年信息素养大赛复赛C++算法创意实践挑战赛真题模拟强化训练(3)

2025年全国青少年信息素养大赛复赛C算法创意实践挑战赛真题模拟强化训练&#xff08;3&#xff09; 四位数密码 【题目描述】 情报员使用4位数字来传递信息&#xff0c;同时为了防止信息泄露&#xff0c;需要将数字进行加密。数据加密的规则是: 每个数字都进行如下处理&…

爬虫知识零基础到入门-数据解析-css, xpath(三)

数据解析 前言一、常见数据类型1.结构化数据2.半结构化数据3.非结构化数据二、HTML概述1.HTML骨架格式2.HTML标签关系三、CSS选择器1.标签选择器2.类选择器3.ID选择器4.组合选择器5.后代选择器6.伪类选择器7.属性提取器8.小结四、xpath节点提取1.什么是xpath2.认识xml1.html和x…

56、Ocelot 概述

Ocelot 是一个基于 .NET Core 开发的开源 API 网关&#xff0c;主要用于微服务架构中&#xff0c;为多个后端服务提供统一的访问入口。它通过集中化管理请求路由、认证、限流、负载均衡等功能&#xff0c;简化了客户端与后端服务之间的交互&#xff0c;同时增强了系统的安全性和…