【2025年5月】AI生产力再探再报:各家智能体持续内卷,前沿应用不断细分

article/2025/7/2 5:56:14

前言
2025年5月的个人学习笔记。

一、工具尝鲜快报:初探感觉好玩,但还未深入的工具。
二、生产力军火库:开箱即用的神器,以及一些好用的技巧。
三、前沿动态速递:一些可反复品读的优质资料和个人感兴趣的新工具。

文章目录

  • 一、工具探索快报
    • 1.扣子空间
    • 2.纳米AI超级搜索
    • 3.Qwen3分析研究
    • 4.Kimi长思考
    • 5.AutoGLM沉思
    • 6.文心X1 Turbo
  • 二、生产力军火库
    • 1.AMiner
    • 2.Make
    • 3.Prompt Engineering Guide
    • 4.AI Short
  • 三、前沿动态速递
    • 1.Open WebUI MCPo
    • 2.Google A2A
    • 3.DeepAgent
    • 4.Suna
    • 5.DeerFlow
    • 6.Docling
    • 7.Qwen系列
  • 后记

一、工具探索快报

本月加班太多,空余时间没有探索什么工具,用扣子空间实现了一些简单需求,体验了一把通用智能体。底层模型是豆包和 DeepSeek,相当于是升级版自动化工作流的豆包?在 H5 简历制作、大学生数据库实训作业上的表现不错,6月再抽空深入挖掘一下。

prompt:根据文档中的要求开发数据库系统
一、设计一个面向校园共享资源(如自习室、会议室、运动场地、实验室设备等)的管理数据库
1.设计两类用户:管理员(管理公共资源数据库)、普通用户(学生/教师)
2.公共资源管理:公共资源类别、位置、名称、可用状态等
3.预约管理:按时间段预约公共资源(支持按小时预约),预约冲突检测(同一实验室同一时间段不可重复预约),查看自身的个人预约记录。此外,有些公共资源,如自习室,在学期一开始就会安排一些固定的课程,如:XX课程就会一直在每周固定时间段占用XX自习室,这些也需要考虑进去。
4.分类查询:管理员可以查看借用资源的用户详细信息,如:联系电话,邮箱等,普通用户只能查看占用情况,出于个人隐私保护,无法查询用户详细信息。
5.绘制ER图,创建相关的关系表
6.提供管理该数据库所需的sql语句(相应的增删改查语句)
二、需要做出来的东西
1.提供可运行并演示的数据库demo程序(能在mysql上运行),初步解决该共享资源管理问题,能够支持基本的查询,如:预约查询;能够支持基本的预约操作等
2.数据库的ER图设计文档
3.并发控制封锁机制、安全权限机制、SQL扩展功能等
4.设计报告:对代码和相应的功能进行说明的文档

以下,用其他 5 个类似产品和扣子空间对比了一下数据库作业的实现。

AI文档设计ER图尝试执行代码
扣子空间详尽
纳米AI超级搜索详尽
Qwen3分析研究详尽
Kimi长思考简略
AutoGLM沉思详尽
文心X1 Turbo简略

1.扣子空间

交付内容还算齐全,不仅有详细的设计文档,还用 python 尝试执行了数据库创建,要求是用 mysql,不过运行空间里没有相关环境,在线创建失败。总体感觉还是很丝滑的,执行大约 5~10 分钟(自身没有计时显示),交互界面也很舒服,易上手。似乎没有任务数限制,单个任务中生成文件不超过 300 个。
在这里插入图片描述

2.纳米AI超级搜索

交付内容齐全,同样无法在线建库,中间输出了交互网页,但比较鸡肋,最终的设计文档内容比较混乱,不易于理解。耗时 17 分钟,官方在最后也提示还在公测,每天 10 次体验也是完全足够用的。
在这里插入图片描述
在这里插入图片描述

3.Qwen3分析研究

总体设计比较完善,质量较好,但 ER 图的需求没有实现。耗时 7.5 分钟,每月 20 次体验。
在这里插入图片描述

4.Kimi长思考

大模型基操,推理后快速输出了干练的方案,但只是方案,达不到直接交付的要求,也缺少 ER 图。
在这里插入图片描述

5.AutoGLM沉思

相比 KIMI 一次性思考后输出,进行了多轮思考,还去搜索了外部资料,输出的方案更加详尽,但仍缺少 ER 图。
在这里插入图片描述

6.文心X1 Turbo

扣子空间和纳米都具有沙箱所以尝试了在线建库,文心也调用解释器进行了多次尝试(通义也有代码模式,但不能和分析研究模式同时开启),它们都意识不到自己是因缺少 mysql 环境才失败的。最终文心称自己达到了最大思考轮数,中止试验进行了输出,方案和 KIMI 一样比较干练,但思考过程还是很有意思的。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二、生产力军火库

1.AMiner

科研神器,AI 赋能科技情报挖掘-学术搜索-论文检索-论文专利-文献追踪-学者画像。
地址:https://www.aminer.cn/
在这里插入图片描述

2.Make

超强的自动化编排工具,在国内似乎少有提及,也没有能匹敌的产品。
地址:https://www.make.com/en
在这里插入图片描述

3.Prompt Engineering Guide

虽然 prompt 工程师不再像最初一样大热,但基本的提示词设计理念还是值得学习的,这是一个不错的指南。
地址:https://www.promptingguide.ai/zh
在这里插入图片描述

4.AI Short

即便不学习,也可以轻易找到前人积累的优质提示词,一个提示词集合站。
地址:https://www.aishort.top/
在这里插入图片描述

三、前沿动态速递

1.Open WebUI MCPo

Open WebUI 推出的进一步简化 MCP 连接的工具,能够将任何基于 MCP 协议的工具转换为兼容 OpenAPI 的 HTTP 服务器。使个人开发需要调用工具的 AI 应用时更加快捷,也可以不编码而快速集成到 Open WebUI 中使用。对普通用户而言,用各大厂商的在线服务更好,但有定制化需求或本地化应用时,可以了解一下这个。
地址:https://github.com/open-webui/mcpo

2.Google A2A

Google 表示其是对 MCP 的补充,MCP 连接工具,而 A2A 连接 Agent (每个 Agent 可能有自己的 MCP )。工作流程:Agent 发现 → 任务委派 → 监控执行 → 结果整合。简单来说是用于开发多智能体协作应用的,非开发者知道有这个东西就行。拿做菜来说,一个 LLM 做的是想出一个菜谱,一个 MCP 做的是用锅加水煮,一个 Agent 做的是按菜谱去买菜回来做,而 A2A 做的是知道有哪些 Agent 能做什么事情、派谁去买菜、派谁去做菜、派谁来上菜。

核心差异MCP(How?)A2A(What?)
通信方式输入、输出均是结构化数据主要使用自然语言
任务处理本质是一次性的函数调用管理完整的生命周期
定义描述精确的函数规格,JSON 格式Agent Card,类似专家简历
应用场景精细化的标准任务模糊而复杂的需求

地址:https://github.com/google-a2a/A2A

3.DeepAgent

‌ Abacus AI 推出,如果说前两项是给开发者用的,那么这个产品就是直达用户的,只需表达需求,它会自动调度 N 种大模型、附带 N 种工具,完成最接近可交付物而无需再次加工的输出。不过自 Manus 造势以来,几乎所有的通用智能体产品都想表明自己是最通用、最智能的,DeepAgent 每月 10 刀(Manus 19 刀),会不会比免费的扣子空间表现更好呢?

4.Suna

Kortix AI 开源,复刻 Manus 的通用智能体,类似开源的 OpenManus,本地部署略繁琐,据说表现超过 100% 的 Manus。或许是 Manus 吃相太难看,打它脸的开源项目似乎越来越多(Suna 即 anus 倒着写),见此景也是乐哉。
地址:https://github.com/kortix-ai/suna

5.DeerFlow

字节跳动开源的深度研究框架,类似 DeepResearch。
地址:https://github.com/cccZone/deer-flow

6.Docling

IBM 开源的支持视觉大模型的 PDF 解析工具。
地址:https://github.com/docling-project

7.Qwen系列

很积极,技术雄厚,不断推出新产品,但仍要点名批评通义官网的用户体验极差,网站产品经理要拖出去打靶。另外像 DeepSeek、Claude、Gemini、Mistral 等各家大小模型和相关产品线的更新,也是遭受一发布即颠覆的鼓吹,看的有些精神疲劳,您们就继续卷吧,益街坊。
地址:https://modelscope.cn/organization/Qwen?tab=model

后记

这里是加班时感觉会猝死的 Seon塞翁,下一篇再见~


http://www.hkcw.cn/article/ALSCSxyBAH.shtml

相关文章

ubuntu22.04安装megaton

前置 sudo apt-get install git cmake ninja-build generate-ninja安装devkitPro https://blog.csdn.net/qq_39942341/article/details/148388639?spm1001.2014.3001.5502 安装cargo https://blog.csdn.net/qq_39942341/article/details/148387783?spm1001.2014.3001.5501 …

shell脚本的条件测试

命令结果判定 && :在命令执行后如果没有任何报错时会执行符号后面的动作 || :在命令执行后如果命令有报错会执行符号后的动作 条件判断 # test 语句 # [],[[]],(()) 语句 # [[]] 可以支持的表达式更多,是最常…

已有的前端项目打包到tauri运行(windows)

1.打包前端项目产生静态html、css、js 我们接下来用vue3 vite编写一个番茄钟案例来演示。 我们执行npm run build 命令产生的dist目录下的静态文件。 2.创建tarui项目 npm create tauri-applatest一路回车,直到出现。 3.启动运行 我们将打包产生的dist目录下的…

随记 nacos + openfegin 的远程调用找不到服务

这里的配置问题就不说了,基本的都没有问题,然后现在的是怎么样的场景呢,就是有两台服务器,两台服务器分别部署了两个模块,B要调用A服务,然后通过nacos找到了这个服务的名称,但是呢发现连不上&am…

【Python 算法零基础 4.排序 ⑦ 桶排序】

草木不争高,争的是生生不息 —— 25.5.26 选择排序回顾 ① 遍历数组:从索引 0 到 n-1(n 为数组长度)。 ② 每轮确定最小值:假设当前索引 i 为最小值索引 min_index。从 i1 到 n-1 遍历,若找到更小元素&am…

天机学堂-分页查询

需求 分页查询我的课表 返回: 总条数、总页数、当前页的课表信息的集合 返回的VO(已经封装成统一的LearningLessonsVO) 定义Controller RestController RequestMapping("/lessons") RequiredArgsConstructor public class Lear…

Transformer 是未来的技术吗?

之前的文章中,聊了不少关于 Transformer 方面的内容: Transformer 中的注意力机制很优秀吗?-CSDN博客初探 Transformer-CSDN博客来聊聊Q、K、V的计算-CSDN博客 现在的大模型基本都是基于 Transformer 或者它的演进技术,那么&…

阿里云国际站,如何通过代理商邀请的链接注册账号

阿里云国际站:如何通过代理商邀请链接注册,解锁“云端超能力”与专属福利? 渴望在全球化浪潮中抢占先机?想获得阿里云国际站的海量云资源、遍布全球的加速节点与前沿AI服务,同时又能享受专属折扣、VIP级增值服务支持或…

[创业之路-404]:企业战略管理案例分析-战略执行-人才战略

一、概述 在BLM(业务领先模型)战略执行中,人才是核心模块和关键要素,其管理需紧密围绕战略目标展开,具体如下: 1. 人才战略与战略目标的对齐 关键任务分解:通过战略解码,将业务目…

C++11 : 智能指针

C11 : 智能指针 目录 C11 : 智能指针引言1. 智能指针的使用场景分析2. RALL和智能指针的设计思路3. C标准库智能指针的使用4. 智能指针的原理5. shared_ptr和weak_ptr5.1 shared_ptr循环引用问题5.2 weak_ptr 6. shared_ptr的线程安全问题7. C11和boost中…

嵌入式开发之STM32学习笔记day16

STM32F103C8T6 I2C通信协议 1 I2C简介 I2C(Inter-Integrated Circuit)是一种两线制的串行通信协议,广泛应用于微控制器与外围设备之间的数据传输,它支持多主多从的通信模式,允许多个设备连接在同一总线上,…

Redis数据类型操作命令

Redis通用命令 keys:查看符合模板的所有key 因为keys命令使用的是模糊查序,比较耗性能,由于有redis是单线程,因此在生成情况下不建议使用该命令。del:删除一个或者多个keyexists:判断一个key是否存在expi…

Leetcode 2123. 使矩阵中的 1 互不相邻的最小操作数

1.题目基本信息 1.1.题目描述 给你一个 下标从 0 开始 的矩阵 grid。每次操作,你可以把 grid 中的 一个 1 变成 0 。 如果一个矩阵中,没有 1 与其它的 1 四连通(也就是说所有 1 在上下左右四个方向上不能与其他 1 相邻)&#x…

STL解析——list的使用

目录 1.简介 2.构造函数 3.迭代器 3.1封装 3.2迭代器分类 4.排序性能 4.1链式与数组 4.2缓存读取 1.简介 STL容器中提供的list容器也是一种顺序容器,底层实现方式是带头双向链表,这种实现方式能比单链表更高效的访问数据。 下面围绕部分重要接口…

数据库系统概论(十一)SQL 集合查询 超详细讲解(附带例题表格对比带你一步步掌握)

数据库系统概论(十一)SQL 集合查询 超详细讲解(附带例题表格对比带你一步步掌握) 前言一、什么是集合查询?二、集合操作的三种类型1. 并操作2. 交操作3. 差操作 三、使用集合查询的前提条件四、常见问题与注意事项五、…

数学建模期末速成 最短路径

关键词:Dijkstra算法 Floyd算法 例题 已知有6个村庄,各村的小学生人数如表所列,各村庄间的距离如图所示。现在计划建造一所医院和一所小学,问医院应建在哪个村庄才能使最远村庄的人到医院看病所走的路最短?又问小学建…

MonitorSDK_监测用户行为(点击、页面路由变化、页面浏览量变化)

点击事件监测 为了实现用户点击事件的监控和数据埋点,可以通过监听全局的 mousedown 和 touchstart 事件,收集用户交互数据,并将其上报到服务器。 export default function onClick(){[mousedown, touchstart].forEach( eventType > { …

NE555输出PWM驱动NMOS控制灯光电路Multisim仿真

仿真电路: 遇到的一些问题: 1、NE555怎么产生PWM波形? 解: 555定时器频率计算器_555定时器频率在线计算_电路参数计算 - 电子发烧友(www.elecfans.com) 这个在线工具可以通过设定频率、占空比、电阻,从而求出电阻值…

ThinkPrune:在RL中引入长度限制,在保持性能一致或略有提升下,显著提升推理效率

摘要:我们提出了THINKPRUNE,这是一种简单而有效的方法,用于缩短长思考型大语言模型(LLMs)的思考长度。这些模型被发现常常会产生低效且冗余的思考过程。现有的关于减少思考长度的初步探索主要集中在迫使思考过程提前结…

重温经典算法——堆排序

版权声明 本文原创作者:谷哥的小弟作者博客地址:http://blog.csdn.net/lfdfhl 基本原理 堆排序是一种基于二叉堆的排序算法,时间复杂度为O(n log n)。堆排序核心步骤包括构建最大堆和反复取出堆顶元素排序:首先从最后一个非叶子…