对 AI Agent 定义的一些探讨

article/2025/8/15 16:35:54

编者按: 当身边的人都在谈论 AI Agent 时,你是否会困惑:究竟什么才是真正的智能体?为什么 OpenAI、IBM 和各大技术领袖给出的智能体定义都不相同?

我们今天为大家带来的这篇文章,作者的观点是:当前流行的智能体定义要么过于复杂,要么严重偏离核心要义,真正的智能体应该被定义为“具备自主性和行为能力,能在所处环境中实现一个或多个目标的系统”。

本文系原作者观点,Baihai IDP 仅进行编译分享

作者 | Steven Willmott

编译 | 岳扬

2025 年显然将成为智能体元年[1]。大语言模型(LLMs)的快速发展让文本生成、图像生成甚至视频生成等不断突破,但现在大家的兴奋点已经转向那些超越单纯的生成能力、能够在数字或现实世界中执行具体操作的系统。

产生这种兴奋确实有其合理性。如果 AI 能够"基于环境输入或内部决策机制,主动执行具体操作以达成目标。",其实用性将呈指数级提升。虽然软件自动化(software automation)已发展多年,但其中多数方案仍显僵化、脆弱。尽管要做到尽善尽美非常困难,但是将其与更敏捷的决策机制相结合必将带来巨大的收益(后续我们会深入探讨)。

核心问题自然是:“究竟什么是智能体?[2]” 是指 OpenAI 对智能体的定义[3]?还是 IBM 的定义[4]?还是 Simon Willison[5] 通过集思广益收集的六大热门定义之一(感谢 Swyx[6] 在 AI Engineer Conference 上提供):

又或是其他定义?

我的观点可能不会让你意外:虽然这些定义中的某些部分是正确的,但都存在缺陷。 更不必说前人早已提出过各种智能体定义,且存在专门研究多智能体系统的完整学术领域(我早期的重要研究成果之一,就发表在 2000 年在波士顿召开的第四届国际多智能体系统大会上,该会议后来与另两个会议合并成为延续至今的 AAMAS 会议[7])。

01 让时光倒流,回顾智能体定义的历史

若要全面梳理智能体定义的演变史,恐怕需要鸿篇巨制才能完成,不过可以肯定的是,学术界从未形成过统一定义。学术文献中记载的智能体类型就包含:

  • 具备完整感知能力的实体机器人(可自主探索环境)
  • 商业实战模拟中用于预测价格波动的独立行为主体简化模型
  • 拥有内部知识表征(internal knowledge representations)与世界模型(world models)的复杂软件实体(通过标准化的智能体语言进行通信,KQML[8] 与 FIPA-ACL[9] 是当时最主流的两种协议)
  • 由非常简单的个体组成的集群,他们通过自行组织实现超复杂行为

当年在各类 AI 会议上,"如何准确定义智能体"曾是学者们最热衷的晚宴话题。

02 如今智能体的各种定义

到如今,该领域已经涌现出大量关于智能体的定义,这并不令人意外。我们现在拥有了一套强大的新工具来构建智能体,大家的兴奋程度可想而知。然而,我认为当前的这些智能体定义中存在着诸多错误,要么过于复杂,要么严重偏离了核心要义。

存在多种不同定义的问题在于,它们可能模糊了构建智能体系统所面临的底层挑战(进而延伸至构建多智能体系统这一更为艰巨的挑战!)。

基于前文提到的那些智能体现代定义(这些是我见过的当代最佳智能体定义)(译者注:应当指的是 OpenAI、IBM 等对智能体的定义),系统梳理这些定义中反复出现的共性要素:

  • “智能体是配备指引行为的指令、能访问可以扩展能力的工具的模型,并封装在具有动态生命周期的运行时环境中。”(需要指令吗?必须是模型吗?模型的本质含义究竟是什么?)

  • “能够自主学习、适应并执行操作以实现既定目标的应用程序。”(学习能力是关键吗?必须被指定目标吗?由谁指定?)

  • “能在现实世界中执行并完成长期的、开放式任务的人工智能系统。”(任务必须长期运行吗?必须完成吗?)

  • “智能体 = 大语言模型 + 记忆能力 + 规划能力 + 工具 + While 循环。”(需要记忆能力吗?必须有大语言模型吗?规划能力是必需的吗?用 FOR 循环后优雅退出不行吗?)

  • “一个值得信赖的系统,能代表用户做出有影响力的决定”(必须代表用户吗?代表它自己可以吗?人类算智能体吗?)

  • “应用程序的智能体化程度越高,其程序执行逻辑的走向就越由大语言模型决定。”(必须是大语言模型吗?智能体属性是从"完全脚本化"到"完全自主"的连续过渡,还是要么是智能体,要么不是的二元状态?)

  • “执行非简单、多步骤操作(这些操作以往需要人类完成)的人工智能系统组件。”(必须是非简单任务吗?人类原本就无法完成的任务呢?杀毒软件算智能体吗?)

撰写这些内容的重点并非要否定这些定义。智能体的概念确实难以界定,而所有定义提出者都在进行有价值的尝试。

实际上,我甚至可以说:我热爱这些智能体定义中的每一个,因为它们从不同角度捕捉了智能体的关键特征,又融入了当前技术浪潮的时代精神。

过去往往将智能体的定义简化,因为在当时难以想象软件系统能像今天用大语言模型构建的这般强大。现代定义某种程度上陷入了相反的问题 —— 它们默认必须使用 LLM 这样复杂的系统才能构建智能体。

03 “Agent”(智能体)的本质到底是什么?

不太可能有一个定义能满足所有人的需求,但我认为,基于一个相对稳健的核心定义,然后再进行扩展,这是很有帮助的。

现在的智能体定义包含很多核心要素,但大多数都至少遗漏了过去的智能体定义中反复出现的一个关键点(即强调智能体与其所在环境的不可分割性)。 现在的智能体定义还(非常自然但并非必要地)将 LLM(大语言模型)作为核心要素。实际上构建智能体并不需要像 LLM 这样强大的技术。

这个定义并非我的原创,它本质上是对过去智能体定义的整合以及当下智能体定义的补充,但可以说这是最接近本质的阐述:

Agent(智能体)是:

具备自主性(autonomy)和行为能力,能在所处环境中实现一个或多个目标的系统。

它可以是软件系统(软件智能体),也可以是人工智能系统(AI 智能体),还可以是生物智能体(比如刚咬断你家电线的老鼠)。

分解一下这个定义的关键要素:

  • 我们讨论的是一个单独的实体(系统)。
  • 具有自主性,能根据某些评判标准选择是否采取行动(这是所有智能体定义中最麻烦的部分,但正如后文所述,这其实是一个比较关键的属性)
  • 具有行为能力,换句话说,它拥有可在周遭环境中执行的一套行为操作。这些能力可以是与生俱来的、可以是一套工具、可以是改变物理世界的行为(如破坏电缆)或单纯收集信息的行为(如间谍智能体)
  • 智能体位于其运行的环境中。这个环境可以是物理的,也可以是数字的,可以是静态的,也可以是快速演变的。智能体运行的环境(environment)是持续影响智能体决策的动态场域(Context)。
  • 智能体具有可选择是否实现的目标。这些目标可以是内置的(预设的程序)、被其他智能体(人或软件)赋予的,也可以是动态生成的(甚至是随机生成的或基于环境的某些特征生成的)

除了核心定义外,可能还需要补充一些附加条件:

  • 大多数有用的智能体可能需要具备长期运行或持久存在的特性,也就是说,它们需要持续运行,坚持完成任务。但这并非严格意义上的必要条件 —— 只要具备自主性,并拥有某种身份,使他们成为一个实体,理论上完全可以存在一次性的智能体:在完成某一个任务后(甚至启动后即刻)自动销毁。
  • 大多数有用的智能体可能都有某种感知循环(sensing loop),监测环境中的触发条件与变化。同样,这也并不是严格意义上的必要条件 —— 可将大量智能体投入环境以暴力覆盖目标达成路径(就像无需复杂感知的暴力拒绝服务攻击)。

尽管如此,即使补充上述条件,当前的智能体定义仍缺失不少东西:大语言模型、While 循环、模型、规划、外部指令、学习能力、记忆等。这些要素对某些类型的智能体确实有价值,但很难论证它们是智能体概念的核心。

要理解这一点,我们不妨思考一下多智能体系统的构成 —— 这正是下文要探讨的内容。

在结束智能体定义的讨论之前,让我们回到“自主性”这个最棘手的概念上来。系统具备自主行动能力究竟意味着什么?是否意味着无需人类指令?是否意味着无需人类触发?甚至无需其他智能体的触发?

这是一个深奥的哲学问题,与“意识是什么?”有异曲同工之妙:

  • 推特/ X 机器人若仅在用户提及某些关键词时才群发垃圾信息,算智能体吗?
  • 病毒算是智能体吗?单个生物病毒呢?
  • 按钮触发式系统  (如使用按键启动)仍是智能体吗?抑或只是应用程序的一个函数?

虽然难以达成共识,但有一个实用的工程学定义:只要系统具备内部逻辑来决定是否响应外部请求,就允许来自人类、其他智能体或环境的外部触发。这可以是对相关操作成功几率的复杂评估,也可以是执行相关操作前简单的安全检查或身份验证。

同样重要的是,触发器通常不会导致立即采取行动。例如:安全扫描系统可能长期被动收集信息,直到侦测到入侵企图才突然启动,阻止攻击行为。Unix 系统的守护进程早在"智能体"概念流行前就已践行这一理念。

至此,我们是否得到了第 15 个智能体的定义?

XKCD Standards[10]

太好了,现在我们有了新的“智能体”定义。毫无疑问,未来会出现更多新定义,最终哪种胜出并不重要,但思考“智能体的定义对智能体系统的实际影响”确实很有价值。

我之所以更喜欢上一节中的简单定义,是因为它能帮助我们聚焦智能体系统的几个关键特性:

  • 自主性真的很重要。 不论是长期运行的 For 循环,还是能被环境条件触发(如安全扫描器)的系统,智能体系统都是异步的,几乎可以随时激活运作。若你正在构建长流程的、复杂的工作流,请慎重考虑是否真正需要智能体。若系统需响应环境变化,且各流程间松耦合协作,智能体可能是理想选择。
  • 环境是核心要素。 必须将智能体看作是嵌入在环境中的。例如,一个具备强大且多样化的操作能力且可访问几乎所有个人数据的系统,必然面临严峻的安全管理挑战。在过去的六个月里,苹果公司可能已经深刻认识到这一点,导致其大肆宣传的 Siri AI 升级版被迫推迟[11]。
  • Environment × abilities = Power。 我欣赏为智能体开发"工具"的理念(如 exa.ai[12] 和browserbase.com[13])。此类基础设施将开放的网络环境转化为智能体的运作环境。工具效能与环境"强度",既决定着智能体可能达成的效果范围,也左右着错误操作发生的风险等级。
  • 目标(Goals)可能来自任何地方。 有些目标可能是硬编码的,有些可能是随机的。在设计智能体时,必须全面考虑并妥善管理所有潜在的目标来源。智能体是否会在网络上搜索信息并制定搜索计划?传入的外部信息会多大程度影响新目标的生成?在算力无限供给的情况下,智能体的目标迭代是否会陷入无限循环?
  • 许多“多智能体”系统实际上是单智能体系统。 近期涌现的许多所谓多智能体系统,本质上是完全决定所有后续操作的系统链,或者是每个系统都生成一个结果以便选出最佳结果的系统集合。这些架构都不符合真正的多智能体系统的标准。真正的多智能体系统需要每个智能体都具备自主性,换句话说,它需要有自己的独立目标,以及是否实现这些目标的一些标准。从广义上讲,只有当每个“智能体”代表不同利益主体(包括其它们自身)时,才能构成真正的多智能体系统。将系统功能拆解到多个子模块的架构本身没有问题,但若各子系统之间不存在相互冲突的可能性,本质上仍是在搭建一个“单智能体”系统。
  • 多智能体系统通过环境实现交互(无论你是否喜欢)。 这些冲突发生的速度远超我们想象。即使智能体之间没有直接的信息联系,只要能够操作同一资源就会产生交互(例如共同修改代码库的两个编程智能体,在同一服务器集群上调度任务的两个调度智能体,或五十个向同一数据库写入数据的搜索智能体)。这些交互行为需要显性的或隐性的协调机制予以管理。

用智能体还是不用智能体,这是一个问题…

一个看起来很简单的话题,却写成了一篇这么长的博文,你可能会觉得要彻底远离智能体系统才是上策,这也情有可原。又或许是因为"智能体热"的炒作实在令人应接不暇。

这两种想法都可以理解,但你可能无法逃避。一旦你开始构建能在某个环境中“行动”的人工智能系统,你就已经踏上了构建智能体的征途。当你走上这条道路,特别是如果你还添加了一点自主性(长期运行进程、触发规则等),你的系统就值得被视为一个智能体。

通过审视智能体的系统设计,你可以开始明确环境是什么、有哪些可用的动作/工具、如何设计决策机制等。这些思考通常都会帮你实现更优秀的系统设计。

About the author

Steven Willmott

Leading product and engineering at http://SafeIntelligence.AI. Writes at https://steampunkai.com. Also @njyx@hachyderm.io (mastodon) and njyx.eth.

END

本期互动内容 🍻

你认为智能体的核心要素是什么?自主性、目标导向、环境交互——如果必须舍弃一个,你会选哪个?为什么?

文中链接

[1]https://www.youtube.com/watch?v=kHPXbo2OkzA&ref=steampunkai.com

[2]https://techcrunch.com/2025/03/14/no-one-knows-what-the-hell-an-ai-agent-is/?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAANawXVc85pqGm4747r0gZ695ufjLDpKArFcOdPBrDnoGshuiddCe5UF-MrwbXhk1S6Q2Kv6KPLieGvW5rHixqzZ3ZQRxmUbE103bN5_eKY-BOCVcXGa92OGWX6lY5xsR10GYBWKhj09rw6qdyxaQ7v5FsuFyMR24WMbc1dZmc1vH&ref=steampunkai.com

[3]https://www.steampunkai.com/dispatch-from-the-ai-engineer-summit-day-1-small-errors-self-replication-and-context-2/

[4]https://www.ibm.com/think/topics/ai-agents?ref=steampunkai.com

[5]https://x.com/simonw?ref=steampunkai.com

[6]https://x.com/swyx?ref=steampunkai.com

[7]https://en.wikipedia.org/wiki/International_Conference_on_Autonomous_Agents_and_Multiagent_Systems?ref=steampunkai.com

[8]https://en.wikipedia.org/wiki/Knowledge_Query_and_Manipulation_Language?ref=steampunkai.com

[9]http://www.fipa.org/repository/aclspecs.html?ref=steampunkai.com

[10]https://xkcd.com/927/?ref=steampunkai.com

[11]https://www.theverge.com/news/629940/apple-siri-robby-walker-delayed-ai-features?ref=steampunkai.com

[12]http://exa.ai/?ref=steampunkai.com

[13]http://browserbase.com/?ref=steampunkai.com

本文经原作者授权,由 Baihai IDP 编译。如需转载译文,请联系获取授权。

原文链接:

https://www.steampunkai.com/ai-fundamentals-agent-definitions/


http://www.hkcw.cn/article/kxMjLvBSEw.shtml

相关文章

46岁缺氧离世卡车司机有6个孩子 卡友自费护送归乡

河南一名46岁的货车司机在青海五道梁因缺氧不幸离世。得知消息后,几位热心的卡车司机远赴2000多公里,自费护送他的遗体归乡。其中一位司机表示,他们不希望家属承担任何费用,认为中国人应该互相帮助。参与护送的任先生提到,这位去世的卡车司机家中还有六个孩子需要抚养。目…

女子与被告名字同音屡遭传唤调查 身份误认影响生活

近日,河北省廊坊市的颜女士反映,因身份信息被误列为一起经济纠纷案件被执行人,两年内多次受到廊坊市广阳区人民法院的核查和传唤。即便她多次澄清自己与案件无关,执行局工作人员仍携民事判决书到其工作单位调查。颜女士认为法院工作人员执行程序违法,并对其身心、名誉造成…

成都及都江堰附近有4级地震 地震台网测定

中国地震台网自动测定,6月1日16时02分在四川成都市都江堰市附近发生4.0级左右地震,震中位于北纬30.88度、东经103.49度。具体信息以正式速报为准。责任编辑:0882

一汽奥迪Q6L e-tron家族开启预售 重塑豪华电动新标杆

在2025年5月31日的第29届粤港澳大湾区国际车展上,一汽奥迪Q6L e-tron家族正式开启预售。作为基于PPE豪华纯电平台打造的首款车型,该车融合了德国精工与中国智慧,定位为纯电动中型SUV,并提供传统SUV和Sportback轿跑SUV两种车身造型。新车搭载华为乾崑智驾技术,已在一汽奥迪…

石破茂:日本须从历史中汲取教训

5月29日,在第30届“亚洲的未来”国际论坛上,日本首相石破茂就第二次世界大战结束80周年发表言论,称日本须从历史中汲取教训,决心不再重蹈战争覆辙,愿虚心学习亚洲各国历史文化,深化与亚洲各国的经济关系并建立真正的信任。这一表态在国际社会尤其是亚洲地区引发了广泛关注…

刘宇宁康乃馨音乐节回顾vlog 锡纸抹胸引发热议

2025年5月28日的康乃馨音乐节5.0直播中,刘宇宁的造型引发了全网热议。他身穿银色金属质感拼接上衣,被粉丝戏称为“锡纸抹胸”或“锡纸铠甲”,相关话题迅速登上微博热搜,成为当晚的娱乐焦点。这套造型是品牌合作款,设计理念融合了“未来纪元风”,但银色材质拼接部位被调侃…

【中国·广州】第三届信号处理与智能计算国际学术会议 (SPIC2025) 即将开启

第三届信号处理与智能计算国际学术会议 (SPIC2025) 即将开启 在信息技术飞速发展的当下,信号处理与智能计算作为前沿科技领域,正深刻改变着我们的生活与产业格局。为汇聚全球顶尖智慧,推动该领域进一步突破,第三届信号处理与智能…

研究员:印度空军甩锅工业部门 军工困境凸显

印度空军总参谋长维阿马尔普里特辛格最近罕见发声,批评了自家军工企业。他直言按时交货是不可能完成的任务,这揭示了印度政府近年来投入巨额资金进行的印度制造军工计划陷入了困境。自印巴冲突后,印度空军一直心怀不平,丧失了战斗力,还被世界各地揶揄。问题的根源在于光辉…

新加坡“香会”现场 中方代表发声 批驳无端指责

第22届香格里拉对话会于5月30日至6月1日在新加坡举行。5月31日,对话会举行了4场全体大会、一场部长级圆桌会议和3场特别论坛,聚焦区域安全热点话题。在5月31日的新加坡香格里拉对话会上,美国公开阐述了其亚太政策。当天下午,在“亚太海上合作安全”特别论坛上,中国人民解放…

梁建章:儿童是希望不是负担 儿童减少引发社会危机感

“六一”儿童节到来之际,除了祝福孩子们节日快乐外,也正好讨论与儿童相关的话题。人口统计学上所说的少年儿童人口通常指0-14岁人口。近年来,中国儿童人口占比不断下降,七普数据显示,2020年中国0-14岁人口占比为17.9%,到2024年降至15.8%。简单来说,能够欢度儿童节的人数…

印度GDP超日本是自嗨造假吗 数据炼金术背后的真相

4万亿GDP的牛粪经济学,是莫迪政府的创造性成就。当印度国家转型机构执行官苏布拉马尼亚姆在2025年夏日宣布“印度已超越日本成为全球第四大经济体”时,新德里电视台同步播放着孟买贫民窟儿童在污水里捕捞死鱼的画面。这组魔幻现实主义的镜头恰似莫迪经济学最传神的注脚——用…

郑钦文1比0萨姆索诺娃 抢七险胜先下一城

6月1日,在法网女单1/8决赛中,中国选手郑钦文迎战俄罗斯选手萨姆索诺娃。首盘比赛历时76分钟,郑钦文通过抢七以7-6(5)获胜,大比分1-0领先。比赛开始后,郑钦文率先保发,取得1-0的领先。在接下来的多拍拉锯战中,郑钦文得分并率先拿到破发点,但萨姆索诺娃凭借正反手大角度…

俄方调侃马克龙:妻子不会没事扇丈夫 视频风波引发猜测

当地时间5月25日,法国总统马克龙开始为期六天的东南亚访问。在首站越南期间,他与夫人布丽吉特抵达河内机场时的一段视频引起了广泛讨论。次日,马克龙否认了有关他和布丽吉特之间存在“家庭纠纷”的说法,解释称这只是夫妻间的玩笑。马克龙表示,他们在视频中的互动只是开玩笑…

“华为+奥迪”第一车来了 智驾技术深度融合

在2025粤港澳大湾区车展上,明星刘德华在一汽奥迪新闻发布会上的感言令人印象深刻。他说:“也许这个时代,大家都在比谁跑得更快,但我们更愿意用长期主义陪大家走得更远。”这句话不仅道出了奥迪在中国市场坚持技术积淀与品牌价值并重的发展理念,也体现了其在智能化、电动化…

俄乌第二轮谈判俄方代表团已启程 准备开启关键对话

俄罗斯代表团已飞往土耳其伊斯坦布尔,准备参加与乌克兰的第二轮谈判。据俄罗斯总统新闻秘书佩斯科夫透露,俄罗斯代表团将于6月2日在伊斯坦布尔与乌克兰开启新一轮谈判。俄罗斯外交部发言人扎哈罗娃也表示,由俄罗斯总统助理梅金斯基率领的代表团将携带备忘录草案和其他停火提…

MySQL数据库二进制安装

一、数据库的基本概念 1.数据 描述事物的符号记录称为数据(Data)。数字、文字、图形、图像、声音、档案记录等都是数据。 在数据库中,数据是以“记录”的形式按照统一的格式进行存储的,而不是杂乱无章的。相同格式和类型的数据统一存放在一起&…

【Spring】深入浅出SpringAOP

SpringAOP 前言AOP基础ProxyFactoryPointcutAdvisorProxyFactory策略选择JDK策略的执行流程Cglib策略的执行流程 EnableAspectJAutoProxyAnnotationAwareAspectJAutoProxyCreator 前言 SpringAOP的原理是动态代理,动态代理又分为JDK动态代理和Cglib动态代理&#x…

白玉兰入围奖项全名单 各单元角逐揭晓在即

第30届上海电视节白玉兰奖海外电视剧单元的入围名单已经公布,颁奖典礼将于6月27日举行。至此,本届白玉兰奖的所有入围名单已全部发布,包括中国电视剧单元、纪录片、动画和综艺类别。之前公布的名单中,有10部作品将角逐中国电视剧单元奖项,15部综艺节目也入围了综艺类别的评…

我国北部将有机会出现极光 太阳活动引发期待

北京时间5月31日07时45分左右,太阳活动区14100开始爆发耀斑,软X射线流量快速上升,并在08时05分达到M8.1级中等耀斑强度。中国气象局国家空间天气监测预警中心预判,未来三天可能发生地磁暴。2日左右,我国北部有机会出现较为明显的极光,部分地区甚至可能出现红绿复合极光。…

Hailo8教程笔记

Hailo8教程笔记 Tappas系统整合测试工具模型转换工具资料下载自己安装记录Hailo AI Software Suite – Docker(完整开发环境Docker镜像安装)TAPPAS安装教程安装基础环境OpenCV安装 TAPPAS 所需系统依赖项安装Tappashttps://github.com/hailo-ai/hailort Tappas 系统整合测试工…