谷歌的新WebAgent对其自身的生存构成威胁?

article/2025/6/8 7:49:27

今日份知识你摄入了么?

这说不通啊,谷歌为什么要这么做?

这是许多人在谷歌DeepMind发布了一篇关于其最新网络自主代理(名为“WebAgent”)的研究论文后可能会问的问题,这是人工智能领域又一次艰苦的命名工作。

但奇怪的是,制造代替人类上网的机器人,违背了谷歌商业模式的核心——互联网广告,并可能在这个过程中抹杀谷歌的存在。

与此同时,WebAgent在自主网络搜索方面树立了新的技术标杆,通过引入模块化、局部-全局注意力等几个概念,让我们看到了人工智能架构的未来,这些概念让我们更接近这样一个未来:你只需简单地提出需求,互联网将轻松满足你。

对于某些任务,普通的LLM无法胜任

在人们幻想使用大型语言模型(LLM)的许多用例中,自主网络搜索无疑占据了最重要的位置。

网络搜索商品化

这个想法太吸引人了,让人无法不憧憬:

任何旅游预订,任何产品,任何博客文章…都只需通过一条文本指令即可实现。

也就是说,自主的、以文本为条件的网络搜索描述了一组机器人代理,通过简单地给它们一个纯文本指令来为你在网络上搜索:

  • “给我订一张去Dallas的头等舱机票”,或者
  • “给我找本月最畅销的科幻小说”

其吸引力是显而易见的,但实现自主网络代理绝非易事……

“机器人上网”,图片来源于作者

永远存在的泛化问题

正如Michael Jordan(来自加州大学,而不是篮球运动员)最近所说,尽管LLM将泛化问题最小化,但它仍然是人工智能中最大的问题之一。

但他这句话的真正含义是什么呢?

对于构建的每个人工智能模型,目标始终是相同的,使用一些已知的数据分布——训练数据——使模型能够在未见数据上进行良好的预测。

然而,即使是最先进的模型,当分布变化足够大时,模型也很可能会失败。

例如,如果你训练你的模型识别照片中的房子,并且只给它提供了红色的两层楼的训练数据,模型也许能够识别紫色的两层楼的房子——这是一个小的分布变化——但如果你给他看一座白色的纽约摩天大楼,模型肯定会迷失方向。

换句话说,无论GPT-4等生成式人工智能的基础模型如何推动人工智能向前发展,当巨大的分布变化出现时,即使是最通用的模型也会受到影响。

这就引出了网络代理面临的最大问题。从本质上讲,网络搜索是开放式的,这意味着代理搜索的下一个网站可能与前一个网站截然不同。

因此,尽管LLM确实有很好的能力来理解搜索意图的语义,但由于HTML代码的极端波动性,它们在处理HTML代码时会受到影响。

但这并不是人工智能网络代理面临的唯一问题,还涉及到大小的问题。

HTML绝非易事

上下文窗口。

这两个词对你来说可能不太熟悉,但对像ChatGPT这样的LLM来说非常重要。在特定的互动过程中,模型可以使用一定量的工作记忆来记住之前的互动。

例如,当你以来回的方式与ChatGPT交谈时,你希望它记住你之前的提示以及对这些提示的回答,以确保对话继续进行。

原因我们今天就不讲了,这个“记忆”越长,模型创建新预测(ChatGPT中的单词)的成本就越高,因为这种预测的计算成本与上下文窗口的长度呈二次关系。

通俗地说,如果你将文本序列大小增加一倍,则计算成本将增加四倍。

因此,今天所有的模型都对这种工作记忆有一定的限制。就ChatGPT而言,最多有32,000个标记,或26,000个单词。

但在开源模型的情况下,大多数模型很难达到2000个标记,或1500个单词。

为什么这一点很重要呢?

很简单,根据谷歌的数据,HTML页面的平均标记数在7,000到14,000之间,这对于今天的大多数LLM来说是不可能完成的任务。

因此,谷歌必须跳出思维定势。

他们确实做到了。

引入HTML-T5

为了实现这一令人难以置信的壮举,WebAgent由一个新的、领域特定的LLM——HTML-T5组成。

考虑到大多数LLM对HTML的归纳偏差较大(这是一种不必要的花哨说法,他们不擅长对新的HTML代码进行泛化),他们决定训练一个新的LLM模型来做两件事。

在收到HTML代码和用户指令后:

  • 该模型准备了一个计划,将用户指令分解为标准的基于Web的操作,如填写表单字段或单击按钮。
  • 然后,对于每个子指令,它分析完整的HTML代码,并提取与该子指令最相关的代码片段。

再然后,这些输出被发送到一个Flan-U-PaLM模型,一个专门生成代码的Google LLM。

为什么?

简单来说,为了弥补开放式网络搜索的差距,其中不同的操作选项很多,与浏览器交互的最佳方式是通过代码,使用Selenium API(一个允许通过代码控制Web浏览器的API库)

我知道这很难理解,所以请看看下面的图片:

来源:谷歌

在用户要求WebAgent导航到一个房地产网站并找到一个位于圣地亚哥的带健身中心的一居室公寓任务后,WebAgent将该指令分解成几个子指令,例如:

  • 访问realestatewebsite.com
  • 在搜索框中输入圣地亚哥
  • 用“包括健身中心”过滤搜索

然后,对于每个子任务,HTML-T5模型会提取最相关的代码片段引用,并将该代码片段和子指令发送给FLAN-U-PaLM模型,然后该模型继续生成Selenium Python代码,该代码将在浏览器上执行操作,过程如下所示:

来源:谷歌

但是,HTML-T5如何处理超长序列(如real网站的HTML代码)呢?

HTML-T5使用局部和全局注意力的组合。

注意力是Transformer LLMs的关键要素。简而言之,它是机器理解自然语言的方式,通过让序列中的单词相互“交谈”,生成注意力分数,向模型传达单词之间的关联性,从而获得序列的实际含义。

在标准的Transformer中,这种注意力机制是“密集”和“局部”的,这意味着单词与所有(密集)附近的单词(局部)进行交谈。

在这里,谷歌采取了不同的方法。

虽然局部注意力仍然需要理解细粒度HTML标记,如‘<span>’或‘<image>’的语义,但HTML这样的树状结构代码包含了如‘<div>’或‘<body>’这样的父标记,这需要注意力机制远远超出附近的标记。

HTML-T5将全局注意力与局部注意力相结合,能够更好地捕获长HTML文档的语义。通过查看下面的图片,可以清晰的看到这种组合的效果:

来源:谷歌

此外,WebAgent取得了哪些成果?它击败了一些模型。

WebAgent为自主网络代理设立了一个新的技术标杆。

让开,新的王者在这里。

与以往的大多数网络代理相比,在real网站上使用时的成功率在10%到20%之间,而WebAgent的成功率则飙升至65%,高出3到6倍。

但最令人印象深刻的是,当他们将HTML-T5(只是WebAgent的一部分)与一个流行的网络搜索基准进行比较时。

它不仅表现得非常出色,得分高达76%,而且还击败了其他更大的模型,如Flan-T5-XXL(110亿个参数,而HTML-T5只有30亿个参数)

但对我来说,WebAgent的意义远不止表面上看到的那么简单。

这证明了人工智能的发展方向。虽然像ChatGPT这样的通用模型肯定仍然很重要,但像HTML-T5这样的领域特定的LLM将发挥关键作用,尽管规模要小得多,但它们能够在其特定领域中发挥同样作用,甚至更好。

因此,就像几乎任何技术领域一样,像WebAgent这样结合了通用(FLAN)和领域特定(HTML-T5)两者优点的模块化模型将成为常态。

谷歌,现在怎么办?

撇开技术讨论不谈,这次发布也向搜索引擎公司发出了一个强有力的信息。

不可否认,它们的商业模式即将改变,这意味着那些无法适应的企业将面临死亡。

我的意思是,如果没有人在网上搜索,那么在网上做广告宣传又有什么意义呢?

谷歌也知道这一点,那么你认为谷歌将如何在WebAgent等模型不断变化的新环境中生存?

这不是“是否”的问题,而是“何时”的问题。

原文作者:Ignacio de Gregorio

翻译作者:文玲

美工编辑:过儿

校对审稿:Chuang

原文链接:https://medium.com/@ignacio.de.gregorio.noblejas/google-webagent-f1a971577b92

数据应用学院本周公开课预告

当前生成式人工智能的产品和发展前景

如何建立一个全自动的数据漂移检测管道

迎战秋招,商业分析师求职训练营限量半价!

5个ChatGPT插件,让你领先于99%的数据科学家!

求职必杀技!Linkedin中的个人品牌塑造(针对IT和数据专业人士)

点「在看」的人都变好看了哦

点击“阅读原文”查看数据应用学院核心课程


http://www.hkcw.cn/article/DnUuRFTHTa.shtml

相关文章

原创《武动乾坤》是烂剧吗?这就是杨洋的林动

这部名为《武动乾坤》(《武动乾坤之英雄出少年》)的国产电视剧是根据网络作家天蚕土豆的同名玄幻小说改编而成的,由导演张黎编剧,并由杨洋、张天爱、吴尊、王丽坤、释小龙、柳岩、杨皓宇、谢君豪等人共同主演的古装武侠玄幻剧。 有人说《武动乾坤》和《斗破苍穹》的套路相似…

印度女星遭轮奸,看完这部纪录片你会更愤怒!

前段时间有一个这样的新闻女星巴瓦纳(Bhavana)在回家的车中,途中遭1辆轻型货车蓄意追撞,接着连人带车遭6名男子挟持。 随后暴徒们开着车子四处绕,并在车上对巴瓦纳实施了强奸。 暴行持续了长达两个小时,女星还被拍照勒索。在被施暴虐待之后,巴瓦纳被扔出车外,施暴者扬长而…

VR新鲜报:泷泽萝拉拍情趣VR片助阵小辣椒

简介:VR新鲜报是我泡的一档特色新闻栏目,小的们会将每天较为热门的VR、AR、甚至AI类新闻汇总到这里集中展示,新闻内容除了来自我们自己网站以外,也会有部分来自微博、微信、外媒报道等新闻渠道,希望在帮助大家获取新闻资讯的同时,也可以博各位观众老爷一笑。—泷泽萝拉拍…

“艳门”事件波及15位女星,应采儿成唯一全身而退者

近日,摄影师陈老师的艳门照事件引发广泛关注。这起事件不仅给娱乐圈的女明星们带来了负面影响,也让普通民众大跌眼镜。在这起事件中,有多位女明星受到影响,其中最严重的是小林青霞和阿娇。阿娇因此事遭受邻居和家人指责,甚至一度患上抑郁症,甚至出现轻生倾向。另一位受影…

主持人边策男友是谁?边策事件真相究竟是怎么回事

边策曾是央视主持人,因相貌英俊,主持功底深厚,所以未来发展很被看好。但是后来边策在当红期选择结束自己的生命,同时还牵出同事件,让大众改变对边策的看法。边策走后,网上传出很多消息,有人说边策是被同男友出卖了,毁了前途,所以他只能选择极端。不知道边策男友是谁?…

原创王君馨:进女团追梦,年纪没有成为负担

说到王君馨,或许在大多数人的心目中,她并不算什么。她就是《了不起舞社》的新成员,虽然已经老了,但却一直在追逐自己的梦想。她究竟是什么人,让我们来了解一下。王君馨,香港香港女星,1985,生于我们香港,纽约曼哈坦舞蹈学校。2007,她在香港小姐的比赛中以第二名的身份…

原创太经典!男人装杂志历代最佳封面女郎,是你的pick吗

《男人装》是时尚集团在2004年推出的一本男性综合类时尚杂志,有中国的花花公子之称。今天就为大家带来我心目中最佳的男人装历代封面女郎,看看也是你的pick吗? 虽然在最佳名单里,不得不说刘诗诗端正秀雅的长相实在是不太符合这种蕾丝皮裤式硬拗出来的“性感”,只能算是个另…

原创熊黛林新电影尺度大,片中遭男主角侵犯,拍亲热戏获丈夫批准

本文编辑剧透机构:issac 未经授权严禁转载,发现抄袭者进行全网投诉 知名女演员、超模熊黛林,虽然已婚并生下了女儿,但整体状态还是相当不错的。成功嫁入豪门后,熊黛林并没有在家里做富婆的安心。相反,她在丈夫的鼓励和支持下,继续在娱乐圈发展自己的演艺事业。近日,她主…

8部新海诚的电影,你看过几部?

最近动画电影《铃芽之旅》在国内上映,票房大爆。 导演新海诚是继宫崎骏之后的日本动画导演。 今天君君就来盘点下新海诚的动画。 1.《星之声》2002 豆瓣评分:8.1 推荐指数:★★★★ 科幻冒险故事 为了追捕侵袭火星的外星人,宇宙探索舰在各地挑选先发人员,初中生美加子也…

科技动画制作详解:从构思到成片的完整流程

科技动画,作为现代数字媒体的重要组成部分,凭借其独特的视觉表现力和信息传达能力,在科技教育、产品展示、科普宣传等领域发挥着重要作用。本文将详细介绍科技动画制作的完整流程,包括前期准备、设计、动画制作、后期处理以及发布等各个环节。一、前期准备 1. 项目分析与定…

2019年属猴人运势运程完整版大全详解

属猴的人2019年全年运程大全及破解 2019年是己亥猪年,对于属猴人来说是害太岁的一年。害太岁(又名穿太岁或太岁相害)是指出生年地支跟流年地支相害, 其影响力量较冲太岁为低。与坐太岁、冲太岁、刑太岁、会太岁、合太岁、破太岁合称为犯太岁。流年害太岁代表互相争斗对峙,…

Discuz论坛采集的工具和方法详解

随着网络时代的不断发展,Discuz论坛作为一个具有广泛用户基础的开源论坛系统,其采集全网文章的技术也日益受到关注。在这篇文章中,我们将专心分享通过输入关键词实现Discuz论坛的全网文章采集,同时探讨采集过程中伪原创的发布方法。毫无疑问,采集和发布已经成为网络内容管…

原创生肖鸡:12个月份12种命,你出生于哪个月,后半生就是什么命!

古话说,人的命运分两半,一半是父母给的,另一半是天地给的,所以世上有很多生来好命的人,也有很多生来命就比较苦的,从出生月份看,似乎有几分证据可循,这就是为什么同一生肖的人命运有好有坏的原因。你是天生的好命吗?生于正月:新春之时,虽万象之回春,雪地将开,冰天…

原创富豪相亲会实录,名媛们低眉俯首,像极了等待挑选的白菜

说到富豪相亲会,大家可能有些陌生,但这些年频频亮相。大有越演越烈的阵势,前段时间在成都就举行了一场富豪相亲会,这次的相亲会,堪称豪华版,为什么说是豪华版呢? 根据主办方称,18位择偶人都是身价上亿的富豪,甚至有的人身价百亿还多。全是“钻石王老五”级别,居然组团…

20张施工现场平面布置图CAD版,住宅小区/酒店/博物馆工程!

来源:土木工程干货集 文件下载方式在最后 住宅小区工程 1、住宅小区工程施工现场平面布置图-临电2、住宅小区工程施工现场平面布置图-临建3、 住宅小区工程施工现场平面布置图-临水展开全文4、住宅小区工程施工现场平面布置图-主体酒店工程 5、酒店工程施工阶段现场平面布置图…

美人计 | 周冬雨用樱花粉唇撩男神,看得我面红心跳

“ 没办法来一趟说走就走的樱花之旅,可是樱花粉唇你可以说画就画。或许你不是粉红咖,但当你看完杨幂和周冬雨的樱花唇之后可能会改变心意。 画粉唇的女人永远像在热恋 粉色并不只有俏皮,其实粉色也可以有更多的表达。亮粉色增添醒目时尚感,裸粉是外出社交的优雅范儿,如果你…

曝刘烨吸毒被抓 刘烨发微博幽默回应吸毒传言

近半个月没有更新微博的刘烨,前天还缺席了其主演的电影《北京纽约》首映式。3月3号,有网友爆料称久未现身的刘烨因吸毒被抓。此消息一出立刻引起网友们热议。 刘烨发微博回应吸毒传闻 刘烨吸毒这到底是真的假的?然而昨日下午,刘烨更新微博称,“山里拍戏,哥也是兼职摄影,…

十二生肖:属鸡人的婚姻与命运最全解析

1981年属鸡人属于那类笼藏之鸡也乃为石榴木命之鸡。本年出生的属鸡人他的为人豪爽,终身下来就是伶俐伶俐的那类人,精神也是十分的爽朗,充满阳光之气,善言能辩。干事不私心,让人感受敬沉。财帛衣服也脚用,可是独一不脚的处所就是六亲十分的冷酷,骨肉也是情疏。本年出生的…

还原“厅官三亚被扣衣物“事件:拍照发文是否作秀?

游完泳上岸,衣服却没了。近日,一则《一厅级干部在三亚被城管弄得没了尊严》的帖子及相关报道引发社会广泛热议。网帖中所涉及的当事人毕国昌因为到南方过冬,也被称为“候鸟”老人。那么,这位“候鸟”老人和三亚城管之间到底发生了什么纠葛?央视记者就此进行了深入采访,试…

咬唇妆OUT了!!来学学乔妹同款“走光唇“

如“女大十八变”一般,女人的美丽圈子也是变化万千。前两年大火的咬唇妆,几乎是明星的最爱,暗红色的唇部就像是被牙齿咬过而出现的血色似的,显示出楚楚可怜的性感。不过最近流行趋势大变,随着半丸子头、流星眉和这款“越界走光唇”火了起来,宋慧乔等一众女明星除了画流星…