持续学习新突破!登上nature!

article/2025/6/26 21:09:44

强化学习之父在Nature发表持续学习新成果!《Nature》杂志最新刊登了一篇名为《Loss of plasticity in deep continual learning》的研究论文,标志着持续学习领域的一个新里程碑。这项研究提出了一种创新算法一一持续反向传播(Continual Backpropagation),它通过在训练过程中随机重置一小部分使用频率低的神经元,保持了网络的可塑性,这对于深度学习中的持续学习是一个重大进步。

论文作者Richard Sutton,作为强化学习领域的领军人物,被誉为“强化学习之父”。他的工作不仅在时间差分学习、策略梯度方法和 Dyna架构等方面有着深远影响,而且对整个人工智能领域都产生了广泛的影响。

我整理了一些时间序列【论文+代码】合集,需要的同学公人人人号

 

论文1

标题:

A Comprehensive Survey of Continual Learning: Theory, Method and Application持续学习:理论、方法与应用综述

法:

  • 提出了持续学习的基本框架,包括其在动态数据分布下的学习过程。

  • 分析了持续学习中的典型场景,如任务增量学习、域增量学习、类增量学习等。

  • 提供了评估持续学习性能的指标,如平均准确率、遗忘量度和前向转移量度。

  • 深入讨论了持续学习的理论基础,包括稳定性-可塑性权衡和泛化能力。

  • 总结了持续学习的代表性方法,如正则化方法、经验回放方法、优化方法、表示方法和架构方法,并详细分析了它们的动机、实现和性能。

创新点:

  • 提供了持续学习的最新进展的全面概述,填补了现有综述的空白,为后续研究提供了宝贵的资源。
    • 强调了在资源效率、模型更新和任务适应性方面对现有方法的改进,推动了持续学习领域的发展。

    • 通过深入分析不同方法在不同场景下的性能,为实际应用中的持续学习提供了指导。

    • 提出了持续学习的理论基础,为理解和设计新的持续学习算法提供了理论支持。

 

论文2

标题:

Achieving a Better Stability-Plasticity Trade-off via Auxiliary Networks in Continual 

通过辅助网络在持续学习中实现更好的稳定性-可塑性权衡

法:

    • 提出了辅助网络持续学习(ANCL)框架,该框架通过引入一个额外的辅助网络来促进持续学习模型的可塑性。

    • ANCL框架通过正则化器自然地在稳定性和平滑性之间进行插值,超越了强大的基线方法。

    • 通过权重距离、中心核对齐和平均准确率景观等分析方法,深入研究了ANCL解决方案中的稳定性-可塑性权衡。

    创新点:

      • ANCL方法在任务增量和类增量场景下均优于现有的持续学习基线方法,性能提升显著。

      • 通过实验验证,ANCL在CIFAR-100和Tiny ImageNet数据集上均表现出色,平均准确率提高了1-3%。

      • 提供了对稳定性-可塑性权衡机制的深入分析,为理解持续学习中的交互机制提供了新的视角。

       

      论文3

      标题:

      Boosting Continual Learning of Vision-Language Models via Mixture-of-Experts Adapters

      通过专家混合适配器提升视觉-语言模型的持续学习能力

      方法:

      • 提出了一个参数高效的持续学习框架,通过在预训练的CLIP模型上动态扩展混合专家(MoE)适配器来应对大规模模型中的性能退化问题。

      • 引入了分布判别自选择器(DDAS),自动将输入数据路由到MoE适配器或原始CLIP,以实现对已见数据和未见数据的有效预测。

      • 通过增量激活-冻结策略,使专家能够同时获取任务内知识并参与任务间协作。

      创新点:

        • 在多任务和类增量学习场景中,该方法在保持零样本泛化能力的同时,显著减少了参数训练负担,减少了约60%。

        • 在有限样本的持续学习中,该模型表现出色,平均准确率提高了3.6%,7.0%和4.2%。

        • 通过实验验证,该方法在各种设置中均优于现有方法,包括动态扩展和CLIP基方法。

        论文4

        标题:

        Computationally Budgeted Continual Learning: What Does Matter计算预算内的持续学习:什么才是关键

        法:

          • 重新审视了持续学习问题,特别是在计算预算受限的设置下,分析了传统持续学习方法的性能。

          • 通过大规模基准测试,评估了不同的持续学习采样策略、蒸馏损失和部分微调方法。

          • 在ImageNet2K和Continual Google Landmarks V2等大规模数据集上,进行了数据增量、类增量和时间增量设置的实验。

          创新点:

            • 发现即使在计算受限的设置下,简单的最小基线方法(如均匀采样)也能胜过现有的持续学习方法。

            • 证明了在计算预算受限的情况下,现有持续学习方法的性能普遍不佳,而简单的经验风险最小化方法在这些条件下表现更好。

            • 通过实验验证,即使在不同的计算预算和时间步数下,这些结论仍然成立,为持续学习的实际应用提供了新的视角。

             

             


            http://www.hkcw.cn/article/OjEDMhTqiF.shtml

            相关文章

            兵马俑修复曾被指需要半年时间 实际难度远超预期

            5月30日,陕西西安秦始皇兵马俑博物馆内发生了一起意外事件。一名男子进入三号坑中,躺在地面上,旁边有倒下的陶俑以及陶俑残片。专家表示,损坏的兵马俑修复起来非常困难,甚至比刚出土时的修复和拼接还要难。苏州考古博物馆馆长、苏州考古所所长程义解释说,兵马俑刚被发掘出…

            “内鬼”李卓勋任上被查 涉嫌严重违纪违法

            黑龙江省哈尔滨市纪委监委第九审查调查室主任李卓勋因涉嫌严重违纪违法,正在接受纪律审查和监察调查。这一消息由“清廉龙江”于5月30日发布。李卓勋出生于1973年11月,是黑龙江双城人。他于1994年6月参加工作,并在1997年6月加入中国共产党。李卓勋毕业于省委党校法律专业,在…

            在哈佛演讲的25岁中国女生发声 签证不确定性影响未来规划

            5月30日,在哈佛大学毕业典礼上,中国学生蒋雨融穿着中国传统服饰发表了动情演讲。25岁的蒋雨融来自青岛,获得了哈佛大学国际发展方向的公共行政硕士学位。她提到,特朗普政府威胁遣返学生签证持有者,给她的未来带来了极大不确定性。蒋雨融开始考虑在海外从事国际发展工作。她…

            vm文件传输

            1、安装VMware Tool工具,然后直接拖拉文件进虚拟机里(menu->vn->)。 2、安装VMware Tool工具后设置共享目录。 3、Serv-Uflashfxp 架设FTP服务器,作为虚拟机与主机之间传输文件。

            媒体:欧冠决赛边路是争夺焦点 双雄边路对决引发关注

            北京时间6月1日凌晨,本赛季欧洲足坛的压轴大戏如期上演,国际米兰和巴黎圣日耳曼争夺欧冠冠军。两队赛季初都不被看好,但最终在慕尼黑安联球场相遇,双方都志在必得。登贝莱让所有欧冠对手头疼。边路成为比赛的关键点。尽管两队此前未曾交手,但这个赛季的欧冠征程已让彼此印…

            XCTF-web-Cat

            尝试输入127.0.0.1 尝试127.0.0.1;ls 试了很多,都错误,尝试在url里直接输入,最后发现输入%8f报错 发现了Django和DEBUG 根据Django的目录,我们使用进行文件传递 尝试?url/opt/api/database.sqlite3,找到了flag

            YOLO12 改进|融入 Mamba 架构:高效视觉状态空间模块 EVSS 模块,模糊图像清晰化与特征增强, 提升小目标 多尺度

            在图像去模糊领域,卷积神经网络(CNNs)因卷积操作的局部性和空间不变性,难以捕捉全局信息和空间变化特性;Transformer 虽能通过自注意力机制建模长距离依赖,但计算复杂度随分辨率呈二次增长,不适…

            国足将全员奔赴印尼客场 备战关键之战

            中国男足计划于6月2日下午从上海出发,前往印尼雅加达,准备参加6月5日18强赛第9轮对阵印尼队的关键比赛。随着出征时间临近,国足的训练量有所减少,重点转向针对对手的防守策略。教练组提醒队员们在客场比赛中要尽可能控球,同时减少犯规,以免被裁判抓住机会。此前受伤的汪士…

            安装CUDA:AI大模型软件实现GPU加速(2025最新版)

            本文主要介绍在Windows系统中,针对NVIDIA GeForce RTX 50 系列显卡,安装CUDA 12.9版本,实现大模型软件加速的方法。 NVIDIA GeForce RTX 旧版的显卡也都支持CUDA,只是版本有所不同。由于AMD的ROCm在Windows中运行需要WSL&#xff…

            女子与被执行人姓名同音 屡被法院找 身份误认影响生活

            近日,河北省廊坊市的颜女士反映,因身份信息被错列为一起经济纠纷案件被执行人,两年内多次被廊坊市广阳区人民法院核查、传唤。即使她多次澄清,执行局工作人员仍携民事判决书到其工作单位调查。颜女士认为法院工作人员执行程序违法,并对其身心、名誉造成损害。她通过多种方…

            田径亚锦赛女子400米栏莫家蝶夺冠 完美逆袭亚洲纪录保持者

            5月31日,2025年亚洲田径锦标赛迎来最后一个比赛日的争夺。广东跨栏名将莫家蝶在女子400米栏决赛中以55秒31的成绩夺得冠军,并创造了今年亚洲最佳成绩。这是中国田径继2005年黄潇潇之后时隔20年再度收获该项目的亚洲冠军。16岁的陈妤颉在女子200米决赛中以22秒97的成绩摘得金牌…

            河北“狗王”海外爆火 土狗成全球网红

            近日,河北承德一只名叫“长毛”的土狗因轻松拿捏犬群而全球爆红,被外国网友狂赞为“中国狗王”。其视频在YouTube、TikTok等平台累计播放量突破3亿次,全球社交平台上掀起了现象级传播浪潮,衍生出超过20种语言的二次创作内容。国外粉丝甚至将“长毛”的形象印在T恤上,并为它…

            大量西瓜被扔进鱼塘喂鱼?当地回应 供大于求致价格跳水

            近日,有博主发布视频称广西崇左扶绥县的西瓜价格大幅下跌,部分瓜农将西瓜扔进鱼塘喂鱼,甚至有几万斤西瓜烂在地里。5月30日,扶绥县经济作物站工作人员表示,网传视频中被扔进鱼塘的主要是尾瓜和次瓜,这些西瓜质量不好,无法销售,因此用这种方式处理。当地政府正在积极寻找…

            俄乌第二轮会谈能否打破僵局 停火条件成焦点

            当地时间5月30日,俄罗斯总统新闻秘书佩斯科夫表示,俄罗斯代表团将前往伊斯坦布尔,并准备好在6月2日与乌克兰开启第二轮谈判。即将举行的第二轮俄乌谈判中,核心问题仍然是停火。北京外国语大学国际关系学院教授王朔指出,约半个月前的首轮直接谈判因双方意见分歧未能取得实质…

            韩国大选最大的变数是什么 候选人合并成关键

            韩国第21届总统选举投票将于6月3日举行。尽管共同民主党候选人李在明目前支持率领先,但选情仍充满变数。随着大选进入最后倒计时,国民力量党总统候选人金文洙和改革新党候选人李俊锡的支持率双双上升,两者支持率之和已接近李在明。保守阵营能否通过推举单一候选人实现逆转成…

            截屏精灵:轻松截屏,高效编辑

            在移动互联网时代,截图已经成为我们日常使用手机时的一项基本操作。无论是记录重要信息、分享有趣内容,还是进行学习和工作,一款好用的截图工具都能极大地提升我们的效率。截屏精灵就是这样一款功能强大、操作简单的截图工具,它不…

            美对C919出手 打得越狠中国越强 加速自主研发进程

            近日,有消息指出美国政府暂停了部分允许美国公司向中国商用飞机有限责任公司(中国商飞)出售产品和技术的许可证。对此,香港《南华早报》援引分析称,虽然短期内这可能推迟中国喷气发动机的国产化进程,但任何挫折都只会坚定中国自主自强的决心。分析人士认为,中国将在未来…

            世界海拔最高的龙舟赛在哪里 高原竞渡创纪录

            今天是端午节,全国各地都掀起了赛龙舟的热潮。在西藏拉萨,2025年西藏自治区端午节牛皮船(龙舟)赛创造了世界海拔最高的龙舟赛纪录,比赛场地海拔高度为3645.9米,这一成就得到了世界纪录认证机构(WRCA)的认可。来自全国各地的160名选手组成10支龙舟队伍和20支牛皮船队伍,…

            媒体:精神病患者是如何“入坑”的 法律责任待鉴定

            5月31日,西安市公安局临潼分局发布警情通报,5月30日,孙某进入兵马俑景区参观时,翻越遗址坑护栏及防护网跳至三号坑内推拉陶俑,造成两尊铠甲武士俑不同程度损坏。目前,孙某已被公安机关控制,经查,孙某患有精神疾病,案件正在进一步办理中。千年国之瑰宝遭此横祸,让人痛…

            余承东:可能不会再有新的“界”了 五界合作已足够

            5月31日,华为常务董事、终端BG董事长余承东在2025未来汽车先行者大会上透露,鸿蒙智行目前拥有“五界”,并暗示未来可能不会再有新的“界”。最初认为只有“四界”,但在上汽集团总裁贾健旭等领导的推动下,增加了一界。他强调,维持五个界已非常困难,因此不太可能再增加新的…