AAAI 2025论文分享│STD-PLM:基于预训练语言模型的时空数据预测与补全方法

article/2025/7/2 7:45:35

本文详细介绍了一篇发表于人工智能顶级会议AAAI 2025的论文《STD-PLM: Understanding Both Spatial and Temporal Properties of Spatial-Temporal Data with PLM》。该论文提出了一种基于预训练语言模型(Pre-trained Language Model‌,PLM)的时空预测与补全统一框架STD-PLM。通过显式设计的时空标记器和时空嵌入,STD-PLM 能够有效理解时空数据的空间和时间特性。此外,还引入沙漏注意力模块(Sandglass Attention.SGA),通过构建区域级空间标记显著降低计算成本。大量实验表明,STD-PLM表现出具有竞争力的性能。论文的工作表明,构建基于PLM的统一预训练时空模型具有广阔前景。

本推文由韩煦撰写,审核为邓镝。

原文链接:https://arxiv.org/html/2407.09096v4

代码链接:https://github.com/Hyheng/STD-PLM

一、研究背景

时空数据的时空特性理解对智能交通、城市规划等动态系统至关重要,其中时空预测与补全是核心任务。精准的预测可优化交通管理与出行规划,补全则能支撑时空模式分析及下游任务。然而,现有方法存在以下核心挑战:

  1. 时空相关性建模不足:传统PLM缺乏对时间序列动态性、空间拓扑结构(如节点连通性)及高阶时空交互的显式建模;
  2. 任务适配性差:现有PLM-based方法多聚焦预测任务,补全能力不足,且难以同时支持多任务;
  3. 计算效率瓶颈:PLM的高维嵌入与大量tokens导致处理时空数据时训练和推理成本激增;

该论文的主要贡献如下。

  1. 提出STD-PLM统一框架。设计基于预训练语言模型的时空预测与补全统一框架,实现对时空数据的空间和时间特性的联合建模,同时支持时空预测、补全、零样本及少样本学习任务。
  2. 设计拓扑感知节点嵌入,利用图拉普拉斯矩阵的特征向量捕捉空间拓扑结构,使PLM能感知节点间的静态关系与动态状态。
  3. 开发空间和时间标记器,从时空双维度将数据转换为PLM可处理的标记序列,显式建模时间相关性、空间连通性及高阶时空交互。
  4. 设计沙漏注意力模块(SGA),通过区域级标记聚合减少计算量,结合约束损失函数强制模型学习符合原始图结构的特征,在保证性能的同时显著提升计算效率。

 二、方法

1、方法概述

1 STD-PLM 模型架构

图1展示了STD-PLM模型架构,图中将模型分为了四部分:模块A为节点和时间信息提供时空嵌入。时空标记器B从不同角度构建时间标记和空间标记。模块C基于B-2输出的节点级空间标记构建区域级空间标记。模块D将隐藏表示投影到目标输出。对于预训练语言模型,采用了部分冻结策略,并结合低秩适应技术对多头注意力、位置嵌入和层归一化层进行微调。

2、时空嵌入

拓扑感知节点嵌入:利用图拉普拉斯矩阵的特征向量捕捉空间节点的拓扑结构,通过选取前 K大特征值对应的特征向量,生成包含节点连通性信息的嵌入表示,其作用为捕捉节点在空间网络中的拓扑属性(如枢纽节点与边缘节点的差异),支持归纳式学习(即模型可泛化到未见过的图结构,如不同城市的交通网络)。

周期感知时间嵌入:结合 “小时级” 和 “星期级” 周期性粒度,构建时间嵌入字典,通过查表与拼接操作生成包含时间上下文的向量,捕捉数据的周期性波动模式。

3、时空标记器

空间标记器为每个节点生成包含 “静态属性”(节点嵌入与时间嵌入)、“动态状态”(历史数据特征)和 “缺失掩码” 的标记,支持 PLM 建模节点间的复杂空间依赖;

内在状态:拼接时间与节点嵌入,通过 MLP 提取静态时空特征(如节点在特定时段的拓扑角色)。

动态状态:直接对原始数据应用多层感知机( Multilayer Perceptron‌,MLP),捕捉实时动态特征(如节点的流量、速度)。

掩码标记:将二进制掩码转换为标记,显式提示缺失位置(补全任务关键)。
融合操作:通过逐元素相加与层归一化,生成包含 “动态 + 静态 + 缺失” 信息的复合标记。

时间标记器通过全局聚合节点信息,生成 “整体状态” 与 “变化趋势” 标记,帮助 PLM 捕捉时空数据的宏观演化规律,避免仅依赖局部节点信息。

整体状态:融合全局平均状态与最后时刻的时间嵌入,体现当前系统整体状态。

整体趋势:融合全局趋势与时间嵌入,表征 “系统随时间的变化方向”

4、沙漏注意力模块

编码器:通过可学习查询矩阵将节点级空间标记压缩为更少的区域级标记,减少计算量的同时捕捉非成对、高阶时空相关性;

解码器:将区域级表示还原为节点级,结合约束损失函数(强制区域划分符合原始图结构),确保压缩过程中拓扑信息不丢失;

效率优化:通过稀疏注意力机制与区域级聚合,显著降低 PLM 处理大规模节点时的时间与内存开销。

三、实验

1.实验设置

数据集:在交通领域的四个真实数据集(PEMS03/04/07/08)上,STD-PLM通过多维度实验验证了其在时空预测、补全及少样本场景下的领先性能。

基线对比:选取LSTM、ASTGCN等 7 种传统深度学习模型,以及OFA、STGLLM等 3 种 PLM-based 模型作为基线;

训练策略:采用6:2:2的数据集划分,滑动窗口构建样本,使用AdaW优化器及LoRA技术微调 PLM 参数,平衡效率与性能。

2、与最先进方法的比较

基线模型有两种,包括六种传统深度学习模型和三种基于预训练语言模型的模型。

1 预测性能

表1展示了 STD-PLM 与六种传统深度学习模型(如LSTM、ASTGCN等)及三种PLM-based模型(如OFA、STGLLM等)在四个交通数据集上的预测性能对比,指标包括MAE(平均绝对误差)、RMSE(均方根误差)和MAPE(平均绝对百分比误差)。STD-PLM在所有数据集上实现最优或次优性能。

2 在PEMS08数据集上的补全性能

表2展示了STD-PLM与BRITS、E2GAN等4种基线模型在PEMS08数据集高缺失率(70%)场景下的补全性能,结果显示:在随机缺失(RM)和时空连续缺失(CM)两种模式中,STD-PLM均以显著优势领先——RM 场景下 MAE为14.36,CM 场景下MAE为22.69。其核心优势源于掩码标记显式定位缺失位置、时空嵌入融合拓扑与周期先验及PLM 生成能力支持长程推理,使模型在高缺失率下仍能结合全局趋势(如早晚高峰规律)与局部拓扑关联(生成合理补全值,突破了传统方法依赖局部观测或数据拟合的局限,为传感器故障、数据采集不全等实际场景提供了高效可靠的解决方案。

3、消融研究

消融研究通过移除STD-PLM的关键组件,验证各模块对性能的贡献。假设表3对比了以下变体:

  1. 完整模型(STD-PLM):包含时空嵌入、时空标记器、沙漏注意力模块(SGA)及PLM微调策略;
  2. w/o 时空嵌入:移除拓扑感知节点嵌入与时间周期嵌入,仅用原始数据特征;
  3. w/o 时空标记器:直接将原始数据输入PLM,不进行时空维度解耦;
  4. w/o SGA 模块:保留节点级标记,不进行区域压缩;
  5. w/o 掩码标记:在补全任务中移除缺失模式编码。

表 3 消融分析

消融研究证实了STD-PLM的每个组件均不可替代:时空嵌入注入领域先验,时空标记器激活PLM时空理解,SGA模块优化计算效率,掩码标记增强补全针对性。这一结果不仅验证了模型设计的合理性,也为后续时空PLM的组件优化提供了方向。

四、总结

本文介绍了STD-PLM模型,旨在通过预训练语言模型解决时空数据的预测与补全问题。模型通过时空嵌入模块生成拓扑感知的节点嵌入与周期感知的时间嵌入,融合空间结构与时间规律;利用时空标记器解耦时空维度,构建包含动态状态、静态先验及缺失掩码的节点级标记与全局时间趋势标记;通过沙漏注意力模块压缩节点级标记为区域级以降低预训练语言模型的计算复杂度,同时通过约束损失保留拓扑信息;采用部分冻结预训练语言模型结合低秩自适应‌微调策略平衡预训练知识与任务适配性。实验表明,STD-PLM在交通数据集PEMS03/04/07/08的预测与补全任务中性能显著优于传统深度学习模型及其他PLM-based模型,尤其在70% 高缺失率场景下补全误差降低超40%,消融研究验证了各组件的必要性。该模型通过时空特性显式建模、预训练语言模型的推理能力与效率优化的结合,为时空智能任务提供了高效且泛化性强的解决方案,适用于智能交通、城市计算等数据稀缺或大规模场景。


http://www.hkcw.cn/article/HBqkCRUNFs.shtml

相关文章

抗辐照加固CANFD芯片:以车规级设计提升商业航天系统可靠性

摘要 商业航天领域的发展对电子系统的可靠性和抗辐照能力提出了更高要求。本文深入探讨了抗辐照加固CANFD芯片如何借助车规级设计,增强商业航天系统的可靠性。本文以国科安芯CANFD芯片ASM1042为例,通过对芯片单粒子效应脉冲激光试验报告、数据手册及芯片…

曼联亚洲行第二站3-1战胜中国香港队 逆转取胜展现实力

曼联队在5月30日于香港大球场进行的一场友谊赛中,以3:1逆转战胜中国香港队。此前,曼联在马来西亚吉隆坡的首场比赛中以0:1不敌东盟全明星队。本次亚洲之行,曼联最终以一胜一负的成绩结束。比赛开始后不久,曼联便陷入被动,第19分钟被儒尼奥尔左路突破防守抽射入网,比分变为…

高考人数下降 上好大学会更容易吗 报名人数减少竞争减小

2025年全国高考将于6月7日至8日举行。教育部官网消息显示,2025年全国高考报名人数为1335万人,这是自2018年以来首次出现下降。过去几年,全国高考报名人数经历了先降后升的过程。2008年达到顶峰1061万人,随后逐年减少,至2013年降至912万人。2014年至2017年间,报考人数相对…

耿爽敦促美方停止无聊的指责游戏 聚焦外交努力

当地时间5月30日,中国常驻联合国副代表耿爽在安理会审议向乌克兰提供武器问题时发言指出,战场上武器数量不断增加只会加剧对抗、延长战火,敦促美方聚焦当前的外交努力,停止无聊的指责游戏。自战争爆发以来,中方一直呼吁冲突当事方尽快停火止战、开启谈判、恢复和平。遗憾的…

国际油价5月30日小幅下跌 新华社发布图表

新华社图表,北京,2025年5月31日新华社发责任编辑:zhangxiaohua

湖南一溶洞清出垃圾3000斤 排污问题引关注

近日,有网友反映湖南省张家界市慈利县一处天然溶洞遭到人为排污,导致洞内被污染,引起广泛关注。该溶洞位于通津铺镇长峪铺村杨家坡,属于喀斯特地貌,垂直深度约150米。洞内存有陈年垃圾和污水,近期因暴雨导致洞内污水上涨并外溢至溇水。初步调查显示,污染是由当地部分养殖…

暴雨黄警发布 10省份有大到暴雨 警惕次生灾害

据中央气象台消息,5月27日,强降雨主要出现在贵州中东部、湖南中西部、重庆东南部、四川南部、云南北部、海南岛南部等地。预计今天,强降雨落区东移南压至江西南部、福建、广西东部、广东等地,公众需及时关注预报预警信息,警惕强降雨可能引发的次生灾害,注意出行安全。今晨…

Postgres Checkpointer 实战:优化数据持久化性能的策略

如果你正在经历一段格外艰难的人生,请允许我祝福你可以从今天开始,邂逅最棒的一年。 ——莉兹克里莫 本文将使用 langgraph-checkpoint-postgres 库,将 Postgres 作为后端来持久化 checkpoint 状态。温馨提示:本文搭配 jupyter-la…

【清晰教程】利用Git工具将本地项目push上传至GitHub仓库中

Git 是一个分布式版本控制系统,由 Linus Torvalds 创建,用于有效、高速地处理从小到大的项目版本管理。GitHub 是一个基于 Git 的代码托管平台,提供了额外的协作和社交功能,使项目管理更加高效。它们为项目代码管理、团队协作和持…

雷达目标起伏特性简析

目录 一、五种起伏模型辨析 二、数学模型 一、五种起伏模型辨析 在《雷达搜索状态下的脉冲积累雷达方程-CSDN博客》中提到雷达方程模型是假定是非起伏目标,即目标RCS是稳定的,然而在真实的雷达搜索目标的过程中,目标的RCS总是变化的&#xf…

差分与共模的相互转化:

差分与共模的相互转化: 理想情况下,如果在差分对接收端,两个单端信号完全对称,即幅度相同、翻转方向相反、边沿对齐,那么共模信号将是恒定的电平,如图8-21a所示。但是实际中两个单端信号不可能完全对称,比如…

python-pptx去除形状默认的阴影

文章目录 效果原理1. 阴影继承机制解析2. XML层操作细节3. 注意事项 扩展应用1. 批量去除阴影2. 复合效果控制 效果 右边这个是直接添加一个形状。可以看到它会默认被赋予一个阴影。 然而,这个东西在特定的场合,其实是我们所不需要的。 那怎么把这个阴…

使用pydantic-i18n将fastapi的接口返回消息翻译成中文

使用fastapi时,发现接口报错的结果是英文的,自己的英语水平不太行,就想能不能翻译成中文,发现果然有办法。 先看结果: 实现方法: 参考链接pydantic-i18n PyPI 首先执行如下代码获取原有的英文翻译字典 …

说一说SAP系统从Non-Unicode到Unicode的演化

当前的 SAP 系统基本上都是 Unicode 系统。然而,在 SAP 的发展过程中,最初并不是 Unicode 系统,而是 Non-Unicode 系统。 1. 什么是 Non-Unicode 和 Unicode? Non-Unicode 系统: 在 Non-Unicode 系统中,字符…

特朗普马斯克发表“分手感言” 称赞成就与未来合作

5月30日,美国总统特朗普与美国企业家、政府效率部负责人埃隆马斯克在白宫召开新闻发布会。会上,特朗普对马斯克领导的“政府效率部”所取得的成绩表示赞赏,称该部门聘请了计算机领域的杰出人才。特朗普还提到,政府将致力于推动“政府效率部”削减政府开支政策的永久化。他指…

特朗普称将把进口钢铁关税提高至50% 加强行业保护

当地时间5月30日,美国总统特朗普宣布将进口钢铁的关税从25%提高至50%。美国白宫当天在社交媒体上发布公告,表示此举是为了进一步保护美国钢铁行业免受外国和不公平竞争的影响,并指出新的关税政策将从下周开始实施。特朗普曾于2月10日签署行政命令,对所有进口至美国的钢铁和…

警方:跳进兵马俑坑男子有精神疾病 警情通报发布

5月31日凌晨3点15分,新浪微博账号@平安临潼发布了一则警情通报。责任编辑:zhangxiaohua

5月全国各地经济社会发展观察 高质量发展新图景绘就

5月,万物繁茂。消费新动能持续涌动、夏粮生产力保丰收、就业岗位挖潜扩容、城市更新提升民生福祉……一派充满生机的高质量发展新图景在神州大地不断绘就。临近端午小长假,北京的宋女士这几天正忙着订火车票和酒店,准备利用假期去河南游玩。她说:“想去看石窟、吃水席,还要…

白皮精读:70页 2025 基于数据空间的金融数据可信流通研究报告【附全文阅读】

该报告聚焦金融数据可信流通,基于数据空间理念,分析全球及我国金融数据流通现状与挑战,提出包含典型场景、关键角色、流通模式及技术方案的可信流通框架,并通过中信银行、工银金租等多个实践案例验证其可行性。报告指出当前面临法…

【解决办法】Git报错error: src refspec main does not match any.

在命令行中使用 Git 进行 git push -u origin main 操作时遇到报错error: src refspec main does not match any。另一个错误信息是:error: failed to push some refs to https://github.com/xxx/xxx.git.这是在一个新设备操作时遇到的问题,之前没有注意…