AAAI 2023 | 面向低质量数据的时空预测
©PaperWeekly 原创 · 作者 | 寄家豪
单位 | 北京航空航天大学
研究方向 | 时空数据挖掘
论文标题:
Spatio-Temporal Self-Supervised Learning for Traffic Flow Prediction
https://doi.org/10.48550/arXiv.2212.04475
https://github.com/Echo-Ji/ST-SSL
研究背景
时空预测广泛存在于我们生活的方方面面,例如交通预测、细粒度疫情预测、空气质量预测等,由于待预测的数据同时存在时间属性和空间属性,因此这类问题被称为时空预测。
本文介绍
交通预测通常会面临数据质量低的问题,这些低质量数据主要指城市郊区的交通数据比较稀疏。原因在于郊区人口稀少、交通活动强度低。而这些数据稀疏的地方通常不被预测模型所关注,因此预测误差较大,这就会导致模型在这些区域的泛化性不足。
因此,建模数据分布的异质性,是提升模型在低质量数据上泛化性能的关键。为此,我们首次引入自监督学习方法来解决这一问题,时空自监督学习模型 ST-SSL(Spatio-Temporal Self-Supervised Learning)应运而生。
模型架构
该模块是一个多层卷积结构。在每一个卷积层,模型依次进行三次卷积:时间卷积-空间卷积-时间卷积。其中,
时间卷积阶段,在时间维上进行一维卷积,以捕获不同时间步的特征相关性。这一操作对不同节点分开进行。 空间卷积阶段,利用地理邻接矩阵,将不同节点的信息进行传播和聚合,以捕获节点间特征相关性。这一操作对不同时间步分开进行。
3.2 自适应数据增强
在这一阶段,ST-SSL 利用数据异质性信息,分别在时间和空间两个层面进行数据增强。
在时间层面,ST-SSL 依据各个时间步同整个时间序列的异质程度,对时间步进行遮盖(mask)。这一操作对不同节点分开进行。由于这一步操作作用在交通流数据上,所以称为 Traffic-level 增强。
而在空间层面,我们以区域间的邻接矩阵为对象,依据不同节点间时空模式的异质程度,对节点间连边进行删除或增加。异质程度越高,则越可能被删除,异质性程度越低,则越可能被增加。由于这一步操作作用在交通图的拓扑结构上,所以称为 Topology-level 增强。
在空间异质性捕获部分,模型利用软聚类方法,增强模型对不同地区不同时空模式的区分能力。模型使用深度学习方式对模型的增强表征进行软聚类,计算每个节点被分到各个簇的概率。并期望原始表征能够准确预测每个区域所属的类簇。因为增强数据的时间和空间异质性更低,所以生成的表征质量更高,如果用其聚类结果作为标签,可以指导原始表征的学习,使得时空编码器关注不同区域的差异。
在时间异质性捕获部分,模型计算不同时间步的对比损失。具体来说,模型对每个时间步分别计算出「整体表征向量」。随后将同一时间步下的节点表征与整体表征视为正样本,将不同时间步的节点表征与整体表征视为负样本计算对比损失,从而将时间异质性引入时空编码器,让其感知当前所处时间步的特征。
4.1 性能评估
4.2 时空稳健性分析
接下来,我们分析 ST-SSL 在空间尺度的和时间尺度上的稳健性。为此,我们在 BJTaxi 数据集上对具有不同数据分布的时间段的不同模式的空间区域分别进行了预测结果评估。
我们对比了 ST-SSL 和几个 SOTA 基线模型在不同类别区域上的预测性能,如上图(b)所示。可以发现,ST-SSL 对于数据稀疏的区域的预测性能提升更明显,这也验证了 ST-SSL 性能的空间稳健性,它可以准确预测不同类型空间区域的交通流量。
4.3 异质信息指导的数据增强
总结
在 NYCBike、NYCTaxi、BJTaxi 等数据集上进行的实验证实了 ST-SSL 模型的表现要优于现有预测模型,从而进一步证实了时空异质性在交通预测中的重要性。
更多阅读
#投 稿 通 道#
让你的文字被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。
📝 稿件基本要求:
• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注
• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题
• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算
📬 投稿通道:
• 投稿邮箱:[email protected]
• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者
• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿
△长按添加PaperWeekly小编
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
微信扫码关注该文公众号作者