Redian新闻
>
扩散模型还能预测地震和犯罪?清华团队最新研究提出时空扩散点过程

扩散模型还能预测地震和犯罪?清华团队最新研究提出时空扩散点过程

公众号新闻
机器之心专栏

机器之心编辑部

清华大学电子工程系城市科学与计算研究中心最新提出时空扩散点过程,突破已有方法建模时空点过程的受限概率形式和高采样成本等缺陷,实现了灵活、高效且易于计算的时空点过程模型,可广泛用于城市自然灾害、突发事故和居民活动等时空事件的建模与预测,促进城市规划和管理的智能化发展。

时空点过程是具有时间和空间属性的随机事件集合,相关研究方法主要是对随机事件在时间和空间上的分布和演化规律进行建模,这对于许多领域都至关重要,包括地震学、疾病传播、城市流动、环境监测等。然而,以往的研究在建模时通常将时间和空间视为条件独立,无法准确捕捉事件时空之间的复杂相互作用,且计算对数似然需要使用蒙特卡罗来近似积分,这导致对时空点过程的理解和预测存在很大的局限性。

清华大学电子工程系城市科学与计算研究中心近日在 KDD2023 发表论文《Spatio-temporal Diffusion Point Processes》,提出时空扩散点过程(DSTPP)模型,率先实现了对复杂时空联合分布的灵活精准建模。由于不对概率密度函数的参数形式施加任何限制,这种基于扩散模型的点过程方法解决了当前时空建模的一系列困难问题,在捕捉复杂时空动态性方面具有很大潜力。该方法建立了新的生成式时空建模范式,为该领域的研究和应用带来了新的可能性。


  • 论文链接:https://arxiv.org/abs/2305.12403
  • 开源代码及数据:https://github.com/tsinghua-fib-lab/Spatio-temporal-Diffusion-Point-Processes

针对时空点过程,研究团队提出了全新的参数化框架,利用扩散模型学习复杂的时空联合分布。该框架将目标联合分布的学习分解为多个步骤,每个步骤可由高斯分布准确描述。为了增强每个步骤的学习能力,研究团队在去噪网络中嵌入时空共注意力机制,使其能自适应地捕捉时间和空间复杂的依赖耦合关系。通过这一创新模型,研究团队首次突破了现有解决方案对时空依赖关系的建模限制,为时空点过程提供了新的建模范式。下表展示了 DSTPP 相比已有点过程解决方案的优势。

方法优势对比结果

大量来自流行病学、地震学、犯罪学和城市流动等各领域的实验表明,DSTPP 在性能上显著超越现有解决方案,平均提升幅度超过 50%。进一步深入分析验证了该模型适应不同场景下复杂时空耦合关系的能力。

这一创新研究成果为时空点过程建模提供了全新的思路和方法,具有重要的理论和应用价值。该模型的成功应用将为地震预测、疾病控制和城市规划等领域带来更准确的分析和预测能力,助力城市发展和人类福祉。

值得注意的是,该项目的论文、代码和数据集均已开源:

开源地址:https://github.com/tsinghua-fib-lab/Spatio-temporal-Diffusion-Point-Processes

效果展示

下面展示了不同数据集(地震,高斯霍克斯过程,流行病传播)的去噪过程。

日本地震分布去噪

混合高斯霍克斯过程去噪


美国新泽西州疫情分布去噪


日本地震密度图


混合高斯霍克斯过程密度图


美国新泽西州疫情密度图


方法概览

扩散去噪建模框架

该框架首先设计时空编码器学习历史时空事件的表征,以该表征作为条件,DSTPP 旨在学习未来事件的时空联合分布模型。具体而言,对于序列中的每个事件,该方法将扩散过程建模为在空间和时间域上的马尔科夫过程,逐步向空间和时间值添加微小高斯噪声,直到它们被破坏城纯高斯噪声。在时空场景下,向时间和空间域添加噪声的过程类似于图像场景(噪声独立地应用于每个像素),DSTPP 通过以下方式在空间和时间域上分别进行独立扩散:

时空扩散过程

相反地,DSTPP 将下一步事件的预测建模为从第 K 步到第 0 步的逆向去噪迭代过程。时间和空间的去噪过程依赖于前一步中获得的彼此之间的信息,而下一步的预测值以时间和空间条件独立的方式进行建模,具体公式如下:

时空去噪过程

通过这种方式,DSTPP 成功将时空联合分布的建模分解为单步条件独立建模,而组合起来是联合建模的形式,实现了对时空联合分布的有效建模。下面罗列了 DSTPP 的训练和采样算法,这些算法训练稳定,易于实现。

训练及采样算法

网络架构

针对网络架构,研究团队在时空编码器部分提出使用基于 Transformer 的架构来学习历史时空表征,在时空扩散部分提出时空共注意力网络来参数化噪声预测网络。在每个去噪步骤中,时空共注意力网络同时执行空间和时间注意力,以捕捉二者之间的细粒度交互。不同去噪步骤共享相同的网络结构,都是基于历史表征,上一步预测得到的时空结果和去噪步数 k 的位置编码,来预测下一步的时空噪声。

网络结构图

实验结果

研究团队将 DSTPP 与最先进的时空点过程方法进行比较,并在 8 个数据集(所有数据集均已开源)进行了大量的实验。在连续空间情形下中,论文使用了两个仿真数据集和四个真实世界数据集,涵盖了广泛的领域,包括地震学,人类移动、流行病传播、城市单车使用,以及模拟的霍克斯高斯混合过程和风车结构数据。此外,论文还使用了两个真实世界的离散数据集,包括犯罪数据和出租车数据,它们的空间标签是离散的街区。

研究团队将所提的 DSTPP 与一系列最先进的建模方法进行对比,这些方法可以分为三类:空间点过程模型,时间点过程模型,时空点过程模型。针对时空点过程,可以自由组合已有的空间点过程和时间点过程来进行建模。结果显示,DSTPP 在所有数据集上的多个评估指标上均取得了最佳表现,相比最佳基线模型平均提升超过 50%。

似然和预测误差结果

为了更深入地理解去噪过程中的时空相互依赖关系,研究团队对共同注意力权重进行了深入分析。并构造一个新的的仿真数据集,该数据的时空两个维度是完全独立的,因此可以验证所设计的时空共同注意力机制是否可以学习不同的时空相互依赖关系。下图展示了在去噪过程中时间和空间维度在彼此和自身上的注意力权重变化情况。在时空耦合数据集上,随着去噪过程的进行,时间和空间维度逐渐向彼此分配注意力;而在时空独立数据集上,两个维度几乎没有相互分配注意力权重。这表明 DSTPP 可以自适应地学习时间和空间之间的各种相互作用机制。

时空注意力权重变化

团队信息

清华大学电子工程系城市科学与计算研究中心聚焦于城市科学与计算研究方向,以城市科学为基础研究问题,基于复杂系统、计算社会学等理论展开研究,结合数据科学、机器学习的新一代 “认知人工智能” 为核心技术,服务于城市孪生、城市治理、无线网络孪生等面向国家重大需求的应用领域。团队在 Nature 子刊等顶级国际期刊与 KDD、NeurIPS、WWW、UbiComp 等顶级国际会议发表学术论文 150 余篇(CCF A 类 70 余篇),文章引用 19000 余次,7 次获国际会议最佳论文 / 提名奖。团队近年来与华为、腾讯、美团、快手、高德、商汤、丰田以及移动运营商等各类商企也建立了良好的合作关系,各研究课题的研究成果得到了工业界与学术界的广泛认可,已部署于武警总部、中央网信办、公安部等国家重要部门。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
CVPR'23 最佳论文候选 | 采样提速256倍!蒸馏扩散模型生成图像质量媲美教师模型蛋白质侧链预测新方法DiffPack:扩散模型也能精准预测侧链构象!Snap团队最新AI研究成果:2秒文字成图,手机上也能运行澳洲昨晚突发4.3级地震,多地震感强烈!深度达10公里,地震局:未来几天大概率不会再有更强地震《绿色的牧歌》&《怎么了》大模型的思想钢印:如何让ChatGPT相信水是有毒的?​中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制图像生成终结扩散模型,OpenAI「一致性模型」加冕!GAN的速度一步生图,高达18FPS终结扩散模型:OpenAI开源新模型代码,一步成图,1秒18张无题CVPR 2023 | 微软提出LDGM:利用解耦扩散模型统一版面生成田渊栋团队最新研究:不到1000步微调,将LLaMA上下文扩展到32K血压高至180 ,继续退圈谷歌下场优化扩散模型,三星手机运行Stable Diffusion,12秒内出图基于扩散模型的音频驱动说话人生成,云从&上交数字人研究入选ICASSP 2023美国的首富们越来越富了;三分之一的西雅图居民因为房价和犯罪率正在考虑离开西雅图记忆中的南京之十五:重访故地Cancer Cell | 王凌华团队在单细胞层面描绘胃癌进展过程中免疫和间质细胞状态以及生态型的演变山东凌晨突发5.5级地震,多地震感明显!山东、北京地震局最新研判!钟南山团队最新研究:氢/氧气疗法治疗新冠添新实证还能这么玩?清华给 ChatGPT 做逆向,发现了 ChatGPT 的进化轨迹!强过AutoGPT!微软重磅研究提出APO算法,「自动提示」淘汰提示工程师7 Papers & Radios | 爆火论文打造《西部世界》雏形;OpenAI终结扩散模型扩散模型生成带汉字图像,一键输出表情包:OPPO等提出GlyphDraw3D版「分割一切」来了!NUS华人团队最新模型,单视图重建3D,又快又准玩不起RLHF?港科大开源高效对齐算法RAFT「木筏」,GPT扩散模型都能用AI读心重磅突破登Nature!大脑信号1秒被看穿,还能预测未来画面Nature子刊|威大华人团队全新多模态数据分析及生成方法JAMIE,大幅提升细胞类型、功能预测能力港大和微软提出Uni-ControlNet:可控制扩散模型再添一员!刚刚,国常会重磅定调!研究提出一批政策措施,推动经济持续回升向好!科技型企业迎利好美国最新研究:今年加州极可能发生大地震!已勘测到1200余次浅源地震……12秒内AI在手机上完成作画!谷歌提出扩散模型推理加速新方法警惕口罩危害健康?宁光院士团队最新研究:长时间佩戴N95口罩,或对健康产生负面影响!我在iPhone上装了70亿参数大模型,来自陈天奇团队最新成果宾州斯沃斯莫尔学院(Swarthmore College),校园樱花ICML 2023 | 清华团队提出使用低维优化求解器求解高维/大规模优化问题
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。