视频场景图生成任务新SOTA!中山大学提出全新时空知识嵌入框架,登顶刊TIP'24
新智元报道
新智元报道
【新智元导读】STKET框架将先验时空知识纳入多头交叉注意机制中,从而可以学习到更多有代表性的视觉关系表示,在视频图生成基准上大幅领先其他算法。
论文概述
基于时空知识嵌入的Transformer
时空知识表示
知识嵌入注意力层
时空聚合模块
实验结果
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章新智元报道
论文概述
基于时空知识嵌入的Transformer
实验结果
微信扫码关注该文公众号作者