Redian新闻
>
ICCV 2023 | 即插即用!上海交大提出AccFlow:跨帧光流估计框架

ICCV 2023 | 即插即用!上海交大提出AccFlow:跨帧光流估计框架

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【目标检测和Transformer】群

ICCV23|上海交通大学提出跨帧光流估计框架:AccFlow,对帧间光流进行累积获得长距离跨帧光流,适配任意帧间光流估计算法,即插即用

在CVer微信公众号后台回复:AccFlow,可以下载本论文pdf和代码

论文:https://arxiv.org/abs/2308.13133
代码:https://github.com/mulns/AccFlow
近年来,光流估计算法在深度学习的加持下获得了性能上的突飞猛进。然而,现有的光流算法主要对视频相邻帧之间进行光流估计,而对跨帧光流的估计少有探索。本文提出了一种跨帧估计光流的算法,AccFlow,通过对邻帧光流进行累积来获得long-range光流。AccFlow可以配合任意帧间光流算法使用,即插即用。

反向累积

假设现在有一个T帧的视频,并有T-1个预先获得的帧间光流          。我们这些帧间光流不断累加即可获得长距离的跨帧光流。现在考虑两个光流的累加过程,可以分为两个步骤:首先,将两个光流向量的起点对齐;然后,将两个向量的值相加。这两个步骤中,难度较大的是对齐的过程,因为这其中存在由warping操作导致的遮挡问题。我们提出一种反向累积的方法,相比于前向累积,反向累积可以大大减轻遮挡问题。

如上图所示,我们将累积看作是红色箭头与蓝色箭头的相加。而黄色的虚线箭头,则代表着对齐距离。如果需要对齐的两帧在时间上的跨度较大,通常运动也就越大,而更大的运动则会导致更大的遮挡问题。因此,前向累积的遮挡问题随着时间的增加而逐渐增加。相比之下,反向累积的过程,我们发现对齐距离与时间无关,并始终保持最小值。我们统计了5000个数据下的遮挡比例,给出不同帧间间隔下()遮挡比例的统计如下:

上图中,我们给出了一个实际的例子。可以看到,前向累积的遮挡区域比例随着迭代次数增加而持续增加。相反,反向累积的遮挡比例不随迭代次数而叠加,并始终保持较小的比例,因此更易于解决。这印证了我们提出的反向累积的重要性。

AccFlow网络

AccFlow的网络结构分为两个部分:AccPlus和Adaptive Blending。其中,AccPlus是完成光流反向累积的核心部分。Adaptive Blending则提供一个补充信息,用于帮助网络更好地处理误差累积问题。在AccPlus网络中,我们使用可变形卷积对两个光流场进行特征对齐与特征融合,并自适应地对遮挡区域进行填补。进一步,我们利用Adaptive Blending将补充的信息进行融合,其中补充信息来自于对long-range光流的端到端估计(利用邻帧光流估计算法OFNet)。整个AccPlus网络结构简单且轻量。然而,AccPlus中的累积过程容易导致误差累积,因此,Adaptive Blending模块提供的补充信息提供一个端到端估计的motion feature作为补充信息,对累积误差进行矫正,从而获得了更好的效果。值得一提的是,OFNet在AccFlow框架中起到提供输入光流的作用,我们的实验发现OFNet可以用不同的光流算法代替,例如RAFT[1],GMA[2],GMFlow[3]等等。

数据集

为了有效训练AccFlow网络,我们提出了一个新的数据集CVO,它包含了11406个样本。其中,每个样本包括一个7帧的视频序列其对应的光流标签。与其他光流数据集不同的是,我们不仅提供了相邻帧之间的光流,还提供了不同帧间距下的跨帧光流。因此,CVO可以为相关任务提供更加丰富的标签数据,并有效帮助AccFlow学习long-range光流的生成。

实验结果  

如上图所示,我们探究了不同算法随着累积距离的增加而带来的性能变化。可以看到,AccFlow的EPE保持最低且变化幅度最小。相比之下,RAFT[1]和GMA[2]算法及其变体随着累积距离的增加性能逐渐下滑。其中,RAFT与GMA算法均在CVO数据集上进行fine-tune过,从而保证与AccFlow比较的公平性。‘-w’代表warmstart算法,可以看到用warmstart可以一定程度提升性能,但是对于长距离的光流估计仍然效果不佳。

上图中,我们展示了主观视觉效果的比较。‘-Lim’为一种光流累积的算法[4]。由上图可以看出,直接估计首尾帧的光流(左2)较为困难,用到accumulation的方法(左3至5)均有所提升。而AccFlow在遮挡情况更加复杂的运动上超越了其他算法。更多视觉效果对比可参见补充材料。

在CVer微信公众号后台回复:AccFlow,可以下载本论文pdf和代码

Reference   

[1] Zachary Teed and Jia Deng. Raft: Recurrent all-pairs field transforms for optical flow. In Proc. Eur.Conf. Comput. Vis. (ECCV), pages 402–419, 2020.
[2] Shihao Jiang, Dylan Campbell, Yao Lu, Hongdong Li, and Richard Hartley. Learning to estimate hidden motions with global motion aggregation. In Proc. IEEE/CVF Int. Conf. Comput. Vis. (ICCV), pages 9772–9781, 2021.
[3] Xu, Haofei and Zhang, Jing and Cai, Jianfei and Rezatofighi, Hamid and Tao, Dacheng. GMFlow: Learning Optical Flow via Global Matching. In Proc. IEEE/CVF CVPR, pages 8121-8130, 2022.
[4] SukHwan Lim, John G. Apostolopoulos, and Abbas El Gamal. Optical flow estimation using temporally oversampled video. IEEE Trans. Image Process., 14:1074–1087, 2005

点击进入—>【目标检测和Transformer】交流群


ICCV / CVPR 2023论文和代码下载


后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:ICCV2023,即可下载ICCV 2023论文和代码开源的论文合集

目标检测和Transformer交流群成立


扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信号: CVer333,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!


扫码进星球


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
数学能力超过ChatGPT!上海交大计算大模型登开源榜首上海交大&蚂蚁提出四合一物体传送门,向场景中可控传送物体ICCV 2023 | 清华&天津大学提出SurroundOcc:自动驾驶的环视三维占据栅格预测手套花,优雅含蓄ICCV 2023 | 只需过一次CLIP!美团&港大提出高效的开放字典语义分割框架DeOPICCV 2023 Oral | 南科大提出SGA:针对VLP模型的集合级引导攻击ICCV 2023 | 港中文MMLab: 多帧光流估计模型VideoFlow,首次实现亚像素级别误差获字节跳动、联想之星投资,这位上海交大博士带领团队塑造智慧实验室行业新标杆西工大提出全新「群聊式」无人机控制框架!类人对话交互、主动环境感知、自主实体控制纽约州莫霍克山屋(Mohonk Mountain House),难忘美景ICCV 2023 | TUM&谷歌提出md4all:挑战性条件下的单目深度估计七律-记白天鹅宾馆茶聚ICCV 2023 | 北大提出MotionBERT:人体运动表征学习的统一视角一日登三峰 2023.07.29三登雪山 Mt. Shasta 2023.07.08GPT-4推理更像人了!中国科学院提出「思维传播」,类比思考完胜CoT,即插即用ICCV 2023 | HoP:即插即用,重塑3D检测时序利用新范式​ICCV 2023 | 华科大提出NVDS:即插即用的视频深度预测框架ICCV 2023 | 发挥offline方法的潜力:解耦合的视频实例分割框架DVISICCV 2023 最佳论文候选!北大提出UniDexGrasp++:基于几何感知课程和迭代通用-专家策略学习的灵巧手抓取算法20余位学术名师:用人文大智慧感悟人生(上海交大人文艺术研修班)CBNdata&美团&上海交大:2023年中国城市咖啡发展报告上海交大梁晓峣:疯狂的大模型时代,开源GPGPU平台为国产AI芯片企业谋出路丨GACS 2023已被LLM“杀死”?Stack Overflow:打不过就加入ICCV 2023 | 即插即用!百度提出S3IM:用于NeRF提点的Magic LossICCV 2023 | 上交提出CCD:基于自监督字符到字符蒸馏的文本识别希腊圣托里尼岛(Santorini),蓝天白屋ICCV 2023 | 刷新多项记录!武大&快手提出DVIS:解耦视频实例分割框架ICCV 2023 | 新注意力!清华黄高团队提出FLatten Transformer视觉新主干CVPR 2023 | SCConv: 即插即用的空间和通道重建卷积第3年那1年内每100辆车有多少毛病ICCV 2023 | 发挥offline方法的潜力,武大&快手提出解耦合的视频实例分割框架DVIS自古就是礼仪之邦吗?ICCV 2023 | 比分割一切SAM更早实现交互式开集分割!港科大提出OpenSeeD:开放词表图像分割和检测北大提出RestGPT框架,通过RESTful API控制真实应用的AgentTexas Sunshine 2023招聘 | 上海交大刘尽尧课题组博士后招聘上海交通大学马利庄教授团队多项成果获ICCV 2023录用!网红cos向太爆红!她吐槽太low:我衣服几十万!网友炸锅了UTMB 越野
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。