Redian新闻
>
AAAI 2022 | 车辆重识别全新方向!解决恶劣天气下的车辆重识别!有效提升真实世界可行性!训练代码以及预训练模型皆以开源!

AAAI 2022 | 车辆重识别全新方向!解决恶劣天气下的车辆重识别!有效提升真实世界可行性!训练代码以及预训练模型皆以开源!

科技

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—> CV 微信技术交流群

SJDL-Vehicle: Semi-supervised Joint Defogging Learning for Foggy Vehicle Re-identification

科研机构:台湾大学

论文:https://ojs.aaai.org/index.php/AAAI/article/view/19911

代码(已开源):

https://github.com/Cihsaing/SJDL-Foggy-Vehicle-Re-Identification--AAAI2022

近期AAAI'22的文章已经逐渐释出,当中这篇内容对于重识别在恶劣气候下提出了新的议题,并且开发出解决的算法架构及对于现有的资料集做更近一步地分类并提供额外的辅助标签,因此将本篇重点整理下来分享给大家,目前训练代码、预训练模型和辅助标签集皆已开源。

简介

当前车辆重识别算法随着DCNN发展以不同架构达到最先进性能,但旧有资料集皆针对清晰气候设计,在雾景中进行车辆重辨识仍是一项巨大的挑战:

  1. 现有重识别方法(Existing ReID method) [1,2,3]: 这些方法是为清晰的图像而设计的,虽能在现有资料集下获得良好的成绩,但是对于恶劣气候下的成效却相当有限,而雾是现实世界中最常见的气候之一,是一种由烟雾、灰尘和其他漂浮颗粒组成的大气现象,将会导致能见度下降,并降低车辆重识别的特征提取能力,不利于真实世界的应用。
  2. 二阶除雾重识别(Defogging+ReID) [4]: 最直接的解决方法是透过现有的去雾策略提高输入影像的可见性,然后进行ReID算法。然而传统的去雾方法是根据人类感知设计,影像还原过程无法保证能提供有效的ReID资讯,此外,去雾方法需要大量的计算负担,集成式架构将会增加系统的复杂性,对于效能有极大的局限性。
  3. 资料集限制 [5,6]: 现有的车辆重识别资料集为了减轻问题难度,主要在清晰气候下所组成,而真实世界中雾气下的标记成本极高,且难以收集对应的ground truth样本,常见的方法可透过合成资料模拟,却仍然与真实世界中存在一定程度的domain gap。

对于雾气车辆重识别而言,如何有效地从雾气影像中抽出ReID特征成为开发的重点,本篇贡献如下:

  • 提出新的训练框架,将去雾网络和重识别网络统一起来。联合去雾学习框架可以为 ReID 保留去雾特征,以应对可见度差的问题。
  • 提出半监督去雾训练机制,交替优化合成数据和真实世界数据上的网络,以解决域差距问题。
  • 重新标注现有的基准并构建了一个名为 Foggy Vehicle ReID (FVRID) 的额外分类标签资料。

此外,这个团队在过去对于影像还原有许多发表:

  • 单张影像、单个模型多合一天气去除:[Github] (CVPR'22)
  • 单张影像去雾:[PMS-Net] (CVPR'19) and [PMHLD] (TIP'20)
  • 单张影像去雪:[JSTASR] (ECCV'20) 、 [HDCW-Net] (ICCV'21)
  • 单张影像去雨:[ContouletNet] (BMVC'21)

方法

Joint Defogging Learning network for vehicle ReID

本篇引入多任务学习(joint learning)的技巧,所提出的架构主要由两个分支组成:重识别分支(ReID Branch)和去雾分支(Defogging Branch),期望透过去雾分支学习干净的图像特征,有效的指引重识别分支在雾气状况下学习到有鉴别性的ID特征。

为了达到此目的,此论文将网路切分成集体特征共享模块(CFSM)、无雾图像重建模块(FIRM)和重新识别模块(ReIDM)以产生相应的输出:

  • Collective Feature Sharing Module(CFSM): 集体特征共享模块。作为输入影像的特征提取模块,以确保抽取的无雾特征(FC)共享去雾和车辆 ReID 的关键信息。从网络底层提取的特征包含更多的空间和低层信息[7],有利于去雾过程,因此CFSM由重识别分支中的前两个卷积块构成。
  • Re-identification Branch(CFSM+ReIDM): 重识别分支。采用ResNet50作为主干,将CFSM提取特征(FC)通过其余ResBlocks,再进行全局平均池层(GAP)和批量归一化(BN)层生成2048维ReID特征,此部分透过三元学习与ID分类来优化网路。
  • Defogging Branch(CFSM+FIRM): 无雾图像重建模块。CFSM特征表示会因雾而恶化,将导致ReID性能受限,此分支将FC特征经过FIRM网路还原成干净影像,并透过MSE进行合成数据集训练以规范CFSM保持干净的特征抽取,作为辅助训练使用,在测试阶段可拔除FIRM减少运算量。

Semi-supervised Optimization for Joint Defogging Learning

半监督优化联合去雾学习机制(SJDL)。由于真实世界中无雾图像的ground truth难以收集,仅在合成数据上优化去雾分支。将导致车辆重识别的性能在现实世界和合成场景之间存在领域差距。为了解决这个问题,我们提出了一种半监督优化方案,在每次迭代中交替训练真实世界图像和合成图像。培训过程可以分为两部分:

  • Supervised Learning Stage: 在这个阶段,基于合成数据以监督的方式优化去雾分支。
  • Unsupervised Learning Stage: 此阶段透过物理性质进行非监督学习,主要运用四个特性: (1) Color Entropy: 颜色熵控制清晰图像内容与鲜艳的色彩,增加颜色丰富性。(2) Dark Channel prior: 透过DC[8]的定义,干净影像其暗通道强度应趋近于0。(3) Total Variation: 抑制像素间的变异值,保留图像内容和结构信息的同时抑制噪声。(4) Self-Constraint: 基于傅立叶领域上的信息比对,比对影像前后相似性,限制结构信息。

实验结果

此篇论文做了许多实验来证明其有效性。

数据集额外标注以及补强(Dataset):

根据需求本篇对VERI-Wild和Vehicle-1M数据集进行全面性标记作业:

  1. Foggy Vehicle ReID for real-world scenes (FVRID_Real): 由5051影像403台车组成训练集,1000个真实ID作为Real-World测试集。
  2. Foggy Vehicle ReID for synthetic training (FVRID_Syn): 首先挑选出无雾影像,并根据[9]进行雾气合成,最终由42558影像3000台车组成训练集,1000个合成ID作为Syn测试集。

针对上述的训练以及测试资料,此论文提供了对真实世界的额外标签集以及对合成资料的合成代码,可供所有的研究员使用。

消融实验(Ablation Study):

1.  使用不同Collective Feature Sharing Module深度对于模型性能的影响:

实验结果验证前述的论点,浅层网路包含较多空间与低频资讯,对于影像还原有相当大的帮助。

2. 提出架构与优化技巧对于真实世界雾气影像的还原结果比较:

上图证明了,使用提出的训练技巧与Self-Constraint可近一步提升影像还原品质。

3. 针对Semi-supervised Optimization&Joint Defogging Learning有效性进行验证:

结果表明了使用论文中提出的所有模块有助于提升雾气状况下的ReID效能,并能减少领域差距。

4. 针对架构有效性进行Rank10可视化分析:

与现有方法的比较

可以发现在FVRID_Syn和FVRID_Real数据集上,原先的SOTA模型都会严重崩溃,而直接训练于雾气资料上也比两阶段架构成效较佳,而本篇推出的方法表现效果也显着优于其他模型。

结语

读完这篇文章后,我认为这篇论文有几点非常值得参考

  1. 提出Semi-supervised Optimization和Joint Defogging Learning机制,并且透过集体特征共享模块有效结合两个分支的优势,对于ReID学习雾气状况下特征是相当有帮助的。
  2. 首篇针对恶劣气候下的车辆重识别进行探讨的论文,并提供一份完善的Foggy Vehicle ReID(FVRID)数据集标注资讯,对于新的议题推动有极大的帮助。
  3. 此概念未来对于其他物体辨识等应用可能会有很大的帮助,此外,虽说论文是针对雾气气候去设计,但我认为此方法应该能延展到其他的恶劣环境情景。

参考文献

[1] Meng, Dechao, et al. "Parsing-based view-aware embedding network for vehicle re-identification." Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2020.

[2] He, Shuting, et al. "Transreid: Transformer-based object re-identification." Proceedings of the IEEE/CVF international conference on computer vision. 2021.

[3] He, Shuting, et al. "Multi-domain learning and identity mining for vehicle re-identification." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. 2020.

[4] Zamir, Syed Waqas, et al. "Multi-stage progressive image restoration." Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2021.

[5] Lou, Yihang, et al. "Veri-wild: A large dataset and a new method for vehicle re-identification in the wild." Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2019.

[6] Guo, Haiyun, et al. "Learning coarse-to-fine structured feature embedding for vehicle re-identification." Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 32. No. 1. 2018.

[7] Chen, Wei-Ting, et al. "DesmokeNet: A Two-Stage Smoke Removal Pipeline Based on Self-Attentive Feature Consensus and Multi-Level Contrastive Regularization." IEEE Transactions on Circuits and Systems for Video Technology 32.6 (2021): 3346-3359.

[8] He, Kaiming, Jian Sun, and Xiaoou Tang. "Single image haze removal using dark channel prior." IEEE transactions on pattern analysis and machine intelligence 33.12 (2010): 2341-2353.

[9] Li, Boyi, et al. "Benchmarking single-image dehazing and beyond." IEEE Transactions on Image Processing 28.1 (2018): 492-505.



点击进入—> CV 微信技术交流群


CVPR 2022论文和代码下载


后台回复:CVPR2022,即可下载CVPR 2022论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF


Re-ID交流群成立


扫描下方二维码,或者添加微信:CVer6666,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。


一定要备注:研究方向+地点+学校/公司+昵称(如ReID+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信: CVer6666,进交流群


CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!


扫码进群

▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一个西瓜卖34刀!恶劣天气致全澳西瓜价格暴涨!短期内不会下降!新冠周报丨新冠疫情,筛选出生物制药的两项关键技术;真实世界研究,检验抗病毒药物对Omiron的疗效。如何高效、精准地进行图片搜索?看看轻量化视觉预训练模型两个多月!解封!有人笑着哭着放鞭炮,有人早早等在小区门口!上海Omicron疫情期间,方舱医院病例的真实世界大数据分析银保监会:河南、安徽5家村镇银行性质恶劣,涉嫌严重犯罪惊人的“沉没成本”:及时止损,才是成年人的高配如何突破年薪10万,50万,100万的职场三道坎?今天聊3条可行性思路Johns Creek这位华裔厉害了!训练美国陆军还获奖了!第一个真实世界研究验证丨辉瑞新冠药物Paxlovid,治疗Omicron BA.2到底有没有效?2022高考生 |「或许自己也可以开一朵花,哪怕是戴着口罩」超50篇论文串联起从VQA到多模态预训练大模型的前世今生—Part 2Ladder Side-Tuning:预训练模型的“过墙梯”美国及世界猴痘爆发情况及相关医学知识Paxlovid治疗COVID-19的复阳率到底是多少?美国CDC发布首次真实世界疗效报告这篇53分Nature顶级子刊的重磅综述揭秘你不可不知的肿瘤免疫新方向!传播性更强的BA.5毒性也更强?南非真实世界研究揭示重症率严冬首日,气象局发布恶劣天气警告:澳东部或出现危险大风!新冠周报丨​第一个灭活疫苗预防儿童Omicron的真实世界研究发表文档智能多模态预训练模型LayoutLMv3:兼具通用性与优越性既然都是鸡蛋,彼此帮一把吧ICML 2022 | 字节提出首个用于评测预训练视觉语言模型真正泛化能力的基准评测平台 VLUE在欢声笑语重出江湖之后“农民住在城里,开车下地种田”,这事可行性到底有多高?英国竟有这么多解暑神仙饮料?夏末热天气下,冰饮备起来!CVPR 2022 | 只需要一组预训练参数,所有恶劣天气一次解决!首个超大型真实世界研究:Omicron感染者病情严重程度大幅减弱!赴北美:留学生学生票盘点及预热(2022年版)世界可大可小,全看一颗心 | 人间日签秋字源考恶劣天气警报升级!降雨量增多将致洪水再度来袭!气象专家呼吁澳人做好应对!ACL 2022 | 基于Prompt的自动去偏:有效减轻预训练语言模型中的偏见字节AI Lab提出的新多语言多模态预训练方法刷榜!已开源WAIC 2022 | 澜舟科技创始人&CEO 周明:基于预训练语言模型的可控文本生成研究与应用云九资本牛凤轩:资本视角下的Web3全家桶、以及Web3语境下的元宇宙|36氪专访
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。