CVPR 2022 | 清华&港中大提出:Glow模型助力黑盒对抗攻击
点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
近日,清华大学,香港中文大学(深圳)等单位联合发表了一篇在对抗机器学习领域中黑盒攻击场景下的论文,已顺利被CVPR 2022接收。通过迁移一部分替代模型的条件对抗分布(CAD)的参数,同时根据对目标模型的查询学习剩下未迁移的参数,所提出的方法可以在任何新的正常样本上调整目标模型的 CAD以提高攻击性能。
论文标题: Boosting Black-Box Attack with Partially Transferred Conditional Adversarial Distribution
收录会议: CVPR 2022
论文链接: https://openaccess.thecvf.com/content/CVPR2022/papers/Feng_Boosting_Black-Box_Attack_With_Partially_Transferred_Conditional_Adversarial_Distribution_CVPR_2022_paper.pdf
代码链接: https://github.com/Kira0096/CGATTACK
1 问题背景
随着深度神经网络 (DNN)被广泛的应用于现实任务,其所带来的安全隐患也引起了业界和学界的重视,其中黑盒攻击无疑是最受关注的问题之一。黑盒攻击中,攻击者只能通过被攻击的 DNN 模型返回的查询反馈(query feedback)获取信息进而展开攻击,而模型参数和训练数据集等其他信息是未知的。然而,如果只利用查询反馈,在有限的查询预算下很难达到较高的攻击成功率。为了提高黑盒攻击性能(包括攻击成功率和查询效率),一种有效方法是利用一些白盒替代模型 (surrogate model) 和目标模型(即被攻击模型)之间的对抗迁移性。然而,由于替代模型和目标模型的模型架构和训练数据集之间可能存在差异(被称为 surrogate bias)。因此,如果盲目地全然采用替代模型的信息来代替目标模型,会对攻击产生负面影响(作者在文中用实验结果特别论证了如果surrogate biases过大,所带来的负面影响是确实存在的)。
为了解决这个问题,本论文通过开发一种对抗迁移性的新机制,提出了一种新的黑盒攻击方法。通过迁移一部分替代模型的条件对抗分布(CAD)的参数,同时根据对目标模型的查询学习剩下未迁移的参数,所提出的方法可以在任何新的正常样本上调整目标模型的 CAD。对基准数据集的广泛实验和对真实世界 API 的攻击证明了所提出方法的卓越攻击性能。
2 方法介绍
2.1 总体框架
下图是本工作整个攻击流程的示意图:
首先,我们借助Score-based black-box attack中的Evolutionary Strategy作为攻击算法的基本思路。将替代模型上训练得到的对抗噪声分布的部分参数迁移到对目标模型的攻击流程中直接利用(如下图(b)中的绿色虚线箭头),而剩下一部分参数则是通过对目标模型进行查询后根据得到的反馈来进行更新(如下图(c)中的黄色箭头)。如此更新迭代,执行Evolutionary Strategy的攻击策略,最后达到攻击成功的目的。
2.2 攻击策略:Evolutionary Strategy
Evolutionary Strategy是一种黑盒攻击策略,属于Score-based black-box attack。总的来说,该策略可以概括为通过对某个已知分布进行若干次采样得到对抗噪声以施加在被攻击的样本上,将此被施加对抗噪声的样本在目标模型上进行查询后根据反馈信息来更新该分布的参数,通过不断的迭代优化,达到最终攻击成功的目的。
最简单的分布可以采用高斯分布,后续也有很多工作采用了其他分布来实现更有效的攻击算法。在本工作中,我们采用了CAD (conditional adversarial distribution)作为采样噪声的分布。CAD可以刻画出在高维的样本空间内,选定某个样本点后,对抗噪声的概率分布,以此可以进行采样。为了得到这样的分布,我们采用了Glow模型的框架。
2.3 Glow模型
Glow模型是建立在标准化流(Normalizing Flow)的基础上的,标准化流可以理解成是一系列可逆函数的复合,能够将简单分布(如高斯分布)变换成复杂分布(如上文提到的CAD),且该变换是完全可逆的。
若用 代表对抗噪声, 代表高斯噪声,则通过标准化流的变换(用下式表示)和Glow模型的学习和训练,高斯噪声可以变换成对抗噪声,进而得到所需的CAD。
其中为网络输入, 为层c-Glow模型的参数, 和 为超参,具体的变换操作可以参考原论文中的细节,在此不一一赘述。
值得注意的是,作者没有直接对对抗噪声进行建模,即 , 而是引入样本 建模成 的条件分布 。这样能够更充分地利用样本数据的信息,能够对攻击带来帮助。
根据Glow模型和标准化流的设定,由此可以得到log-liklihood函数。
这样就将CAD作为Evolutionary Strategy中的分布,进行后续的攻击流程。
2.4 目标模型的CAD
如何通过训练得到目标模型的CAD从而实现攻击呢?本文做出了一个假设:一个模型生成的对抗噪声对另一个模型可能也有对抗性,从而假设不同模型的对抗噪声分布是相似的。本论文通过大量实验验证了这个假设。基于这个假设,我们可以在替代模型上训练CAD,再将训练得到的CAD迁移到目标模型上,执行Evolutionary Strategy的攻击。于是,现在需要解决的问题是如何在替代模型上训练得到CAD。
Glow模型是通过maximum log-liklihood (MLL)的方式学习参数的,但在黑盒攻击的场景里,MLL的方法似乎并不可行。原因在于MLL需要大量的样本作为训练数据,而在现实场景下,所需的训练数据对应的是对抗噪声。一般来说,即使是对替代模型进行攻击而得到所需的对抗噪声,其成本也是较为高昂的。因此,短时间内获得大量的对抗噪声作为MLL的训练数据是不现实的。于是,我们考虑以缩小两个分布之间的KL散度为目标,用Energy-based model计算得出的分布,去近似Glow模型的分布。在用Energy-based model计算分布时,所需要的计算样本完全可以是一般的噪声,这样便大大降低了训练成本。
因此,我们在替代模型上定义了一种Energy-based Model
做近似处理后得到下式:
其中 表示对抗损失函数,具体定义可以参见原文。
基于上述模型,我们采取下列流程在替代模型上训练得到CAD:1. 在样本邻域内随机抽取大量的噪声(任何噪声都可以,并不一定是对抗噪声);2. 对样本施加噪声后传入替代模型进行查询,得到反馈和对抗损失函数,并计算得到 ;3. 最小化 和 之间的KL Divergence。
上述的流程可以用下图来概括:
通过这样的训练过程可以在替代模型上得到参数。
2.5 CG-Attack
在替代模型上训练得到的即是在前文提到的需要学习的CAD,在后续以Evolutionary Strategy为基本攻击策略所设计的攻击算法中,将作为search distribution来采样噪声。
根据前文提到的,作者提出了一个假设并用大量的实验验证了该假设是正确的:一个模型生成的对抗噪声对另一个模型可能也有对抗性,从而假设不同模型的对抗噪声分布是相似的。目前已经有了替代模型上的CAD,则根据假设,可直接将替代模型上的CAD迁移到目标模型上作为目标模型的CAD。
需要注意的是,本文在此处并不是将替代模型的CAD全部迁移到目标模型上,而是仅仅迁移部分参数,而剩余的参数将在攻击过程中不断更新,具体流程如下图所示
可以看到,在CG-Attack攻击中,被迁移的参数只有, 而剩余的参数则是在攻击过程中根据查询的反馈结果进行更新。
3 实验结果
下图展示了CG-Attack的主要实验结果。可以看出,CG-Attack的攻击效果是较为显著的,在untargeted场景下,甚至只需查询1次即可攻击成功。除此之外,CG-attack在ImageNet和 GoogleAPI等开放场景下的攻击表现也是非常显著的。更多结果可以参见论文中的实验结果和分析。
4 总结
这篇文章的主要思路是采用score-based attack中常见的Evolutionary Strategy来设计攻击算法,其创新亮点在于借助Glow模型和一种新颖的部分参数迁移机制训练出 Evolutionary Strategy 所需的search distribution(本文对应Conditional Adversarial Distribution, i.e CAD)来实现攻击算法。最后的实验结果表明,该方法的攻击效果显著,能够适用于较为广泛的场景。
点击进入—>CV微信技术交流群
CVPR/ECCV 2022论文和代码下载
后台回复:CVPR2022,即可下载CVPR 2022论文和代码开源的论文合集
后台回复:ECCV2022,即可下载ECCV 2022论文和代码开源的论文合集
后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF
目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer222,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲扫码或加微信号: CVer222,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!
▲扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看
微信扫码关注该文公众号作者