Redian新闻
>
​CVPR 2022 | 子空间对抗训练

​CVPR 2022 | 子空间对抗训练

科技


©PaperWeekly 原创 · 作者 | 鬼谷子

研究方向 | GAN图像生成、情绪对抗样本生成




引言

该论文是关于一篇对抗训练的文章,论文的代码已经开源。对抗训练是一种可以有效抵御对抗攻击的方法,然而其存在一个严重问题,即在训练过程中,模型会出现过拟合现象,PGD 攻击的鲁棒精度突然会下降到 0%。在该论文中,作者从一种新的优化角度来处理这个问题,作者首先揭示了每个样本的快速增长梯度与过拟合之间的密切联系,这也可以用于理解多步自适应算法中的过拟合现象。

为了控制梯度的增长,作者提出了一种新的对抗训练的方法,即子空间对抗训练,它将对抗训练约束在经过严谨提取的子空间中。实验结果显示,该方法成功地解决了这种模型过拟合问题,并显著提高了模型的鲁棒性,而且时间能耗上也比 PGD-10 小很多。



论文标题:

Subspace Adversarial Training

论文链接:

https://arxiv.org/abs/2111.12229

代码链接:

https://github.com/nblt/Sub-AT




相关介绍
对抗训练是目前抵御对抗攻击提高模型鲁棒性最有效的方法。给定一个带有参数 的神经网络 ,其中对抗训练数学形式如下所示:

其中 是一个以半径为 的范数球, 是一个损失函数。对于单步对抗训练来说,内部生成对抗样本的计算公式如下所示:



但是对抗训练一个重要的问题的在于可能会出现严重的过拟合现象,其主要原因在于参数量过大。针对这个问题,之前大多数工作关注在于神经网络训练在低维流形的本质。在低维子空间对神经网络训练可以能够在大大减小参数量的同时使得神经网络模型能够达到一个好的分类性能。


论文方法

当模型过拟合的现象出现的时候,在测试集中的模型的测试准确率会陡然下降。对抗训练时,神经网络在训练数据中获得了对抗信息,这会使得有害于模型对正常样本的泛化能力,导致正常分类准确率下降,同时也会丢失对于由 PGD 生成的新的对抗样本的泛化能力。由此可知,对抗信息的学习很难学习,它会导致神经网络在学习过程中出现巨大的波动,从而最终过拟合。

由于对抗样本学习的困难性,作者主要关注每个样本梯度的演化并通过平均梯度范数去分析模型的训练状态。作者主要在本文中去记录利用 fast 对抗训练方法去抵御 PGD-20 攻击的平均范数,可以发现当过模型的拟合现象出现时,平均梯度和准确率的会同时突然增大,这个现象也暗示着当模型的过拟合现象出现时,平均梯度范数会突然增大,导致神经网络在学习训练数据的过程中出现巨大的波动,从而导致模型的泛化能力下降。

为了进一步探究梯度增长跟过拟合之间的关系,作者更详细地记录了过拟合现象出现之后的统计数据。由下图可以发现,不管学习的多大,最终模型都会出现过拟合现象,但是一个小的学习率可以使得模型有一个更好的鲁棒性而且也会推迟过拟合现象的出现。所以,对于学习的选取时非常重要的,选取一个合适的学习率它可以通过控制平均提梯度范数的大小从而减缓模型过拟合现象。



3.1 控制梯度大小

由以上的数据分析可知,在模型的训练过程中,如何控制每个样本梯度的大小是非常重要的。论文的核心思想是在一个低维子空间里去限制对抗训练过程中的梯度的大小而不是在整个参数空间中。在该思想下,一个急需要解决的问题就是怎样获得这样一个可以进行有效对抗训练的子空间。最近的研究有研究者提出一个 DLDR 的算法,它可以有效从训练过程中提取用于优化的低维子空间,主要过程可以分为如下两步:

步骤一:在模型训练过程中采样获得模型参数向量 ,其中每个参数向量的维度为
步骤二:对参数矩阵 进行奇异值分解并获得有 维子空间的正交基

在该论文中,作者主要应用 DLDR 算法去提取可以有效对抗训练的子空间,这里需要注意的是采样模型参数的时候需要在模型过拟合出现之前。然后,在这个提取子空间里对神经网络的参数进行优化,这样可以有效缓解模型过拟合现象,并能够使模型获得更好的鲁棒性。

采样策略:对于 DLDR 算法,作者在每个训练批次中均匀采样两次。在每个采样批次中,模型将获得最好的分类性能。在训练初始阶段,由于子空间没有很好的评估出来,所以采样效果不是很好。

训练性能:如下图所示,子空间对抗训练可以很好将平均梯度范数数值在一个很低的区间里,这不仅可以有效地解决过拟合问题同时耶大大提高了模型的鲁棒性。另外,子空间对抗训练对模型学习率的选取也没有那么严苛,在一个较大学习率区间内模型学习都可以进行很好的收敛。

计算分析:子空间对抗训练的计算开销分为两部分:DLDR 和子空间对抗训练。DLDR 又包含两个步骤采样和分解,其中跟采样相比,分解的计算开销可以忽略不计。子空间对抗训练与标准的对抗训练计算开销相当。虽然子空间对抗训练的时间开销要比正常对抗训练的时间开销要大一点,但是训练效果却是要好很多。


实验结果

下表所示为不同对抗训练方法在 CIFAR-10 和 CIFAR-100 数据集上的结果。作者将子空间对抗训练方法应用于不同的基本对抗训练方法中,并从相应的训练轨迹中提取子空间。可以发现训练在 200 个的 epoch 的学习率下,Fast AT 和梯度截断 FGSM AT 仍然会遇到严重的灾难性过度拟合现象。在没有任何其他正则化技术的情况下,论文中提出的子空间对抗训练的方法可以使得模型获得更好的鲁棒性。

如下表所示作者总结了不同学习率的训练结果,并对应汇总了对抗训练的时间能耗。可以发现简单地通过增加训练步长和半径,子空间对抗训练可以显著提高模型对对抗攻击攻击的鲁棒性,而不会遭受灾难性的过度拟合或额外的时间开销,另外与 PGD-10 对抗训练相比,子空间对抗训练只需要总训练时间的七分之一,这是一个相当大的优势。

从下图的结果可知,子空间对抗训练成功地解决了大学习率的过度拟合问题,并进一步提高了模型的鲁棒性,这表明使用大步长的学习率确实有利于提高模型的鲁棒性。

如下图所示,在一定范围内,较大步长的学习率的训练持续提高了对不同半径攻击的鲁棒性(尤其是对于较大半径的攻击),表明模型的鲁棒性得到了真正的提高。然而,正如预期的那样,也存在局限性,因为过度的扰动将损害训练数据的宝贵信息,也会导致模型性能退化。




更多阅读




#投 稿 通 道#

 让你的文字被更多人看到 



如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 


PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。


📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算


📬 投稿通道:

• 投稿邮箱:[email protected] 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿


△长按添加PaperWeekly小编




🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧



·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
关于2022年暑期乐高新品的若干情报(2022年4月28日更新)创业邦2021年度中国最活跃CVC TOP50榜单发布「大地量子空间数据平台」近期上新案例分享看奥斯卡最佳外国语电影《在车上》Mol Cell:CRISPR-Cas系统和限制性内切酶携手对抗噬菌体感染ECCV 2022丨力压苹果MobileViT,这个轻量级视觉模型新架构火了这个神器越鸡肋的空间越好用,我用它可以榨干家里的每一寸空间CVPR 2022 | 只需要一组预训练参数,所有恶劣天气一次解决!NAACL 2022 | TAMT:通过下游任务无关掩码训练搜索可迁移的BERT子网络2022,写下你的故事 | 「故事大爆炸2022」征文大赛​CVPR 2022 | 从自注意力中学习语义Affinity,用于端到端弱监督语义分割陆国平教授:2021-2022血脂领域新进展 | OCC 2022CVPR 2022 | 图像修复!中科大&微软提出PUT:减少Transformer在图像修复应用中的信息损失转载:陈年旧事(六)— “我要你的女人”“中国现在允许新加坡长期探访准证LTVP持有人出境吗?”CVPR 2022 | 元学习在图像回归任务的表现​ICLR 2022 | 基于积分梯度的迁移对抗攻击兰卡资讯 | 反对党提交两项不信任动议;JVP党披露拉贾巴克萨家族的涉腐大量文件CVPR 2022 | 一键解锁微软亚洲研究院计算机视觉领域前沿进展!在CVPR上,OPPO的一系列「业界首次」英伟达这篇CVPR 2022 Oral火了!2D图像秒变逼真3D物体!虚拟爵士乐队来了!龙卷风健康快递 160AAAI 2022 | 车辆重识别全新方向!解决恶劣天气下的车辆重识别!有效提升真实世界可行性!训练代码以及预训练模型皆以开源!6月LPR按兵不动 年内或仍有下调空间上海人在海外系列:在蒙特利尔我和我的赌徒老乡 (上)复旦提出ObjectFormer,收录CVPR 2022!图像篡改检测新工作!商汤的数字人研究,在CVPR上成了爆款​ACL 2022杰出论文:为什么生成式大规模预训练模型难以量化?上海封城的利和弊ECCV 2022 | PEBAL:用于城市自动驾驶系统的异常分割模型“每月乐高新刊”-2022年5月:2022年第一本好朋友系列杂志登场,忍者杂志附带的是一款前套装独占人仔。2022年上半年全球新晋独角兽企业194家,平均估值同比下降15.9%——创业邦发布《2022年上半年全球独角兽企业观察》CVPR惊现「缝合怪」!韩国团队连剽10多篇顶会论文,竟评上了OralACL 2022 | 基于Prompt的自动去偏:有效减轻预训练语言模型中的偏见【投票】2022 OABL Season | 常规赛收官,常规赛MVP投票继续,总决赛赛程出炉
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。