一文速览ICML 2023域自适应/域泛化相关论文
/ ICML 2023 Poster /
论文标题:
现有的多源自适应方法通常使用源模型生成的伪标签数据训练目标模型,这些方法主要关注改进伪标签技术或提出新的训练目标。而该研究旨在分析多源自适应的基本限制,并提供平衡这种权衡的洞察力。文章从三个角度(域聚合、选择性伪标签和联合特征对齐)讨论了如何平衡偏差和方差的问题,并提出了新的算法。通过在多个数据集上的实验证实了理论分析,并展示了所提出算法在一些具有挑战性的数据集上的卓越性能。
文章的核心方法是通过理论分析提出了多源自适应问题的信息论上界,揭示了固有的偏差-方差权衡。作者提出了从三个角度平衡偏差和方差的洞察力,并设计了新的算法。其中,域聚合可以减少标签不匹配的偏差,选择性伪标签可以进一步平衡标签不匹配的偏差和方差,而联合特征对齐策略可以显式地解决源域和目标域之间的域漂移问题,从而减少特征不匹配的偏差。
3. a joint adversarial feature alignment approach:使用 adversarial training,对每个模型生成的特征进行对齐。
/ ICML 2023 Poster /
论文标题:
https://openreview.net/forum?id=E3Ny4RnbiT
文章的主要目标是在 SCRM 框架中开发一种学习策略,以最小化超额风险和预期遗憾(excess risk and expected regret)。作者提出了一种新颖的反事实估计器,并通过类似于加速优化方法中的重启策略的分析确定了可以改善 CRM 性能的条件。他们还通过在离散和连续行动设置中进行实证评估探讨了 CRM 多次部署的益处。
/ ICML 2023 Poster /
论文标题:
论文链接:
https://openreview.net/forum?id=0jSSVPrfcX
背景:典型的机器学习应用通常假设数据遵循独立同分布(IID)的假设。然而,在现实世界中,这种假设经常被违反,导致了分布外(OOD)泛化问题和模型鲁棒性的严重下降。为了缓解这个问题,利用不变性学习技术来区分所有输入特征中的虚假特征和不变特征,并仅基于不变特征对模型进行训练。许多不变性学习策略要求训练数据应包含领域信息,如环境索引或先前知识获取的辅助信息。然而,在实践中通常无法获取这些信息。
/ ICML 2023 Poster /
论文链接:
https://openreview.net/forum?id=tpCynHFviX
深度学习模型在关键应用领域(如医疗保健、自动驾驶或国防)中的部署需求,其中重要的安全要求之一是能够区分正常分布和异常分布的样本。当前大多数方法采用后处理的策略,利用预训练模型的特征空间来估计正常样本的密度以进行异常检测。现有的密度估计方法包括高斯混合模型(GMM)、最近邻分布和基于能量的方法(如能量对数 EL)等。然而,这些方法往往针对不同类型的异常数据表现出不同的检测能力,具体而言 EL 一般对 near-OOD data 效果更好,而 GMM 相反。作者引入了一种名为 HEAT 的方法,该方法使用基于能量的混合模型在预训练骨干网络的特征空间中估计内部分布样本的密度。HEAT 通过对先前的内部分布密度估计器(如高斯混合模型)进行能量修正,提供准确而稳健的密度估计。
/ ICML 2023 Poster /
论文标题:
Taxonomy-Structured Domain Adaptation
通过这个四方博弈的框架,文章提出的方法可以平衡表示学习中的领域相似性和领域不变性。当领域层次结构非常简单或不提供任何信息时,方法可以恢复传统的域自适应方法的解决方案。在其他领域层次结构情况下,该方法在合成数据集和真实世界数据集上实现了最先进的性能。
/ ICML 2023 Poster /
论文标题:
Concept-based Explanations for Out-of-Distribution Detectors
该文章的出发点是为解释 Out-of-Distribution(OOD)检测器的决策,提供了基于 concept 的解释,这里的 concept 如下图所示,就是一些类似于皮肤颜色,背景状态等高级信息而不是 feature 的特征。虽然许多方法都致力于改善 OOD 检测器的性能,但在解释其决策方面存在重要差距。为了弥补这一差距,作者提出了两个新的度量标准:检测完整性和概念可分离性,用于评估用于解释 OOD 检测器决策的概念集的有效性。基于这些度量标准,作者提出了一种无监督的框架,用于学习满足高检测完整性和概念可分离性要求的概念集,并展示了该框架在为各种现成的 OOD 检测器提供基于概念的解释方面的有效性。文章还展示了如何识别对检测结果有重要贡献的突出概念,并进一步解释了它们的决策。
文章的主要贡献包括:
1. 提出了用于评估基于概念解释 OOD 检测器的新度量标准:检测完整性和概念可分离性。
2. 提出了一个概念学习目标,并通过适当的正则化项,在给定 DNN 分类器的 OOD 检测器的情况下学习一组具有高检测完整性和概念可分离性的概念。
3. 将 OOD 检测器视为黑盒,并展示了该方法可以应用于解释各种现有的 OOD 检测方法。同时,实验证明了针对分类器学习的概念不能直接用于解释 OOD 检测器,而通过该方法学习的概念对于解释分类器和 OOD 检测器都是有效的。
/ ICML 2023 Poster /
论文标题:
论文链接:
https://openreview.net/forum?id=c5K7gcd2Rw
文章的方法描述主要包括三个部分:1)对三种类型的损失函数(ℓ2-Lipschitz 损失、ℓ∞-Lipschitz 损失和 self-bounding 的 Lipschitz 损失)进行泛化误差界限的开发;2)将这些泛化界限应用于学习线性特征和非线性特征的无监督表示学习问题;3)将结果应用于下游分类问题的泛化分析。
/ ICML 2023 Poster /
论文标题:
Discover and Cure: Concept-aware Mitigation of Spurious Correlation
该文章的出发点是解决深度神经网络在预测过程中依赖于 spurious correlation 而导致泛化能力受限的问题。作者指出,例如将猫与床背景关联的模型在其他没有床的环境中无法正确预测猫的存在。为了解决这个问题,作者提出了一种可解释的框架,名为 Discover and Cure(DISC),用于发现和减轻错误关联。
DISC 框架通过使用可解释的概念,迭代地进行以下两个步骤:1)发现在不同环境中不稳定的概念作为错误属性;2)使用发现的概念对训练数据进行干预,以减少错误关联。通过系统实验证明,DISC 框架相比现有方法在泛化能力和可解释性方面表现更好。在对象识别任务和皮肤病变分类任务上,DISC 方法的性能分别比现有方法提高了 7.5% 和 9.6%。此外,作者还提供了理论分析和保证,以了解通过 DISC 训练的模型的优势。
/ ICML 2023 Poster /
论文标题:
论文链接:
https://openreview.net/forum?id=fX5I7lGLuG
为了充分发挥 DRO 在领域泛化中的潜力,文章提出了一种新的方法称为 Moderately Distributional Exploration(MODE),旨在通过在一个与训练领域具有相同语义因素的不确定子集中进行分布探索,解决领域泛化中的低置信度问题。文章通过理论框架给出了该方法在未知目标领域上的泛化估计和风险估计。实验结果表明,MODE 相比最先进的基线方法具有竞争性的性能。
/ ICML 2023 Poster /
论文标题:
论文链接:
https://openreview.net/forum?id=ChniRIfpRR
为了解决这个问题,作者介绍了一个名为 NINCO 的新的测试 OOD 数据集,其中每个样本都经过检查以确保不包含 ID 对象,并且具有细粒度的 OOD 类别范围,可以详细分析 OOD 检测器的强项和失效模式,特别是与一些合成的 OOD 单元测试相结合。文章通过对 NINCO 数据集和单元测试上的大量架构和 OOD 检测方法进行详细评估,揭示了关于模型弱点和预训练对 OOD 检测性能的影响的新见解。
/ ICML 2023 Poster /
论文标题:
The Value of Out-of-Distribution Data
论文链接:
https://openreview.net/forum?id=8D3SsQlRbY
/ ICML 2023 Poster /
论文标题:
论文链接:
https://openreview.net/forum?id=CERS3hZIrH
4. 在实证研究中表明,DFDG 方法在性能上优于现有的 DG 方法,而且使用更少的超参数,意味着实现更快、更容易。
/ ICML 2023 Poster /
论文标题:
论文链接:
https://openreview.net/forum?id=IgpMs357b5
本文的背景依然是 domain generalization,但是聚焦于如何使用 pretrain models,之前的工作显示,通过选择目前最优的预训练模型(PTM)给特定的 DG 任务,不需要任何 DG 算法就能达到非常好的泛化性能。但是到目前为止,还没有工作去研究各种 PTM 有什么样的 inductive bias,以及这些 bias 如何影响他们的泛化能力。大家在做的事情一般都是选几个效果最好的,而不是最正交或者可以互相补全的,因此在很多场景下,多个模型 ensembling 的效果还不如单个模型。
/ ICML 2023 Poster /
论文标题:
论文链接:
https://openreview.net/forum?id=Yh9sFZQk7Y
文章的出发点是研究源自由领域自适应(Source-free domain adaptation,SFDA)。SFDA 是一种非常有吸引力的方法,因为它允许使用无标签数据将现成的模型适应到新的领域。文章的主要贡献是在生物声学领域应用现有的 SFDA 技术,并发现现有方法在这个领域的性能与视觉领域的基准表现不同,并且有时甚至比没有适应算法的情况下表现更差。为了解决这个问题,作者提出了一个新的简单方法,在新的领域中超过了现有的方法。作者的研究结果表明,现有的 SFDA 方法并不像之前认为的那样具有通用性,而考虑到不同的模态可以是设计更鲁棒模型的有用途径。
/ ICML 2023 Poster /
论文标题:
论文链接:
https://openreview.net/forum?id=FLhE8qzOmo
3. 对比了该研究框架与以往关于平坦极小点猜想的框架,指出傅里叶分析提供了更可靠的理论框架来理解神经网络的泛化性能。
/ ICML 2023 Poster /
论文标题:
论文链接:
https://openreview.net/forum?id=4SHQv4cp3I
传统的 data augmentation 实际上对只对 noise 特征进行了调整
Domain-invariant augmentations 尝试着去随机化所有和域相关的特征,但是这里的话就会影响与域相关的特征中对 label 也有因果影响的部分
/ ICML 2023 Poster /
论文标题:
论文链接:
除此之外,他们的方法不仅能够显示特征如何改变,还能显示分布中的群体如何发生转变。通过使用他们的解释映射,操作员可以更有效地理解环境发生的变化,并采取相应的措施。
/ ICML 2023 Poster /
论文标题:
论文链接:
接下来,文章提出了一个有效的两步元算法,与大多数领域适应启发式方法兼容:(i)在每个时期伪平衡数据;(ii)使用目标标签分布估计调整最终分类器。这个元算法提高了现有的领域适应启发式方法在大的标签比例转移下的性能,通常提高了 2-10% 的准确率,而在标签比例没有变化时几乎没有影响(不到 0.5%)。文章的特殊发现是,现有的针对放松标签偏移的方法往往无法改善源分类器的性能,并且与使用元算法的现有领域适应方法相比表现明显不佳。
更多阅读
#投 稿 通 道#
让你的文字被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。
📝 稿件基本要求:
• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注
• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题
• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算
📬 投稿通道:
• 投稿邮箱:[email protected]
• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者
• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿
△长按添加PaperWeekly小编
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
微信扫码关注该文公众号作者