一文速览ICML 2023测试时自适应/在线学习相关论文
现实场景中,模型不仅仅局限于单次训练,在部署之后是依然可以利用在线的数据流对模型进行一些调整,本文总结了和 Test time adaptation, online learning 场景下 ICML 2023 的相关文章。
/ ICML 2023 /
论文标题:
Uncovering Adversarial Risks of Test-Time Adaptation
不过本文提到的风险个人理解的话并不适用于所有的方法,比如 AdaNPC 这种不需要调整模型参数的方法。
/ ICML 2023 /
论文标题:
On Pitfalls of Test-Time Adaptation
https://arxiv.org/abs/2306.03536
超参数的选择对 TTA 的有效性有很大影响,但在实践中很难进行选择,特别是在没有关于分布偏移的先验知识的情况下。常规的超参数选择方法并不一定提高测试准确性,甚至可能产生负面影响。 TTA 的有效性可能在不同模型之间差异很大。模型在源域中的准确性和特性都对适应后的结果产生很大影响。此外,对于域泛化的好的数据增强方法可能对 TTA 产生负面影响。 即使在理想的算法条件下,现有方法在某些分布偏移情况下仍表现不佳。这些情况包括相关偏移(correlation shift)和标签偏移(label shift),这些偏移在 TTA 领域中很少考虑,但在领域适应和领域泛化中广泛使用。
/ ICML 2023 /
论文标题:
论文链接:
提出了一种使用训练数据代理的测试阶段自适应方法,避免了大内存需求和隐私泄露问题。 设计了一种专门用于测试阶段自适应的数据集压缩技术,通过合成少量的图像来代表整个训练数据集,同时保持较少的领域特异性和隐私敏感信息。 提出了一种名为 Class-Relation Knowledge Distillation(CRKD)的知识蒸馏方法,通过转移训练数据中的类间关系来适应测试数据。 在四个测试基准上,该方法在计算和内存方面的要求都比现有技术更低,同时性能更好。
测试阶段自适应部分利用训练数据代理的两种方式。首先,使用具有测试数据风格的合成数据进行有监督学习。其次,将从训练数据中学习到的类间关系传递到测试数据的预测中。通过将测试样本的风格信息注入到合成数据中,可以减少训练和测试数据之间的分布差异。此外,还使用对比学习减小了测试样本和测试样本风格化的合成数据之间的表示差异。
/ ICML 2023 /
论文链接:
https://arxiv.org/abs/2306.12646
该论文的出发点是研究持续学习(Continual Learning,CL)中的类增量学习(Class Incremental Learning,CIL)设置。CIL 是一种学习由不相交的概念或类组成的任务序列的方法。在任何时间点,都会构建一个单一模型,该模型可以应用于预测/分类到目前为止学习的任何类的测试实例,而不为每个测试实例提供任何与任务相关的信息。尽管已经提出了许多用于 CIL 的技术,但它们大多是经验性的。最近的研究表明,强大的 CIL 系统需要强大的任务内预测(within-task prediction,WP)和强大的超出分布(out-of-distribution,OOD)检测。然而,目前尚不清楚 CIL 是否实际上是可以学习的。该论文证明了 CIL 是可以学习的,并基于这一理论提出了一种新的 CIL 算法。实验结果证明了其有效性。
该论文的主要贡献有两个:
首次进行了 CIL 的可学习性研究,以作者所知,迄今为止还没有类似的研究。
基于理论,提出了一种新的 CIL 方法,称为 ROW(Replay, OOD, and WP for CIL)。实验结果表明,它优于现有的强基准方法。
在论文中,首先提出了 CIL 的定义和挑战,包括灾难性遗忘(catastrophic forgetting,CF)和任务间类别分离(inter-task class separation,ICS)的问题。接着,论文介绍了一种理论,即良好的 WP 和 OOD 检测是强大的 CIL 模型的必要和充分条件。然而,之前的研究并未证明 CIL 是可学习的,因此本论文对 CIL 的可学习性进行了研究,并提出了基于该理论的新的 CIL 算法 ROW。
/ ICML 2023 /
论文标题:
这篇文章的出发点是研究如何将场景解析为其组成实体,并改进当前视觉检测器在超出训练分布的场景中的泛化能力。近期的测试时自适应方法使用辅助的自监督损失来独立地为每个测试样例调整网络参数,并在图像分类任务中显示出在训练分布之外泛化的有希望的结果。该研究发现,在场景分解任务中,这些损失单独来说对于任务是不足够的,还需要考虑架构的归纳偏差。最近的基于槽中心生成模型尝试通过重建像素来以无监督的方式将场景分解为实体。结合这两个研究方向,作者提出了一种名为 Slot-TTA 的半监督槽中心场景分解模型,该模型在测试时通过梯度下降在重建或交叉视图合成目标上对每个场景进行自适应调整。作者在多个输入模态(图像或 3D 点云)上评估了 Slot-TTA,并展示了其对最先进的监督前馈检测器和替代测试时自适应方法在分布之外性能上的显著改进。
文章的主要贡献如下:
(i)提出了一种算法,通过对测试集中的每个示例进行测试时自适应,显著提高了超出训练分布示例的场景分解准确性。作者描述了不同输入模态(2D 多视图 RGB 图像、2D 单视图 RGB 图像和 3D 点云)的编码和解码骨干结构以及训练方式。
(ii)展示了基于半监督学习的测试时自适应方法在场景分解任务中的有效性,而先前的自监督测试时自适应方法主要在分类任务中展示了结果。
(iii)引入了槽中心生成模型的半监督学习,展示了它可以使这些方法在测试时继续学习。与此相反,之前关于槽中心生成的工作既没有受到监督训练,也没有用于测试时自适应。
/ ICML 2023 /
论文标题:
Theory on Forgetting and Generalization of Continual Learning
这篇文章的出发点是填补关于连续学习(Continual Learning,CL)的理论研究空白。目前大部分的研究都集中在对 CL 的实验性能进行评估,而对于 CL 的理论研究还比较有限。文章的主要贡献是在过参数化线性模型的基础上提供了第一个明确的连续学习设置下遗忘和泛化误差的期望形式。通过对这一关键结果的进一步分析,文章揭示了过参数化、任务相似性和任务顺序对于遗忘和泛化误差的影响。文章通过在实际数据集上使用深度神经网络进行实验,证明了其中一些洞察甚至可以超越线性模型,并可以应用于实际设置中,解释了一些最近研究中的一些有趣的经验观察,并且为连续学习的更好实际算法设计提供了动力。
文章特殊的发现主要有以下几点:
过参数化、任务相似性和任务顺序对于遗忘和泛化误差的影响:
过参数化的模型可以在一定程度上减轻遗忘和改善泛化误差,特别是在存在大噪声或任务相似性较低的情况下,良性过拟合现象更容易观察到。
任务相似性的增加可以降低泛化误差,但并不总是降低遗忘。在某些情况下,当任务不太相似时,遗忘甚至可以减少。
为了最小化遗忘,最佳的任务顺序应该在早期阶段多样化学习任务,并在旁边学习更不相似的任务。
/ ICML 2023 /
论文标题:
论文链接:
https://arxiv.org/abs/2306.04911
该论文的出发点是解决域泛化(domain generalization,DG)问题,即在模型训练时未知目标域,但训练后的模型在推理过程中应能成功处理任意(可能是未见过的)目标域。文章采用了一种简单而有效的方法来解决这个问题。首先,提出了测试时样式转换(test-time style shifting)的方法,该方法将测试样本的样式(与源域存在较大样式差距)转换为模型已熟悉的最近的源域样式,然后进行预测。这种策略使模型能够处理具有任意样式统计的任何目标域,而无需在测试时进行额外的模型更新。其次,提出了样式平衡(style balancing)方法,通过处理 DG 特定的不平衡问题,为最大化测试时样式转换的优势提供了良好的平台。这些提出的方法易于实现,并能与各种其他 DG 方案结合使用。实验结果表明,这些方法在不同数据集上有效。
提出了测试时样式转换(test-time style shifting)方法,通过在测试时将测试样本的样式转换为最近的源域样式,解决了源域与目标域之间的大样式差距问题。该方法不需要在测试时进行额外的模型更新,并且与任何任务/模型兼容。
此外,论文还发现在 DG 中存在特定的不平衡问题,传统的类别不平衡处理方法无法有效处理这些问题。因此作者提出了提出了样式平衡(style balancing)方法,通过处理 DG 特定的不平衡问题,为测试时样式转换的有效性提供了支持。该方法通过选择具有相似样式统计的样本,并将其样式转换为其他域,增加了训练过程中每个类别的域多样性,以弥补每个域中缺失的类别。
/ ICML 2023 /
论文标题:
Learning Rate Schedules in the Presence of Distribution Shift
该研究的特殊发现是,当数据分布发生变化时,最优学习率调度通常会增加,即需要更多的探索。这一发现与直觉一致,并为在在线学习中处理数据分布变化提供了理论支持。
/ ICML 2023 /
论文标题:
https://arxiv.org/abs/2302.02460
对于离散和连续平滑密度估计问题,给出了漂移下的最小风险界。
在离散密度估计问题中,使用离散密度的总变差距离,得到了关于总变差距离的最小风险界。
在连续平滑密度估计问题中,使用 L2 距离,得到了关于集成平方损失的最小风险界。
对于在线版本的问题,给出了离散密度估计和二元分类器学习问题的最小风险界。
Conclusion
总结以下:
目前存在许多测试时间适应性方法,包括参数微调、和模型修正等。这些方法采用不同的策略来解决模型在测试阶段遇到的领域偏移和数据分布不匹配等问题。 自监督学习(self-supervised learning)被广泛应用于测试时间适应性中,通过从数据中提取自动生成的标签来提高模型的泛化性能。 测试时间适应性的研究主要集中在计算机视觉领域,如图像分类、目标检测和语义分割等任务上。然而,其概念和方法也适用于其他机器学习领域,如自然语言处理和强化学习。
在测试时间适应性的发展趋势方面,可以预见以下几个方向的研究:
方法改进:未来的研究将进一步改进测试时间适应性方法的效果和效率。这包括设计更有效的领域自适应算法、开发更强大的模型修正技术以及优化自监督学习的方法。 跨领域应用:尽管当前的研究主要集中在计算机视觉领域,但测试时间适应性的概念和技术在其他领域的应用潜力仍然很大。未来的研究可以将测试时间适应性方法应用于自然语言处理、医学图像分析、推荐系统等不同领域,以提高模型的泛化性能。 理论探索:测试时间适应性的理论研究相对较少,未来的工作可以探索该领域的理论基础,深入研究测试时间适应性方法的原理和局限性。 实际应用:测试时间适应性的研究还需要更多的实际应用和验证。未来的工作应该注重将测试时间适应性方法应用于真实世界的场景和问题,并在实际应用中评估其效果和可行性。
更多阅读
#投 稿 通 道#
让你的文字被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。
📝 稿件基本要求:
• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注
• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题
• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算
📬 投稿通道:
• 投稿邮箱:[email protected]
• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者
• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿
△长按添加PaperWeekly小编
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
微信扫码关注该文公众号作者