Redian新闻
>
NeurIPS 2023 Spotlight | 半监督与扩散模型结合,实现少标签下可控生成

NeurIPS 2023 Spotlight | 半监督与扩散模型结合,实现少标签下可控生成

公众号新闻

©作者 | 游泽彬

单位 | 中国人民大学

研究方向 | 生成模型及其应用


本文介绍本组近期发表在 NeurIPS 2023 上的工作 DPT。目前 DPT 已经被 NeurIPS 2023 录取接收为 Spotlight.


论文题目:
Diffusion Models and Semi-Supervised Learners Benefit Mutually with Few Labels

论文链接:

https://arxiv.org/abs/2302.10586

代码链接:

https://github.com/ML-GSAI/DPT

论文作者: 

游泽彬,钟勇,鲍凡,孙嘉城,李崇轩,朱军



概述


本文提出了一种简单有效的训练策略,称为双重伪训练(DPT),以进一步推进半监督生成和分类任务。DPT 分为三个步骤:首先,在部分标记的数据上训练分类器以产生伪标签;接着,利用这些伪标签训练条件生成模型,生成伪图像;最后,结合真实图像和伪图像重新训练分类器。实验结果显示,在极少的标签数据(如<0.1%)下,扩散模型能够可控语义地生成高质量图像。此外,生成式增强对半监督分类任务也有显著的助益。



DPT的概览图


▲ Overview





主要的实验结果


生成的样本图



▲ samples


这里展示了一些生成的样本图,最上面是 512 分辨率的样本,每一类只用了五个标签。下面两行是 256 分辨率的样本,每一类仅使用了一个标签。可以看到,生成的样本图的质量很高,而且语义上也是可控的。


半监督生成和分类


▲ results


左边的图展示了半监督生成的结果,圆圈的圆心点对应的 y 值代表对应的 FID 结果,FID 是越低越好,代表生成的图像跟真实图像的差距越小。可以看到,随着使用的标签数量增加,FID 也不断减小,证明用的标签越多,一定程度上可以认为生成图像的质量越高,语义匹配程度也越好。同时,因为我们使用的生成器为 U-ViT,是一种领先的扩散模型,因此我们仅使用非常少的标签,比如小于 0.1% 的标签,就可以达到很好的效果,甚至超过一些使用全标注训练的扩散模型。


右边的图展示了半监督分类的结果。可以看到,生成式增强对于半监督分类有明显的增益作用。这主要得益于扩散模型在生成质量上相比于之前主流的生成模型,比如生成对抗网络,变分自编码器等,有了很大的提升。因此,生成的图像可以作为一种有效的数据增强手段,来提升半监督分类的性能。


分类器无法正确分类时,生成的图像


▲ fail_samples


在该图中,从左到右分别为每类使用了 1,2,5 个标签时,给定金鱼这个标签生成出来的图像,然后 P 跟 R 越低代表着对金鱼这个类分类越差,即有很多的金鱼图被分类为了其他的类别,同时也有很多的其他类别的图被分类为了金鱼。


当每一类使用了一个标签时,分类器无法正确地为金鱼进行分类,此时生成器给定金鱼这个标签去生成时会生成出很多珊瑚的图,这主要是因为在分类时有很多珊瑚的图被分类为了金鱼,因此分类器就给生成器提供了非常多的错误语义的有标签数据。这是比较不好的。


但是随着我们标签使用的增加,生成的图质量会更好,同时在语义匹配程度上也会有提高。


更多阶段


▲ more_stages


从概览图可以看出,目前 DPT 主要分为三个阶段,但是第三个阶段产生的分类器相比于第一阶段有一定的提高,那么一个比较关系的话题就是,当使用第三个阶段得到的分类器重新为生成器提供伪标签,是否会取得更好的效果。


我们发现,当使用更好的伪标签时,在生成指标上都有了一定的提高,证明我们 DPT 的三个阶段能够形成一种正向循环,来迭代的提高伪标签的准确率和伪图像的语义匹配程度。使得生成的图质量更高,语义更准。




主要贡献


我们提出了双重伪训练这种训练策略,简单有效,原则上能够结合任何一种半监督分类器和生成模型。我们得到了在半监督生成任务上的显著提升,特别地,我们在极少的标签数据(如<0.1%)下,扩散模型能够可控语义地生成高质量图像。在半监督分类任务上取得了领先的结果。证明了生成式数据增强对半监督分类任务的仍然是有帮助的。


更多阅读



#投 稿 通 道#

 让你的文字被更多人看到 



如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 


PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。


📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算


📬 投稿通道:

• 投稿邮箱:[email protected] 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿


△长按添加PaperWeekly小编



🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧


·
·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
NeurIPS 2023 | PointGPT:点云和GPT大碰撞!点云的自回归生成预训练NeurIPS 2023 | 任意模型都能蒸馏!华为诺亚提出异构模型的知识蒸馏方法NeurIPS 2023 | 旷视张祥雨等人提出RevColV2:当解耦学习遇见自监督训练!视觉预训练新思路NeurIPS 2023 Spotlight | 探索不变学习中的充分必要因果ACM MM 2023 | CLE Diffusion:可控光照增强扩散模型NeurIPS 2023 | SlotDiffusion: 基于Slot-Attention和扩散模型的全新生成模型NeurIPS 2023 Spotlight | 基于超图的表格语言模型China's Top Court Spotlights Domestic Violence Children语言模型战胜扩散模型!谷歌提出MAGVIT-v2:视频和图像生成上实现双SOTA!国内AI顶会CPAL论文录用结果放出!共计30篇Oral和60篇Spotlight|另附报名流程红色日记 代理出纳 3.1-10JMT 2023.08.21NeurIPS 2023 | 扩散模型解决多任务强化学习问题NeurIPS 2023 | RevCol V2: 当解耦学习遇上自监督训练,视觉预训练的思路NeurIPS 2023 | 李飞飞团队提出SiamMAE:孪生掩码自编码器,刷榜视觉自监督方法!北大全新「机械手」算法:辅助花式抓杯子,GTX 1650实现150fps推断|NeurIPS 2023NeurIPS 2023 | 全新机械手算法:辅助花式抓杯子,GTX 1650实现150fps推断China’s Rural Children Close Height, Weight Gap, but Obesity LooJMT 2023.08.20NeurIPS 2023 | 扩散模型再发力!微软提出TextDiffuser:图像生成的文字部分也能搞定!Financial Aid in Spotlight As Student Flaunts $209 ConcertMigratory Birds Protection in Spotlight at World Coastal Forum俄乌战况12JMT 2023.08.24NeurIPS 2023 Spotlight|高质量多视角图像生成,完美复刻场景材质!SFU等提出MVDiffusionNeurIPS 2023 | MSRA、清华、复旦等联合提出AR-Diffusion:基于自回归扩散的文本生成大语言模型击败扩散模型!视频图像生成双SOTA,谷歌CMU最新研究,一作北大校友在图像、视频生成上,语言模型首次击败扩散模型,tokenizer是关键在巴黎,任意识流《时代周刊》上的毛泽东笑谈邂逅(42)海口银达公司的老总达森跑了芝马训练第八周CIIE Watch | Sustainability in Spotlight: from Product to BoothNeurIPS 2023 | 大模型时代自监督预训练的隐性长尾偏见NeurIPS 2023 | 中科院&旷视提出DropPos:全新的自监督视觉预训练代理任务NeurIPS 2023 | 结合脉冲神经网络和Transformer的纯加法TransformerJMT 2023.08.23NeurIPS 2023 Spotlight | 面向通用决策场景的MCTS基准框架:LightZero一文速览NeurIPS 2023大模型/预训练/上下文学习相关Spotlight文章NeurIPS上新 | 从扩散模型、脑电表征,到AI for Science,微软亚洲研究院精选论文
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。