国际科技财经博客移民网络热点娱乐民生时事公众号

>

ICLR 2024论文审稿结果出炉！7000+高产论文创新纪录，扩散模型占比最高

ICLR 2024论文审稿结果出炉！7000+高产论文创新纪录，扩散模型占比最高

公众号新闻

2023-11-13 11:11

新智元报道

编辑：桃子好困

【新智元导读】ICLR 2024论文审稿终于出结果了，今年7000多片论文提交，创下有史以来最新记录。

ICLR 2024审稿结果公布了！

ICLR是机器学习领域重要的学术会议之一，每年举办一次。2024年是第十二届，将在奥地利维也纳5月7日-11日召开。

根据OpenReview官方放出的结果显示，今年共有7135篇投稿论文。

此外，另有国内开发者魏国强自己爬虫做了完整的统计数据，论文投稿有7215篇，平均分为4.88。

https://guoqiangwei.xyz/iclr2024_stats/iclr2024_submissions.html

就具体分数分布情况来看，均分为4.2分的论文有1086篇，4.9分1163篇，5.7分1015篇，这些都是1000篇+的论文的得分。

亚马逊工程师统计有7304篇提交的论文，平均分为4.9。

具体占比，均分为4.9-5.0，5.2-5.3论文数分别占总数的9%。

https://github.com/maxxu05/openreview_summarizereviews/tree/main

论文投稿暴涨7000+，创历史新高

最值得一提的是，不管具体投稿数字是多少，ICLR 2024总论文提交创下历史新高。

这种巨大反差，可以从历年的统计数据中可以看出。

ICLR 2017那时仅有490篇，一直到ICLR 2023涨到4955篇。ICLR 24更是增长了2000+篇。

最近两年接收率都在30%以上，今年也不会低。

论文提交数量空前爆发，离不开ChatGPT做出的巨大贡献。

上周，arXiv平台公布了10月份该平台论文提交总数，仅仅一个月就有20,710篇，也创下了最新记录。

其中，大约一半的论文关于CS领域，3500预印与CV、ML领域有关。

平均一下，每天有668论文上传，这个数据确实有点离谱。

ICLR 2024研究领域，扩散模型占比最多

那么，ICLR 2024提交论文的主题都涉及了哪些领域，也有网友做出了总结。

- 451个标题包含「Diffusion」
- 208个标题包含「LLM」
- 6个标题包含「ChatGPT」
- 25个标题包含「NeRF」
- 41个标题包含「GAN」
- 15个标题包含「All you need」
- 22个标题包含「Dream」
- 6个标题包含「Magic」

高分论文

第一篇Generalization in diffusion models arises from geometry-adaptive harmonic representation是关于扩散模型的研究，评分为8,8,10,8。

当前，基于分数的反向扩散算法，能够生成高质量的样本，这一发现表明经过去噪训练的深度神经网络（DNN）可以学习数据密度分布，尽管存在维数灾难（curse of dimensionality）。

但是，最近有许多讨论关于，模型只是简单地记忆了训练数据，并没有真正意义上学习到数据的本质分布。

对此，研究人员训练了两个在不同数据子集上训练去噪DNN模型，结果发现它们得分函数和密度分布非常接近，而且训练图像数据量惊人地少。

这种强大的泛化能力证明了，DNN架构和训练算法中存在强大的归纳偏置（Inductive bias）。

研究人员进一步分析了这种归纳偏置存在的原因，证明去噪模型在适应底层图像的基础上执行收缩操作。

即使在一些不适合这种基础的图像数据上训练，模型也还是会学习到这种谐波表示。因此可以证明去噪模型对这种自适应谐波表示存在偏置。

此外，我们表明，当在已知最优基础是几何自适应和调和的常规图像类上训练时，网络的去噪性能接近最优。

第二篇Revitalizing Channel-dimension Fourier Transform for Image Enhancement是关于图像增强、傅里叶变换的研究，评分为8,10,8,8。

探索傅立叶变换的全局表示来增强图像已成为一种替代方法，并取得了重大进展。

然而，以往的研究只在空间维度上进行，忽略了通道维度的潜力，而通道维度本身就具有识别特征。

在这项工作中，作者提出了一个全新的视角，即用于图像增强的通道维傅里叶变换。

其中的设计过程简单而有效，包括3个简单的步骤：对通道维度进行傅里叶变换以获得通道傅里叶域特征，对其振幅和相位分量进行通道变换，然后返回空间域。

根据上述规则，作者在不同的运算空间中提供了3种可供选择的通道变换实现格式，分别在 1) 带高阶的全局向量；2) 带通道组的全局向量；以及 3) 基于空间的傅里叶变换得到的傅里叶特征中进行运算。

上述核心设计作为通用运算器，可与增强网络无缝集成，取得显著收益并建立高效模型。

通过对多种图像增强任务（如低照度图像增强、曝光校正、SDR2HDR转换和水下图像增强）的广泛实验，研究的设计架构显示出一致的性能提升。

Monte Carlo guided Denoising Diffusion models for Bayesian linear inverse problems是关于去噪扩散模型的研究，评分为6,10,8,10。

从计算摄影到医学成像，各种应用中经常出现难以解决的线性逆问题。最近的研究方向是利用贝叶斯推理和信息先验来处理这类问题。

在这些前置条件中，基于分数的生成模型（SGM）最近被成功应用于几个不同的逆问题。

在这项研究中，作者利用SGM定义的先验的特殊结构，定义了一系列中间线性逆问题。随着噪声水平的降低，这些逆问题的后验越来越接近原始逆问题的目标后验。

为了从这一系列后验中采样，研究人员使用了序列蒙特卡罗（SMC）方法，并提出了算法 \algo。

研究证明，在贝叶斯环境下处理问题不明确的逆问题时，该算法的性能优于其他同类算法。

SDXL模型我们最熟悉不过了，它的评分为8,8,8,8。

作者介绍了用于文本到图像合成的潜在扩散模型——SDXL。与之前版本的SD模型相比，SDXL利用的UNet主干网扩大了3倍，这是通过显著增加注意力块的数量，并加入第二个文本编码器实现的。

此外，研究者还设计了多种新颖的调节方案，并在多种长宽比上对SDXL进行了训练。

为了确保获得最高质量的结果，他们还引入了一个细化模型，用于利用事后图像对图像技术提高SDXL生成的样本的视觉保真度。

研究证明，SDXL比以前版本的Stable Diffusion有了显著改进，其结果可与Midjourney等先进图像生成器相媲美。

至于如何能拿下8,8,10,8的高分论文，你只需要复习自己大学本科学习的图像处理课程就行了。

剩下的高分论文，有感兴趣的童鞋，可以自己查阅。

地址：https://guoqiangwei.xyz/iclr2024_stats/iclr2024_submissions.html

最后，祈祷大家都能中。

参考资料：

https://www.zhihu.com/question/622925909

https://twitter.com/SergeyI49013776/status/1723265271366914481

https://guoqiangwei.xyz/iclr2024_stats/iclr2024_submissions.html

https://twitter.com/omerbartal/status/1723247327710761029

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

國外網站《SimpleGhar》統計知名照片平台 Flickr 資料，查閱多達 4 億 7000 萬張照片的標籤大语言模型击败扩散模型！视频图像生成双SOTA，谷歌CMU最新研究，一作北大校友浙江东湖，水中乌篷船苹果“套娃”式扩散模型，训练步数减少七成！英国净移民人数创新纪录，想拿工签的留学生可能更难了在图像、视频生成上，语言模型首次击败扩散模型，tokenizer是关键红色日记金训华 12.1-15 NeurIPS 2023 | 扩散模型再发力！微软提出TextDiffuser：图像生成的文字部分也能搞定！最新！澳全民公投初步结果出炉！澳洲突现大批蒙面黑衣人！占领火车站，行“纳粹礼”！路人吓傻！NeurIPS上新 | 从扩散模型、脑电表征，到AI for Science，微软亚洲研究院精选论文美国电动车年度销量创新纪录，特斯拉份额仍在增长 AI视觉字谜爆火！梦露转180°秒变爱因斯坦，英伟达高级AI科学家：近期最酷的扩散模型｜亮马桥小纪严选土耳其以弗所(Ephesus)，海中城堡 AIGC时代的视频扩散模型，复旦等团队发布领域首篇综述语言模型战胜扩散模型！谷歌提出MAGVIT-v2：视频和图像生成上实现双SOTA！NeurIPS 2023 | 扩散模型解决多任务强化学习问题狙击扩散模型！谷歌&伯克利提出IGN：单步生成逼真图像！浙江丽水一美女老师“自曝”不雅聊天记录，与12名老师关系暧昧！调查结果出炉…生成扩散模型漫谈：中值定理加速ODE采样美国多家大银行宣布关分行！新泽西占比最高你的社区受影响吗？NeurIPS 2023 Spotlight | 半监督与扩散模型结合，实现少标签下可控生成 9连降！跌破700万对，我国去年结婚人数比上年降10.6%！25至29岁结婚人群占比最多 GPT-4+物理引擎加持扩散模型，生成视频逼真、连贯、合理手机上0.2秒出图、当前速度之最，谷歌打造超快扩散模型MobileDiffusion 生成的分子几乎 100% 有效，用于逆向分子设计的引导扩散模型公司法修订丨相较于二审稿，公司法修订三审稿到底改了啥 2023全美机场评比结果出炉！德州两个上榜最佳顶会CoRL 2023获奖论文出炉！华人团队获最佳论文、最佳系统论文！NeurIPS 2023 | SlotDiffusion: 基于Slot-Attention和扩散模型的全新生成模型终结扩散模型，IGN单步生成逼真图像！UC伯克利谷歌革新LLM，美剧成灵感来源乱云飞，跟唱武汉大学最新处理结果出炉！网友：没碰到就不算性骚扰……美国大学MBTI民间票选结果出炉！i人e人怎么选择最合适的名校？神秘的大杂院（十）石匠的婚事画你所想！北航港大提出DiffSketcher：基于扩散模型的文本驱动矢量化手绘草图合成谷歌推出创新SynCLR技术：借助AI生成的数据实现高效图像建模，开启自我训练新纪元！

热点事件追踪