Redian新闻
>
顶流Mamba竟遭ICLR拒稿!AI学者集体破防,LeCun都看不下去了。。。

顶流Mamba竟遭ICLR拒稿!AI学者集体破防,LeCun都看不下去了。。。

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【CV算法和求职】交流群

扫描下方二维码,加入CVer学术星球可以获得最新顶会/顶刊上的论文ideaCV从入门到精通资料,及最前沿应用!发论文搞科研,强烈推荐!

梦晨 西风 发自 凹非寺
转载自:量子位(QbitAI)

一项ICLR拒稿结果让AI研究者集体破防,纷纷刷起小丑符号

争议论文为Transformer架构挑战者Mamba,开创了大模型的一个新流派。发布两个月不到,后续研究MoE版本、多模态版本等都已跟上。

但面对ICRL给出的结果,康奈尔副教授Alexander Rush都表示看不懂怎么回事了,“如果这都被拒了,那我们小丑们还有什么机会”

在评论区和转发区,不少研究者带上小丑面具前来报道。


具体来说,四位审稿人打出8/8/6/3的分数,这样被拒很多人就已经觉得不正常。

其中一位审稿人提的问题是“有没有训练更大的模型,和10b参数的Transformer比较如何?”

对此,有人表示已经开始向审稿人提及实验成本了。

审稿人可能不知道他们要求的实验会花费50000美元

ICLR会议创办的初衷正是优化同行评审过程,LeCun作为会议创始人之一,也表达了不满:

很遗憾,历届程序委员会主席慢慢把它变成了一个与传统评审流程差不多的会议。

只有一些小胜利:OpenReview平台现在被大多数ML/AI会议使用,以及论文提交后立刻就能被所有人阅读(尽管匿名)。

LeCun还举例自己也有一篇从未被接受、ArXiv独占的论文,现在被引用次数已超过1880次。

也有研究者认为,这次很多高分被接受论文与Mamba比起来充其量只能算增量研究,更令人遗憾了。

这届ICLR混乱重重

先来借用给6分审稿人的意见,简单介绍一下Mamba论文的主要贡献。

  • 提出了基于SSM状态空间模型的新架构,可实现Transformer质量的性能,同时线性缩放序列长度。

  • 提出了一种硬件感知算法,通过扫描而不是卷积来循环计算模型,避免具体化扩展状态以减少内存使用。

  • 将先前的深度序列模型架构简化为同构架构,具有快速推理、线性缩放和改进的长序列性能。

  • 在多种模态(语言、音频和基因组学)上都取得SOTA性能,成为跨模态通用序列模型主干的有力候选者

但这位审稿人提出的二次内存需求问题,不少熟悉这篇论文的人都表示不认可。

对此,作者也在Rebuttal中给出了解释,内存需求实际上是随序列长度线性增长的。

另外一位打3分的审稿人,还被吃瓜群众指出可能根本不熟悉什么是RNN。

作者针对这位审稿人的Rebuttal太长,足足分了4条才发完。

然鹅,这位对自己评分给出5级置信度的审稿人,根本没有回复

这就让人更担心会不会影响领域主席的判断了。

正如这位研究者所说,这届ICLR出现的争议还不止一例。

8/8/6/3如果被拒还算事出有因,知乎相关讨论上还有得分8/8/8被AC拒,就更离谱了。

还有作者和审稿人吵起来,以至于要讨论礼貌问题的。

投稿接不接收全靠随机?

这也引发了网友们对整体学术评审现状的讨论。其中一个主要讨论点是评审过程有缺陷“接不接受真的很随机,和论文本身的质量关系不大”:

网友也是缓缓打出一个问号:

既然评审流程存在问题,那解决方案是什么?就靠运气?

对此,康奈尔副教授Alexander Rush甚至还提出了这样的建议(手动狗头)

如果你读博已经读到了第六年的那种,应该提交两篇糟糕的论文,而不是一篇好的。

不只一位学者分享了类似的建议:

我的教授曾说,论文被接受的过程就像掷一个四面骰子,如果这次运气不好,就再掷一次……

当然,也有人抱有不同的观点,认为会议作为一种认可,已出名的作品其实已经不需要了,可以给其他未被发掘的论文更多机会,所以已经出名的论文被学术会议拒绝也是完全可以接受的。

值得一提的是,还有不少人建议大家转投新生代会议CoLM,Alexander Rush自己也参与了这个会议的创办:

而大家提到的CoLM会议,全称Conference On Language Modeling,专注于语言模型领域。CoLM刚创立不久,第一届大会将在今年10月份举办。

其中七位组织者均是来自业界学界的大佬,其中有三位是华人学者谷歌周登勇、普林斯顿陈丹琦、Meta的Angela Fan。

与ICLR类似,COLM将采用双盲审核,并使用OpenReview管理投稿。

会议征稿主题包括但不限于语言建模及大模型语境下的对齐、数据、评估、社会影响、安全、科学、高效计算、工程、学习和推理算法等17个方向。

据说,COLM还是在ACL 2024主席公开抨击称“arXiv是科研的毒瘤”而后引发争论的背景下,催生出来的。

参考链接:
[1]
https://twitter.com/srush_nlp/status/1750526956452577486
[2]https://x.com/ylecun/status/1750594387141369891
[3]https://openreview.net/forum?id=AL1fq05o7H

快点击进入—>【CV算法和求职】交流群


计算机视觉技术交流群成立

扫描下方二维码,或者添加微信:CVer444,即可添加CVer小助手微信,便可申请加入CVer-计算机视觉微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer444,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!


扫码加入星球学习


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
看不下去加沙的“惨无人道暴行”,美高官辞职:我无法保持沉默LeCun转发!大连理工卢湖川、贾旭团队提出可插入图像/视频/3D生成的StableIdentityhé bàng?hé bèng?大自然的力量真神奇啊。。。。。。。他竟说“汉字由韩国人创造”,连韩国网民都看不下去了ICLR 2024 放榜!接收率31%!清华LCM论文作者:讲个笑话,被拒了。。。他们不想让孩子继续卷下去了,于是做出了这个选择。。。《商君书》驭民五术67、长篇民国小说《永泰里》第十三章 螳螂捕蝉(6)这个抹黑中国人的谣言,连日本官方和媒体都看不下去......维州人看病马上要更贵!这次,连他都看不下去了...半颗包菜让澳洲网民们集体破防!“还能回到10年前吗?”9点1氪:苹果市值一夜蒸发7919亿元;美国消费者集体起诉爱马仕“配货”潜规则;阿里巴巴回应出售哔哩哔哩股权Learning Curve: Young Teachers Strive as Class Leaders《星级男人通鉴》第49章 半瓶子酱油韩国仁川新地标抄袭中国广州塔?!几乎等比复制,韩国人都看不下去了...“网易蛋仔派对”上线抖音新春活动,一周涨粉超千万;YouTube顶流MrBeast入驻B站,一周涨粉115万 | 涨粉周榜伦敦2月UNCLE合租,仅£369/周;适合UCL/LSE/KCL的Studio仅£304/周;转租更便宜! (1月22日更新)AI搜索引擎再吸金5.28亿,英伟达贝佐斯入股,LeCun一众大佬夹道祝贺!网友:干翻谷歌又开偷了!韩国新地标碰瓷抄袭广州塔,设计团队死不承认!连韩国民众都看不下去了......去年双十一买的电器,既不发货也不退款!曾经的零售巨头,遭消费者集体起诉ICLR 2024 | 高分工作!Uni3D:3D基础大模型,刷新多个SOTA!美国大姐飞机上逼别人降舱换座,华裔妹子看不下去突然狂飙粤语,所有人都懵了....新加坡保安对中国游客作羞辱性手势,连日本游客都看不下去!官方最新回应来了墨尔本司机停车引热议!网友看不下去了,怒批:自私OpenAI像素级抄袭好莱坞IP,反手开撕《纽约时报》,LeCun舌战网友疑似站队支持ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞空白以军加沙掘墓,美媒看不下去了韩国仁川新地标抄袭中国广州塔?! 几乎等比复制, 这次韩国人都看不下去了...lululemon都出“旗袍”了?“980元穿上像迎宾服务员”如何在养老院生活鹅厂最新AI工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验华裔小哥再获融资7360万美元!天才程序员联合创办,LeCun大佬纷纷站台别骂了,昨夜一二线楼市集体破防!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。