Redian新闻
>
LSTM之父炮轰LLaMA 2:抄我想法还羞辱我!网友:LeCun干的吧?

LSTM之父炮轰LLaMA 2:抄我想法还羞辱我!网友:LeCun干的吧?

公众号新闻
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

LLaMA可谓是「驼红是非多」。

新版本刚发布没多久,就遭到了LSTM之父Jürgen Schmidhuber的炮轰。

你「饭来张口」也就算了,竟然还「放下碗骂娘」?

Schmidhuber称,Meta在训练LLaMA 2的时候用到了他在1991年提出的想法,结果LLaMA却对他疯狂抹黑。

一开始,网友发现在询问LLaMA 2关于Schmidhuber的事时,得到了令人意外的回复。

抱歉,我不能提供关于有负面背景的人的信息……

LLaMA还说,Schmidhuber「从事过有害活动」「对社会没有贡献」云云。

有网友猜测,这个回答是LeCun硬编码进去的。

LLaMA究竟是故意还是不小心的,这一点无从考证,不过可以确定的是这个消息传到了Schmidhuber的耳朵里。

Schmidhuber要求Meta和LeCun对此做出解释,两方到目前均没有回应。

「LeCun抢了我很多想法」

Schmidhuber提到的1991年的成果,是一种Transformer的线性(未归一化)变体。

Schmidhuber说,这也是最早的Transformer变体。相关论文在1992年发表,1993年登上了ICANN。

另外,根据Schmidhuber的说法,LeCun在「抢成果」方面已经是「惯犯」了。

不仅是LLaMA,LeCun还有很多成果都用到了他的想法,却声称自己是首创。

Schmidhuber称,早在2017年,Meta(当时还叫Facebook)就使用了他发明的LSTM。

不过当时Facebook的通告当中通篇未提及Schmidhuber的名字。

甚至还说LSTM是自己发明的。

又如在2022年,LeCun总结了10年来AI领域最重要的五大突破。

Schmidhuber表示,这些成果大部分都是来自他的实验室:

  • 自监督学习实际上就是把1991年的RNN进行堆叠

  • ResNet就是2015年的Highway Net

  • 3和4就是1991年的fast weight

  • 5实际上就是1991年的线性Transformer变体

当时的LeCun毫不客气地回怼,还对Schmidhuber挖苦了一番:

在莱特兄弟之前也有人发明过飞机,但是只飞了不到50米,所以没有人记住他(Ader)的名字。
Schmidhuber做出来的模型就和Ader的飞机一样,就算是最早的,也没有什么作用。

Schmidhuber接下来又拿出了LeCun的一篇关于机器自主智能的论文。

Schmidhuber说,这篇论文中涉及了1990-2015年间的成果,但并未标注引用。

为了充分展示这篇论文中「抢」走的成果,Schmidhuber还专门做了一个网页,详细列举了有关内容。

具体内容这里就不一一介绍了,我们来看LeCun是怎么回应的。

LeCun先是呛了一句,「咱就不能说点有建设性的意见吗?」,之后又说:

我在论文里都说了,很多概念已经存在了很长时间,你为什么非揪着不放?
再说了,可训练的世界模型本就是系统识别的核心思想。
而且论早的话,80年代就有人用神经网络学习人类世界了,不比你1991更早?

就这样,这场战火一直烧到今年。

2月,Schmidhuber发推称,LeCun既没有承认错误,也没有通过正确的方式(OpenReview)对他的论文进行辩护,而是针对Schmidhuber发表了极具误导性的观点。

直到这次LLaMA 2被曝出发表攻击Schmidhuber的言论,两人之间的争斗似乎仍未平息。

One More Thing

「羊驼事件」发生之后,有网友调侃性地创造了「Schmidhubered」这个新单词。

「schmidhubered」的表现包括下面这几点:

  • 发明了很好的东西,结果不但没人关心,反而被嘲笑

  • 几年之后(这个方面)又流行起来了,但是却被别人说是首创

  • 开始解释自己才是最早的发明者

  • 结果没人在意,甚至所有人都觉得你是在🍋

  • 名字被做成动词

如果Schmidhuber的说法都属实,那么这个词的解释的确形象地描述了他的遭遇。

LeCun这次又会做出什么样的回应?还是让子弹再飞一会儿……

参考链接:
[1]https://people.idsia.ch/~juergen/lecun-rehash-1990-2022.html

[2]https://twitter.com/SchmidhuberAI/status/1683870175299239937

「AIGC时代的算力基石」沙龙筹备中

8月9日,量子位将在北京线下举办行业沙龙「AIGC时代的算力基石」,诚邀算力产业相关企业报名参与~ 

点击图片了解招募详情,企业报名可联系活动负责人微信iris_wang17,备注企业-姓名。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
【拒绝做被选剩下的孩子!Allston翡翠琉璃全新高级公寓】【时间任选至9/1】【免中介/免月租】【BU/BC/Allston】人多好办事吗?Sam Altman预警:AI灭绝人类!375+大佬签署22字联名信,LeCun唱反调马斯克将直播“约架”扎克伯格,一汽大众回应停工传言,“Vim之父”去世 ,中国选手“小孩”夺冠,这就是今天的其他大新闻!明天带娃南京游,整理了出游装备,来抄我作业了!某设计院图审长期不让过,设计师怒斥:故意的吧?比Python快3.5万倍的Mojo融资7亿,LLVM之父:不会威胁到Python,该恐惧的应该是C++年仅62岁!开源巨擘「Vim之父」因病离世,一生写下Vim传奇8.16鸡毛信:抄底时机公布比 Python 快 3.5 万倍的 Mojo 融资七亿,LLVM之父:不会威胁到 Python,该恐惧的应该是 C++「你的胸是被人摸大的吧?」1.3>7?微软新模型“以小博大”战胜Llama2,网友:用Benchmark训练的吧?大话三国218:蒋干的致命弱点是什么?周瑜对蒋干的心理战Vim之父去世,前辈一路走好!“王宝强一直羞辱我,让我背着潘金莲的骂名”,马蓉离婚7年,她无法释怀当年的离婚声明CNN、GRNN、CLSTM、TD-LSTM/TC-LSTM…你都掌握了吗?一文总结情感分析必备经典模型(一)你长成这样,一看就是字节/阿里/百度…的吧?School Gym Collapse Kills 11, Girl Volleyball Players Among DeadLlama 2宇宙大爆炸!伯克利实测排第8,iPhone本地可跑,一大波应用免费玩,LeCun狂转MemNet、AT-LSTM、IAN、AF-LSTM…你都掌握了吗?一文总结情感分析必备经典模型(二)美国梦缩影!日餐店老板上班途中被四枪爆头一尸两命!黑命贵:“是我干的!是我干的!”且随诗吟:《五月》by 星如雨​它就是水果届来人间报恩的吧?一口酸甜爆汁脆嫩细腻,热量还超低!【老键曲库】Hans Zimmer - Time (Remix)击败LLaMA?史上最强「猎鹰」排行存疑,符尧7行代码亲测,LeCun转赞Erklärung zur Zusammenarbeit战地恋情(一)日本一高3学生为了不吃妈妈做的“爱心便当”,拼命考上东大!网友:亲妈才干的出来!GPT-4最强平替更新!UC伯克利发布Vicuna v1.5,支持4K和16K上下文,刷新SOTA,LeCun转赞最强编辑器 Vim之父去世,Vim 项目谁来接管?9.5思考:抄底吗?Vim之父因病去世:年62岁 在开源社区上投入超30年遭Llama 2诋毁,LSTM之父暴怒!Meta盗用32年前idea训模型,喊话让LeCun负责广告科技公司TTD推出媒体购买平台;Gusto Collective收购Mercury Integrated(广告狂人日报)未尽的遗憾和完美的自然直角
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。