Redian新闻
>
智源AI研究院回应大模型论文学术争议

智源AI研究院回应大模型论文学术争议

民生新闻


“我们已经注意到对《A Roadmap for Big Model》一文的质疑,正在对相关情况进行核实,智源研究院鼓励学术创新和学术交流,对学术不端零容忍,有关进展将尽快通报。”4月13日,北京智源人工智能研究院回复谷歌大脑(Google Brain)的著名科学家Nicholas Carlini对一项中外合作大型学术论文涉嫌剽窃的指控。

此前4月8日,Nicholas Carlini公开撰文,指控一篇于今年3月26日刊登在论文预印网站Arxiv的论文《关于“大模型”的路线图》(“A Roadmap for Big Model”)一文涉嫌严重抄袭。
该文是前不久国内外多家高校和企业共同完成的长达200页的学术综述论文,有多达100名作者,分别来自于清华大学、北京大学等国内高校,哥伦比亚大学、蒙特利尔大学等国外高校,字节跳动、华为、京东、腾讯等企业以及中科院和北京智源等机构。

Nicholas Carlini在文章《机器学习研究中的一个抄袭案例》(“A Case of Plagarism in Machine Learning Research”)中则详细列举了该论文存在大段抄袭其他论文的嫌疑,证据是大规模的文本重叠,疑似被剽窃的论文也包括他自己的论文“Deduplicating Training Data Makes Language Models Better”。

Nicholas Carlini在文章中解释,他们是在阅读这篇论文时发现很多语句都非常的熟悉,然后通过使用论文查重工具发现了更多的证据,进而准确定位《关于“大模型”的路线图》论文中和已有论文中存在剽窃嫌疑的文本内容。
澎湃记者发现,这篇被质疑的论文目前已经被其发表网站Arxiv在页面上备注了该文和Nicholas Carlini的论文有“文本重叠”(text overlap)。

此前3月31日,北京智源社区撰文以《如何炼大模型?200页pdf100+位作者19家单位!北京智源清华唐杰等发布》介绍该篇论文:
“随着以深度学习为代表的AI技术的快速发展,智能模型的训练应用模式逐渐由‘大炼模型’向‘炼大模型’转变。大模型研究在近年来发展迅速,模型的参数量以惊人的速度扩展。北京智源人工智能研究院最近发布的《A Roadmap for Big Model》由悟道大模型研究项目负责人,智源学术副院长,清华大学计算机系教授唐杰牵头,从大模型基础资源、大模型构建、大模型关键技术与大模型应用探索4个层面出发,对15个具体领域的16个相关主题进行全面介绍和探讨。非常值得关注。”
《关于“大模型”的路线图》中的研究主体“大模型”是近几年人工智能的热门关注领域。人工智能发展到今天,GPT和BERT等参数量巨大的模型被人们开发出来,他们在计算机视觉和自然语言处理等领域取得了前所未有的成就。同时,因为大模型参数量巨大,最近学术界开始将它们当作一类特别的人工智能模型进行研究。
在一篇去年发布的,由斯坦福教授李飞飞等领衔的约百名作者署名论文将此类模型称为“基础模型”(Foundation Model),这篇由清华主要参与的论文关注与此相同含义的“大模型”(Big Model)的未来研究路径。在清华的论文中,作者们介绍到“之前论文提及的’基础模型’在中文语境中也被称为‘大模型’”(“The mentioned foundation model is known as the BMs, and it is called Big Model in the Chinese context.” )。

这起“涉嫌抄袭”事件在国外社交媒体上引起热议。滑铁卢大学教授Gautam Kamath表示,对于一篇有如此多作者的文章,他很惊讶没有一个作者注意到相似之处并且去改正它。

戳这里提交新闻线索和高质量文章给我们。
来源: cnbeta
相关阅读
今日arXiv最热NLP大模型论文:IBM研究院提出Genie方法,自动生成高质量数据集今日Arxiv最热NLP大模型论文:复旦大学最新研究,如何让大模型说出“我不知道”?今日arXiv最热大模型论文:清华把大模型用于城市规划,回龙观和大红门地区成研究对象今日arXiv最热NLP大模型论文:北京大学警惕ChatGPT等大模型遏制人类的创新能力今日arXiv最热NLP大模型论文:大模型RAG新宠!浙江大学发布自反馈检索增强方法今日arXiv最热NLP大模型论文:华东师大发布对话级大模型幻觉评价基准DiaHalu今日arXiv最热NLP大模型论文:天津大学发布大模型数学能力细粒度评价基准FineMath今日arXiv最热NLP大模型论文:微软:用大模型分析用户满意度,让智能系统更善解人意今日arXiv最热NLP大模型论文:Github万星!北航发布零代码大模型微调平台LlamaFactory今日arXiv最热NLP大模型论文:一文读懂大模型的prompt技术今日arXiv最热NLP大模型论文:微软发布可视思维链VoT,提高大模型空间想象力谷歌发布West-of-N,利用合成数据,显著提升LLM奖励模型质量 | 今日Arxiv最热大模型论文今日arXiv最热NLP大模型论文:微软提出SliceGPT,删除25%模型参数,性能几乎无损今日arXiv最热大模型论文:何恺明重提十年之争——模型表现好是源于能力提升还是捕获数据集偏见今日arXiv最热NLP大模型论文:伯克利&DeepMind联合研究,RaLMSpec让检索增强LLM速度提升2-7倍!最新大模型论文合集!谷歌/微软/Meta/苹果/英伟达/阿里最新研究报告!北京内推 | 微软亚洲研究院WWE大模型团队招聘大模型研究实习生今日arXiv最热NLP大模型论文:像人一样浏览网页执行任务,腾讯AI lab发布多模态端到端Agent今日arXiv最热NLP大模型论文:引入噪声,可提升RAG检索效果超30%??今日arXiv最热NLP大模型论文:COLING2024发布数据集揭示从莎士比亚时期开始的性别偏见
原创公众号
“瑞幸不招聘上海人”?官方紧急回应!向雷军要小米SU7,与马化腾握手“泯恩仇”,周鸿祎等互联网大佬在这场盛会上都聊了些什么?尹锡悦政府让步了,韩国医生罢工现转机?422团品合集 | 10点开团,快上车~突发!岸田给鬼送“真榊”俄乌,美国接下来会“死磕”中国忽然,想去长沙了!千万别穿纯棉T恤了!今夏流行这“空调凉感T”,99元3件抢要粮食?朝鲜农业委员会委员长率团访问俄罗斯卫健局:过“紧”日子。某三甲医院老主治回应:30块钱的夜班费还有的降?!股价狂跌一周!特斯拉大裁员,在美国卖不动了??美国再爆大规模枪击,至少16人中弹2人当场死亡,众人尖叫狂逃(图)买金条保值、好投资?脱手恐“先赔5%”,得不偿失!美联储加息致房贷利率飙升!购房者不敢出手,房价或将回落?突发!美国再爆大规模枪击,至少16人中弹,众人尖叫狂逃(图)全美新房价格再创新高,背后主因曝光!玩水需谨慎!圣地亚哥海滩游客激增藏隐患,市府提醒注意安全!一堆人不知!每晚刷牙后别忘1小事儿,短短30秒保健大升级和凯特大魔王、刘亦菲上海看LV秀!走进LV的“动物世界”…为什么这些中文词,压根儿无法翻译成英文?[日签] ​或许我可用夏日把你来比方[干货] “捧腹大笑”,英语怎么说?开班了开班了!解救被导师压榨的怨种硕博生!中小学生科研培训它来了!热议!三甲医院40多名护士称“无故”集体被辞退!医院回应……没发表但上了知网的研究生论文,如果现在想发表,算学术不端吗?(中科院博士答疑专区)AI安全之问:我们的智能助手真的安全吗?研究了两年后,我发现领域的开山之作是瞎编的今日arXiv最热NLP大模型论文:微软发布可视思维链VoT,提高大模型空间想象力第三期经济学人打卡群(最后1天)屏幕时间对孩子有什么影响?| 经济学人
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。