Redian新闻
>
比ChatGPT早发两周!被喷下线的Galactica成了LeCun最大的意难平...

比ChatGPT早发两周!被喷下线的Galactica成了LeCun最大的意难平...

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【视觉和Transformer】交流群

扫码加入CVer知识星球可以最快学习到最新顶会顶刊上的论文ideaCV从入门到精通资料,以及最前沿项目和应用!发论文,强烈推荐!

转载自:机器之心 | 编辑:小舟、大盘鸡

今天我们提到大型语言模型(LLM),第一个想到的就是 OpenAI 的 ChatGPT。一年来,ChatGPT 因其强大的性能,广泛的应用前景而爆火出圈。但谈到大型语言模型,ChatGPT 并不是第一个。


一年前,也就是 OpenAI 发布 ChatGPT 的前两周,Meta 发布了一个名为 Galactica 的试用版模型。作为一个大型语言模型,Galactica 是在大量的论文、参考资料、知识库和许多其他来源的科学语料库上进行训练的,包括超过 4800 万篇论文、教科书和讲义、数百万种化合物和蛋白质知识、科学网站、百科全书等。


彼时,Meta 声称 Galactica 能够总结学术文献、解决数学问题、生成 Wiki 文章、编写科学代码,甚至可以执行涉及化学公式和蛋白质序列的多模态任务。


然而,上线不到三天,Galactica 就迅速下架了,原因是 Galactica 生成的文本不严谨,不负责任地胡编乱造。


当时,「幻觉」这个词还没有成为机器学习领域的主流词汇,但 Galactica 可以说是因为严重的幻觉问题而被下架。


图灵奖得主、Meta 首席科学家 Yann LeCun 为 Galactica 的下架感到非常遗憾,并发布推文:「再也不能用它来找乐子了。你们都开心了吗?」显然,LeCun 认为大家对 Galactica 的指责有些过分。



有趣的是,就在同一周,关于 GPT-4 即将发布的传言不胫而走。11 月 30 日,当许多 AI 研究人员正在 NeurIPS 上讨论 OpenAI 可能要推出 GPT-4 时,ChatGPT 突然就发布了。


当然, ChatGPT 很快也被发现有幻觉问题,这与 Galactica 和其他生成式 AI 一样。ChatGPT 会「滔滔不绝」,自信满满,但它的回答又是似是而非的。但值得注意的是,OpenAI 在发布 ChatGPT 的博客中明确指出了它这一弱点,并解释称:「解决这一问题极具挑战性。」


接下来的事情大家都看到了,ChatGPT 迅速成为 LLM 「顶流」。在过去的一年里,它已经成为有史以来增长最快的服务之一。推出两个月后,月活用户就突破了 1 亿,现在每周用户也有约 1 亿。


现在,Galactica 的故事又一次被提起。外媒 VentureBeat 资深撰稿人 Sharon Goldman 发布了一篇新文章,讲述了 Galactica 给 Meta 带来的经验教训。


文章链接:https://venturebeat.com/ai/what-meta-learned-from-galactica-the-doomed-model-launched-two-weeks-before-chatgpt/


关于 Galactica,Meta 公司 AI 研究副总裁 Joelle Pineau 在采访时向 VentureBeat 讲道:「我们学到了很多好的经验。这是一个很好的模型,我仍然收到很多人想要这个模型的请求。」


「人们对产品会有一种期望,就像是你想要用它来撰写论文。但这并不是我们的初衷。」Pineau 强调说:「Galactica 从来就不是一个产品,而是一个研究项目。我们是抱着这样的目的发布的,我们做了一个低调的发布,把它放在 GitHub 上,研究人员在推特上发布了它,但是期望与研究之间的差距太大了。」


当时的人们显然对模型幻觉十分惊讶,而幻觉这件事在一年后将变得稀松平常。其实,Galactica 的幻觉水平实际上低于其他模型,因为它是根据科学文献进行微调的。


此外,在 VentureBeat 的文章中,作者 Sharon Goldman 也提到:令人庆幸的是,Galactica 的教训给 Llama 的发布上了一课。


Meta 公司撤下了 Galactica 演示版,以确保人们不会被误导使用它。Pineau 表示:「如果让我今天来做这件事,我们会对发布进行管理。」当时,Meta 很可能错误地估计了人们对 Galactica 的期待,但 「我们已经将从中吸取的教训融入到下一代模型中了。」


Meta 的下一代大型语言模型就是 LLaMA,它于 2023 年 2 月在 AI 研究领域掀起了一场风暴,随后在 7 月推出了商用的 LLaMA 2,8 月又推出了 Code LLaMA。随着 LLaMA 成为第一个主要的免费开源 LLM,开源 AI 开始崭露头角,并引发了一场热火朝天的讨论。


LLaMA 于 2 月 24 日发布时,Meta 非常谨慎。Yann LeCun 在分享 LLaMA 论文时表示:「Meta 致力于开放研究,将在 GPL v3 许可证下向研究社区发布所有模型。」


当被问及为什么研究人员必须填写表格才能访问 LLaMA 时,LeCun 回答道:「因为上次我们向所有人提供 LLM( 旨在帮助科学家撰写科学论文的 Galactica)时,人们对我们嗤之以鼻,并告诉我们这将破坏社会结构。」


看起来,LeCun 对 Galactica 的下架一直抱有「怨气」。


如今,LeCun 也是马上就在推特上转发了 Sharon Goldman 这篇文章,说道:「舆论称我们现在所说的 LLM 幻觉会摧毁科学出版系统。结果,一个对科学家来说非常有用的工具被毁了。」最后他还表示:「以人工智能道德为幌子的误导性观点可能会适得其反。」这不得不让人联想到最近 LeCun 与另一位图灵奖得主 Geoffrey Hinton 关于「AI 监管」的辩论。


Galactica 的第一作者 Ross Taylor 也在推特上发文表示:Galactica 在发布时因人手稀缺而没有对基础模型进行充分的检查,这导致了一些问题。他们原本希望通过公开演示来收集科学查询的数据,但这反而引起了误解和批评。但他们的研究仍然是有价值的,并且从这次经历中学到的教训已经用到了后续的 LLaMA 2 项目中。


LeCun 更是用开源应「尽早发布,经常发布(release early, release often)」为 Galactica 再鸣不平。


无论如何,掀起大模型浪潮的是 OpenAI 的 ChatGPT,在开源领域实现突破的是 LLaMA,Galactica 的故事已成过去。


参考链接:https://venturebeat.com/ai/what-meta-learned-from-galactica-the-doomed-model-launched-two-weeks-before-chatgpt/

CVPR / ICCV 2023论文和代码下载
后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:ICCV2023,即可下载ICCV 2023论文和代码开源的论文合集

计算机视觉和Transformer交流群成立


扫描下方二维码,或者添加微信:CVer444,即可添加CVer小助手微信,便可申请加入CVer-计算机视觉或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer444,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!


扫码加入星球学习


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
咏富阳皮衣老黄套路多!被抢破头的GPU,其实没有任何惊喜人类还是比ChatGPT厉害 | 一周科技University of Connecticut 康涅狄格大学 学术诚信政策及申诉指南GPT-4不知道自己错了! LLM新缺陷曝光,自我纠正成功率仅1%,LeCun马库斯惊呼越改越错我不是虎妈—另类哈佛妈妈与女儿一起长大(完)德媒报道新的作弊趋势,比ChatGPT更好用?为什么大学时候的风云人物毕业后都变成了loser?热乎的GPTs体验报告:创建专属GPT,不懂代码人的春天来了OpenAI回应ChatGPT服务故障;新研究以99%准确率识别ChatGPT生成化学论文;三星发布自研大模型丨AIGC日报比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平惊呆!某院医生4个月用ChatGPT写了16篇论文,发表5篇!(附ChatGPT干货)OpenAI大佬甩出「喵喵GPT」调戏黑客!分享ChatGPT成功的秘密:极限压榨GPU资源红色日记 派委会 6.23-28头像|𝐒𝐡𝐚𝐫𝐞·招桃花头像三线的城市,一线的房价,真贵Hinton和LeCun再交锋,激辩LLM能否引发智能奇点!LeCun:人类理解能力碾压GPT-4斯坦福公开十大主流模型透明度!Llama 2位列第一,GPT-4透明差,LeCun炮轰:盈利完全理解《心叙——美国中文作家协会作品集萃三》正式出版发行超级AI不会主宰人类,但人工智能必须开源!LeCun最新采访引全网300万人围观惊了!某院医生用ChatGPT4个月写了16篇论文!成功发表5篇!(附ChatGPT干货教程)微软发布 166 页 GPT-4V 测评报告,ChatGPT 的高阶用法都在这|Hunt Good 周报GPT-4 Turbo更强更便宜,GPTs、GPT商店最大亮点,这是OpenAI首个开发者日UNC斯坦福等曝光GPT-4V意外漏洞,被人类哄骗数出8个葫芦娃!LeCun和Jim Fan震惊了LeCun又双叒唱衰自回归LLM:GPT-4的推理能力非常有限,有两篇论文为证重磅!ChatGPT放大招!GPT Store应用商店今天上线!超300万GPTs,内卷之下的赚钱机会!ChatGPT之父被开除,加入微软!ChatGPT员工要集体辞职?《我的父亲是流亡学生》: 31. 一张黄黄的信纸ChatGPT让ChatGPT吐槽宕机;OpenAI对竞争对手Anthropic的合并要约被拒丨AIGC日报ChatGPT 元年:野心,战略,以及绕不开的困难|TECH TUESDAY司马南不封禁,则千万民营企业意难平GPT-4作弊被抓!吉娃娃or松饼打乱顺序就出错,LeCun:警惕在训练集上测试十年来最强日漫,看完大结局意难平能赚钱的GPT Store上线了!官方最佳榜单公布,ChatGPT被玩出花LeCun和xAI联创对呛,GPT-4重大推理缺陷无解?网友:人类也是「随机鹦鹉」
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。