Redian新闻
>
OpenAI新模型研发遇挫,稀疏性是大模型降本的钥匙吗?

OpenAI新模型研发遇挫,稀疏性是大模型降本的钥匙吗?

公众号新闻

选自theinformation

机器之心编译

编辑:小舟

OpenAI 也有失败的模型。

大模型的训练与运行成本极其高昂,OpenAI 也尝试过降低成本,只可惜失败了。

去年年底,当 ChatGPT 引起全球轰动时,OpenAI 的工程师开始研究一种新的人工智能模型,代号为 Arrakis。Arrakis 旨在让 OpenAI 能够以更低的成本运行聊天机器人。 

但据知情人士透露:2023 年年中,OpenAI 已经取消了 Arrakis 的发布,因为该模型的运行效率没有公司预期的那么高。


这次失败意味着 OpenAI 失去了宝贵的时间,并需要将资源转移到开发不同的模型上。

对合作投资来说,Arrakis 的研发计划对于两家公司完成 100 亿美元投资和产品交易的谈判非常有价值。据一位知情的微软员工透露,Arrakis 的失败让微软的一些高管感到失望。

更重要的是,Arrakis 的失败预示着人工智能的未来发展可能会充满难以预测的陷阱。

Arrakis 是个什么样的模型?

知情人士称,OpenAI 希望 Arrakis 是一个与 GPT-4 性能相当,且运行效率更高的模型。Arrakis 模型用到的关键方法是利用稀疏性。

稀疏性是谷歌等其他人工智能开发商也公开讨论并使用的机器学习概念。谷歌高管 Jeff Dean 曾表示:「稀疏计算将成为未来的一个重要趋势。」

OpenAI 很早就开始了关于稀疏性的研究,早在 2017 年他们就推出了稀疏计算内核。Arrakis 本来可以让 OpenAI 更广泛地推广其技术,因为该公司可以使用数量有限的专用服务器芯片来为其软件提供支持。

当前,增加稀疏性的一种常见方法是借助「混合专家系统(MoE)」技术。然而,加州大学伯克利分校计算机科学教授 Ion Stoica 曾表示:「一般来说,专家模型的数量越多,模型就越稀疏,效率也越高,但可能会导致模型生成的结果不太准确。」

大约在今年春天,OpenAI 的研究人员开始训练 Arrakis 模型,其中涉及使用先进的计算硬件来帮助模型处理大量数据。知情人士称,该公司预计训练 Arrakis 比训练 GPT-4 要便宜得多。然而,研究团队很快就意识到该模型的表现不够好,无法获得预期的增益。研究团队花了大约一个月的时间试图解决问题后,OpenAI 的高层领导决定停止训练该模型。

值得欣慰的是,OpenAI 可以将其在 Arrakis 上的工作整合到其他模型中,例如即将推出的多模态大模型 Gobi。

两位知情人士表示,Arrakis 的表现之所以低于 OpenAI 的预期,是因为该公司试图提高模型的稀疏性,这意味着将只使用模型的一部分来生成响应,从而降低运行成本。该模型在早期测试中有效但后来表现不佳的原因尚不清楚。

值得一提的是,有知情人士称 OpenAI 曾为 Arrakis 考虑的公开名称是 GPT-4 Turbo。

降低成本有多重要?

对于 OpenAI 来说,随着人们对技术成本的担忧日益增加以及开源替代方案的激增,使其模型更便宜、更高效是首要任务。

据知情人士称,微软使用 OpenAI 的 GPT 模型为 Office 365 应用程序和其他服务中的人工智能功能提供支持,并且微软原本预计 Arrakis 能够提高这些功能的性能并降低成本。

与此同时,微软开始研发自己的 LLM,并且其 LLM 的运行成本可能比 OpenAI 的模型更低。

尽管这场挫折并没有减缓 OpenAI 今年的业务发展,但随着 LLM 领域的竞争日益加剧,特别是谷歌、微软等科技巨头的加速研发,OpenAI 也有可能在这条赛道上式微。

原文链接:https://www.theinformation.com/articles/openai-dropped-work-on-new-arrakis-ai-model-in-rare-setback



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
OpenAI神秘新模型Q*曝光,太强大让董事会警惕,或是奥特曼被开除导火索笑谈邂逅(35)顶撞书记被免职【限量抢】9~10月周末不加价!随时出发遇见隐于千亩山林中的疗愈酒店!「专题速递」边缘降本、智能语音降本、提高压缩率、极速高清实践【荐】作家鲁稚送给父母一把打开孩子写作之门的钥匙《基于增收降本的分算奖经营模式》09.23-09.26北京站打开科幻时代的钥匙,是网盘咀外文嚼汉字(272)宰鸡烹羊刀狼智能周报|OpenAI发布ChatGPT企业版,预计今年营收10亿美元;首批11家国产大模型「获批」,不包括阿里巴巴通义大模型李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型专访丨积家CEO Catherine Rénier:情感联结和艺术表达对腕表也至关重要谷歌 Pixel 8系列发布,折叠屏后续机型研发中"妈妈让我来自首",7岁男孩在派出所写下"bǎozhèng书"文学城我喜欢的有才德的妇人银发遇「杀猪盘」,华妇3周遭骗72万…积蓄化乌有连续失利,美这项“追赶中俄的计划遇挫”重构 LLaMA、更改张量名,李开复公司回应来了!网友:这就是中国大模型研发现状?OpenAI首届开发者大会内容曝光;马斯克xAI大模型进展公布;中国第二批大模型备案获批丨AIGC大事日报B 站广州研发工作室解散;外媒曝光苹果中国区丑闻;OpenAI 被曝已叫停新大模型项目 | Q资讯免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大激光雷达成「烫手山芋」?或成车企降本的牺牲品谷歌大模型研究陷重大争议:训练数据之外完全无法泛化?网友:AGI奇点推迟了相聚多伦多(十三)无可奈何花落去红色日记 5.21-31旺季来临,稀土价格大幅反弹!全球下游需求旺盛,这些A股获机构扎堆关注北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型科研上新 | 大模型推进科研边界;大模型的道德价值对齐;优化动态稀疏深度学习模型;十亿规模向量搜索的高效更新曝OpenAI大模型新进展!将推出多模态大模型,新项目Gobi筹备中实现梦想的钥匙。「卓视智通」获数千万Pre-B+轮融资,加快推进AI视觉大模型研发和应用落地|36氪首发谷歌新模型的算力已是GPT-4的5倍,要大力出奇迹反超OpenAI了?华为在中国销售势头强劲,苹果遇挫思想周报丨《花月杀手》与美国原住民往事;澳洲原住民和解之路遇挫银杏谷资本陈向明:大模型降温,创业者要寻求最小阻力线
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。