Redian新闻
>
Meta计划曝光:下一个大模型以GPT-4为标准,2024年开始训练

Meta计划曝光:下一个大模型以GPT-4为标准,2024年开始训练

公众号新闻
机器之心报道
编辑:陈萍
随着技术竞赛的升级,Meta 更强大的 AI 系统正在研发当中。

在 AI 研究这一领域,Meta 可谓是走在了众多科技公司的前列。

自年初以来,我们见证了大型语言模型如雨后春笋般不断涌现,在这一赛道上,Meta 先后开源的 Llama、Llama 2 系列模型在一众模型中脱颖而出,尤其后者的可商用化,为开源社区带来了众多便利,很多人纷纷表示大模型的「安卓时刻」来到了。


然而,训练大模型离不开算力的支持,这就回到了一个怎么也绕不开的问题:芯片短缺,这一问题也是各大科技公司所面临的一个老大难问题,就连 Meta 也是如此。

就在前两天,据 The Information 报道,Meta 内部因为团队之间抢夺算力资源内斗激烈,参与 Llama 项目的很多人都辞职了。

可见,算力短缺是布局生成式 AI 的核心难题,很多科技公司开始加入抢夺芯片这一行列。

Meta 也是如此。据《华尔街日报》报道,Meta 一直在抢购芯片,并且开始建立自己的数据中心,以创建一个更强大的新型聊天机器人,Meta 将 GPT-4 作为其下一个 AI 模型的标准,并希望新的聊天机器人能够像 GPT-4 一样强大和复杂

这款大模型将在 2024 年年初开始训练,会比 Llama 2 模型强大数倍,可能还会免费供他人使用。

报道还称,为了更好的进行 AI 研究,Meta 一直在购买更多的英伟达 H100 AI 训练芯片,其基础设施也在加速部署当中,所以,在此后的模型训练中,Meta 将不再依赖微软的 Azure 云平台来训练新的聊天机器人。

虽然有关 Meta 训练新模型的具体细节仍然未知,但我们可以从此前的报道中推测一二。

根据今年 6 月的一份泄密报告显示,图片及视频分享软件 Instagram 正在加速测试一款聊天机器人,该机器人可以回答问题并为用户提供建议。在此之前,Instagram 竞争对手 Snap 早早就推出了自己的 AI 聊天机器人,这可能是 Instagram 着手研发 AI 聊天机器人的原因之一,与对手直接竞争。

图源:https://twitter.com/alex193a/status/1665825192398995469

Meta 尚未宣布任何关于此类功能的正式计划,我们也无从得知 Meta 是否真的打算在 Instagram 上推出此类机器人,也不清楚 Meta 会采取哪些安全措施。

不过,今年 2 月,Meta 首席执行官马克・扎克伯格 (Mark Zuckerberg) 透漏,Meta 正在开发能够以多种方式帮助人们的 AI 角色,并且该公司正在探索如何通过文本对话来访问此类机器人。

不仅 Meta,其他公司机构也在加速大模型的研发,两月后 OpenAI 将会迎来首届开发者大会,很多人对大会上要发布的内容好奇不已;苹果每天在自己的大语言模型框架 Ajax 上投入数百万美元,并已经将其应用在地图、siri 等功能上;谷歌和微软都在各自的生产力工具中扩大人工智能的使用;亚马逊在其组织内开展生成式人工智能计划,可能会产生由聊天机器人驱动的 Alexa。

由此可见,大模型的竞赛还在激烈进行中,或许最大的赢家还是芯片公司。

不过,对于 Meta 的这一计划,有网友开玩笑的表示:当他们完成这些的时候,GPT-5 就已经问世了。



不管怎样,对于 Meta 将要研发的下一代大模型,我们还是可以期待一波的。

参考链接:
https://www.theverge.com/2023/9/10/23867323/meta-new-ai-model-gpt-4-openai-chatbot-google-apple


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
「苹果 GPT」首次曝光/百度称文心大模型3.5能力已超GPT-3.5/《奥本海默》确定引进碾压H100,英伟达下一代GPU曝光!首个3nm多芯片模块设计,2024年亮相常客:“多在我这儿花钱,少薅我羊毛” 达美航空更新其高级会员保级要求,2024年开始执行OpenAI最新大模型曝光:剑指多模态,GPT-4之后最大升级《别君叹》&《爱人先爱己》清华系大模型新秀获20亿投资;AI教父加入初创公司;套壳ChatGPT不是长久之计;百图生科拿下10亿美元大模型订单微博(24)—起早最近看的几个烧脑的电影小米mios要来了?曝MIUI14为最后一个正式大版本一份新报告称Meta将GPT-4作为其下一个人工智能模型的标杆小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大百度云上交大模型成绩单:接入42个大模型,月活企业近万家|甲子光年Meta为什么要发布开源Llama 2大模型;2027上市,Meta AR眼镜放弃MicroLED技术以色列军事计划与宣传计划曝光接入Llama 2等33个大模型,上线Prompt模板,百度智能云千帆大模型平台重磅升级英伟达推出大模型加速包;Meta将训练对标GPT-4的大模型;ChatGPT等成费水大户丨AIGC大事日报32卡176%训练加速,开源大模型训练框架Megatron-LLaMA来了GPT-5正秘密训练!DeepMind联创爆料,这模型比GPT-4大100倍周伯文:下一代大模型OS,工具和语言缺一不可丨GAIR 2023引入33个大模型,百度智能云千帆大模型平台的“破茧时刻”MetaMath:新数学推理语言模型,训练大模型的逆向思维《孙子兵法》,中国军师和非洲军阀李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型重磅!持美国护照去欧洲将要付费签证了,2024年开始执行!李小龙训练计划曝光,比运动员还猛,强度无法想象!快手自研大模型「快意」亮相,在多个大模型榜单上表现优异UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型AI大模型背后的惊人数字:问ChatGPT 5个问题,耗水500毫升?训练一次GPT-3,碳排放量相当于开车往返月球?万锦16街机场改建计划曝光!购物中心巨头要狂建11栋楼!但是...通用大模型转向行业大模型:腾讯云、华为云们的下一个战场​TinyLlama-1.1B:从零开始训练一个精悍的语言模型怀胎半年​「混元」初开,腾讯大模型以慢为快|焦点分析重瓣天竺葵,美丽大爆炸​下一代Transformer:RetNet结构可视化及Vision RetNet展望
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。