国际科技财经博客移民网络热点娱乐民生时事公众号

>

Meta被曝明年发布「开源版GPT-4级」全新大模型！参数量比Llama 2大数倍，可免费商用

Meta被曝明年发布「开源版GPT-4级」全新大模型！参数量比Llama 2大数倍，可免费商用

公众号新闻

2023-09-11 05:09

新智元报道

编辑：编辑部

【新智元导读】外媒爆料，Meta正在加急研发全新开源大模型，对标GPT-4，参数量比Llama 2还要大上数倍。Meta这是又要颠覆AI社区了？

根据外媒《华尔街日报》消息，Meta正在加紧开发新的大语言模型，能力将完全对标GPT-4，预计将于明年推出。

消息还特别强调了，Meta新的大语言模型将比Llama 2大数倍，而且大概率还是会开源，支持免费商用。

自从年初Meta将LlaMA「不小心」泄露出来之后，到7月份Llama 2的开源发布，Meta渐渐找到了自己在这次AI浪潮中的独特位置——AI开源社区的旗帜。

人员震荡不断，模型能力有硬伤，靠开源坐回主桌

年初，在OpenAI用GPT-4引爆了科技行业之后，谷歌，微软也相继推出了自己的AI产品。

在5月份的时候，美国监管层就邀请了当时他们认为AI行业相关的头部企业CEO，开了一个圆桌会议，讨论AI技术的发展。

OpenAI，谷歌，微软，都被邀请了，甚至还包括了初创公司Anthropic，但是却没有Meta的身影。当时官方对Meta缺席的回应是：「我们只邀请在AI行业中最顶尖的公司。」

好事没有轮上Meta，但是麻烦却源源不断地找上门来。

先是6月初国会一封质询信直接寄到的小扎手上，措辞严厉的要求他说明3月份LlaMA泄漏事故的前因后果。

而在后来的几个月时间里，即便在Llama 2发布之后，Meta之前花重金打造的AI团队却依然在逐渐分崩离析。

在Llama 2的致谢中，提到的4位最先发起这项研究的团队，其中三位已经离职，目前仅有Edouard Grave还在Meta。

业界大牛何恺明，也将离开Meta，回归学术界。

根据最近The Information的爆料文章，Meta的AI团队，因为对于内部算力的争夺，摩擦不断，人员陆续离开。

在这样的大背景下，小扎自己应该也很清楚，Meta自己的大语言模型，也确实没有办法和业内最前沿的GPT-4沾边。

不论是在各个方向的基准测试还是从用户反馈来看，Llama 2和GPT-4的差距依然还比较大。

在各项基准测试中，开源的Llama 2和GPT-4还有不小差距

网友的实际体验也在不断强调GPT-4比Llama 2依然领先不少

于是，小扎决定让Meta直接在模型开源之路上继续一路狂奔。

也许小扎背后的逻辑是这样的：Meta模型能力一般，打不过闭源大佬，藏着掖着也没啥意义。那就索性开源让AI社区以自家模型为基础来不断迭代，扩大自己产品在业界的影响力。

而且小扎也不止一次的在公开场合表示，开源社区针对自己模型的迭代会让自己的技术团队获得启发，从而在未来开发出更有竞争力的产品。

小扎在Fridman的播客中强调，开源能让Meta从社区中吸取灵感，而且未来Meta可能会推出闭源模型。

参见：https://lexfridman.com/mark-zuckerberg-2/

而事实也证明，Meta的这个选择确实是正确的。

虽然在算力资源和技术实力上比不上谷歌，OpenAI，但是Meta的Llama 2等开源模型对于开源社区的吸引力依然是首屈一指的。随着Llama 2慢慢成为AI开源社区的「技术底座」，Meta也在行业中找到了自己的生态位。

最明显的一个标志是，马上9月份将要召开的国会AI闭门会议之中，小扎终于成为了监管层的座上宾，和谷歌、OpenAI等行业最前沿的公司CEO一同作为代表，对于AI行业监管发出自己的声音。

而如果明年Meta推出的新模型，能够继续保持进步，获得和GPT-4持平的能力，一方面能让开源社区继续拉近与闭源巨头的差距，坐实了「开源社区与行业最先进水平差距在一年左右」的说法。

另一方面，小扎在采访中也曾透露，如果未来大模型能力进一步提升，Meta可能会推出自己的闭源模型。如果新的模型能进一步迫近行业SOTA，也许就离Meta推出自己的闭源模型不远了。

虽然Meta看起来在这波AI浪潮中已经暂时落后了，但是小扎的野心也不甘心只做一个追随者。

在「AI三巨头」Yann Lecun的指引下，Meta也正在为颠覆整个行业做着准备。

Meta的未来

所以，这个传说中能比肩GPT-4的神秘大模型之后，Meta AI未来会是什么样子？

因为目前还没有具体信息，我们也只能做一番猜测，比如从Meta AI首席科学家LeCun的态度入手。

当红炸子鸡GPT，一直是LeCun批评和鄙视的人工智能发展路线。

今年2月4日，LeCun就直白地表示，「在通往人类级别AI的道路上，大型语言模型完全是一条歪路」。

他认为这种根据概率生成自回归的大模型最多活不过5年，因为这些人工智能只是在大量的文本上训练的，它们无法理解现实世界。

所以这些模型既不会计划也不能推理，它们拥有的只是上下文学习能力。

严肃的说，这些在LLM上训练的人工智能几乎毫无「智能」可言。

而LeCun期待的，则是能够通向AGI的「世界模型」。

世界模型能够学习世界如何运作，更快速地进行学习，为完成复杂任务做出计划，并随时应对不熟悉的新情况。

这与需要大量预训练的LLM不同，世界模型能够像人类一样，从观察中找到规律，适应新环境、掌握新技能。

相较于OpenAI在LLM领域不断精进深耕的策略，Meta力求多样化的模型开发。

今年6月14日，Meta发布了一个「类人」的人工智能模型 I-JEPA，也是史上第一个基于LeCun世界模型愿景关键部分的AI模型。

论文地址：https://arxiv.org/abs/2301.08243

I-JEPA能够理解图像中的抽象表征，并通过监自督学习获取常识。

并且I-JEPA不需要额外的人工制作的知识作为辅助。

之后，Meta推出了Voicebox，这是一个全新的突破性语音生成系统，基于 Meta AI 提出的一种新方法——流匹配。

它可以合成六种语言的语音，执行去噪、编辑内容、转换音频风格等操作。

Meta还发布了通用的具身AI agents。

通过语言引导技能协调（LSC），机器人能够在部分预先映射的环境中，进行自由的移动、拾取。

在多模态模型的开发中，Meta也与众不同。

ImageBind，第一个能够从六种不同模态绑定信息的人工智能模型。

它赋予机器全面的理解能力，将照片中的物体与它们的声音、三维形状、温度以及运动方式联系起来。

而来自Meta AI和CMU_Robotics共同开发的RoboAgent，让机器人可以获得各种各样的非平凡技能，并将它们推广到数百个生活场景中。

同时，所有这些场景的数据都比该领域先前的工作少一个数量级。

对于这次爆料的模型，有网友表示，希望他们继续开放源代码。

不过也有网友表示，Meta要到2024年初才会开始训练。

但令人欣慰的是，Meta依旧释放了自己将继续坚持原有战略的信号。

参考资料：

https://www.wsj.com/tech/ai/meta-is-developing-a-new-more-powerful-ai-system-as-technology-race-escalates-decf9451?mod=followamazon

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

650亿参数大模型预训练方案开源可商用！LLaMA训练加速38%，来自明星开源项目 34B参数量超越GPT-4！「数学通用大模型」MAmmoTH开源：平均准确率最高提升29%元象XVERSE-65B：国内最大开源模型来了，高性能无条件免费商用微博（24）—起早 GitHub热榜登顶：开源版GPT-4代码解释器，可安装任意Python库，本地终端运行官方的Code Llama开源：免费商用，神秘版本接近GPT-4 开源版 GPT-4 代码解释器，可安装任意 Python 库，本地终端运行 Meta为什么要发布开源Llama 2大模型；2027上市，Meta AR眼镜放弃MicroLED技术英伟达推出大模型加速包；Meta将训练对标GPT-4的大模型；ChatGPT等成费水大户丨AIGC大事日报百川智能开源最新商用大模型！王小川：比LLaMA更香，下一枪打ChatGPT 微软赢麻了！联合Meta 重磅发布开源、可直接商用大模型Llama 2，网友：OpenAI 感觉如何？Meta“搞大事”了：发布GPT“平替”Llama 2，开源、免费、还可商用！Meta发布免费商用大模型 / 微信团队取消秋招/ iPhone 16 Pro Max拍照性能或大幅提升全面拥抱大模型！腾讯正式开放全自研通用大模型：参数规模超千亿、预训练语料超 2 万亿 tokens 北交大开源交通大模型TransGPT·致远，可免费商用挑战GPT-4V，浙大校友推出开源版多模态大模型，获GitHub 6k+星标阿里云中标9亿AI算力大单；浙大校友开源LLaVA-1.5多模态大模型；Meta因开源模型遭抗议丨AIGC大事日报爱奇艺VR公司业务停滞，员工或被欠薪；阿里云开源通义千问 70 亿参数模型，免费可商用；华为正式发布鸿蒙 4，接入大模型｜Q资讯最强“GPT-4平替”开源！Meta推出免费商用的Llama 2，联手微软掀全球AI狂欢性能超越Llama2-13B，可免费商用，姚星创业公司开源百亿参数通用大模型国内最大开源模型发布，无条件免费商用！参数650亿，基于2.6万亿token训练重瓣天竺葵，美丽大爆炸免费、可商用，阿里云开源70亿参数通义千问大模型国内首款开源交通大模型TransGPT（致远），可免费商用 Meta发布大规模视觉模型评估基准FACET！开源视觉模型DINOv2允许商用国产大模型开源一哥再登场，最强双语LLM「全家桶」级开源！340亿参数超越Llama2-70B 《别君叹》&《爱人先爱己》全球首个可商用生物医药大模型BioMedGPT-10B开源旷视恢复IPO注册程序；清华ChatGLM2-6B模型免费商用；传马斯克的xAI估值200亿美元丨AIGC大事日报改写游戏规则！Meta开源大语言模型Llama 2，可免费商用；微软Copilot定价每月每用户30美元 | 环球科学要闻 UC伯克利团队开源MemGPT大模型上下文内存管理方案；AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源最近看的几个烧脑的电影国产130亿参数大模型免费商用！性能超Llama2-13B，支持8k上下文，哈工大已用上昆仑万维开源130亿参数大模型！0门槛商用、多榜超Llama 2，预训练数据也开源《孙子兵法》，中国军师和非洲军阀

热点事件追踪

美国公司裁员Layoff

2024-01-28 18:01

2024-01-09 19:01

2024-01-07 18:01

美国堕胎权争议

2024-01-06 18:01

美国枪击案

2024-01-06 18:01

2023-12-13 17:12

2023-12-02 07:12

2023-11-26 18:11

中美航班重磅消息！每周85班，直飞更方便！

微软、亚马逊、谷歌大裁员！哪些科技和零售公司有缩减规模计划？

中国外长王毅：中美关系已经止跌回稳

脱轨事故造成20多人受伤联邦调查纽约市全部地铁系统

更多 2024-11-02 的新闻