Redian新闻
>
免费还能干翻GPT-4,Meta打了所有闭源大厂的脸。

免费还能干翻GPT-4,Meta打了所有闭源大厂的脸。

科技


不知道李彦宏现在心情如何。

就在他公开表示 “ 开源模型会越来越落后 ” 的 3 天后,活菩萨小扎慢悠悠地登场了。

丝毫不给面子,以一己之力掀翻了桌子。

就在今天凌晨, Meta 正式发布了全新的 Llama 3 模型,还一次上新了 8B 和 70B 两个参数版本。

它的训练数据集比 Llama 2 整整大了 7 倍,达到了 15T ,容量也是上一代的两倍,支持 8K 上下文长度。

目前,它们已经接入了 Meta 最新发布的智能助手 Meta AI 中,所有人都可以免费使用。

这两个模型同样全面开源,开发者可以免费下载,并且用于商用。( 不过要注意的是,如果 MAU 超过 7 亿,你得申请特殊商业许可 )

小扎这是誓死要在开源这条路上一条道走到黑了。

当然更炸裂的是 Llama 3 的实力除了稳居开源大模型榜首外,甚至还能在一定程度上,薄纱 Gemini Pro 1.5 、 Claude 3 Sonnet 等处于第一梯队的闭源大模型。

 有网友更新了一份现有大模型的能力和参数对应表,能看到 Llama 3 的两个模型的表现都相当亮眼。

这,可以说是给大模型的开源派大涨了一波士气。

反正消息一出炉,开源社区立马就沸腾了,各种梗图满天飞,感谢着小扎又带兄弟们冲了一次。

不过,世超觉得既然模型已经上线了,看再多的技术细节和跑分数据,都不如咱们亲自上手试试。

稍微有些可惜的是,目前发出的这两个版本,还没有办法支持中文输出。

也暂时只有文字对话和画图这两个简单的功能。在各家多模态打磨得出神入化的现在,多少有点 OUT 了。

不过好在这次 Meta 的图片输出,有一个挺新奇的功能。我们在聊天框里输入文字,不需要发送, Llama 3 就会实时根据内容生成图像。

比如我分几次在对话框输入了【 一只猫在睡觉、跳舞和跳跃 】,就能看到屏幕上生成的图片内容在跟着实时变化。

到了文字输出这边,惊喜度就不高了。

 既然它在测试中,说自己在编程、多选题等等方面,都赶超 Claude 3 的中型版本,咱也着重测了测这方面的虚实。

世超测了很多题,这里就只放出两边有差别的地方。

比如简单的逻辑推理:我今天有 3 个苹果,昨天吃了一个,今天还剩几个?

Llama 3 完全没有压力,轻松驾驭。

但同样的题抛给 Claude 3 ,却被完全绕进去了。

不过,后面世超后面简单测了几道代码能力,反而 Claude 3 的表现更让人惊艳。

世超要求 Llama 3 给我做两个简单的 html 小游戏。

结果,做出的贪吃蛇和打砖块游戏,都没有办法正常运行。游戏还没有开始,就显示 Game Over 了。

但 Claude 3 这边做的,虽说有点小瑕疵,游戏重新开始之后,分数不会刷新。但除此之外都很完美,游戏能有正常运行。

而且生成速度巨快,几秒钟就做出来。上一次见到这个速度的,还是 GPT-4 。

而在后面的开放题, Llama 3 则又马上扳回了一城。

世超给了一个开放性的问题:类人机器人的未来会是什么样子?

几个字的小问题, Llama 3 按照短期、中期和远期,三个阶段来分点构思了一下可能性。

由于篇幅限制,这里只截取了短期

Claude 3 这边就有些中规中矩了,跟上面分时间、分点罗列的优等生比,逊色不少。

整体测试下来,Llama 3 和闭源的 Claude 3 基本打得有来有回,甚至一些方面小胜。

但如果只能做到这个程度, Meta 这次更新根本没法在圈子里掀起这么大风浪。

这俩模型并不是重头戏,真正牛叉的地方,是官网里提到的一个信息:400B+ 参数级的 Llama 3 正在训练准备中了。

从纸面的各项数据上看,它各方面都强得可怕。

Llama 的产品副总裁 Ragavan Srinivasan 在一次采访中说,这个版本可以媲美同类的一流专业模型。

不仅做到媲美,很多功能表现,还要强过 Claude 3 的超大杯版本和 GPT-4 。

虽说 Meta 认为还要评估一下安全性,再决定开不开源,但消息一出,业内早已经开始狂欢了。

因为开源社区的人,或许不用等着 OpenAI 重拾初心,就能到调教、魔改上GPT-4 级别的模型

英伟达科学家直接就发文说,小扎这个 400B+ 的模型,将会是行业的一个分水岭,会改变很多公司和研究的未来。

 刚好今天过生日的前百度首席科学家、谷歌大脑之父吴恩达,也说 Meta 这次更新,是他有史以来收到过最好的生日礼物。

可想而知, Llama 3 给行业带来的震撼。

目前,这个 400B+ 的终极版本预计将会在夏天发布。

OpenAI 再不发力,Llama 3 为代表的开源大模型,彻底超车闭源大模型的历史时刻,可能真的就要来临了。

而早在 Llama 3 发布之前,大模型是开源牛,还是闭源好的问题,其实早就吵得不可开交了。

两边阵营都不缺大佬,李彦宏所说的, “ 开源模型会越来越落后 ” ,世超觉得逻辑上是很自洽的。

因为闭源公司有成熟的商业模式,有更多的资金和人力砸进去搞研究,自己辛苦研发的成果,也可以得到保护。简而言之就是能赚钱,能赚钱才能聚集算力、聚集人才。

 反观很多开源模型,不仅商业模式还在探索中,有的也都是零零散散的小规模产品。

月之暗面的杨植麟就曾发表过类似的观点,说是大部分基于开源大模型的应用,没有经过大算力的验证,它们在性能的稳定性、未来的可扩展性都不好说。


而支持开源的这一派,世超同样也觉得不无道理。朱啸虎曾经表达过一个看法,闭源现在确实领先于开源,但开源模型最终会追上。

 “OpenAI 就一两百个工程师,开源的全世界几百万、几千万工程师在用,怎么可能一直比非开源的落后? ” 

开源社区用了一年时间,就超过了 GPT-3.5 ,现在已经来到 GPT-4 水平。而现在 Llama 3 等模型的大力赶超,正在不断验证这句话。

比尔盖茨早年间,曾经公开吐槽过 Linux 系统。觉得它从商业上来看根本不可行,既不能保护自己的知识产权,又没法赚取收入来搞研发,最多就是个半吊子

《 乔布斯传 》中也提到过,乔布斯也怒喷过隔壁安卓就是 shit ,认为它的开源给它带来各种麻烦。

 最后这俩超级大佬都被打脸了。。。甚至比尔盖茨后来公开承认微软在偷学 Linux ,安卓也丝毫不比 iOS 差。

而世超觉得,很可能大模型的开源闭源之间,根本就不是你死我活、不是谁强谁就一定弱。

就比如谷歌,基本就是两手抓,既有闭源的 Gemini ,也有开源的 Gemma 。曾靠开源出圈的 Mistral 在拿了微软投资之后,它的 Mistral Large 也不再对外开源。

所以开源和闭源很可能只是路线之别,哪有啥对错,只是有合适与否。

而唯一能确定就是,甭管你是开源还是闭源,烧钱都是逃不开的,无论是 OpenAI 背后的微软,还是 Llama 背后的 Meta ,亦或是国内的 BAT ,大模型的战场还是这帮顶级资本之间的斗争。

咱们就搬好小板凳,磕着瓜子继续吃瓜吧。

撰文:四大  编辑:江江&面线  封面:子曰


图片、资料来源

X、Meta AI、Claude 3、Huggingchat

Meta:Introducing Meta Llama 3: The most capable openly available LLM to date、Meet Your New Assistant: Meta AI, Built With Llama 3

The Verge:Meta’s battle with ChatGPT begins now

腾讯新闻《潜望》:朱啸虎讲了一个中国现实主义AIGC故事

As Meta debuts its Llama 3 model, today’s generative AI landscape is a different animal


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
性能强,成本低,运行快!最强开源大模型出现,超越ChatGPT和Llama!上来就是万亿模型,要单挑大厂的阶跃星辰就是中国版Inflection AICMU小鲜肉求职记:轻松上岸美国养老大厂的感觉,爽爆了哈尔滨啤酒检出呕吐毒素;Meta发布开源大模型Llama 3丨大公司动态微软秒删堪比 GPT-4 的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试Llama3发布,开源模型追上闭源模型的历史时刻就在眼前了?吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果最强开源大模型 Llama 3震撼发布!开源模型将追上GPT-4,4000亿参数模型也在路上发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试最强开源大模型深夜炸场! Llama 3 王者归来,直逼 GPT-4, 马斯克点赞 | 附体验链接最强开源大模型Llama 3来了!4000亿参数狙击GPT-4,训练数据达Llama 2七倍全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用李彦宏:开源大模型不如闭源,后者会持续领先;周鸿祎:“开源不如闭源” 的言论是胡说八道半数企业主认为ChatGPT比学位更重要,Meta发布免费人工智能模型Llama 3Meta震撼发布Llama 3,一夜重回开源大模型铁王座张核子回应张姗姗身份;雷军直播回应造车亏损;Meta发布最强开源大模型Llama 3;阿里拍卖回应前员工指控高管职场霸凌|邦早报所有大厂的尽头?鹅厂也不例外Meta、微软、Mistral AI、Hugging Face、通义、港中文六路进发开源大模型 | 大模型一周大事特斯拉全系降价后与小米 SU7 差价仅 1.6 万/ Apple Watch X 渲染图曝光/周鸿祎称开源和闭源没必要相互贬低那些离开大厂的人,后悔了吗?李彦宏称开源落后于闭源,圈内大佬力挺;雷军否认“爽文人生” ;特斯拉裁员遣散费“过低”,马斯克:“得加钱”! | Q资讯华为 Pura 70 系列上架即售罄/Meta 发布全球最强开源大模型/理想汽车 L6 发布和爱美丽游750米格格不入开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4二月长周末在铜山Tucker峰大模型开闭源争吵不休:开源落后闭源一年,决定模型能力的不是技术?ChatGPT 大更新曝光!免费用户自动升级 GPT-4 ,还能创建 GPTs便捷快速的国内手机银行 春节庙会 (多图)微软秒删堪比GPT-4的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试旧金山艺术宫(Palace of Fine Arts),环境很美大模型又开“卷”!万亿参数闭源模型、四千亿开源模型来了免费无门槛!Wetzel’s Pretzels免费送Original Pretzels啦!神秘GPT模型引爆社区,GPT-4.5、GPT-5谣言满天飞,奥特曼在线围观大厂的忙碌,可能是一种表演型人格障碍
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。