Redian新闻
>
马斯克发全球最大开源模型!3140亿参数的Grok真打脸OpenAI了?

马斯克发全球最大开源模型!3140亿参数的Grok真打脸OpenAI了?

科技

 点击订阅,抓住风口

要闻背景简述

前段时间,马斯克起诉OpenAI并要求开源GPT模型。之后,马斯克在推特上宣布要开源自家公司的大模型。

3月17日,马斯克旗下人工智能公司xAI宣布正式开源Grok-1模型,模型参数达3140亿,是迄今参数量最大的开源大语言模型。

那么,我们可以从Grok-1这一全球最大的开源模型中看到什么启示呢?

以下是王煜全要闻评论:


最近有关马斯克的新闻真是不断。我们之前介绍过,他成立了一个xAI公司专门做人工智能,现在这公司推出成果了,叫Grok-1大模型。

这个模型有3140亿个参数,是所有开源大模型里参数最多的,所以很多人在惊呼马斯克打脸OpenAI了。

是不是真的打脸OpenAI?我认为可能是反过来的,有可能被OpenAI打脸。

我在这顺便给大家做一堂教学,告诉大家怎么去判断科技产业的未来发展,或者说一个技术到底未来有没有巨大的机会,我相信很多人都想掌握。

还是先给结论,我认为对未来能够有预判主要看两点:一个叫看趋势,另一个叫看模式。

什么叫看趋势呢?就是说任何的技术发展都不是孤立的,往往有一大堆公司相互差距没有那么大,相互伴随着发展,所以从这堆公司的发展来看就能看出趋势来。

那最近的趋势是什么呢?大模型之争还在继续,但是可能到了一个转折点上。

注意最近Anthropic公司推出了Claude 3大模型,它的一些通用性的指标上号称比OpenAI强了一点点,但是在一些专有指标上它强了很多。

这意味着很有可能它并不是大模型胜出了,而是用一些比如说多模态,包括Multi Agents来处理一些事情。

现在很明显人工智能已经往解决实际的应用问题方面去转化了。这种时候看具体的解决问题能力,往往不是看这个模型参数有多大,而是看你有没有相关的一系列的配套的配件,把配件组合起来形成组合拳去解决实际问题。

另外,最近有一个公司叫Cognition,他们强调的就是端到端地解决实际问题的能力。比如,你用他们的AI Devin开发一个程序,或者开发一个游戏,你只需要把指令下完,这个游戏就会完整地开发给你,不需要做任何其他事,它还能帮你挑错,帮你做质量检测。

以前很多人工智能只能解决一个环节的问题,整体的把控包括很多的细节判断还是要人来做。那现在人工智能可以完成完整的工作了。

无独有偶,前一段微软就发了一篇论文,专门讲他们在测试两种不同类型的AI agents。

一种叫APP agent,应用智能体。它解决的是在手机上操作的时候选哪个手机APP。另一个叫作ACT agent,行动智能体。应用智能体选了某个APP了,到APP里面去执行操作就用另一个执行智能体。两类不同的智能体综合起来就能完成一个相对复杂的任务。

所以,有两个大趋势出现了交叉。一个趋势,就是人工智能正在从强调大模型、强调参数、强调性能,转到强调解决实际应用问题。

另一个趋势,我们说2024年开始会出现终端智能。因为终端离每个用户近,尤其是对每个用户的数据收集得比较多,对用户的行为理解会更深刻,那这种时候我在终端就能够更有智能地去帮用户解决问题,这一定是一个发展趋势。

那从终端智能角度上讲,当然更强调解决实际问题了。那这两个趋势融合,你会发现未来很有可能就强调看模式了。

看模式也是说两点。一点就是以前我们说工业革命的模式,尤其是瓦特蒸汽机出来以后,还有人在不断地改进,但是这个性能提升就没那么多了。

按经济学术语来讲,叫边际效益递减,也就是说这种时候再去提升蒸汽机本身的性能就不值当了。

就像今天大模型可能还能提升,但是你提升大模型的性能,可能它的边际效益就不够大了。

那什么时候边际效益能增加?就是要一堆配套的技术,包括像当时的曲轴连杆才能使得蒸汽机能够驱动火车轮船。所以这些配套的技术就特别重要。

那现在的配套技术就是AI Agents,尤其是前一段时间吴恩达提的叫Autonoumous Agent,叫自主化智能体,非常重要。

另一个模式是什么?以前PC硬件主要使用X86结构CPU,当初Intel的CPU可以说是性能最好的。其实到今天很多手机CPU也不能说超过了英特尔的CPU了。

但手机就有一个新的需求,在解决问题的现实场景当中,我需要的并不是足够强大的算力,而是能够随时随地提供算力,甚至说需要能够相对低能耗的算力,别俩小时就没电了。

这种时候,ARM架构的简易指令集CPU变成了主流,也就是后来高通主导的这些CPU。

所以,从过去的历史中可以看到这样一个模式,就是一开始性能是第一位的,但是真到实际应用场景的时候,我们更强调就不是性能,而是解决实际问题了。

现在,手机上需要有智能的时候,就会从云端的强调高性能的大模型,变成了终端的强调在有限算力之下提供一定智能水平的大模型,甚至可能是小模型。

当解决实际问题的时候,你会发现有可能未来的趋势是小模型加上一堆的配套技术,包括和终端上的用户数据、用户互动相结合,它最后的性能甚至会超过大模型。

因为大模型没有那么多的终端用户的数据,尤其是实时的数据,所以它到最后未必能够竞争得过更贴近用户需求的小模型。

所以,从趋势和从模式都能看出来,有可能我们正处在人工智能的一个转折点上,从过去追求性能到现在追求应用,追求解决实际问题。

所以我们得到的结论也是两条。

第一条,即使是马斯克这么聪明的人,离OpenAI也有点远了,对整个人工智能,尤其是生成式人工智能的发展趋势可能理解得就没那么透了,很有可能他是在跟上已经过去的趋势。

另一个是给了我们一个重大启示,中国是有机会的。为什么这么说呢?因为如果一味强调模型的性能领先,咱真不一定追得上。

但是,如果是强调解决问题,而且是在有限条件下解决问题,中国有很多很多的高手。想想咱们手机上各种丰富的应用,你就可以想象了。

我们说从2024年开始,手机上会有一大堆的AI原生的APP,就是它有很强的智能性,也有个性化、随身的这样的特点,那么这些很有可能也是中国人制造的。

也就是说,在人工智能时代,我们在应用落地上可能还能领先。当然也是给大家指一个方向,就是如果你要在中国创业做人工智能,我觉得大模型未必是一个好选项,但是贴近用户做应用很可能是有巨大的机会的。

最后,我们也希望把这次评论当做一次演示,希望每一个普通人都不只是看着新闻,觉得别人很厉害,别人很牛。而是外行看热闹,内行看门道,看出来这个技术到底如何分析,才知道它的趋势,才知道它的未来发展方向,从而我们也能够把握住技术趋势,成为技术趋势的受益者。

以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!

王煜全要闻评论,我们明天见!


我们还整理了一份huggingface20个热门开源模型(3月18日)”清单请你扫描下方二维码加入微信群,你就会获得这份清单。

清单每天更新,所以请跟上全球风口的节奏;如果想要所有行业清单,扫码加入科技特训营,分分钟尽在掌握!

【科技特训营】全新的会员订阅制线上书院模式,全年50次“在线直播课程+私享群互动”,你随时可以加入、我持续保持更新!一起互动,伴随成长!让我们为未来五年做好准备,一起探讨把握机遇,决胜未来!


回放地址
长按扫描二维码加入科技特训营,可观看所有直播和回放。

1. 前哨科技特训营直播课程第四季(2023年)共50讲+,除此之外还有5节加餐+公开课。
2. 每讲承诺为1小时视频内容,实际平均时长为2小时。
3. 每周四晚八点准时直播,会员可无限次观看回放。
4. 新入会员,可以无限次回看之前所有视频课程。
5. 成为会员即可使用【AI王煜全】,最新AI大模型开发的专属科技分析助手
6. 每周组织【前哨·创新启发局】,链接科技/产业一线人士,打开技术/应用前沿视野
7. 优先获取全球科技产业一线游学、访问机会,接触科技/产业专家,获取最新、最前沿的趋势洞察,人脉链接
8. 本课程为虚拟内容服务,年费订阅服务制。一经订阅概不退款,线下活动需另行支付差旅成本,请您理解。

课程咨询】
请加“创新地图助手”:
微信:innovationmapSM

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
全球最大开源模型再刷爆纪录!4800亿参数MoE击败Llama 3、Mixtral最强开源大模型 Llama 3震撼发布!开源模型将追上GPT-4,4000亿参数模型也在路上马斯克发布全球最大开源模型Grok-1抱抱脸正面挑战OpenAI,推出开源版GPT商店!完全免费、支持六大开源模型当底座P70系列有3或4款新品;国内首个开源千亿参数MoE大模型来了,对标马斯克的Grok……扎克伯格的Llama 3号称全球最强开源模型!却写不好这个……马斯克开源Grok-1,OpenAI如何应对?|【经纬低调分享】开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型童年故事(35):小镇钟表匠通义千问开源王炸,1100亿参数称霸开源榜单,中文能力全球第一微软拟与OpenAI投资1000亿美元建AI超算;Databricks 推出1320亿参数大语言模型 DBRX丨AIGC日报说到做到,马斯克开源Grok,3140亿参数免费可商用大模型又开“卷”!万亿参数闭源模型、四千亿开源模型来了英文作者会描述一个景物叙事的双重比喻刚刚!马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型黄仁勋扔出的算力核弹​是堆叠吗?马斯克开源的大模型Grok才是全球最大吗?开源大模型王座再易主,1320亿参数DBRX上线,基础、微调模型都有负笈不敌温柔乡(1)OpenAI有望在今年夏季推出GPT-5;英伟达推出更强GPU芯片;马斯克宣布正式开源Grok-1|AIGC周观察第三十七期AI早知道|马斯克Grok大模型开源;荣耀正式发布首款AI PC;苹果谷歌和OpenAI商谈iPhone大模型使用苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源马斯克正式开源 Grok-1,成为全球最大的开源大模型全球最强开源模型一夜易主,1320亿参数推理飙升2倍新开源之王来了!1320亿参数,逻辑数理全面打赢Grok,还比Llama2-70B快1倍写小说,还是回忆录?马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星周鸿祎向李彦宏“开炮”:有些名人胡说八道别被忽悠了;全球最强开源大模型Llama 3发布:最大模型参数将超4000亿丨AI周报国内首个开源千亿参数MoE大模型来了!性能超Grok-1,单张GPU可跑全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报不明白播客:大选前夜体验台湾民主的细节Llama3发布,开源模型追上闭源模型的历史时刻就在眼前了?开源日报 | 微软AI程序员登场,马斯克开源Grok;Open-Sora全面开源全球最强开源模型一夜易主,1320亿参数推理飙升2倍!马斯克发布Grok 1.5! 编码和数学能力大幅提升开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。