Redian新闻
>
马斯克发全球最大开源模型!3140亿参数的Grok真打脸OpenAI了?

马斯克发全球最大开源模型!3140亿参数的Grok真打脸OpenAI了?

科技

 点击订阅,抓住风口

要闻背景简述

前段时间,马斯克起诉OpenAI并要求开源GPT模型。之后,马斯克在推特上宣布要开源自家公司的大模型。

3月17日,马斯克旗下人工智能公司xAI宣布正式开源Grok-1模型,模型参数达3140亿,是迄今参数量最大的开源大语言模型。

那么,我们可以从Grok-1这一全球最大的开源模型中看到什么启示呢?

以下是王煜全要闻评论:


最近有关马斯克的新闻真是不断。我们之前介绍过,他成立了一个xAI公司专门做人工智能,现在这公司推出成果了,叫Grok-1大模型。

这个模型有3140亿个参数,是所有开源大模型里参数最多的,所以很多人在惊呼马斯克打脸OpenAI了。

是不是真的打脸OpenAI?我认为可能是反过来的,有可能被OpenAI打脸。

我在这顺便给大家做一堂教学,告诉大家怎么去判断科技产业的未来发展,或者说一个技术到底未来有没有巨大的机会,我相信很多人都想掌握。

还是先给结论,我认为对未来能够有预判主要看两点:一个叫看趋势,另一个叫看模式。

什么叫看趋势呢?就是说任何的技术发展都不是孤立的,往往有一大堆公司相互差距没有那么大,相互伴随着发展,所以从这堆公司的发展来看就能看出趋势来。

那最近的趋势是什么呢?大模型之争还在继续,但是可能到了一个转折点上。

注意最近Anthropic公司推出了Claude 3大模型,它的一些通用性的指标上号称比OpenAI强了一点点,但是在一些专有指标上它强了很多。

这意味着很有可能它并不是大模型胜出了,而是用一些比如说多模态,包括Multi Agents来处理一些事情。

现在很明显人工智能已经往解决实际的应用问题方面去转化了。这种时候看具体的解决问题能力,往往不是看这个模型参数有多大,而是看你有没有相关的一系列的配套的配件,把配件组合起来形成组合拳去解决实际问题。

另外,最近有一个公司叫Cognition,他们强调的就是端到端地解决实际问题的能力。比如,你用他们的AI Devin开发一个程序,或者开发一个游戏,你只需要把指令下完,这个游戏就会完整地开发给你,不需要做任何其他事,它还能帮你挑错,帮你做质量检测。

以前很多人工智能只能解决一个环节的问题,整体的把控包括很多的细节判断还是要人来做。那现在人工智能可以完成完整的工作了。

无独有偶,前一段微软就发了一篇论文,专门讲他们在测试两种不同类型的AI agents。

一种叫APP agent,应用智能体。它解决的是在手机上操作的时候选哪个手机APP。另一个叫作ACT agent,行动智能体。应用智能体选了某个APP了,到APP里面去执行操作就用另一个执行智能体。两类不同的智能体综合起来就能完成一个相对复杂的任务。

所以,有两个大趋势出现了交叉。一个趋势,就是人工智能正在从强调大模型、强调参数、强调性能,转到强调解决实际应用问题。

另一个趋势,我们说2024年开始会出现终端智能。因为终端离每个用户近,尤其是对每个用户的数据收集得比较多,对用户的行为理解会更深刻,那这种时候我在终端就能够更有智能地去帮用户解决问题,这一定是一个发展趋势。

那从终端智能角度上讲,当然更强调解决实际问题了。那这两个趋势融合,你会发现未来很有可能就强调看模式了。

看模式也是说两点。一点就是以前我们说工业革命的模式,尤其是瓦特蒸汽机出来以后,还有人在不断地改进,但是这个性能提升就没那么多了。

按经济学术语来讲,叫边际效益递减,也就是说这种时候再去提升蒸汽机本身的性能就不值当了。

就像今天大模型可能还能提升,但是你提升大模型的性能,可能它的边际效益就不够大了。

那什么时候边际效益能增加?就是要一堆配套的技术,包括像当时的曲轴连杆才能使得蒸汽机能够驱动火车轮船。所以这些配套的技术就特别重要。

那现在的配套技术就是AI Agents,尤其是前一段时间吴恩达提的叫Autonoumous Agent,叫自主化智能体,非常重要。

另一个模式是什么?以前PC硬件主要使用X86结构CPU,当初Intel的CPU可以说是性能最好的。其实到今天很多手机CPU也不能说超过了英特尔的CPU了。

但手机就有一个新的需求,在解决问题的现实场景当中,我需要的并不是足够强大的算力,而是能够随时随地提供算力,甚至说需要能够相对低能耗的算力,别俩小时就没电了。

这种时候,ARM架构的简易指令集CPU变成了主流,也就是后来高通主导的这些CPU。

所以,从过去的历史中可以看到这样一个模式,就是一开始性能是第一位的,但是真到实际应用场景的时候,我们更强调就不是性能,而是解决实际问题了。

现在,手机上需要有智能的时候,就会从云端的强调高性能的大模型,变成了终端的强调在有限算力之下提供一定智能水平的大模型,甚至可能是小模型。

当解决实际问题的时候,你会发现有可能未来的趋势是小模型加上一堆的配套技术,包括和终端上的用户数据、用户互动相结合,它最后的性能甚至会超过大模型。

因为大模型没有那么多的终端用户的数据,尤其是实时的数据,所以它到最后未必能够竞争得过更贴近用户需求的小模型。

所以,从趋势和从模式都能看出来,有可能我们正处在人工智能的一个转折点上,从过去追求性能到现在追求应用,追求解决实际问题。

所以我们得到的结论也是两条。

第一条,即使是马斯克这么聪明的人,离OpenAI也有点远了,对整个人工智能,尤其是生成式人工智能的发展趋势可能理解得就没那么透了,很有可能他是在跟上已经过去的趋势。

另一个是给了我们一个重大启示,中国是有机会的。为什么这么说呢?因为如果一味强调模型的性能领先,咱真不一定追得上。

但是,如果是强调解决问题,而且是在有限条件下解决问题,中国有很多很多的高手。想想咱们手机上各种丰富的应用,你就可以想象了。

我们说从2024年开始,手机上会有一大堆的AI原生的APP,就是它有很强的智能性,也有个性化、随身的这样的特点,那么这些很有可能也是中国人制造的。

也就是说,在人工智能时代,我们在应用落地上可能还能领先。当然也是给大家指一个方向,就是如果你要在中国创业做人工智能,我觉得大模型未必是一个好选项,但是贴近用户做应用很可能是有巨大的机会的。

最后,我们也希望把这次评论当做一次演示,希望每一个普通人都不只是看着新闻,觉得别人很厉害,别人很牛。而是外行看热闹,内行看门道,看出来这个技术到底如何分析,才知道它的趋势,才知道它的未来发展方向,从而我们也能够把握住技术趋势,成为技术趋势的受益者。

以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!

王煜全要闻评论,我们明天见!


我们还整理了一份huggingface20个热门开源模型(3月18日)”清单请你扫描下方二维码加入微信群,你就会获得这份清单。

清单每天更新,所以请跟上全球风口的节奏;如果想要所有行业清单,扫码加入科技特训营,分分钟尽在掌握!

【科技特训营】全新的会员订阅制线上书院模式,全年50次“在线直播课程+私享群互动”,你随时可以加入、我持续保持更新!一起互动,伴随成长!让我们为未来五年做好准备,一起探讨把握机遇,决胜未来!


回放地址
长按扫描二维码加入科技特训营,可观看所有直播和回放。

1. 前哨科技特训营直播课程第四季(2023年)共50讲+,除此之外还有5节加餐+公开课。
2. 每讲承诺为1小时视频内容,实际平均时长为2小时。
3. 每周四晚八点准时直播,会员可无限次观看回放。
4. 新入会员,可以无限次回看之前所有视频课程。
5. 成为会员即可使用【AI王煜全】,最新AI大模型开发的专属科技分析助手
6. 每周组织【前哨·创新启发局】,链接科技/产业一线人士,打开技术/应用前沿视野
7. 优先获取全球科技产业一线游学、访问机会,接触科技/产业专家,获取最新、最前沿的趋势洞察,人脉链接
8. 本课程为虚拟内容服务,年费订阅服务制。一经订阅概不退款,线下活动需另行支付差旅成本,请您理解。

课程咨询】
请加“创新地图助手”:
微信:innovationmapSM

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
负笈不敌温柔乡(1)开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4马斯克开源Grok-1,OpenAI如何应对?|【经纬低调分享】写小说,还是回忆录?全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报大模型又开“卷”!万亿参数闭源模型、四千亿开源模型来了OpenAI有望在今年夏季推出GPT-5;英伟达推出更强GPU芯片;马斯克宣布正式开源Grok-1|AIGC周观察第三十七期苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源抱抱脸正面挑战OpenAI,推出开源版GPT商店!完全免费、支持六大开源模型当底座最强开源大模型 Llama 3震撼发布!开源模型将追上GPT-4,4000亿参数模型也在路上直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral CEO自曝是旧模型,OpenAI再败一局?扎克伯格的Llama 3号称全球最强开源模型!却写不好这个……吊打一切开源模型!DBRX真的有那么神奇吗?AI早知道|马斯克Grok大模型开源;荣耀正式发布首款AI PC;苹果谷歌和OpenAI商谈iPhone大模型使用开源大模型王座再易主,1320亿参数DBRX上线,基础、微调模型都有国内首个开源千亿参数MoE大模型来了!性能超Grok-1,单张GPU可跑马斯克发布Grok 1.5! 编码和数学能力大幅提升全球最大开源模型再刷爆纪录!4800亿参数MoE击败Llama 3、Mixtral刚刚!马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型周鸿祎向李彦宏“开炮”:有些名人胡说八道别被忽悠了;全球最强开源大模型Llama 3发布:最大模型参数将超4000亿丨AI周报马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星黄仁勋扔出的算力核弹​是堆叠吗?马斯克开源的大模型Grok才是全球最大吗?全球最强开源模型一夜易主,1320亿参数推理飙升2倍说到做到,马斯克开源Grok,3140亿参数免费可商用P70系列有3或4款新品;国内首个开源千亿参数MoE大模型来了,对标马斯克的Grok……童年故事(35):小镇钟表匠英文作者会描述一个景物叙事的双重比喻新开源之王来了!1320亿参数,逻辑数理全面打赢Grok,还比Llama2-70B快1倍马斯克正式开源 Grok-1,成为全球最大的开源大模型不明白播客:大选前夜体验台湾民主的细节Llama3发布,开源模型追上闭源模型的历史时刻就在眼前了?最强开源大模型Llama 3来了!4000亿参数狙击GPT-4,训练数据达Llama 2七倍微软拟与OpenAI投资1000亿美元建AI超算;Databricks 推出1320亿参数大语言模型 DBRX丨AIGC日报全球最强开源模型一夜易主,1320亿参数推理飙升2倍!开源日报 | 微软AI程序员登场,马斯克开源Grok;Open-Sora全面开源
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。