马斯克发全球最大开源模型！3140亿参数的Grok真打脸OpenAI了？

科技

2024-03-18 22:03

▲ 点击订阅，抓住风口

要闻背景简述

前段时间，马斯克起诉OpenAI并要求开源GPT模型。之后，马斯克在推特上宣布要开源自家公司的大模型。

3月17日，马斯克旗下人工智能公司xAI宣布正式开源Grok-1模型，模型参数达3140亿，是迄今参数量最大的开源大语言模型。

那么，我们可以从Grok-1这一全球最大的开源模型中看到什么启示呢？

以下是王煜全要闻评论：

最近有关马斯克的新闻真是不断。我们之前介绍过，他成立了一个xAI公司专门做人工智能，现在这公司推出成果了，叫Grok-1大模型。

这个模型有3140亿个参数，是所有开源大模型里参数最多的，所以很多人在惊呼马斯克打脸OpenAI了。

是不是真的打脸OpenAI？我认为可能是反过来的，有可能被OpenAI打脸。

我在这顺便给大家做一堂教学，告诉大家怎么去判断科技产业的未来发展，或者说一个技术到底未来有没有巨大的机会，我相信很多人都想掌握。

还是先给结论，我认为对未来能够有预判主要看两点：一个叫看趋势，另一个叫看模式。

什么叫看趋势呢？就是说任何的技术发展都不是孤立的，往往有一大堆公司相互差距没有那么大，相互伴随着发展，所以从这堆公司的发展来看就能看出趋势来。

那最近的趋势是什么呢？大模型之争还在继续，但是可能到了一个转折点上。

注意最近Anthropic公司推出了Claude 3大模型，它的一些通用性的指标上号称比OpenAI强了一点点，但是在一些专有指标上它强了很多。

这意味着很有可能它并不是大模型胜出了，而是用一些比如说多模态，包括Multi Agents来处理一些事情。

现在很明显人工智能已经往解决实际的应用问题方面去转化了。这种时候看具体的解决问题能力，往往不是看这个模型参数有多大，而是看你有没有相关的一系列的配套的配件，把配件组合起来形成组合拳去解决实际问题。

另外，最近有一个公司叫Cognition，他们强调的就是端到端地解决实际问题的能力。比如，你用他们的AI Devin开发一个程序，或者开发一个游戏，你只需要把指令下完，这个游戏就会完整地开发给你，不需要做任何其他事，它还能帮你挑错，帮你做质量检测。

以前很多人工智能只能解决一个环节的问题，整体的把控包括很多的细节判断还是要人来做。那现在人工智能可以完成完整的工作了。

无独有偶，前一段微软就发了一篇论文，专门讲他们在测试两种不同类型的AI agents。

一种叫APP agent，应用智能体。它解决的是在手机上操作的时候选哪个手机APP。另一个叫作ACT agent，行动智能体。应用智能体选了某个APP了，到APP里面去执行操作就用另一个执行智能体。两类不同的智能体综合起来就能完成一个相对复杂的任务。

所以，有两个大趋势出现了交叉。一个趋势，就是人工智能正在从强调大模型、强调参数、强调性能，转到强调解决实际应用问题。

另一个趋势，我们说2024年开始会出现终端智能。因为终端离每个用户近，尤其是对每个用户的数据收集得比较多，对用户的行为理解会更深刻，那这种时候我在终端就能够更有智能地去帮用户解决问题，这一定是一个发展趋势。

那从终端智能角度上讲，当然更强调解决实际问题了。那这两个趋势融合，你会发现未来很有可能就强调看模式了。

看模式也是说两点。一点就是以前我们说工业革命的模式，尤其是瓦特蒸汽机出来以后，还有人在不断地改进，但是这个性能提升就没那么多了。

按经济学术语来讲，叫边际效益递减，也就是说这种时候再去提升蒸汽机本身的性能就不值当了。

就像今天大模型可能还能提升，但是你提升大模型的性能，可能它的边际效益就不够大了。

那什么时候边际效益能增加？就是要一堆配套的技术，包括像当时的曲轴连杆才能使得蒸汽机能够驱动火车轮船。所以这些配套的技术就特别重要。

那现在的配套技术就是AI Agents，尤其是前一段时间吴恩达提的叫Autonoumous Agent，叫自主化智能体，非常重要。

另一个模式是什么？以前PC硬件主要使用X86结构CPU，当初Intel的CPU可以说是性能最好的。其实到今天很多手机CPU也不能说超过了英特尔的CPU了。

但手机就有一个新的需求，在解决问题的现实场景当中，我需要的并不是足够强大的算力，而是能够随时随地提供算力，甚至说需要能够相对低能耗的算力，别俩小时就没电了。

这种时候，ARM架构的简易指令集CPU变成了主流，也就是后来高通主导的这些CPU。

所以，从过去的历史中可以看到这样一个模式，就是一开始性能是第一位的，但是真到实际应用场景的时候，我们更强调就不是性能，而是解决实际问题了。

现在，手机上需要有智能的时候，就会从云端的强调高性能的大模型，变成了终端的强调在有限算力之下提供一定智能水平的大模型，甚至可能是小模型。

当解决实际问题的时候，你会发现有可能未来的趋势是小模型加上一堆的配套技术，包括和终端上的用户数据、用户互动相结合，它最后的性能甚至会超过大模型。

因为大模型没有那么多的终端用户的数据，尤其是实时的数据，所以它到最后未必能够竞争得过更贴近用户需求的小模型。

所以，从趋势和从模式都能看出来，有可能我们正处在人工智能的一个转折点上，从过去追求性能到现在追求应用，追求解决实际问题。

所以我们得到的结论也是两条。

第一条，即使是马斯克这么聪明的人，离OpenAI也有点远了，对整个人工智能，尤其是生成式人工智能的发展趋势可能理解得就没那么透了，很有可能他是在跟上已经过去的趋势。

另一个是给了我们一个重大启示，中国是有机会的。为什么这么说呢？因为如果一味强调模型的性能领先，咱真不一定追得上。

但是，如果是强调解决问题，而且是在有限条件下解决问题，中国有很多很多的高手。想想咱们手机上各种丰富的应用，你就可以想象了。

我们说从2024年开始，手机上会有一大堆的AI原生的APP，就是它有很强的智能性，也有个性化、随身的这样的特点，那么这些很有可能也是中国人制造的。

也就是说，在人工智能时代，我们在应用落地上可能还能领先。当然也是给大家指一个方向，就是如果你要在中国创业做人工智能，我觉得大模型未必是一个好选项，但是贴近用户做应用很可能是有巨大的机会的。

最后，我们也希望把这次评论当做一次演示，希望每一个普通人都不只是看着新闻，觉得别人很厉害，别人很牛。而是外行看热闹，内行看门道，看出来这个技术到底如何分析，才知道它的趋势，才知道它的未来发展方向，从而我们也能够把握住技术趋势，成为技术趋势的受益者。

以上是今天的内容，更多详细的产业分析和底层逻辑，我会在科技特训营里分享。欢迎关注全球风口微信号，报名加入！

王煜全要闻评论，我们明天见！

我们还整理了一份”huggingface20个热门开源模型（3月18日）”清单，请你扫描下方二维码加入微信群，你就会获得这份清单。

清单每天更新，所以请跟上全球风口的节奏；如果想要所有行业清单，扫码加入科技特训营，分分钟尽在掌握！

【科技特训营】全新的会员订阅制线上书院模式，全年50次“在线直播课程+私享群互动”，你随时可以加入、我持续保持更新！一起互动，伴随成长！让我们为未来五年做好准备，一起探讨把握机遇，决胜未来！

【回放地址】

长按扫描二维码加入科技特训营，可观看所有直播和回放。

1. 前哨科技特训营直播课程第四季（2023年）共50讲+，除此之外还有5节加餐+公开课。
2. 每讲承诺为1小时视频内容，实际平均时长为2小时。
3. 每周四晚八点准时直播，会员可无限次观看回放。
4. 新入会员，可以无限次回看之前所有视频课程。
5. 成为会员即可使用【AI王煜全】，最新AI大模型开发的专属科技分析助手
6. 每周组织【前哨·创新启发局】，链接科技/产业一线人士，打开技术/应用前沿视野
7. 优先获取全球科技产业一线游学、访问机会，接触科技/产业专家，获取最新、最前沿的趋势洞察，人脉链接
8. 本课程为虚拟内容服务，年费订阅服务制。一经订阅概不退款，线下活动需另行支付差旅成本，请您理解。

【课程咨询】

请加“创新地图助手”：

微信：innovationmapSM

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章