我们不惮于同巨浪相遇

2023-06-07 07:06

作者｜Neil Shen
邮箱｜[email protected]

来源｜未来科技力（smartechworld）

大语言模型技术横空出世让每个关心这一话题的人都出现了信息过载——因为技术迭代的速度实在是太快了。

从开源社区到互联网大厂，从最顶尖的人工智能专家到每个试用ChatGPT的普通人，每天，关于技术更新与迭代的细节、关于大模型层出不穷的玩法、关于谁倒闭了谁又拿到了新的融资，关于政策的应对和AI安全性的集体大辩论，这些消息像是密集投放的炸弹，轰炸着人们的认知，让人类亲眼见证一项突破性的技术是如何在全球掀起滔天巨浪。

中国自然不会在这么明确而巨大的浪潮中缺席。实际上中国被公认是世界上唯一可堪在大模型领域与美国展开正面竞争的国家——极具活力与创新的互联网产业、超级巨大的市场、完整的工业链条和强大的人才资源储备，大语言模型所必须具备的三要素——算力、数据与算法在中国都能找到，因此百模大战自然而然在中国这片土地上发生。

但这并不意味着，大模型产业会水到渠成、自然而然的出现。

它和互联网产业不一样。在大模型领域，靠堆量上规模实现赢者全得的马太效应暂时还无法显现，因为中国是技术上的追赶者和后来者，而大模型本身还正处于一日千里的进化阶段。一发牵而全身皆动，大模型正在重塑整条产业链，算力（芯片）、算法、数据库、软硬件供应链……产业端已经嗅到了天下行将大变的味道，但具体要往哪个方向走，怎么走，所有人都尚在摸索。

事实上就连大模型本身该如何落地，也存在着诸多亟待厘清的问题。

中国应该构建一个通用大模型，还是若干个？大厂和初创公司谁在大模型上更有机会出线？如何在不同的垂直赛道让大模型能力落地？技术和算力上的卡脖子问题要怎么解决？

这还只是大模型本身，如果放眼整个产业链，需要回答的问题只会更多。大模型是一种全新的玩法，玩法一变，其它的生产要素要么跟着改变，要么等着被颠覆。

在一片波涛汹涌的蓝海，无数机会酝酿其中，但风暴也在其中。

这正是品玩举办大模型产业研讨会——模型思辨的原因。

这场研讨会是闭门形式，因为我们想要聚集大模型产业链上真正懂行、资深、身处第一线的人深度交流，事实上我们也做到了。品玩邀请了从软件到硬件，从大厂到初创公司，从数据库到半导体再到聚焦AI领域知名VC共一百多名行业的关键决策人参会。

我们还安排了格外频密的分享环节，有品玩创始人兼CEO骆轶航和360集团创始人周鸿祎的一对一访问（我们不日即将发布），有Zilliz创始人兼首席执行官星爵和昆仑万维CEO方汉的主题演讲，还有三场圆桌论坛，分别聚焦于算力经济、大厂大模型进展和垂直赛道大模型应用，分享的内容力图涵盖自大模型横空出世以来所涉及的产业链条每个环节上的痛点、难点问题。

在分享的严肃性和信息量上，我们认为这场研讨会的“含金量”是无出其右的。就拿和周鸿祎的一对一访问来说，中美大模型差距，友商的各种言论和360自己的研发进度，乃至中国到底算不算有大模型生态这样的问题都被摆到了台面上，品玩和周鸿祎严肃地“较量”了几个回合。

不过有一点是我们在策划这场活动的时候未曾预料到的，那就是因为都在一个朋友圈，分享着同样的激动和困惑，实际上这场研讨会台上和台下的交流几乎是同步发生的：做基础架构的人在找半导体从业者，数据库专家也在寻觅大模型合作伙伴，当然还有初创公司寻找VC，不过根据我们同事的事后反馈，许多VC其实也在寻觅着有潜力的初创公司。

在一个同频的场域里，每一句话、每一条信息都能引起更广范围的共振，这恰恰呼应着品玩成立的初衷——不只是科技内容平台，更是创新的连接器。

在这场放眼整个行业都没有人做过的，别具一格的大模型产业研讨会上，有关大模型产业的连接真实的发生着。

这是品玩的荣幸，我们也深信这是中国大模型产业的幸运。

这场研讨会结束的时间比预计晚了整整一个小时——因为实在是有太多的内容需要被分享了。

实际上这几个月以来，各种各样有关AIGC的峰会不少，但我们希望让这场闭门研讨会更像是一个严肃讨论问题的平台，而不仅仅局限于所谓“社交”和“认识新朋友”。

内容太多的另一个原因是因为大模型一日千里的快速迭代，恐怕没有任何一个人敢于说他完全掌握了关于大模型的一切——因为它本身仍在急速变化中，一个月前的知识可能已经被淘汰掉了，同样的大模型，两周前的能力也无法和此刻同日而语。

因此总结这场研讨会的成果变成了一件难事，因为它可能很快就被证明是过时的。我们此刻的观点，可能在下一刻就被巨浪打翻。因此我们最后选择三个关键词来概括这场研讨会。

焦虑

不只有一位嘉宾表达了自己的焦虑。

大模型的能力颠覆了很多行业的基本逻辑，许多从前需要巨大投入才能取得成果的东西现在已经不复存在了，过去的积累有时甚至变成了一种负担，而此刻大家被拉在了同一个起跑线上。

让人焦虑的还有大模型技术迭代的速度，从OpenAI到硅谷大厂再到开源社区，从prompt的调试策略（以至于就连prompt似乎也会消失）到预训练和数据集的遴选，每天都在出现新的技术、新的策略和新的方法，稍不留意好像就会被时代抛下，或者更准确一点说，被大洋彼岸的对手抛下。

算力

黄仁勋是不在场却被谈论最多的人，实际上就在研讨会举办前两天英伟达在台湾国际电脑展上发布了DGX GH200 AI超级电脑，它把256块GPU连接成一体，仅仅内存就高达144TB。

如何解决算力瓶颈也是这场研讨会聚焦的焦点，从迭代更新算法到推进国产替代，每个有志于从事大模型的人都在想办法解决“算力饥渴”的问题。

落地

大模型的通用能力和垂直行业应用落地之间到底隔了多少步？或者说我们应该大干快上训练几个极为出色的大模型，还是基于更准确的（和加密的）数据明确的商业化场景，花更多的时间聚焦于垂直领域？这几乎成了这场研讨会讨论中的一条暗线。对于拥抱大模型的态度大家是一致的，但大模型对千行百业的颠覆究竟应该如何发生，不同赛道和垂类领域的人有着不一样的想法。