黄仁勋:一切皆计算|Z Talk
Z Talk 是真格分享认知的栏目。
我们在这里谈论最新的行业观察,先锋的创业动态,也在这里与真格老友相聚。我们相信持续的学习和进化,相信最深刻的认知来自实践。
当地时间 3 月 18 日-21 日,英伟达召开 GTC 大会(GPU Technology Conference)。在这场被誉为 AI 行业风向标的技术发布大会上,创始人黄仁勋做了一场长达两小时的开幕演讲,称生成式 AI 是一次新的产业革命,并发布地表最强 GPU Blackwell B200 及 GB200 组合芯片。
黄仁勋如何带领英伟达创造出增长神话?英伟达技术的最新进展如何?这些问题或许可以在他「一切皆计算」的思考方式中找到部分答案。
内容要点
摩尔定律是对芯片的限制,但不是对计算的限制。
生成式 AI 也能生成「动作」,人形机器人的发展指日可待。
状态空间模型(State Space Model,SSMs)可能是下一个 Transformer。
英伟达正在开发新的 AI 超级计算机,有 3.5 万个组件。
如何构建一个操作系统,使其可以协调上亿个处理器的工作,仍是难题。
英伟达今天的业务已有 70%来自推理,30%是训练。
英伟达总部到处都是三角形,三角形里还有三角形,从 Logo 到建筑。英伟达对三角形的推崇并不令人意外,因为三角形是图像渲染中除了点与线之外最基础的图元,而且,基于三角形可以渲染出千变万化的图形,这种形状帮助英伟达赚得了第一桶金。
这家公司如今风头正劲。科技公司渴望它的芯片,而它也早已不是那个只为 X 世代提供视频游戏显卡、通过高效渲染大量三角形使图像栩栩如生的英伟达了。
这家公司的硬件如今把我们引到了一个新世界,在这个世界里,人与计算机可以通过自然语言交谈,有观点认为,照这样下去有朝一日计算机就会取代人类。
创办这家公司的黄仁勋因此成为风云人物。他今年 61 岁,喜欢穿皮夹克和黑色运动鞋,最讨厌的日子是周一早上,因为他通常会在周日工作一整天,以至于在正式工作周感到疲惫。但是当需要上台时,他又会即刻精力充沛地出现在舞台上。
在一个医疗保健投资研讨会上,「这不是我习惯的群体。生物学家和科学家是一个如此愤怒的群体,」黄仁勋对着麦克风说,引来一片笑声。「我们使用『创造』『改进』和『加速』这样的词语,而你们使用『目标』和『抑制』。」他逐渐进入状态,「如果你想在硅基材料上设计药物、发现药物,那么你很有可能需要处理大量数据。如果你在人工智能计算上遇到困难,随时给我们发邮件」。
黄仁勋一直致力于使英伟达站在每一个重大科技趋势的最前沿。2012 年,一小群研究人员发布了一个具有突破性的图像识别系统 AlexNet,它使用 GPU 而不是 CPU 来驱动其程序,开创了深度学习的新时代。黄仁勋果断引导公司全力以赴投入 AI。2017 年,Google 发布了名为 transformer 的新型神经网络结构(这是 GPT 中字母 T 对应的词),引发了当今生成式 AI 热潮,科技公司急需 AI 芯片,而英伟达处于向大公司销售 AI 专用 GPU 的绝佳时刻。
英伟达目前占据 AI 芯片市场 70%以上的份额,其估值接近 2 万亿美元。2023 年第 4 季度收入为 220 亿美元,同比增长 265%,其股票价格在过去一年上涨了 231%。黄仁勋要么具有超常的商业头脑,要么极其幸运——又或者二者兼具,人人都想知道他是如何做到这一点的。
在最近一次与美国《连线》杂志的对话中,他部分展露了他的思考方式,那就是把一切都视作「计算」,无论芯片架构、数据中心或者计算机的结构,再或者风头正劲的生成式 AI,在他看来都是计算——生成式 AI 在他口中是一种生成式计算(generative computing)。
这种计算方式在黄仁勋看来是通用的,既可以用来计算下一个 token、下一个像素、下一个代码,也可以计算下一个动作,从而为机器人的行动提供建议。
通过将一切视为计算,英伟达试图不断打破摩尔定律。黄仁勋称,英伟达正在将整个数据中心打造成一个超级芯片,从而构建类似「AI 超级计算机」的东西,它有 3.5 万个组件。因为将足够多芯片以特定方式连接在一起,这种超级计算机被认为能够重构计算。不过,黄仁勋也承认,如何构建操作系统,使其可以协调连接在一起后的上亿个处理器之间的工作,仍是难题。
2 月 15 日,英伟达发布 AI 超级计算机 Eos 的第二个版本,Eos 是希腊神话中的黎明女神。
为了更好理解黄仁勋对于芯片、AI 等技术趋势和公司未来战略的思考,我们编译本文。以下是来自美国《连线》对黄仁勋的专访:
01
下一个大事件是「AI 工厂」
黄仁勋:你和我都是斯坦福的毕业生。
Q:是的,我是新闻学专业的,而你不是。
黄仁勋:我希望我是。
Q:为什么?
黄仁勋:我非常敬佩一个人,无论是从领导者角度,还是从个人角度去看。他就是 Adobe 的 CEO Shantanu Narayen。他说他一直想成为一名记者,因为他爱讲故事。
Q:这似乎是创办企业的一个重要部分——能够有效讲述企业故事。
黄仁勋:是的,制定策略就是讲故事,构建文化也是讲故事。
Q:你多次表示,你不是通过演示文稿来推销英伟达的理念的。
黄仁勋:对的,推销理念真的与讲故事息息相关。
Q:我想从另一位技术主管告诉我的事情开始。他指出英伟达创立比亚马逊还要早一年,但在很多方面,英伟达比亚马逊更有「day one(第一天)」的理念。你如何看待这种观点?
黄仁勋:坦白说,这确实是一个好比喻。我每天早上醒来都像第一天一样,因为我们总在做一些以前从未做过的事情。当然这个词也有脆弱的一面,意思是我们很有可能会失败。就在刚才,我在开一个会,讨论我们正在做的对公司来说全新的事情,我们不知道该如何正确地去做。
Q:新事情是什么?
黄仁勋:我们正在建立一个新型数据中心,我们称呼它为「AI 工厂」。现在数据中心的建设方式是:许多人共享一个计算机集群,并将文件放在这个巨大的数据中心。AI 工厂的方式更像发电厂,这非常独特。过去几年我们一直在建设它,但现在必须将其转化为产品。
「AI 工厂」指的是一种企业定制的数据中心(私有云),英伟达去年已与富士康合作。
Q:你们打算怎么称呼它?
黄仁勋:我们还没有给它命名,但它会无所不在。云服务提供商将建造它们,英伟达也会建造它们。每个生物技术公司、零售公司、物流公司都会拥有它。未来每家汽车公司都会拥有建造汽车的工厂——打个比方,用来组装汽车产品的工厂就像是原子,做汽车 AI 研发的工厂就像是电子。事实上,你可以看到马斯克正在这么做。在思考「未来的工业公司会是什么样」这件事上,他遥遥领先于大多数人。
02
机器人行为模型可能明年就会出现
Q:你之前说过,你运行了一个扁平化的组织,有 30 到 40 名高管直接向你报告,因为你想融入信息流。最近引起你兴趣的事是什么,让你认为「我最终可能需要押注英伟达来投入这个领域」?
黄仁勋:信息不需要像史前时代那样,从组织的顶端流向底端,因为那时我们没有电子邮件和短信这些东西。如今信息可以流动得更快。所以树状的等级结构和自上而下的信息传递不再必要。扁平网络让我们适应变化的速度更快,这是我们所需要的,因为技术发展太快。
英伟达的技术发展过去遵循摩尔定律,计算效率每隔几年翻一番。然而在过去 10 年中,我们的 AI 能力大约提高了 100 万倍,这远超过摩尔定律。如果你处在指数增长的世界中,你就不希望信息在每层都传播一次。
Q:今天的 Transformer 架构是什么样的?现在正在发生的、又会改变一切的事情是什么?
黄仁勋:有几件事。其中一件实际上还没有名字,是我们在基础的机器人技术领域所做的工作。如果你能生成文本,能生成图像,你也能生成动作吗?答案可能是肯定的。如果你能生成动作,你就可以理解意图,并生成一种广义的运动方式。因此,人形机器人的发展指日可待。
状态空间模型(State Space Model,SSMs)方面的工作能够使你在计算量不再二次方增长的情况下学习极长的模式和序列,这可能就是下一个 Transformer 架构。
Q:它可以实现什么?举个现实生活中的例子?
黄仁勋:你可以与计算机持续很长时间的对话,而上下文永远不会被遗忘。你甚至可以暂时改变话题,然后回到早期话题,那个上下文可以被保留。你可能能够理解一个极长链的序列,比如人类基因组,仅仅通过查看遗传密码,你就可以理解它的意义。
Q:我们距离这个目标还有多远?
黄仁勋:从我们拥有 AlexNet 到超越人类的 AlexNet,只用了大约 5 年时间。基础机器人平台指日可待,我猜测明年就会有。从那时起再过 5 年后,你会看到一些惊人的事情。
Q:哪个行业最能从广泛训练的机器人行为模型中受益?
黄仁勋:重工业代表了世界上最大的行业。运输、物流、将重物从一个地方移动到另一个地方、发现新药——所有这些都需要对原子、分子和蛋白质的理解,这些是 AI 尚未影响到的大型行业。
03
摩尔定律已终结,但计算没有
Q:你提到了摩尔定律,它现在不再相关了吗?
黄仁勋:摩尔定律现在更多地成为一个系统问题,而不是芯片问题。它在很大程度上与多片芯片之间的互联有关。大约 10 到 15 年前,我们开始解构计算机,以便可以使用多片芯片并将它们连接在一起。
Q:这就是你们在 2019 年收购以色列公司 Mellanox 的原因?当时英伟达表示,现代计算对数据中心的要求越来越高,而 Mellanox 的网络技术将使加速计算更加高效。
黄仁勋:没错,正是这样。我们收购 Mellanox 是为了能够利用我们芯片的扩展,将整个数据中心打造成一个超级芯片,这使得现代 AI 超级计算机成为可能。实际上我们认识到摩尔定律已经终结,如果想继续扩展计算,我们必须在数据中心的规模上实现。我们审视了摩尔定律的表述方式,并认为「不要被它限制,摩尔定律并不是计算的限制。」我们必须抛弃摩尔定律,以便思考新的扩展方式。
Q:Mellanox 现在被视为英伟达一笔十分聪明的收购。近期,你还试图收购 Arm,这是世界上最重要的芯片 IP 公司之一,但是遭遇了监管机构的阻挠。
黄仁勋:那本是笔好交易。
Q:我不确定美国政府是否同意,但是,我们暂且不谈这个。当你现在考虑收购时,具体正在看哪些领域?
黄仁勋:大型系统的操作系统极其复杂,我们的 GPU 中包含了上千万乃至上亿个微型处理器,如何在一个计算栈内构建一个操作系统,来协调组织这么多处理器的工作,这是一个复杂的问题。如果我们公司外有能解决这个问题的团队,我们可以与他们合作,甚至可以做得更多。
Q:所以我听你的意思是,英伟达对拥有一个操作系统,并将其打造成一个更完整的平台至关重要。
黄仁勋:我们是一家平台公司。
Q:作为一个平台,你面临的问题会越来越多。人们倾向于对平台的输出结果赋予更多责任。自动驾驶汽车的表现如何、医疗设备的容错率是多少、AI 系统是否存在偏见,你将如何应对这些问题?
黄仁勋:我们不是一个应用公司。这可能是思考问题的最简单方式。我们会做尽可能少但是必要的事情来服务一个行业。所以就医疗保健而言,药物发现不是我们的专长,计算才是。制造汽车不是我们的专长,但为汽车制造出色的 AI 计算机是。坦白说,一家公司很难在所有事情上都很出色,但我们可以在其中的 AI 计算部分做得非常出色。
Q:去年有报道说,你们的一些客户等待你们的 AI 芯片,要等上几个月。目前情况如何?
黄仁勋:我不认为我们今年能赶上供应。今年不行,明年可能也不行。
Q:目前的等待时间是多久?
黄仁勋:我不知道现在的提前期是多少。不过你知道,今年对我们来说也是新一代产品的开始。
Q:你是说 Blackwell,你们的新款 GPU?
黄仁勋:没错。一代新 GPU 即将面市,Blackwell 的性能指标惊人。
Q:这意味着客户需要更少的 GPU 吗?
黄仁勋:这就是我们的目标:极大降低训练模型的成本,然后人们可以扩大他们想要训练的模型规模。
Q:英伟达投资了许多 AI 创业公司,去年有报道说你投资了 30 多家,这些创业公司在你们硬件的等待队伍中会获得优先吗?
黄仁勋:他们和所有人一样,都会面临供应紧张的问题,因为他们大多使用公共云,所以不得不自行与公共云服务提供商谈判。不过,他们可以访问我们的 AI 技术,这意味着他们可以使用我们的工程能力和优化 AI 模型的特殊技术,我们提高了他们的效率。如果你的计算吞吐量(指计算速度)提高了 5 倍,那本质上就相当于获得了 5 块额外的 GPU,这就是他们从我们这里得到的。
Q:你认为自己在这方面是一个关键人物吗?
黄仁勋:不。我们投资这些公司是因为他们在自己的领域做得非常出色。能投资他们是我们的荣幸,而不是反过来。他们都拥有世界上最明智的头脑,不需要英伟达给他们做背书。
04
生成式计算的时代刚刚开始
Q:随着机器学习越来越多地转向推理而不是训练,如果 AI 在计算上变得不再那么密集,这会减少对英伟达 GPU 的需求吗?
黄仁勋:我们喜欢推理。事实上,英伟达今天的业务可能有 70%是推理,30%是训练(注:「训练」指的是模型训练阶段,「推理」指的是训练好模型后服务用户的阶段)。这为什么是件好事呢,因为这时你会意识到 AI 终于被实际应用了。如果英伟达的业务有 90%是训练和 10%是推理,你可以说 AI 仍处于研究阶段。七八年前就是这种情况。但如今,每当你在云端输入提示时,它生成的东西——无论是视频、图像、2D、3D、文本还是图表——背后很可能都有英伟达的 GPU 在支持。
Q:你认为对 AI 的芯片需求会减弱吗?
黄仁勋:我认为我们正处于生成式 AI 革命的开端。如今,世界上大多数计算仍然基于检索。检索意味着你在手机上触摸某些内容,它会向云端发送信号,检索一段信息。它可能会用几个不同的东西组合一个响应,并使用 Java 在你的手机屏幕上呈现。未来,计算会更多地基于 RAG(检索增强生成:允许一个大语言模型从模型知识之外获取数据)。检索的部分会更少,而个性化生成的部分将大大增加。
某个 GPU 会完成这种生成。所以我认为我们正处于检索增强、生成式计算革命的开端,生成式 AI 将成为几乎所有事物的重要组成部分。
Q:我最近与一位关注生成式 AI 的 CEO 对话。我问他英伟达未来的竞争对手可能是谁,他提到了 Google 的 TPU(Tensor Processing Unit:Google 设计的专用硬件加速器,用于机器学习和深度学习任务的高效张量计算)。还有人提到 AMD。我猜这对你来说不是非此即彼,但是你认为谁是你最大的竞争对手?是什么让你夜不能寐?
黄仁勋:他们都让我担忧。TPU 团队非常出色,AWS Trainium 团队和 AWS Inferentia 团队也非常出色,真的很优秀。微软也有一个正在进行的内部 ASIC 开发项目,叫作 Maia。中国的每个云服务提供商都在自主研发芯片,然后还有很多初创公司在制造出色的芯片,以及一些现有的半导体公司。每个人都在制造芯片。
这不会让我夜不能寐,因为我的工作已经让我精疲力尽,以致没有人能让我夜不能寐。这是我唯一能控制的事情。
但是每天早上唤醒我的肯定是,我们必须继续履行我们的诺言:我们是世界上唯一一家能让大家合作建造数据中心规模的 AI 超级计算机、并提供完整技术栈的公司。
05
创业艰辛,人生重来依然会全力以赴
Q:我有一些想问你的个人问题。
黄仁勋:顺便说一句,每当 Morris(张忠谋)或我认识很久的人让我当采访的主持人时,他们这样做的原因是因为我不会只坐在那里采访,我会与嘉宾交谈。你必须思考观众可能想听到的东西。
Q:所以我向 ChatGPT 提了一个关于你的问题。我想知道你是否有文身,因为我打算在我们下次见面时为你纹一个文身。
黄仁勋:如果你文身,我也会纹。
Q:我已经有一个了,但我一直想扩大文身。
黄仁勋:我也有一个。
Q:是的。这就是我从 ChatGPT 那里了解到的。它说当股票价格达到 100 美元时,黄仁勋纹上了公司的标志。接着它说:「然而,黄仁勋表示他不太可能再纹其他文身,并指出疼痛比他预想的更加剧烈。」 它说你哭了。你有哭吗?
黄仁勋:有一点。我的建议是在文身前喝一杯威士忌,或者吃布洛芬。我也认为女性能忍受更多疼痛,因为我女儿有一个相当大的文身。
Q:所以如果你愿意文身,我在考虑可能选择一个三角形,谁不喜欢三角形呢?它们是完美的几何形状。
黄仁勋:或者是英伟达大楼的轮廓!它由三角形构成。
Q:这可是个承诺。我想知道,你个人有多频繁地使用 ChatGPT、Bard 或类似工具?
黄仁勋:我一直在使用 Perplexity,我也很喜欢 ChatGPT。我几乎每天都在使用这两个工具。
Q:用来做什么?
黄仁勋:做研究。例如,计算机辅助的药物发现。你可能想了解计算机辅助药物发现的最新进展。因此,你需要构建整体主题的框架,基于该框架,你可以问更多更具体的问题。我真的很喜欢这些,大语言模型可以做到这一点。
Q:我听说你以前举重。你现在还这么做吗?
黄仁勋:不了。我会试着每天做 40 个俯卧撑。这不会花费几分钟的时间。我是个懒惰的健身爱好者,我会在刷牙的时候做深蹲。
Q:最近你在播客节目 Acquired podcast 上发表了一番评论,引发了网络上的热议。主持人问,如果你今天 30 岁并考虑创业,你会创办什么公司?你说你根本就不会创业。你对此有什么补充吗?
黄仁勋:这个问题可以用两种方式回答,我选择的方式是:如果我当时知道现在我知道的所有事情,我会感到太过吃力而不去做。我会太害怕。我不会去做的。
Q:创业必须有点痴人说梦的气质。
黄仁勋:这就是无知的优势。你不知道会有多难,也不知道会有多少痛苦和艰辛。如今当我见到创业者,他们告诉我创业会有多容易时,我非常支持他们,实际上,我不会试图破坏他们的美好憧憬。但在心底里,我会想:「哦,伙计,结果不会像想象的那么简单。」
Q:你认为在经营英伟达的过程中,不得不做出的最大牺牲是什么?
黄仁勋:与其他创业者一样的牺牲。你会工作得非常非常努力。而且很长一段时间里,没有人认为你会成功。只有你自己相信你能成功。那种不安全感,脆弱性,有时还有屈辱,都是真实的。没有人谈起这些,但它们都是真实的。CEO 和创业者也和其他人一样会有情绪。当他们在公众面前失败时,这令人难堪。
所以当有人说,「黄仁勋,有了现在拥有的一切,当初你难道还不愿意创立英伟达吗?」 如果知道创业阶段的种种艰辛,我就说:「不,不,当然不会。」但如果我当时知道英伟达会成长为现在的样子,我会不惜一切代价去创业的。
推荐阅读
微信扫码关注该文公众号作者