红杉资本|供应链拉锯战!一次性说清GPU、半导体、模型工业应用的关系
“在推特上仔细看完那个创始人的所有推特,找到ta最喜欢的电影明星,然后千方百计请那个明星录了一段专属视频,发给创始人,让创始人非常激动……”
代工厂层:
台积电是 Nvidia 的制造合作伙伴。台积电为 Nvidia 建设的制造产能越多,它就越容易受到未来需求波动的影响。 然而,它建设的晶圆厂越少,Nvidia 的供应短缺问题就越严重。因此,这种关系中的核心矛盾就出现了:台积电的动机是只提供足够的可用性来为 Nvidia 服务,仅此而已。 Nvidia 的动机是让台积电尽可能多地建设资本支出,以最大限度地提高可用性。 在这种关系中,台积电拥有所有的杠杆作用——它是全球占主导地位的纯晶圆代工厂,为许多客户提供服务,包括 Nvidia 的竞争对手。 因此,当我们试图预测人工智能的未来时,我们应该预期稳定的平衡是台积电的产能建设低于峰值需求。 一个体现这一点的例子是:台积电目前正在为其2nm 节点规划未来的资本支出。我们可以预计,无论台积电选择建设多少产能,它都会少于英伟达和其他人工智能芯片公司所要求的产能。 半导体层:
人工智能最大的讽刺之一是,虽然大型云计算公司和 Nvidia 都是“七巨头”的成员——而且随着投资者对人工智能潜力的信心时好时坏,它们的命运往往是相关的——但这些公司实际上在许多方面截然相反。 例如,云计算公司极力抵制 Nvidia 在人工智能领域的利润,它们都在开发自己的竞争芯片。 与此同时,Nvidia 一直试图与其最大客户竞争,将芯片供应导向 Coreweave 等新进入者,并通过 DGX 云建立自己的云业务。半导体拉锯战主要是为了利润率。 工业供应层:
工业供应链是另一个我们可以看到风险转移涟漪的领域。 当我们与大型科技公司交谈时,我们听到的一个一致的说法是,他们正试图买断他们可以获得的所有工业部件(如柴油发电机和冷却系统)以及钢铁和电力变压器等大宗商品的制造能力。 他们的供应商发现这些订单量之大,几乎令人难以置信,实际上不愿意满足这种需求——他们担心,如果他们将制造能力翻一番,他们将来就会出现产能过剩的情况。 为了解决这一冲突,云计算公司正在做出重大承诺——承诺提前购买多年的供应——以激励工业资本支出。 云层:
云层是将所有事物联系在一起的关键。我们将在这篇文章的第二部分深入讨论这一点。
模型层: 如果你是 OpenAI、Anthropic 或 Gemini,你希望为你的前沿模型获得尽可能多的计算,因为更多的计算意味着更智能的模型。
但是,如果你是 Azure、AWS 或 GCP,你希望将 GPU 或 CPU 计算引导到企业客户——这是你的主要业务。 因此,模型层的主要冲突是「数据中心容量分配」。由于模型层目前没有盈利,这些分配由云计算高管和研究实验室负责人协商。 所有权结构使这些谈判变得更加复杂,其中研究实验室部分或全部由云计算拥有。随着模型大小增加 10 倍,这些权力斗争只会加剧。 客户层:
客户万岁!在这个漫长而复杂的链条的末端,有一个应用层 AI 初创公司或企业买家调用 API 并查询基础模型。 对其他人而言是“需求风险”,对客户而言却是“选择的奢侈”。客户可以按需使用 AI 模型,并且可以根据自己的判断轻松在供应商之间切换。 如果客户认为 AI 不够有用,他们可以将其关闭。整个供应链都为这个客户服务,客户从竞争和供应链效率中受益。
GPU——现在还是以后?
Nvidia 的最佳利益是现在尽可能多地销售 H100 GPU,然后在未来销售更多 B100 和下一代芯片。超大规模企业的最佳利益是根据需要在其数据中心中安装GPU(这意味着构建数据中心“外壳”,然后仅在需求实现时才安装 GPU)。市场上究竟发生了什么?超大规模企业似乎在相互竞争 GPU 供应,并向 Nvidia 下大订单,以确保他们不会落后。他们没有等待,而是现在就囤积 GPU 并支付两倍的费用:首先是巨额的前期费用,其次是更高的预期未来折旧费用。
数据中心建设:
建造和组装数据中心的房地产开发商获得了相当丰厚的回报。这些公司几乎不承担任何需求风险。CyrusOne、QTS 和 Vantage 等开发商为大型科技公司建造数据中心,但他们只有在签订 15 年或 20 年租约后才会开始建设。他们设计这些交易是为了让他们能够在租赁期内偿还投资——他们将“剩余风险”限制在数据中心资产的长期价值范围内(例如,即使租赁期结束后价格暴跌,他们仍然可以赚钱)。长期需求风险完全由云提供商承担。
资产负债表外安排:
最近我们都看到了有关 GPU 融资交易和为融资购买 GPU 而发行的债务的头条新闻。许多人没有意识到,这些债务中的大部分实际上都得到了大型科技公司的租赁担保的支持。这些协议看起来非常强大,以至于许多债务投资者认为自己是在投资大型科技公司的债务,而不是 GPU。大型科技公司参与这些交易的动机是将前期资本支出转变为经常性运营支出。这是一个非常明显的例子,说明大型科技公司——即使它们没有直接进行融资——实际上也在支持当今人工智能领域发生的大部分投资活动。
研究实验室的资金和退出:
大型科技公司是当今人工智能研究实验室最大的资金来源。最大的实验室——OpenAI 和 Anthropic——都得到了大型云平台的支持。Inflection、Adept 和 Character 最近的退出表明,如果没有这样的支持,运营可能会变得越来越困难。
微信扫码关注该文公众号作者