xAI 和 Oracle 间 100 亿美元的生意谈崩了!有钱也租不到芯片的马斯克要自建超级计算中心,就不信“钞”能力还会失效?
当地时间 7 月 9 日,据多家外媒消息爆出,亿万富翁埃隆·马斯克的人工智能初创公司 xAI 和科技巨头甲骨文已经结束了潜在价值约 100 亿美元的服务器交易的谈判。
消息称,xAI 一直在就一项与甲骨文公司将展开多年合作的协议进行谈判,本质是 xAI 希望从甲骨文公司租赁更多的 Nvidia 芯片来构建超级数据中心。据《The Information》方面的消息,谈判已经陷入了僵局,原因是马斯克提出的部署速度高于甲骨文认定的可行上限,另外甲骨文对 xAI 优先选址的电力供应能力也表达了担忧。
马斯克在 X(原 Twitter)的一篇帖子中证实了此项决定,并解释称 xAI 的“根本竞争力就在于比任何其他 AI 厂商行动得更快”。他强调了速度和控制的必要性,并补充道“当我们的命运取决于能否成为行动最快者时,我们必须亲自掌控方向盘,而不是安心扮演后排乘客。”
xAI 正在构建 10 万张 H100 系统,并将以最快速度完成部署。训练工作计划于本月晚些时候开始……在很大程度上,它将成为世界上最强大的训练集群。”
尽管谈判已经结束,但 xAI 与甲骨文的原有协议不会受到影响。马斯克指出,xAI 目前在甲骨文这边的租赁容量已经由 5 月份的约 1.6 万张 GPU 增加至 2.4 万张。这部分资源正用于训练 Grok 2.0 大模型,马斯克预计此版本将在微调及 bug 修复后于下个月对外发布。
100 亿美元也租不来所需数量的芯片,这让马斯克意识到求人不如靠自己。向来“敢想敢做”的马斯克决定自己动手处理问题,不再依赖甲骨文提供的基础设施。遵循马斯克的处事风格,该公司计划在田纳西州孟菲斯建造一处庞大的 AI 数据中心,并采用戴尔和 Supermicro 提供的英伟达芯片。这处被马斯克称为“计算超级工厂”的设施将容纳令人震惊的 10 万张英伟达 GPU,并成为训练 xAI 下一代大模型 Grok 3.0 的重要基础。
这个雄心勃勃的项目也凸显出 xAI 缩小与 OpenAI 及 Anthropic 等竞争对手间差距的决心。这些对手们已经在用于 AI 模型训练和部署的专用芯片身上砸下数十亿美元。马斯克此前曾经表示,xAI 最新一轮 60 亿美元融资中的大部分都将被用于扩大其计算容量。
此次谈判自 5 月份以来一直在进行,经过一个多月的商谈后依然以失败告终。据悉,交易告吹导致甲骨文股价暴跌,周二股价下跌 3%,收于 140.68 美元。
此次下跌结束了甲骨文连续七天的上涨势头,并引发了投资者对该公司在竞争激烈的云计算市场中能否获得并维持大规模合同的担忧。
对于甲骨文来说,失去 xAI 这笔交易给公司带来了不小的发展隐患。从竞争压力方面来看,未能达成交易凸显了云计算和 AI 基础设施市场的激烈竞争。AWS、Microsoft Azure 和 Google Cloud 等公司都是强大的竞争对手,而甲骨文无法满足 xAI 的需求可能表明其服务产品或运营能力存在潜在弱点。
但不可否认的是,尽管遭遇挫折,甲骨文仍然是软件行业的强大参与者,尤其是在数据库、关系服务器和应用程序开发工具方面。分析师预测到 2025 年,甲骨文的股价将上涨 25%,这表明如果该公司能够利用其核心优势并适应市场需求,该公司仍具有巨大的增长潜力。
虽然新交易失败,但甲骨文和 xAI 将继续在基础设施需求方面进行合作。xAI 与甲骨文签订的在 Oracle Gen2 Cloud 中训练 AI 模型的现有合同仍不受影响,这表明两家公司之间的关系并未完全断绝。
而对于 xAI 来说,取消与甲骨文的交易并建立自己的数据中心的决定反映了其在大模型的开发上更加主动、更加迫切,也从侧面映射出了市场竞争环境的激烈程度。马斯克希望通过投资自己的基础设施,增强其基本竞争力并减少对外部供应商的依赖。此举符合马斯克实现 AI 技术快速进步并保持行业领先地位的更广泛愿景。
目前,马斯克的“计算超级工厂”项目正在等待孟菲斯谢尔比县经济发展增长引擎(EDGE)、田纳西河谷管理局和政府部门的批准。
公用事业公司 MLGW 的首席执行官 Doug McGowen 表示:“该项目带来的高薪工作、拥有全球最强大超级计算机的声望以及 MLGW 的大量额外收入将给我们带来巨大收益并有助于发展电网现代化工作。”
孟菲斯商会主席 Ted Townsend 表示,该项目将成为“孟菲斯市历史上最大的数十亿美元的投资”。
马斯克将该基础设施称为“计算机超级工厂”,并表示他计划在 2025 年秋季之前启用这个超级计算中心。“我的愿景是打造世界上最大、最强大的超级计算中心,我愿意把它放在孟菲斯,”他说。
目前尚不清楚该项目初始阶段的规模有多大,也不清楚第一阶段将花费多少百万或数十亿美元。马斯克曾声称,xAI 将在未来几个月内部署 10 万个 H100 液冷训练集群,并从明年夏天开始部署另外 30 万个 GPU B200 集群。
AIGC技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话30位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选10余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。
在主题演讲环节,我们已经邀请到了「蔚来创始人 李斌」,分享基于蔚来汽车 10 年来创新创业过程中的思考和实践,聚焦 SmartEV 和 AI 结合的关键问题和解决之道。大会火热报名中,7 月 31 日前可以享受 9 折优惠,单张门票节省 480 元(原价 4800 元),详情可联系票务经理 13269078023 咨询。
今日荐文
微信扫码关注该文公众号作者