互联网巨头放弃AI芯片项目:裁员!重组!
来源:内容由半导体行业观察(ID:icbank) ,谢谢。
据路透社看的一份日期为 9 月 20 日的公司备忘录,随着 2022 年夏季的结束,Meta 首席执行官马克扎克伯格召集了他的高级副手,对公司的计算能力进行了五个小时的剖析,重点是其开展尖端人工智能工作的能力。
他们遇到了一个棘手的问题:尽管这家社交媒体巨头对人工智能研究进行了高调投资,但在为其主要业务采用昂贵的人工智能友好型硬件和软件系统方面进展缓慢,这阻碍了其跟上大规模创新步伐的能力,尽管根据备忘录、公司声明和对 12 名熟悉这些变化的人的采访,他们越来越依赖人工智能来支持其增长,这些人在讨论公司内部事务时不愿透露姓名。
“在为 AI 开发时,我们在工具、工作流程和流程方面存在巨大差距。我们需要在这方面进行大量投资,”这份由新基础设施负责人 Santosh Janardhan 撰写的备忘录说,该备忘录发布在 Meta 的内部留言板上九月,现在是第一次报道。
它补充说,支持人工智能工作需要 Meta 从根本上改变我们的物理基础设施设计、我们的软件系统和我们提供稳定平台的方法。
一年多来,Meta 一直致力于一个大型项目,以完善其 AI 基础设施。虽然该公司已公开承认在 AI 硬件趋势上“有点追赶”,但此前并未报道过改革的细节——包括产能紧缩、领导层变动和废弃的 AI 芯片项目。而据The information最新的报道,据两位知情人士透露,Meta Platforms 已从微软聘请了一名芯片主管来监督其为硬件设备开发定制芯片的工作。此次聘用正值 Meta 正在评估公司的硅战略,此举可能意味着更多裁员。
Jean Boufarhat,目前担任微软硅工程公司副总裁,将加入 Meta 的 Facebook Agile Silicon Team(即 FAST),接替 Ofer Shacham。
当被问及备忘录和重组时,Meta 发言人 Jon Carvill 表示,该公司“在大规模创建和部署最先进的基础设施方面有着良好的记录,并结合了人工智能研究和工程方面的深厚专业知识。”
Carvill 表示:“随着我们为我们的应用程序和消费产品系列带来新的人工智能体验,我们有信心继续扩展基础设施的能力以满足我们的近期和长期需求。” 他拒绝评论 Meta 是否放弃了其 AI 芯片。
Janardhan 和其他高管没有同意通过公司提出的采访请求。
据公司披露,此次改革使 Meta 每季度的资本支出增加了约 40 亿美元——几乎是其 2021 年支出的两倍——并导致其暂停或取消了此前计划在四个地点建设数据中心的计划。
这些投资恰逢 Meta 经历了严重的财务紧缩期,Meta 自去年 11 月以来一直在以互联网泡沫破灭以来未见的规模裁员。
与此同时,微软支持的 OpenAI 的 ChatGPT 在 11 月 30 日首次亮相后飙升成为历史上增长最快的消费者应用程序,引发了科技巨头之间的军备竞赛,以发布使用所谓的生成 AI 的产品,除了识别数据中的模式,例如其他人工智能,根据提示创建类似人类的书面和视觉内容。
五位消息人士表示,生成式人工智能吞噬了大量的计算能力,加剧了 Meta 容量争夺战的紧迫性。
落后
这五位消息人士称,问题的一个关键根源可以追溯到 Meta 迟迟不接受用于人工智能工作的图形处理单元或 GPU。GPU 芯片非常适合人工智能处理,因为它们可以同时执行大量任务,从而减少处理数十亿条数据所需的时间。然而,消息人士称,GPU 也比其他芯片更昂贵,芯片制造商 Nvidia Corp控制着 80% 的市场份额,并在配套软件方面保持绝对领先地位。
Nvidia 没有回应对此故事发表评论的请求。
相反,直到去年,Meta 主要使用公司的商品中央处理器 (CPU) 队列运行人工智能工作负载,这是计算世界的主力芯片,几十年来一直在数据中心使用,但在人工智能的工作上表现不佳。根据其中两个消息来源,该公司还开始使用自己在内部设计的定制芯片进行推理,这是一种人工智能过程,在该过程中,经过大量数据训练的算法会做出判断并对提示做出响应。
两人表示,到 2021 年,这种双管齐下的方法被证明比围绕 GPU 构建的方法更慢、效率更低,而 GPU 在运行不同类型的模型方面也比 Meta 的芯片更灵活。
Meta 拒绝对其 AI 芯片的性能发表评论。
随着扎克伯格将公司转向元宇宙——一组由增强现实和虚拟现实支持的数字世界——其容量紧缩正在减缓其部署人工智能以应对威胁的能力,例如社交媒体竞争对手 TikTok 的崛起和苹果主导的广告隐私四位消息人士说。这些失误引起了前 Meta 董事会成员 Peter Thiel 的注意,他于 2022 年初辞职,没有给出任何解释。
据两位知情人士透露,在离开前的一次董事会会议上,Peter Thiel告诉扎克伯格及其高管,他们对 Meta 的核心社交媒体业务感到自满,同时过分关注元宇宙,他说这让公司容易受到 TikTok 的挑战。
Meta 拒绝对谈话发表评论。
跟上来
一位消息人士称,在取消了计划于 2022 年大规模推出 Meta 自己的定制推理芯片后,高管们转而改变了方向,并在当年订购了价值数十亿美元的 Nvidia GPU。
Meta 拒绝就该命令置评。
到那时,Meta 已经落后于谷歌等同行几步之遥,后者已于 2015 年开始部署自己定制的 GPU 版本,称为 TPU。高管们也在那个春天着手重组Meta 的 AI 部门,在此过程中任命了两名新的工程主管,其中包括 9 月份备忘录的作者 Janardhan。根据他们在 LinkedIn 上的个人资料和一位熟悉离职情况的消息人士,在长达数月的动荡期间,有十几位高管离开了 Meta,这是 AI 基础设施领导层近乎全面的变化。
Meta 接下来开始重组其数据中心以容纳传入的 GPU,这些 GPU 比 CPU 消耗更多的功率并产生更多的热量,并且必须通过它们之间的专用网络紧密地聚集在一起。
根据 Janardhan 的备忘录和熟悉该项目的四位消息人士,这些设施需要 24 到 32 倍的网络容量和新的液体冷却系统来管理集群的热量,要求它们“完全重新设计”,这些细节以前没有被公开披露。
随着工作的进行,Meta 制定了内部计划,开始开发一种新的、更雄心勃勃的内部芯片,该芯片与 GPU 一样,能够训练 AI 模型和执行推理。两位消息人士称,该项目此前未曾报道过,预计将于 2025 年左右完成。
Meta 发言人 Carvill 表示,在过渡到新设计时暂停的数据中心建设将在今年晚些时候恢复。他拒绝就芯片项目置评。
取舍
在扩大其 GPU 容量的同时,Meta 目前几乎没有什么表现,因为微软和谷歌等竞争对手正在推动商业生成人工智能产品的公开发布。
首席财务官 Susan Li 在 2 月份承认,Meta 并没有将其当前的大部分计算投入到生成工作中,并表示“基本上我们所有的 AI 能力都用于广告、提要和 Reels”,这是一种流行的类似于 TikTok 的短视频格式与年轻用户。
据四位消息人士称,直到 11 月推出 ChatGPT 之后,Meta 才优先考虑构建生成式 AI 产品。他们表示,尽管其研究实验室 FAIR(即 Facebook AI Research)自 2021 年底以来一直在发布该技术的原型,但该公司并未专注于将其备受推崇的研究成果转化为产品。
随着投资者兴趣的飙升,这种情况正在发生变化。扎克伯格在二月份宣布了一个新的顶级生成人工智能团队,他说这将“加速”公司在该领域的工作。首席技术官安德鲁博斯沃思本月同样表示,生成人工智能是他和扎克伯格花费最多时间的领域,并预测 Meta 将在今年发布产品。
两位熟悉新团队的人士表示,他们的工作还处于早期阶段,重点是建立一个基础模型,这是一个核心程序,以后可以针对不同的产品进行微调和调整。
Meta 发言人 Carvill 表示,该公司一年多来一直在不同团队中构建生成式 AI 产品。他证实,在 ChatGPT 到来后的几个月里,这项工作已经加速进行。
👇👇 点击文末【阅读原文】,可查看原文链接!
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3383期内容,欢迎关注。
推荐阅读
半导体行业观察
『半导体第一垂直媒体』
实时 专业 原创 深度
识别二维码,回复下方关键词,阅读更多
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
回复 投稿,看《如何成为“半导体行业观察”的一员 》
回复 搜索,还能轻松找到其他你感兴趣的文章!
微信扫码关注该文公众号作者