特斯拉自研芯片的豪赌
👆如果您希望可以时常见面,欢迎标星🌟收藏哦~
来源:内容由半导体行业观察(ID:icbank)编译自techcrunch,谢谢。
伊隆·马斯克不想让特斯拉仅仅成为一家汽车制造商。他希望特斯拉成为一家人工智能公司,一家知道如何让汽车实现自动驾驶的公司。
Dojo 是特斯拉定制的超级计算机,用于训练其全自动驾驶 (FSD) 神经网络,对这项任务至关重要。FSD 实际上并不是完全自动驾驶;它可以执行一些自动驾驶任务,但仍需要驾驶员专心驾驶。但特斯拉认为,有了更多的数据、更强的计算能力和更多的训练,它可以跨越从近乎自动驾驶到完全自动驾驶的门槛。
这就是 Dojo 的作用所在。
马斯克一直在调侃 Dojo,但这位高管一直在加强对 2024 年超级计算机的讨论。Dojo 对特斯拉的重要性可能是生死攸关的——随着电动汽车销量下滑,投资者希望特斯拉能够实现自主化。以下是 Dojo 提及和承诺的时间表。
2019:首次提及 Dojo
4 月 22 日 –在特斯拉的自动驾驶日上,这家汽车制造商让其人工智能团队登台谈论自动驾驶仪和全自动驾驶,以及为两者提供支持的人工智能。该公司分享了有关特斯拉专为神经网络和自动驾驶汽车设计的定制芯片的信息。
在活动期间,马斯克透露 Dojo 是一台用于训练人工智能的超级计算机。他还指出,届时生产的所有特斯拉汽车都拥有完全自动驾驶所需的所有硬件,只需要进行软件更新即可。
2020 :马斯克开始 Dojo 路演
2 月 2 日——马斯克表示,特斯拉很快将在全球拥有超过一百万辆联网汽车,这些汽车配备了实现完全自动驾驶所需的传感器和计算能力,并大力宣传 Dojo 的功能。
“我们的训练超级计算机 Dojo 将能够处理大量视频训练数据,并高效运行具有大量参数、充足内存和核心间超高带宽的超空间阵列。稍后将详细介绍。”
8 月 14 日 -马斯克重申特斯拉计划开发一款名为 Dojo 的神经网络训练计算机,以“处理真正大量的视频数据”,称其为“野兽”。他还表示,Dojo 的第一个版本“大约需要一年时间”,这意味着它的发布日期将在 2021 年 8 月左右。
12 月 31 日——埃隆表示Dojo 不是必需的,但它将使自动驾驶变得更好。“比人类驾驶员更安全是不够的,Autopilot 最终需要比人类驾驶员安全 10 倍以上。”
2021:特斯拉正式推出 Dojo
8 月 19 日——特斯拉在首届 AI Day上正式宣布推出 Dojo ,该活动旨在吸引工程师加入特斯拉的 AI 团队。特斯拉还推出了 D1 芯片,该汽车制造商表示将使用该芯片(与 Nvidia 的 GPU 一起)为 Dojo 超级计算机提供动力。特斯拉指出,其 AI 集群将容纳 3,000 个 D1 芯片。
10 月 12 日——特斯拉发布了 一份Dojo 技术白皮书,内容是“特斯拉可配置浮点格式和算法指南”。白皮书概述了一种新型二进制浮点算法的技术标准,该算法用于深度学习神经网络,可以“完全通过软件、完全通过硬件或通过软件和硬件的任意组合”实现。
2022:特斯拉公布 Dojo 进展
8 月 12 日 –马斯克表示特斯拉将“逐步采用 Dojo。明年将不需要购买那么多增量 GPU。”
9 月 30 日——在特斯拉的第二个 AI Day上,该公司透露已安装第一个 Dojo 机柜,并进行了 2.2 兆瓦的负载测试。特斯拉表示,它每天建造一个tile(由 25 个 D1 芯片组成)。特斯拉在台上演示了 Dojo,它运行稳定扩散模型来创建 AI 生成的“火星上的 Cybertruck”图像。
重要的是,该公司设定了完整 Exapod 集群的目标日期,即 2023 年第一季度完成,并表示计划在帕洛阿尔托建造总共七台 Exapod。
2023:“不太可能的赌注”
4 月 19 日——马斯克在特斯拉第一季度财报发布会上告诉投资者,Dojo“有可能将训练成本提高一个数量级”,并且“有可能成为一种可销售的服务,我们会像亚马逊网络服务提供网络服务一样向其他公司提供这种服务”。
马斯克还指出,他“将 Dojo 视为一种不太可能成功的赌注”,但“值得一试”。
6 月 21 日——特斯拉 AI X 账户发布消息称,该公司的神经网络已经应用于客户车辆。该帖子包含一张图表,其中列出了特斯拉当前和预计的计算能力的时间表,其中指出 Dojo 将于 2023 年 7 月开始生产,尽管目前尚不清楚这是指 D1 芯片还是超级计算机本身。马斯克当天表示,Dojo 已经上线并在特斯拉数据中心运行任务。
该公司还预测,到 2024 年 2 月左右,特斯拉的计算能力将跻身全球前五(没有迹象表明这是成功的),到 2024 年 10 月,特斯拉的计算能力将达到 100 百亿亿次浮点运算。
7 月 19 日——特斯拉在第二季度财报中指出,该公司已开始生产 Dojo。马斯克还表示,特斯拉计划到 2024 年在 Dojo 上投入超过 10 亿美元。
9 月 6 日 –马斯克在 X 上发帖称,特斯拉受到 AI 训练计算的限制,但 Nvidia 和 Dojo 将解决这个问题。他说,管理特斯拉每天从其汽车获得的大约 1600 亿帧视频数据极其困难。
2024:扩大规模的计划
1 月 24 日 –在特斯拉第四季度和全年财报电话会议上,马斯克再次承认 Dojo 是一个高风险、高回报的项目。他还表示,特斯拉正在寻求“Nvidia 和 Dojo 的双管齐下”,“Dojo 正在发挥作用”,并且“正在开展训练工作”。他指出,特斯拉正在扩大规模,并制定了“Dojo 1.5、Dojo 2、Dojo 3 等计划”。
1 月 26 日 –特斯拉宣布计划斥资 5 亿美元在布法罗建造一台Dojo 超级计算机。马斯克随后淡化了这笔投资的重要性,他在 X 上发帖称,虽然 5 亿美元是一笔大数目,但“仅相当于 Nvidia 的 10k H100 系统。特斯拉今年将在 Nvidia 硬件上投入更多资金。目前,在 AI 领域保持竞争力的底线至少是每年数十亿美元。”
4 月 30 日——据 IEEE Spectrum 报道,在台积电的北美技术研讨会上,该公司表示 Dojo 的下一代训练模块 — — D2 已经投入生产。D2 将整个 Dojo 模块放在一块硅片上,而不是连接 25 个芯片来制作一块模块。
5 月 20 日——马斯克指出,Giga Texas 工厂扩建的后部将包括建设“超密集、水冷超级计算机集群”。
6 月 4 日——CNBC 的一份报告显示,马斯克将为特斯拉预留的数千块 Nvidia 芯片转移到 X 和 xAI。在最初表示该报告是虚假之后,马斯克在 X 上发帖称,由于 Giga Texas 南部扩建工程仍在继续,特斯拉没有地方发送 Nvidia 芯片来启动它们,“所以它们只能放在仓库里。”他指出,扩建工程将“容纳 5 万台 H100 用于 FSD 训练”。
他还发文:
“我说过,特斯拉今年将在人工智能方面投入约 100 亿美元,其中约一半是内部支出,主要是特斯拉设计的人工智能推理计算机和传感器,这些设备都安装在我们所有的汽车上,还有 Dojo。在构建人工智能训练超级集群方面,NVidia 硬件约占成本的 2/3。我目前对特斯拉今年将收购 Nvidia 的最佳猜测是 30 亿至 40 亿美元。”
7 月 1 日——马斯克在 X 上透露,目前的特斯拉汽车可能没有适合该公司下一代 AI 模型的硬件。他说,如果不升级汽车推理计算机,“下一代 AI 的参数数量增加约 5 倍是很难实现的”。
Nvidia 供应挑战
7 月 23 日——在特斯拉第二季度财报电话会议上,马斯克表示,对 Nvidia 硬件的需求“如此之高,以至于通常很难获得 GPU”。
“我认为,因此我们需要在 Dojo 上投入更多精力,以确保我们拥有所需的训练能力,”马斯克说。“我们确实看到了通过 Dojo 与 Nvidia 展开竞争的途径。”
特斯拉投资者资料中的一张图表预测,到 2024 年底,特斯拉 AI 训练能力将从 6 月份的 4 万台左右增至大约 9 万台 H100 等效 GPU。当天晚些时候,马斯克在 X 上发帖称,Dojo 1 将“到年底拥有大约 8000 台 H100 等效在线训练”。他还发布了这台超级计算机的照片,它似乎使用了与特斯拉 Cybertrucks 相同的类似冰箱的不锈钢外壳。
7 月 30 日—— 马斯克在回复某人的帖子时表示,AI5 距离大批量生产还有约 18 个月的时间,该帖子声称要成立一个“特斯拉 HW4/AI4 车主对 AI5 发布时落后感到愤怒”俱乐部。
8 月 3 日 –马斯克在 X 上发帖称,他参观了“Giga Texas(又名 Cortex)的特斯拉超级计算集群”。他指出,该集群将由大约 100,000 个 H100/H200 Nvidia GPU 组成,并配备“用于 FSD 和 Optimus 视频训练的海量存储空间”。
参考链接
END
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3855内容,欢迎关注。
推荐阅读
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦
微信扫码关注该文公众号作者