吞吐量最高提升 400%!百度智能云联合 NVIDIA 完成首批 17 个自动驾驶模型优化
人们对自动驾驶的概念已经不再陌生,但是很多人想象不到,自动驾驶的背后,是一个个依赖模型训练出来的 AI 能力。任何一个小的驾驶体验的提升,背后都是汽车厂商投入大量资源和时间用于模型训练的结果。
在自动驾驶模型研发过程中,汽车厂商一般遵循“模型选型 - 模型训练 - 模型上车”的开发步骤。
在模型选型方面,每年工业界与学术界都会提出大量的模型,不同模型有什么优势,什么样的模型适合自己,厂商在挑选合适的模型上存在挑战。
在模型训练方面,大多数模型更侧重于算法的实现,关注易用性和模型的精度,往往忽略了模型吞吐,没有实现生产环境下的训练加速最优,GPU 利用率也很低。这导致了车厂的研发容易成本居高不下,模型落地周期越长,车辆也无法及时获得最新的 AI 能力。
针对这两大难题,百度智能云联合 NVIDIA,根据双方在自动驾驶行业丰富的实践经验,首批精选了 17 个模型,包括了 2D、3D 摄像头、雷达等多种传感设备,为车辆提供覆盖自适应巡航、碰撞检测、紧急制动、交通信号灯检车、车道偏离识别、环绕视图、盲点探索、后方碰撞警告等能力。
在模型优化方面,百度智能云技术团队联合 NVIDIA,针对常见智驾场景的感知模型,从数据 I/O 开销、模型计算开销、损失函数计算开销、优化器开销、分布式通信开销等角度进行全面深入分析,结合硬件集群和模型结构等因素,在 GPU 卡上联合 NVIDIA 进行了软硬一体优化,让算法与 GPU 配合更加默契,最终模型优化实现了平均 138%,最高 400% 的吞吐量提升。
汽车厂商可以直接使用这些模型加速训练,将获得的最新 AI 能力同步至车辆。现在已经有客户开始将这些优化后的模型投入到业务流程中。
在优化的过程中,百度智能云技术团队不断尝试各种手段来提高模型吞吐量和资源的利用率。比如,在 CenterPoint 的模型优化中吞吐效果经历了从 50%、到 169%,再到 391% 的提升,最终实现了目前 400% 的吞吐提升,训练时间缩短 80%。
在模型优化的过程中,百度智能云联合 NVIDIA 提炼出了一套通用的模型优化方法论,可以帮助团队在短时间内完成新模型的优化工作。
NVIDIA 开发与技术部总经理李曦鹏说:“汽车智能化刚刚开始,如何构建自动驾驶端到端的模型生产和上线迭代的闭环能力,将成为自驾领域客户的核心竞争力之一。NVIDIA 和百度智能云针对自驾常用的 17 个模型做的极致优化,加速自动驾驶汽车的研发和商用。为了满足更多模型的需求,相关训练加速的技术手段也会集成到百度百舸的 AI 加速套件中。”
百度副总裁谢广军表示:“云智一体,深入产业”,模型训练是自动驾驶领域的核心场景。百度智能云联合 NVIDIA 对 17 个感知模型的训练进行了优化,最高可达到 400% 的训练吞吐提升,缩短 80% 的训练时间。双方沉淀的优化方法还将帮助更多行业提升模型训练效率,加速产业智能化升级。”
点击阅读原文,了解百度百舸更多内容
微信扫码关注该文公众号作者