「数据」驱动行业拐点，毫末智行冲刺自动驾驶3.0时代

2023-01-09 10:01

“毫末预计，到2025年中国高阶辅助驾驶搭载率将达到70%。而在汽车新消费领域，中国汽车市场增换购消费比例将达到60%，智能驾驶功能成为必选因素，并迎来商业化的加速发展。”1月5日，第七届HAOMO AI DAY上，毫末智行董事长张凯对自动驾驶宏观趋势进行了全面分析。

首先，站在2023年的时间拐点，智能驾驶的下半场进入加速期，高阶辅助驾驶产品的商业应用将迎来大规模落地。“自动驾驶全面进入3.0时代。”在张凯看来，从全球来看，以数据驱动为标志，特斯拉成为率先进入自动驾驶3.0时代的代表。

而在中国，以毫末智行等渐进式自动驾驶企业为代表，正在通过规模量产和高阶辅助驾驶场景落地实现数据闭环，推动自动驾驶技术快速走向成熟，与美国企业一起全面领跑自动驾驶3.0时代。

数据驱动的背后，则是需要一个强大的超级计算中心，来完成闭环体系的最后一环。

今年，毫末智行智算中心“雪湖·绿洲”（MANA OASIS）正式重磅发布，这是中国自动驾驶行业最大智算中心，每秒浮点运算达到67亿亿次。这意味着，在感知、认知等层面，毫末智行可以继续领跑行业，引领大模型、大算力、大数据发展方向，冲刺进入自动驾驶3.0时代。

这些数据来自，2024年上半年毫末城市NOH落地将达到100城，这是中国第一个可大规模落地的城市导航辅助驾驶，并基于重感知、大模型的技术路线及技术应用、用户闭环的数据建设。

公开数据显示，2022年毫末持续稳居中国量产自动驾驶第一名，三代HPilot产品搭载至魏牌、坦克、欧拉、长城炮等近20款车型，辅助驾驶用户行驶里程突破2500万公里。

此外，搭载毫末HPilot的300台摩卡DHT-PHEV车型也已奔赴欧洲。毫末不但是中国首个自研AEB算法落地海内外的公司，也是中国首个出海欧洲、澳洲的自动驾驶公司。

“毫末城市NOH是中国首个可大规模量产的城市导航辅助驾驶。毫末城市NOH的领先性表现在：重感知技术路线领先，大模型的技术应用领先，用户闭环数据建设领先。”毫末智行CEO顾维灏表示。

目前，毫末历经两年研发，建立了全套面向大规模训练的Data Engine，实现了百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500微秒。

在算力优化方面，毫末部署了Lego高性能算子库、ByteCCL通信优化能力、以及大模型训练框架。软硬一体，把算力优化到极致。

在训练效率方面，基于Sparse MoE，通过跨机共享，轻松完成千亿参数大模型训练，且百万个Clips（毫末视频最小标注单位）训练成本只需百卡周级别，训练成本降低100倍。

而产品高速迭代的背后，是毫末打造的业内独有的产品能力迭代铁三角：即场景化用户体验设计、人工智能技术、技术工程化能力。基于此，MANA已形成了强大的数据智能驱动体系，它包含六大闭环：用户需求闭环、研发效能闭环、产品自完善闭环、数据积累闭环、数据价值闭环、业务工程化闭环。

其中，数据积累闭环部分，毫末通过自研自动化数据采集、自动化数据标注工具，在2022年底数据成本降低98%；数据价值闭环部分，让毫末的全新车型复用开发只需4个月时间即达到量产落地状态，全新车型匹配标定2个月内匹配完成。

事实上，今年全球不少车企也已经在搭建自己的超算中心。在张凯看来，这将成为自动驾驶企业的入门配置。“大模型+大数据”的数据驱动模式，成为自动驾驶技术进化的关键，而驱动大模型和海量数据训练的超算中心是关键。

而支持功能不断迭代升级的，还有硬件。

在张凯看来，全新一代芯片、传感器将进入市场，自动驾驶生态呈现更丰富的多样性。随着我国智能汽车渗透率的快速提升，正带动车端芯片、传感器数量的强劲增长。其中，2023年，国内外新一代的AI芯片，以及性能更好的4D毫米波雷达、补盲激光雷达将大量进入市场。

背后，还有大模型在数据合成、知识提取等方面的能力提升。

过去一年，我们看到国内越来越多的自动驾驶公司，正在将Transformer大模型应用到自动驾驶算法当中。作为最早投入研究和应用的公司，毫末发现随着大模型的引入，使得自动驾驶在数据合成、知识提取等方面的能力有大幅提升，而相应开发成本则在大幅降低，技术迭代速度更是实现量级提升。

最关键的，仍是企业开发效率的提升。

比如，在MANA OASIS的加持下，基于视觉自监督大模型，让毫末在中国首个实现4D Clip的100%自动标注，原先依靠的人工标注成本则降低98%。

此外，毫末将爆火的三维重建NeRF技术应用在自动驾驶场景重建和数据生成中，它通过改变视角、光照、纹理材质的方法，生成高真实感数据，实现以低成本获取normal case，生成各种高成本corner case。

在基础上，3D重建大模型生成的数据，不仅比传统的人工显式建模再渲染纹理的方法效果更好、成本更低，增加NeRF生成的数据后，还可将感知的错误率降低30%以上。

而毫末视频自监督大模型的泛化性效果，可以实现即使是在一些非常困难的场景（严重遮挡的骑行者，远处的小目标，恶劣的天气和光照等）都能准确地完成自动标注。

同时，针对城市多种异形障碍物的稳定检测问题，毫末正在思考和探索更加通用的解决方案。比如，多模态互监督大模型引入了激光雷达作为视觉监督信号，直接使用视频数据来推理场景的通用结构表达，很好地补充已有的语义障碍物检测，有效提升自动驾驶系统在城市复杂工况下的通过率。

而在张凯看来，2023年，中国自动驾驶企业能否冲刺进入3.0时代，城市场景辅助驾驶如何快速实现规模化量产交付，将成为未来一年最为值得期待的关键趋势。

按照毫末智行公布的数据，预计到2024年上半年，毫末将完成HPilot落地中国100个城市的计划，实现点点互达。到2025年，更大规模全场景的NOH将更快落地，全面迈入全无人驾驶时代。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq