城市NoA,自动驾驶的「ChatGPT时刻」 |PowerOn未见
聚光灯持续扫射着智能电动车产业,难免留有“盲区”,它可能很快就到来,但未被发觉,可能长久未变,但依然主导规则,我们称之为“未来之见”“未知之见”,这就是我们“PowerOn未见”栏目的由来,致力于呈现汽车产业的关键“盲区”。
采访|李安琪 李勤
文|李安琪
编辑丨李勤、杨轩
来源|启动PowerOn(ID:EV36kr)
封面来源|IC photo、四维图新
ChatGPT的问世,在科技行业掀起风暴,也在汽车行业搅动了暗流。
春节期间,理想汽车高管们没有心思完全放松,CEO李想紧急组织了战略会,讨论ChatGPT风靡之下,公司的智能化走向。最终,管理层得出结论,“AI技术路径逐渐清晰”。
过往,理想以严苛的成本控制著称,对前沿技术的投入稍显谨慎。但ChatGPT的上线成为理想战略变化的分水岭。春节后一开工,李想就发出全员信,“公司在2030年成为全球人工智能行业的领导者”。
智能驾驶是理想人工智能公司愿景的核心抓手。基于和ChatGPT同源的Transformer大模型,理想汽车计划在今年底,落地不依赖高精地图的城市领航辅助驾驶(简称“城市NoA”)功能。据36氪了解,理想智驾业务的高管为交付进度签下了“投名状”,研发团队也已进入高强度的半封闭作业模式。
扛着智能“大旗”的小鹏汽车,也隔空叫阵,号称今年三季度推出“全自动驾驶XNGP”。据36氪了解,为提速智能化研发,小鹏汽车甚至在百度发布类ChatGPT产品“文心一言”后,破天荒同意和百度云推进合作。这相当不易,小鹏汽车通常被认为站在“阿里阵营”。
蔚来官方虽然未公开发声,但有工程师向36氪直言,城市NoA的落地节奏“肯定不会比同行慢”,2021年,蔚来就在搭建BEV+Transformer的技术架构。
特斯拉和国内新造车公司的技术军备赛,也加剧老牌车企向智能化绞入资源。一位智能驾驶技术配套商向36氪描述了行业心态,“头部造车公司都在推,其他车企没有,就显得落后。”
为此,比亚迪董事长王传福不惜炮轰“自动驾驶是忽悠,是皇帝新装”。但36氪独家获悉,这家2022年的新能源车销量之王已经和大疆车载等公司合作,快速推进城市NoA产品落地。
NoA的全称是Navigate on Autopilot,从命名不难看出,这套功能的发起者是特斯拉,最早在高速上应用:以导航地图为牵引,车辆可以在高速路况中,完成自动变换车道、超车、启停、进出匝道等操作。
如果将这套高速NoA能力迁移到城市道路呢?从停车场的自动泊车到高速NoA,再到城市NoA,全场景自动驾驶的雏形已然可见。
不管是光环加身的特斯拉,还是销量大户比亚迪,无不需要从汽车制造的每一个环节抠出每一分钱,以赚取利润。自动驾驶显然是更为梦幻的商业图景。有“抠厂”之称的理想汽车也在春节沟通会上罕见放言,“All in自动驾驶”。
行业的一个共识是:城市NoA是辅助驾驶的天花板,也是自动驾驶的门槛。换句话说,只有解决场景最为复杂的城市NoA难题,自动驾驶才有可能真正到来。
高精地图:是依赖,也是枷锁
“下半年,我们能在数十个无图城市释放XNGP。”小鹏汽车自动驾驶副总裁吴新宙说。这在一年前还是难以想象的。
XNGP是小鹏汽车的新一代辅助驾驶系统,其中的核心功能就是城市NoA(小鹏的命名是城市NGP)。因为高精地图的牵绊,2022年9月至今,小鹏仅在上海、深圳、广州三个城市开放。而在摆脱高精地图依赖后,这家公司推出城市NoA的速度一下子提升近10倍。
高精地图被喻为自动驾驶的“拐杖”,定位精度可达到厘米级,是对物理世界的精准映射,能告诉自动驾驶车辆周边交通环境如何、具体在哪条车道、前方哪里减速、何时提前变道,还能提供红绿灯、限速指示牌等信息,帮助车辆完成行进规划。
为一劳永逸获得高精地图,小鹏汽车曾于2021年斥资2.5亿元收购一家高精度地图公司,以获取地图制作资质。据36氪了解,长城汽车、蔚来汽车、小米汽车等,无不寻求过资质收购的路径。
但高精度地图本身的缺点相当明显:高昂的成本投入、漫长的更新周期,以及对政策强依赖。
小鹏汽车素来主打“智能”标签为抢跑城市NoA,小鹏汽车率先用上了高精度地图、激光雷达等技术,他们有过切肤之痛。
有小鹏人士告诉36氪,从2021年开始,公司就扑了上百号人在广州开发城市NGP,“光是一条几十公里的城市道路,就调了近两年。这不是一个简单可复制的模式。”
高精地图的制作和装车成本成为车企难以承受之重。
“高精度地图的采集制作成本大概在3000元/公里,按每城一万公里城市道路来计算,建图成本在3000万左右。”高精度地图的昂贵主要源于动辄上百万的专业采集车,不过,多位地图业内人士透露,现在为了抢夺市场,图商报价不再像以前那么高。
但除了建图,地图上车还会有一笔装车费用,“按单车地图使用成本来看,5年周期,高速路的高精度地图会收600元~800元/辆,城市道路大概是1200元-1500元/辆。”相当于一台车均摊的地图成本费用超过2000元。
真正掐断车企对高精度地图念想的,还是高精度地图对政策的强依赖。
小鹏汽车员工告诉36氪,小鹏原本想法是通过收购图商来自建地图,但不够幸运的是,收购江苏智图不到一年,随着国家对甲级测绘资质的收紧,江苏智图没能通过评审。小鹏汽车只好与高德地图合作。
解决了资质问题,还要面临地图更新问题。一位地图测绘方面人士告诉36氪,高精度地图的每一次更新都需要送审,从数据采集完成、制作完毕、到监管部门审核完毕需要一定时间,“国家级别的审核是20个工作日,地方审核可能快一两个星期,整个审核流程下来,起码都得一个月。”
上述小鹏人士就因此碰过壁,“城市NGP前期基于高精度地图做了很多开发,想在2022年上半年推出,但图商总拿不到地图的审批文件,非常折腾。前前后后搞了好多轮,最后推迟了半年才发布。”
这在车企抢攻城市NoA的背景下,更加难以接受。城区道路几乎实时变化,理想状态下,“车企希望高精度地图每天更新,甚至是小时级、分钟级更新。”
一场“去高精度地图”运动终于在2023年初上演。
3月24日,华为终端BG CEO余承东在春季发布会上率先开了炮,“高精地图更新太慢了,且一个城市一个城市获取的速度也太慢。我们连上海市的一条小路都要折腾很久。”
小鹏汽车也宣布,今年下半年在全国大部分城市开放智能驾驶功能XNGP,摆脱高精地图的限制。毫末智行、小马智行、元戎启行、轻舟智航、大疆车载等智能驾驶供应商们纷纷喊出“轻地图”宣言。
36氪从行业了解,高精度地图一般分为静态图层和动态图层,当前的高精地图主要围绕静态图层展开,一般包含道路级(Road)、车道级(Lane)、道路部件(Object)三类信息。动态图层则建立于静态图层之上,包括变化的交通标志(如红绿灯状态、潮汐车道等)、道路交通情况,这也是高精度地图更新的难点。
去高精地图也会分层级进行:首先不再依赖高精地图获取动态图层;其次,对于车道级信息中的半径、曲率等几何信息也不再依赖,而主要采用其中的路线节点等拓扑信息;此外,不再完全依赖高精地图中的限速标识、路面箭头等道路部件信息,更多采用实时感知的结果。
和今天风靡全球的ChatGPT出自OpenAI公司一样,智能驾驶“去高精地图”的底气,也和OpenAI不无关系。
Andrej Karpathy是Open AI的首席科学家兼创始成员,他还曾经有过另一重身份:特斯拉AI高级总监、自动驾驶负责人。在斯坦福师从李飞飞期间,Andrej Karpathy主攻的正是自然语言处理与计算机视觉的交叉领域。
2017年,Andrej Karpathy从Open AI加入特斯拉,度过了5年职业生涯(今年2月重回Open AI)。Andrej Karpathy曾在各种行业会议等场合,描绘出了特斯拉的智能驾驶要素:大模型、大数据、大计算中心。
2021年特斯拉的AI Day上,Andrej Karpathy宣告特斯拉基于Transformer将摄像头2D图像拼接转化成3D图景,最后生成汽车周围道路环境的鸟瞰图 “Bird's Eye View”,简称“BEV”。由此引发大模型技术在智能驾驶行业的广泛落地。
Transformer 是众多算法大模型中的一种,最初用于处理NLP自然语言处理,现在也被广泛应用于图像识别领域。ChatGPT中的"T"正是指Transformer大模型。
“就像人用眼睛看世界一样,基于Transformer的BEV能将2D图像转换成3D立体空间。”
国内公司今天的去高精地图方案,无不基于特斯拉这套Transformer+BEV的技术框架。
有小鹏汽车人士告诉36氪,也是2021年看到特斯拉引入Transformer的BEV效果之后,内部才真正决定去掉高精度地图,并搭建了XNet感知系统。理想汽车CEO李想在沟通会上直言,从特斯拉把模型跑通以后,内部才开始正式All-in当前的技术路线。
当然,挑战不容忽视。此前的技术方案有高精度地图兜底,各家产品差异并不明显,而去掉高精地图这条拐杖,就直接考验各家的算法和工程能力。
首先,车辆感知系统的负担会急剧上升,需要检测城市道路上模糊的车道线、形态各异的红绿灯和异形障碍物等。
一位智能驾驶算法工程师向36氪举了个例子,轻地图后,需要车辆的感知模块实时判断哪个红绿灯,控制的是哪条对应车道,“人有时候都会弄错,更何况是车辆。”
同时,基于Transformer大模型的BEV技术,还要解决海量的数据问题。上述算法工程师告诉36氪,城市NoA系统基本上都用了多个800万像素摄像头,要把这么多摄像头的数据实时拼接、融合成3D空间数据,非常考验汽车芯片计算能力和算法优化能力,“硬件算力够不够?带宽够不够?数据能不能实时同步?如果工程能力不够,照样做不出来。”
有小鹏内部人士透露,目前看,公司基于“重感知、轻地图”的系统,已经基本达到类似高精度地图的方案效果。这也让小鹏汽车敢于豪赌一把:下半年将在数十个城市上线XNGP功能。而有智能驾驶业务员工透露,目前的计划是“全量推送”。
要知道,特斯拉可用于城区的FSD系统在2020 年 10 月向部分员工和早期种子用户推送,此后一直迭代到2022年底,才在北美地区全量推送。
而据36氪了解,蔚来和理想汽车等公司相对保守,即便年底推出城市NoA功能,也不会大面积铺开,而是像特斯拉一样,先优选一批专业用户,逐步释放。
去高精地图方案,不光考验感知技术,规划和控制也面临一环扣一环的挑战。
小马智行相关技术负责人表示,去高精地图,只在线感知,意味着对于车道线、可通行区域等的获取结果变差了,“比如车道线的精度没有那么高了、识别的距离变短了,下游的决策和控制环节就要有为感知不准确兜底的能力,对决策控制的要求更高。”
有蔚来工程师也向36氪介绍,原来方案中,车辆的规划、控制系统可以用高精地图给出的可行驶区域找到最优行车路径,规控环节几乎可以“无脑”相信地图输出的静态道路结果。
而去掉高精地图后,车辆需要在感知和规控环节之间,新建一份局部实时地图,告诉车辆可行驶的边界到底在哪里,“这意味着研发流程和团队架构也需要变化。”
行业的竞速还远远不止于此。除了城市NoA系统层面的技术重构,数据获取和加工的生产力重构,也将加剧行业格局的分化。
技术公司与自研车企,抢数据“雪球”
头部造车公司最早跟进这场变革。
小鹏汽车工程师向36氪表示,从2021年下半年起,小鹏开始搭建基于Transformer的BEV视觉感知系统XNet。“技术框架的搭建大概用了12个月,然后再用6个月时间将系统迭代成熟,以及提升一些工程化的性能指标。”
为处理XNet的海量数据标注,小鹏开发了全自动标注系统,曾经2000人一年的标注量,现在16.7天可以完成。此外,小鹏汽车还与阿里云合建自动驾驶智算中心“扶摇”。
一位小鹏汽车员工表示,最初小鹏为智算中心规划了20亿元启动资金,最后考虑到建设成本以及回报周期,选择跟阿里云合建。“即便合资方式,成本也需要10多亿。”
上述员工告诉36氪,目前小鹏汽车内部有两个感知团队:一个团队仍然采用高精度地图方案,将城市NGP功能推送给G9、P7、P5车型用户,以“影子模式”的方式来收集行驶数据;而在测试端,团队在采用Transformer大模型+导航地图方案来开发城市NoA功能。
基于大模型、计算中心、大数据三件套,小鹏汽车的智能驾驶数据驱动模式得以建立,“通过已售车型的‘影子模式’收集数据,在自动标注体系和‘扶摇’智算中心的加持下,系统可以快速修正。”
理想汽车也从今年以来,加速了城市NoA开发节奏。该公司智能驾驶产品总监赵哲伦说,确定路线之后,“理想智能驾驶大部分研发工程师都在参与这件事,新系统对于数据驱动、数据闭环的要求非常高。”
CEO李想此前也在春季发布会上介绍,智能汽车正在从软件1.0时代进入2.0时代。未来车企在智能驾驶方面主要比拼三个方面:
一、降低车端的计算平台和传感器成本,尽可能做到每辆车标配智驾系统;二、比谁在“端到端”闭环数据更多;三、在训练芯片被限的情况下,完成整个大模型的训练。未来自研车端算力、云端训练芯片,是人工智能企业必须要面对和投入的部分。
投入似乎取得一定成果。李想在电动百人会的演讲中表示,自动驾驶一年要做大概1000万帧图像人工标定,成为 6元-8 元/张,一年下来成本接近亿元,但使用软件 2.0 大模型,通过训练方式进行自动化标定后,“效果非常可怕,过去一年做的事情基本上三个小时就能完成,效率是人的1000倍。”
在上述企业看来,依靠海量数据驱动,云端算力、大模型建立起来的数据闭环是城市NoA系统中最难被追赶的部分。
但在商业世界,从来不是搭建一条技术链路和一支团队,就可以高枕无忧。至少,第三方智能驾驶技术供应商不会应允。
近日,大疆车载就公布了其纯视觉城市领航辅助驾驶方案。基于双目视觉技术,大疆车载表示,可以在城市固定道路率先实现点到点自主行驶。而凭借软硬件一体化能力,大疆车载将城市NoA的价格“卷”到了低点:方案成本在5000元-15000元之间。
此外,轻舟智行也宣布,可以基于单颗地平线征程5芯片推出城市NoA,以及36氪获悉,Momenta也将基于英伟达方案,推出万元级城市NoA套件。
“就是要逼车企放弃自研这条道路。”一位智能驾驶技术公司高管对36氪果断表示,“起码以后车企自研30万(元)以下的车型都不划算。”
除了从性价比上撕开口子,技术供应商们也没有轻易被数据闭环拦在门外。
虽然车辆数据都属于车企,智能驾驶技术公司获取存在难度,但技术供应商们都会建立一套工具链,部署在车企机房,和车企共享数据。
“哪怕这个数据最终不一定真的给我们,但也可以做产品迭代,既然合作,双方都是有一些诉求的。”一些技术方案公司负责人告诉36氪。
纯视觉与高精度地图之争、底层技术与生产力层面的重构、车企自研与技术供应商的赛点争抢,都在加速催化着城市NoA的质变。
日前,芯片公司地平线创始人余凯分享道,ChatGPT给业内很大启发,它通过更大的数据、更大的模型,利用文本历史,去预测下一个词的概率。
“同样的事情,也可以发生在自动驾驶上,通过结合当前的交通环境、导航地图、驾驶员整个历史驾驶行为,来预测下一个驾驶动作。从大量的、无监督的、不需要标注的行为里面去机器学习,构建一个自回归的驾驶大语言模型。”
这是个令人激动的想象,也并非不无可能。在大模型、大算力、海量数据的催化下,自动驾驶行业正在进入“ChatGPT时刻”。
过往的行业现实的确残酷,36氪曾获得比亚迪的市场调研数据,智能驾驶在购车决策中排到第11名之末。
但同样也有让人振奋的消息,理想汽车人士向36氪透露,其高速NoA功能在高速路里程的使用占比已经超过50%,而他们的目标是,城市道路也要做到同样水平。
就连站出来炮轰“自动驾驶为忽悠”的比亚迪,也开出了近百万元年薪从鉴智机器人招募人才,而与供应商的合作方案中,也有意部署自身的影子算法。
自动驾驶是一场不知道何时会胜利的战争,但所有玩家都知道,新一轮的号角已经吹响。
(36氪作者苏建勋对本文亦有贡献)
36氪旗下官方公众号
来个“分享、点赞、在看”👇
微信扫码关注该文公众号作者