小马智行CEO彭军:讲再多方法论,也不如一次体验
「最近又坐我们的车了吗?」专访才刚开始,彭军就希望帮我约一台全无人运行的Robotaxi,以便和去年的难点场景表现做一下对比。
因为他认为,「讲再多技术方法论,也比不过实际体验。」
如今的小马智行,包含Robotaxi、Robotruck、POV(乘用车智能驾驶)三条业务线,其中POV的辅助驾驶软件方案「小马识途」因其商业变现能力、极快的发展节奏颇受关注。面对这条竞争愈发激烈的赛道,结合时下热门的城市NOA、去地图化,以及未来无人驾驶等话题,小马智行联合创始人兼CEO彭军均分享了自己的见解。
如何「正视」城市NOA?
根据小马智行的规划,小马识途的高速NOA+记忆泊车方案会在二季度上市,城市NOA+自主泊车方案也会在今年晚些时候推出。
虽说城市NOA已不算什么新鲜概念了,尤其在智能车品牌之间,该功能几乎已成为竞争必需品。但直到目前,用户对各家城市NOA系统的表现评价仍然褒贬不一。整体来看,在使用该功能的过程中,多数时间还需要驾驶者精神高度集中。
对此,彭军认为,城市NOA所面临的挑战,恰恰体现了自动驾驶分级,以及设置ODD(运行设计域)的意义——不同的驾驶能力,要用在不同的场景和道路上。
「不能用L4的标准去看待NOA,因为它们是完全不同的物种。目前的城市NOA主要还是适用于城市主干道等相对规整的道路上,在狭窄混乱的小路上很难落地。」
他认为,车企或方案供应商正面临两种选择:一、以60分水准拓展更多的区域和场景;二、在限定区域内将体验做到无限接近100分。而小马智行选择的正是后者。
「能否明确责任,是目前自动驾驶的市场化短板之一。与其说将100%的场景做到40分,还不如将40%的场景做到100分,也就是在明确的场景中将责任完全转交给机器。」彭军表示,只有让机器能达到像老司机一样的水准,才能体现出真正的辅助价值。
对于小马智行等路径相似的自动驾驶公司来说,「以L4赋能L2」是它们一贯强调的优势。而小马智行方面也曾表示,POV业务可复用70%的L4自动驾驶算法。
但彭军也强调,虽然L2和L4对于安全、舒适,高效的理念都是一样的,可「70%的复用」并不是说有70%一模一样的代码。「全无人驾驶的要求是,能够处理任何极端情况,这与L2还是有较大的不同。」
彭军介绍称,小马智行所运用的「伸缩网络」架构,可在同一套代码、同一个模型下,根据不同的算力做一定的减值,以提高复用性。
伸缩网络要达到的效果就是,「不管是纯视觉方案的高速NOA,还是带有1-3颗激光雷达的城市NOA,用户的驾驶体验都应当是一致的。」而为了保障这种体验感,小马智行的城市NOA系统,初期针对的场景会倾向于主干道等路况较好的区域。
目前,市场对L2的需求处于爆发期,可相关功能至今还没有标准,每家车企都有独特的定制需求。彭军认为,这恰巧提供了机遇。
在彭军看来,L2的实现要比L4容易得多,且目前其实也还处于「从无到有」的过程中,很多用户对其中差异仍不甚清晰。「今天大家还只是『吃饱』就行,但一旦开始要想『吃好』的时候,就能看出每家的差距来了,也就会迎来大洗牌的过程。」彭军说道。
行业面临问题,但不必悲观
尽管POV业务备受关注,但彭军还是一直在强调小马智行的「以终为始」理念——相信用机器完全替代人类驾驶,是唯一的终局。
不过谈到这里,就很难回避一个话题,那就是所谓的「自动驾驶寒冬」。
从年初谷歌及Waymo的裁员,到Argo AI的倒闭,再到近期Cruise召回300辆Robotaxi,接连的事件似乎已形成了一种行业的负面现象。
作为局中人,彭军觉得这主要是由于大家在初期对自动驾驶的期望过高,如今感到了落差,但这并不应被过度解读。
「首先,谷歌裁员的幅度很小,而且是对公司整体政策的执行。如果将其比作一个行业遇冷的标志,未免有点夸大。」彭军认为,虽然大家对无人驾驶的落地进度有所质疑,但更应该看到自动驾驶近两年取得的巨大进步。
「如今我们已经做到全无人Robotaxi了,Waymo和Cruise也已经做到了。另外再看如今的城市NOA,虽然体验还需改进,但在两年前它根本都不存在。」他表示,行业在发展进程中必然会暴露一些问题,但总体来看,行业进步还是显而易见的。
如今,小马智行的Robotaxi数量已达到近300辆。但是要达到这样的量级,也经历了谨慎的考量。尽管迭代速度较快,但在逐步扩大车队之前,也需要进行反复验证。
近期Cruise遭遇的召回风波,召回数量刚好也是300辆。对此,彭军表示,虽说这是新生技术发展的必经过程,但这也说明在实现「大目标」之前,要先做好任务拆解。「在产品还没成熟的时候,不应该快速做到300辆的量级,而是应先做30辆车进行验证。」这种谨慎,也正应对了小马智行「小步快跑」的发展风格。
Robotruck的落地挑战
其实,不管是POV还是Robotruck,说到底都是小马智行Robotaxi的能力延展。此前,由于场景相对单一,Robotruck曾被认为是更容易落地的项目,但彭军直言,Robotruck要想大规模商业落地,挑战也不小。
首先,重卡本身重量高达十余吨,其对安全性的要求实际上要比Robotaxi还要高很多。对此,他给出了几个数字。
「比如说,小车在城市路况下,平均大概3万公里就会有一次事故;而卡车平均行驶至少50万-60万公里才会有一次事故,也就是说卡车虽然面临的场景简单,但它对事故的包容度极低,对安全性的需求也是高一个量级的。」
所以,在简单场景下,为Robotruck做一个Demo很容易,但若要商业化落地,其安全性就要比一般要求高出十倍。另外,再考虑到跨省运营,以及在各省推进政策的难度,彭军认为,相比起大规模、长距离的高速运输,Robotruck可能会先实现部分场景化应用。
不过,小马智行还是选择了「Hard模式」,锁定干线物流,并在去年宣布与三一重卡成立合资公司,开展L4级自动驾驶重卡产品的研发、生产与销售,共同打造高端自动驾驶重卡品牌。
「我们一边依托于量产,一边依托于应用场景,在不断打磨技术。目前进展还是比较顺利的,预计今年之内会SOP。」彭军透露称。
「轻地图」没那么高深
「高精地图无外乎就是一个传感器。」
面对现在自动驾驶玩家们急于要摆脱的高精地图,彭军认为,不用将其理解得过于「高深」。
他表示,高精地图主要是对静态元素进行识别和「预习」,例如车道线、建筑等,这能让自动驾驶车辆通过时更加轻松。
彭军用拟人的方式,将高精地图的相关技术解释得非常通俗:「就像人开车一样,开在你熟悉的路上时,会更安全更轻松;但在陌生的路上,你也是能驾驶的,只是体验感不一样。另外,这时你可能会东张西望,这就意味着对算力和传感器的要求更高了。」
在他看来,高精地图的难点在于鲜度,不依赖高精地图也就是需要实时生成地图。「随着算力越来越大,其实实践起来没那么困难。」
从GPT热潮,看自动驾驶难点
如果说谷歌的裁员令人联想到AI的瓶颈,那ChatGPT则重新打开了AI应有的想象空间。它不仅重塑了人们对AI的现实认知,还将其可能性拓展到了各个领域。试图加入这股大潮的企业,也不在少数。
一些急于「上车」的玩家,第一时间就表达出对技术迭代的急迫感,也难免会有「蹭热点」的嫌疑。彭军认为这种现象可以理解,但急躁没有意义,因为只有通过产品体验,才能评价一家公司的实际竞争力。
「声称使用GPT概念也好,或其他超前概念也好,不能衡量出一款产品的好坏。我觉得没有任何用户会单纯因为多么高级的『方法』而购买产品,最终一定会落在体验上。所以在关注最新技术时,关注点必须是在结果上。」
在彭军看来,如果要做大模型,却不对长尾的低频事件增加权重,能力反而会越来越弱。「这就相当于学生在临考前,只用两天时间把基本题做完了,却没花两个月的时间去做低概率的难题,而后者才是拉开分数差距的关键。」
「实际上,如今自动驾驶的感知、预测,prompt learning等方式都与GPT有异曲同工之处。说到底,车辆也是根据感知到的情况进行不断学习,甚至也会为用户提供『意见』。」
不过,相比于尚停留在软件中的AI系统,能够直接影响物理世界的自动驾驶,无疑是最复杂的系统之一。如果用形而上的方式来看自动驾驶系统,其设计需要覆盖全方位考虑。
「在AI系统中,既有过程导向的系统,也有结果导向的系统:例如AlphaGo之所以下棋不讲套路和定式,是因为其设定是只看重结果,不在乎过程;而ChatGPT则对过程的要求很高,力求每一次都能有很好的对话。」
至于自动驾驶,则要结合两者:既要保证安全,也要提供足够的舒适度和高效路径……这就注定自动驾驶需要多维度的优化,而且会面临更大的难度和挑战。
当专访接近尾声,我们坐上了一辆小马智行的Robotaxi。实际体验全无人的自动驾驶车,比观看测试视频的感觉更加奇妙。
从主动鸣笛提醒,到让行、博弈、避障,控制速度……恍惚间还会令人以为司机就在座位上。不能说全程体验毫无瑕疵,可是相比去年的表现,确实已不可同日而语。
正如彭军所言,在交规框架下,自动驾驶其实还有很大的灵活空间,而这种灵活的处理方式,正能看出技术的区别与高下。
微信扫码关注该文公众号作者