Redian新闻
>
首个感知决策一体化自动驾驶通用大模型!商汤联合团队获CVPR 2023最佳论文

首个感知决策一体化自动驾驶通用大模型!商汤联合团队获CVPR 2023最佳论文

公众号新闻



  新智元报道  

编辑:编辑部
【新智元导读】CVPR 2023正式公布最佳论文等重磅奖项。来自上海人工智能实验室、武汉大学、商汤科技团队联合发表论文Planning-oriented Autonomous Driving(以路径规划为导向的自动驾驶)实现自动驾驶技术的重要突破,获CVPR最佳论文。

一年一度的CVPR是计算机视觉领域的顶级会议。2023年,CVPR大会的论文投稿总量达9155篇。
其中,商汤科技及联合实验室共有54篇论文被CVPR 2023接收,包含一篇最佳论文、一篇最佳论文候选,以及七篇Highlight论文。
在近万篇论文中,上海人工智能实验室、武汉大学、商汤科技联合团队研究成果Planning-oriented Autonomous Driving(以路径规划为导向的自动驾驶)最终脱颖而出,斩获CVPR 2023最佳论文奖(Best Paper Award)。
这是CVPR历史上第一篇以自动驾驶为主题的最佳论文,该论文首次提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构先河,标志着自动驾驶技术的重要突破,为自动驾驶技术与产业的发展提出了新的方向。

论文题目:Planning-oriented Autonomous Driving
论文地址:https://arxiv.org/abs/2212.10156
论文显示,UniAD首次将检测、跟踪、建图、轨迹预测,占据栅格预测以及规划,整合到一个基于Transformer的端到端网络框架下,是自动驾驶中重要的技术突破。

UniAD将各任务通过token的形式在特征层面,按照感知-预测-决策的流程进行深度融合,使得各项任务彼此支持,实现性能提升。
在nuScenes数据集的所有任务上,UniAD都达到SOTA性能,比所有其它端到端的方法都要优越,尤其是预测和规划效果远超其它模型。
作为业内首个实现感知决策一体化自动驾驶通用大模型,UniAD能更好地协助进行行车规划,实现「多任务」和「高性能」,确保车辆行驶的可靠和安全。
于此,UniAD具有极大的应用落地潜力和价值。

融合五大核心模块,解决自动驾驶「规划」难题


为什么之前的自动驾驶系统做不到呢?

自动驾驶是一项高度复杂的技术,需要多个学科领域的知识和技能,包括传感器技术、机器学习、路径规划等方面。
同时,还需要适应不同的道路规则和交通文化,实现与其它车辆、行人进行良好的交互,以实现高度可靠和安全的自动驾驶系统。
当前大部分自动驾驶系统研究,都聚焦在具体的某个模块,缺少能够实现端到端联合优化的通用网络模型。

现有的自动驾驶系统可大致归为三类:

(a)模块化组成的系统;

(b)多任务模块架构的系统;

(c)端到端自动驾驶系统。
其中传统的端到端算法可分为(c.1)基础的端到端算法,直接从传感器输入预测控制输出,但是优化困难,在充满复杂视觉信息的真实场景中应用面临较大挑战;(c.2)按照任务划分网络的显式设计,但是网络模块之间缺乏有效的特征沟通,需要分阶段的输出结果,任务间缺乏有效交互。
(c.3)本文提出的决策导向的感知决策一体设计方法,用token特征按照感知-预测-决策的流程进行深度融合,使得以决策为目标的各项任务指标一致提升。
最为常见的是模块化组成的系统架构,或者部分模块组成多任务架构,他们都以优化部分性能为核心,比如检测性能(检测准确度)、预测性能(预测准确度)。
而端到端自动驾驶系统,以UniAD自动驾驶通用大模型为代表,是以最终的驾驶性能为目标,从解决实际问题出发,例如提升规划出来的车辆行驶轨迹的安全性。

现在行业中大多数端到端(End-to-end,E2E)的自动驾驶系统,由于没有很好的网络框架来融合全部五大模块,都只能融合部分模块
UniAD首次将检测、跟踪、建图、轨迹预测、占据栅格预测以及规划五大模块,整合到一个基于 Transformer 的端到端网络框架下,各任务间以通用的token形式进行融合,共同优化。
通过将环视的图片以Transformer映射得到BEV的特征,同时进行目标的跟踪,在线的建图,包括目标轨迹的预测,还有障碍物的预测,最终实现驾驶行为。
商汤科技联合创始人、首席科学家王晓刚表示,UniAD是业内首个感知决策一体化的自动驾驶通用大模型,并且整体系统性能取得大幅提升,代表了未来自动驾驶技术的发展趋势。
「这种端到端的优化在多项的关键技术指标上超越了SOTA。比如,多目标跟踪准确率超越SOTA 20%,车道线预测准确率提升30%,预测运动位移误差降低38%,规划误差降低28%。」
基于UniAD打造的自动驾驶系统,相比其它只能融合部分模块的系统,各任务间以通用的token进行融合,可同时完成更多任务、突破更高性能,大大提升各个模块的联调效率,更好地解决自动驾驶中的实际问题,以有效推动商业化落地。
以下案例,展示了UniAD在数据集nuScenes上多个复杂场景下的优势。

UniAD感知到左前方等待的黑色车辆,预测其未来轨迹(即将左转驶入自车的车道)和未来的occupancy,推算继续前行有碰撞风险,并立即减速以进行避让,待黑车驶离后再恢复正常速度直行

得益于 UniAD 的地图分割模块与规划模块的深度交互,规划模块基于道路信息作出判断,向前行驶时依据道路结构适时地转弯

在视野干扰较大且场景复杂的十字路口,UniAD 能通过分割模块生成十字路口的整体道路结构(如右侧 BEV 图中的绿色分割结果所示)和周围车辆的轨迹,由基于注意力机制的planner完成大幅度的左转

在夜晚视野变暗的情况下,由于需要继续直行至下个路口左转,UniAD 能感知到前车停止且左右均有障碍物,所以先静止,待前车行驶并再前行并左转
以下案例,展示了UniAD在国内真实场景的实际演示效果。

在拥堵路段上,UniAD能感知到前方大车的停车和启动状态,做出相应的减速和加速决策,保持足够的安全距离

得益于地图重建任务,UniAD在路口和曲折道路上,也可以做出符合道路曲率的路径规划

以UniAD感知决策一体化为基础,推动自动驾驶多模态大模型发展


近些年,作为拥有行业领先技术的人工智能公司,商汤在自动驾驶技术领域的研究和发展布局一直吸引着人们关注。
例如在今年上海车展上,商汤展示了广汽埃安AION LX Plus、哪吒S等车型搭载商汤绝影智能驾驶方案的落地成果。
王晓刚认为这些都离不开商汤持续建设打造的「大模型+大装置」技术路径,以及在自动驾驶行业长期深耕的积累与实践。
「2021年,我们在强大的感知模型的指导下开发了自动驾驶的BEV(Bird Eye View)感知算法并提出了在业内具有广泛影响力的BEV Transformer,在Waymo挑战赛上,以绝对的优势取得了冠军。现在,我们开发的UniAD第一个集成了感知决策一体化,实现端到端的自动驾驶。未来我们将沿着多模态大模型的道路,去进一步推动自动驾驶的进步。」
UniAD 是一项极具创新性的自动驾驶技术,且因其具有很大的潜力和应用价值,目前在学术界和工业界都引起了广泛兴趣和关注。
而随着通用人工智能(AGI)引领的二次革命的到来,以此为基础,期待在未来,我们能推动实现更高阶的自动驾驶人工智能。
参考资料:
https://arxiv.org/abs/2212.10156




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
CVPR 2023最佳论文候选出炉!武大、港中文、商汤等国内机构多篇入选CVPR 2023 | LED阵列+LCD面板=3072个投影仪:浙大-相芯联合团队实现复杂物体高质量数字化建模大幅优化推理过程,字节高性能Transformer推理库获IPDPS 2023最佳论文奖CVPR 2023|All in UniSim:统一的自动驾驶仿真平台CVPR最佳论文颁给自动驾驶大模型!中国团队第一单位,近10年三大视觉顶会首例CVPR 2023 | 南大王利民团队提出LinK:用线性核实现3D激光雷达感知任务中的large kernelCVPR 2023最佳论文候选出炉,12篇上榜!武大、港中文、商汤等国内机构多篇入选CVPR最佳论文:大模型成就端到端自动驾驶|焦点分析上海AI实验室联合团队获CVPR最佳论文奖 | CVPR 2023今年 CV 热点这么多,不可错过 CVPR 2023 线下论文分享会国内首次!山东大学全新点云法向估计算法荣获SIGGRAPH 2023最佳论文奖ACL 2023最佳论文出炉!CMU西交大等摘桂冠,杰出论文奖华人学者占半壁江山7 Papers | 浙大研究获SIGMOD 2023最佳论文;GPT-4拿下最难数学推理数据集新SOTASIGGRAPH 2023最佳论文公布!山大、港大获奖!北大、腾讯光子获提名一天自动发现四大数据库100+漏洞,浙大研究获SIGMOD 2023最佳论文10年首次登顶!CVPR 2023大奖揭晓:上海AI实验室/武大/商汤破纪录夺魁,西工大斩获最佳学生论文UCSD、MIT等华人团队教机器狗感知3D世界!搭M1芯片,爬楼跨障无所不能|CVPR 2023自动驾驶竞逐城市NOA,轻舟智航这篇ICML2023论文为「感知模块评估」指出了新方向微信视觉团队斩获CVPR 2023视频相似性大赛双赛道冠军!【附PDF】整理了114篇医疗论文,含cvpr2023医疗论文+经典论文+医疗论文综述等在自动驾驶领域,感知和决策哪个前景更好?CVPR 2023最佳论文候选!真实高精3D物体数据集OmniObject3D近十年首次,国内机构上海AI Lab、武大、商汤研究获CVPR 2023最佳论文长篇小说:九针 (39)CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型炸裂!最新CVPR2023、ICML2023、AAAI2023、ACL2023论文+Code大合集!富豪相亲会(小小说)清平乐:东篱一曲欣然规划器的先验唯心主义:从决策规划的视角来评估自动驾驶系统的感知能力《七绝》晓春 2023年4月2日谈谈美元中国团队自动驾驶大模型斩获CVPR最佳论文;Stability AI推出新文生图模型;京东大模型即将发布丨AIGC大事日报大模型中的「罗翔老师」!北大兔展联合团队搞出ChatLaw,发布即登顶热榜,可提供法律咨询什么样的方案,夺得了CVPR自动驾驶挑战赛冠军?CVPR'23 最佳论文候选 | 采样提速256倍!蒸馏扩散模型生成图像质量媲美教师模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。