Redian新闻
>
自动驾驶生成式大模型 DriveGPT 来了:基于 4000 万公里量产车驾驶数据训练,参数规模 1200 亿

自动驾驶生成式大模型 DriveGPT 来了:基于 4000 万公里量产车驾驶数据训练,参数规模 1200 亿

公众号新闻

作者 | 刘燕

4 月 11 日,InfoQ 获悉,自动驾驶创企毫末智行发布了业内首个自动驾驶生成式大模型 DriveGPT,中文名“雪湖·海若”。

自动驾驶生成式大模型 
DriveGPT 雪湖·海若

自动驾驶生成式大模型 DriveGPT 雪湖·海若,有望成为大模型技术落地自动驾驶新范式。

毫末智行 CEO 顾维灏介绍了雪湖·海若名字的来源:“‘海若’出自《庄子·秋水》,里面有两个神话人物河伯和北海若。河伯请教北海若,何谓大小之分,北海若教导,不因天地而觉大,不因毫末而觉小。毫末雪湖·海若,寓意智慧包容、海纳百川,为行业发展贡献力量。”

毫末 DriveGPT 雪湖·海若通过引入驾驶数据建立 RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化。它的最终目标是实现端到端自动驾驶,现阶段主要用于解决自动驾驶的认知决策问题,后续持续会将毫末多个大模型的能力整合到 DriveGPT。

目前,毫末 DriveGPT 雪湖·海若实现了模型架构与参数规模的升级,参数规模达到 1200 亿,预训练阶段引入 4000 万公里量产车驾驶数据,RLHF 阶段引入 5 万段人工精选的困难场景接管 Clips。

DriveGPT 雪湖·海若的底层模型采用 GPT(Generative Pre-trained Transformer)生成式预训练大模型,与 ChatGPT 使用自然语言进行输入与输出不同,DriveGPT 输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景 Token 化,形成“Drive Language”,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。(DriveGPT 雪湖·海若)DriveGPT 雪湖·海若的实现过程是,首先在预训练阶段通过引入量产驾驶数据,训练初始模型,再通过引入驾驶接管 Clips 数据完成反馈模型(Reward Model)的训练,然后再通过强化学习的方式,使用反馈模型去不断优化迭代初始模型,形成对自动驾驶认知决策模型的持续优化。同时,DriveGPT 雪湖·海若还会根据输入端的提示语以及毫末 CSS 自动驾驶场景库的决策样本去训练模型,让模型学习推理关系,从而将完整驾驶策略拆分为自动驾驶场景的动态识别过程,完成可理解、可解释的推理逻辑链生成。

在应用方面,DriveGPT 雪湖·海若的首发车型是新摩卡 DHT-PHEV,即将量产上市。顾维灏提到,DriveGPT 雪湖·海若可以逐步应用到城市 NOH、捷径推荐、智能陪练以及脱困场景中。有了 DriveGPT 雪湖·海若的加持,车辆行驶会更安全;动作更人性、更丝滑,并有合理的逻辑告诉驾驶者,车辆为何选择这样的决策动作。对于普通用户来说,车辆越来越像老司机,用户对智能产品的信任感会更强,理解到车辆的行为都是可预期、可理解的。

目前,毫末 DriveGPT 雪湖·海若已正式对外开放,开启对限量首批客户的合作,北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等已经加入。毫末 DriveGPT 的对外开放及服务,将促进自动驾驶的从业者和研究机构快速构建基础能力。

毫末 DriveGPT 雪湖·海若将率先探索四大应用能力,包括智能驾驶、驾驶场景识别、驾驶行为验证、困难场景脱困。当前,毫末在使用数据过程中,逐步建立起一套基于 4D Clips 驾驶场景识别方案,具备极高性价比。在行业上,给出正确的标注结果,一张图片需要约 5 元;如果使用 DriveGPT 雪湖·海若的场景识别服务,一张图片的价格将下降到 0.5 元。单帧图片整体标注成本仅相当于行业的 1/10。接下来,毫末会将图像帧及 4D Clips 场景识别服务逐步向行业开放使用,这将大幅降低行业使用数据的成本,提高数据质量,从而加速自动驾驶技术的快速发展。

大模型研发离不开庞大的算力支撑。

顾维灏介绍,毫末在 2023 年 1 月发布的中国自动驾驶行业最大的智算中心 MANA OASIS(雪湖· 绿洲)此次从算力优化等层面升级了三大能力,进一步支持 DriveGPT 雪湖·海若的算力。首先,毫末与火山引擎全新搭建了“全套大模型训练保障框架”,实现了异常任务分钟级捕获和恢复能力,可以保证千卡任务连续训练数个月没有任何非正常中断, 有效保证了大模型训练稳定性;其次,毫末研发出以真实数据回传为核心的增量学习技术,并将其推广到了大模型训练,构建了一个大模型持续学习系统,自主研发任务级弹性伸缩调度器,分钟级调度资源,集群计算资源利用率达到 95%;最后,MANA OASIS 通过提升数据吞吐量来降本增效,满足 Transformer 大模型训练效率,通过引入火山引擎提供的 Lego 算子库实现算子融合,端到端吞吐提升 84%。

毫末打造的自动驾驶数据智能体系 MANA,在经过一年多的应用迭代后,也迎来了全面的升级,正式开放赋能。顾维灏介绍,MANA 计算基础服务针对大模型训练在参数规模、稳定性和效率方面做了专项优化,并集成到 OASIS 中;其次,MANA 感知和认知相关大模型能力统一整合到 DriveGPT 雪湖·海若中;第三,增加了使用 NeRF 技术的数据合成服务,降低 Corner Case 数据的获取成本;同时针对多种芯片和多种车型的快速交付难题优化了异构部署工具和车型适配工具。


你也「在看」吗? 👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
2000元训练比肩ChatGPT的开源大模型!GPT-4亲自盖章认证,模型权重均可下载AI 智能编程工具 aiXcoder 推出企业版,采用百亿级规模参数大模型进行个性化训练,支持私有化部署CVPR 2023 | 三维场景生成:无需任何神经网络训练,从单个样例生成多样结果参数是ChaGPT的近6倍!英特尔公布AI大模型Aurora genAI,具备1万亿参数我的厉害国, 下了狠手?Bard是拿ChatGPT数据训练的?谷歌顶级科学家抗议无果,出走OpenAI特斯拉路线,奔向自动驾驶大规模量产的「唯一解」MIGA项目原作解读:基于生成式预训练语言模型T5的Text-to-SQL模型拒绝“白嫖”!Stack Overflow 将矛头直指 ChatGPT 等产品:用了我的数据训练,得先给钱!刚刚!商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此交钱!StackOverflow:类ChatGPT们用我数据训练得付费“生成式大语言模型技术分享”系列直播即将启幕谷歌顶级AI专家加入OpenAI 曾警告谷歌不要用ChatGPT数据训练Bard胡鑫宇死因真相大反转,八条信息揭露了他的真实死因?法国、西班牙对 ChatGPT 展开调查;知乎发布知海图 AI 中文大模型;FF91 首款量产车下线 | 极客早知道聆思科技徐燕松:生成式大模型潮流下,智能家居端侧智能化涌现变革叫板ChatGPT?Stability AI 开源语言大模型 StableLM,参数仅为GPT-3百分之四,却能实现超高性能座舱交互/自动驾驶开发/智能驾驶辅助训练...AIGC和大模型席卷智能网联汽车未来十年,我们需要什么样的自动驾驶芯片? |中国自动驾驶十人专访AI大牛周明发布MChat:生成可控,参数规模可负担,顺便官宣了新融资强化学习再登Nature封面,自动驾驶安全验证新范式大幅减少测试里程谷歌Bard是拿ChatGPT数据训练的?BERT一作抗议无果,跳槽OpenAI...CVPR 2023 | 可扩展的视频基础模型预训练范式:训练出首个十亿参数量视频自监督大模型第四范式开源强化学习研究通用框架,支持单智能体、多智能体训练,还可训练自然语言任务!训练速度提升17%OpenAI:已不再使用客户数据训练模型可复现、自动化、低成本、高评估水平,首个自动化评估大模型的大模型PandaLM来了参数是 ChatGPT 的近 6 倍!英特尔公布 AI 大模型 Aurora genAI,具备 1 万亿参数2对夫妻自驾游,晚上妻子故意装睡,看到丈夫惊人的举动提出离婚DriveGPT自动驾驶大模型中国玩家首发!1200亿参数,毫末智行出品商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此一万亿参数,512个昇腾910训练,华为PanGu-Σ大模型来了SpikeGPT项目原作解读:使用脉冲神经网络的生成式语言模型OpenAI CEO 亲自辟谣「GPT-5传闻」:目前没有训练,短期内也不会训练炸掉北溪民用设施习不想做点啥重访西班牙(12)-黄金之城的欢歌
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。