Redian新闻
>
理想汽车发布史上最大更新:多模态大模型首次上车,无人泊车即将推送

理想汽车发布史上最大更新:多模态大模型首次上车,无人泊车即将推送

公众号新闻


今年国庆节前,一位职场人的跳槽冲上了微博热搜榜,热度一度盖过刚发布没多久的 iPhone 15,她便是 iQOO 发布会最大的看点之一,被称为「最美产品经理」的宋紫薇。
「颜值及正义」这句话不只是数码圈的客观规律,同样也适用于汽车圈 —— 宋紫薇的下一站,就是同样自带流量的理想汽车。
手机圈顶流入职理想汽车,在当时引发了不少猜测:理想汽车也要做手机了?
昨晚,理想汽车公布了答案:他们要做的不是手机,而是想取代你的手机
在理想智能软件发布会上,主讲人宋紫薇固然是一大看点,但我们还是先把目光聚焦于发布会内容 ——
理想史上最重磅的系统更新:OTA 5.0。

⬆️ 点击可观看视频 ⬆️

从同学,到老师
在今年 6 月举办的理想家庭科技日上,理想同学第一次从语音助手,变成了一个 AI 虚拟生命,用理想的话来说就是:它从「同学」,变成了一位「老师」
广义上,能够给人提供新知和见解的人,就能够被称作「老师」。拥有丰富的知识和经验,能够启发和帮助他人成长,是理想汽车赋予理想同学的新定位
OTA 5.0 下的理想同学,拥有了多模态感知能力。通过覆盖全车多音区的数字硅麦、3D ToF 摄像头、IR 传感器,以及基于空间多模态感知-3M 技术,理想同学可以充分感知舱内空间的多模态信息。
简单来说就是,理想同学的「耳眼脑」能力,有了大幅度的提升,在多模态感知的帮助下,可以识别「打开这个」、「打开那个」的指令。
说得更具体一点,如今的理想同学,能够通过驾驶员头部向右偏转的角度,判断出驾驶员到底是在给理想同学下达指令,还是在与副驾交谈。
这只是理想同学本次更新的其中一环,理想同学能被称作「老师」,靠的还是首次加入的「Mind GPT」认知大模型。
如果你有关注理想汽车 CEO 李想的微博,或许就会发现,这半年来,他的微博绝大部分都来自「Mind GPT 的 iPhone 客户端」。
背靠 Mind GPT,理想同学如今拥有了类似于 ChatGPT、Midjourney 等生成式 AI 的能力,你可以完全可以询问它你能想到的任何问题,又或者是让它作画,很多时候,它都能给出令人满意的回答。
目前看来,Mind GPT 加持下的理想同学,能够在两个场景发挥出不错的作用,在一定程度下取代你的手机。
1. 周末家庭短途旅行
相信对于许多理想用户来说,周末短途的家庭旅行,是促使他们下单的重要场景,一辆舒适且没有长途里程焦虑的中大型 SUV 去干这样的事儿,确实也很合适。
但实际执行起来,出问题的往往不是车,而是人。好不容易熬过了 5 天的工作日,迎来宝贵的周末,还要我做旅行计划?
如今的理想同学就能帮到你了。好玩的地方,它带你去;好吃的东西,它带你吃,主打的就是一手说走就走。同时,导航与美团的深度融合,也让平日里的聚餐变得更加方便。
2. 解答日常小疑问
理想同学的「老师」身份,在这个场景得以展现。所有生活上遇到的问题,都可以在这里寻求帮助。打个比方,在理想今晚的发布会上,一位理想用户向理想同学提出的问题让我印象深刻:马桶堵了怎么办?
对于后座的小朋友来说,理想同学更是变成了一位名副其实的「理想老师」。理想表示,拥有 Mind GPT 的理想同学,不仅知识渊博,还能实时查询互联网信息,同时支持全车所有座位,甚至还支持粤语、上海话和四川话。
此外,Mind GPT 主打的还有一个图片生成能力,但这个功能的实用性就比较一般了。后排的小朋友可以通过它来进行一定程度上的「创作」,每天使用的次数限制在 30 次。就效果而言,其与目前的其他生成式 AI 并没有太大差异。
整体而言,OTA 5.0 之下的理想同学,确实有了较大的能力提升,但对于没有小朋友的用户来说,也许新加入的浏览器和简洁模式,反而更有吸引力。
浏览器是我更新 OTA 5.0 的唯一动力。
理想 L7 车主程南如此说道。
从开车到停车
比起理想同学的进步,OTA 5.0 带来的智驾能力的提升,似乎更值得说道。毕竟,对于理想汽车这样的大尺寸产品来讲,智驾能力的提升无疑更为实用。
得益于领先的销量,理想汽车拥有了一个超大规模的智能驾驶车队,快速进行着训练里程的积累
以城市 NOA 为例,从今年 3 月开始,理想已经在城市 NOA 和早早鸟测试车辆上,开始运行 NPN 网络,提取和存储 NPN 特征。
通过城市 NPN 覆盖的研发平台,我们可以查看现在 NPN 的覆盖情况。绿色代表已经通过测试验证,是可用状态;红色代表有 NPN 特征但有待验证;灰色代表没有 NPN 特征。
基于此,理想汽车对,算法模型进行了重新架构,从 AD 2.0 全面升级到 AD 3.0。从原先的多个小模型和人工规则为主的模块化算法架构,提升为大模型为主的端到端算法架构。
AD Max 3.0 在感知算法上,采用视觉领域更领先的 BEV 大模型和 Occupancy 占用网络;规划算法逐步切换为时空联合规划算法,能够在毫秒间规划出最优的驾驶轨迹。另一方面,理想汽车更新了 MPC 模型预测控制算法,号称做到了低时延、高准确的转向、加速和制动。
发布会上,宋紫薇也给各位带来了一段自己使用城市 NOA 挑战北京市区晚高峰的视频。

⬆️ 点击可观看视频 ⬆️

理想汽车称,通过 AI 大模型的帮助,理想汽车可以做到接近人类司机的驾驶表现。同时,这也是不依赖高精地图的城市 NOA 产品。
除了「开车」,理想的「停车」能力也有提升。
OTA 5.0 正式为 L 系列车型带来无人泊车功能,在面对窄小车位时,用户可以提前下车,通过手机让车辆自主泊入车位,在内容用户反馈的视频中能够看到,车辆可以在多种场景下完成自主泊入,在一些极限车位,甚至还会主动收回后视镜。

⬆️ 点击可观看视频 ⬆️

此外,OTA 5.0 还带来了「代客泊车」功能,可以帮助用户把车停到地下停车场的指定停车位,支持跨层行驶,宋紫薇在发布会上称:「不仅可跨地下 2 层,地下 10 层系统也能支持。」
OTA,理想的一大「绝活」
每一次的 OTA,都是一次成长,都是一次体验的革新。
理想汽车表示,在过去的 14 个月里,理想汽车一共经历了 20 次 OTA 版本的升级,上线了任务大师、调音大师、哨兵模式、声纹识别、小主人模式等受到用户喜爱软件功能,甚至还推送了理想魔毯空气悬架™2.0,提升了车辆的行驶质感。
而在本次的 OTA 5.0 中,理想汽车主要通过升级电池控制算法和优化增程器介入的时机,提升了车辆的冬季续航能力,提升幅度达到了 15-20%。
理想表示,理想 L 系列车型预计将在 12 月 19 日开启 OTA 5.0 的分批推送,各车型的 Max、Pro、Air 车型都将在本月迎来新版本的「智能空间」。
智驾部分,Max 车型也会在本月迎来升级,但 Pro 和 Air 车型的 AD Pro 3.0 在明年 6 月才会收到推送。
此外,虽然无缘 5.0 更新,但理想还是会在 12 月 26 日为理想 ONE 车型带来 OTA 3.4 更新,包含红绿灯倒计时、副驾屏保、手机版任务大师、能耗分布统计和驻车拍照俯视图 5 个新功能。
是的,理想汽车还没有忘记理想 ONE,帮助理想汽车「站起来」的老用户们,总是不应该被忘记的。
在本次发布会的最后,理想汽车还模仿《星球大战》的开场,列出了所有理想汽车的内测用户,给这些用户提供了一次「上电视」的机会。
最后,用宋紫薇的话来做个总结:「理想汽车 OTA 5.0 的更新,甚至超过了 Windows 95 到 Windows XP 的提升。」
那理想的「Windows 7」,又会在什么时候到来呢?




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
梦里吴语北京内推 | 腾讯光子工作室群招聘多模态大模型方向实习生清华团队攻破GPT-4V、谷歌Bard等模型,商用多模态大模型也脆弱?AI搞定谷歌验证码,最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队北京内推 | 阿里淘天集团招聘大模型/多模态大模型算法实习生多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟震惊!!!谷歌发布最强多模态大模型Gemini媒体基础:打开多模态大模型的新思路曝理想汽车发超大年终奖,多位员工拿了8个月,李想回应;智界被曝独立已是板上钉钉;奔驰宝马在华建合资企业丨汽车早报文末送书 | 及时雨!《多模态大模型:技术原理与实战》首发上市登黄山天都峰北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法无痛缓解多模态大模型幻觉!基于注意力惩罚与回退机制的解码方法「OPERA」无需额外知识或训练!中科大等提出OPERA:缓解多模态大模型幻觉问题的基于注意力惩罚与回退策略的解码方法理想汽车就韩城高速事故发布说明;马斯克称X明年底前将推出金融服务;“快递黑马”终上市,为港股今年市值最大IPO|大公司动态大模型+自动驾驶=?普渡大学等最新《自动驾驶领域多模态大型语言模型》综述听说过年轻的古诗词和书法吗?谷歌发布Gemini,负责人:原生多模态大模型是AI「新品种」,正探索与机器人结合突发!谷歌发布史上最强大模型Gemini,赶超GPT-4|亮马桥小纪严选​苹果计划明年彻底改革iPad产品线/余承东称华为明年将推出颠覆性产品/理想发布史上最大更新GPT-4V只能排第二!华科大等发布多模态大模型新基准:五大任务14个模型全面测评​AAAI 2024 | 首个多模态实体集扩展数据集MESED和多模态模型MultiExpan清华大学与智谱 AI 联合推出 CogAgent:基于多模态大模型的 GUI Agent,具备视觉问答、视觉定位等能力横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%首创pix2emb范式!NUS清华联合发布NExT-Chat:对话/检测/分割全能多模态大模型AI早知道|ChatGPT模型大更新;阿里云发布多模态大模型;百度推多模态模型UNIMO-G将多模态大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7B苹果 iOS 史上最大更新!Siri 要上大模型了低成本扩大输入分辨率!华科大提出Monkey:新的多模态大模型火了半年整天吊打别人的GPT-4,今天碰到个头铁的被吊打, 谷歌发布史上最强大模型Gemini幻觉降低30%!首个多模态大模型幻觉修正工作Woodpecker咏紫玉米6027 血壮山河之随枣会战 第三章 6思谋进博会首秀:发布全球首个工业多模态大模型,现场与松下、江森自控签署全面战略合作
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。