世界上第一个能够理解人类口语的机器名为“Harpy”,诞生于1970年。而从科研到“装车”,人类用了31年。2001年,首套量产车载语音交互诞生。直到2014年,汽车才初步实现数字化,能够进行简单的对话操作。对人类而言,语音是最简单、最直接的沟通方式。特别在驾驶场景中,双手都被方向盘占用。因此,语音对话是交互的最优解,也代表着智能座舱的发展风向。然而车载语音助手的发展路径,看似坦途,实则为天堑。在无数大厂投入巨量人力与资金后,大部分语音助手还依然停留在叫不醒、响应慢、总出错、听不懂、不好用的阶段。使用过语音助手的人很多,但是用户活跃度不高,可使用的功能种类也不多。理想与现实的差距间,认知与体验的鸿沟进一步拉大。这也是智能座舱界亟待解答的问题:为什么人机对话的历史已有53年,车载语音交互也发展了22年,人和汽车之间还是难以“沟通”?智能化是汽车工业发展中不可逆的大潮,那么车载语音需要“智能”到何种程度,才能真正成为辅助用户驾驶的好帮手?更前沿的命题是,未来当AI大模型与车载语音助手结合,又会是人车交互体验的一次新的革命吗?
小艺进化史,走完 “0-1”行业和用户,都苦车载语音助手久矣。2021年是公认的智能汽车元年,但除了以“蔚小理”为代表的部分新势力外,智能汽车的语音交互功能几乎是“荒漠”。车载智能的核心功能停留在导航、音乐和电话等基础操作。比起车机,用户显然更依赖智能手机。最“劝退”的体验,在于交流的繁琐。很多用户认为:比起复杂的语音指令,不如直接用手指操作按键或屏幕。这本质上是“被动智能”的锅,因为绝大多数语音助手采用“命令控制”,机器本身不具备语义理解能力,只对固定的“关键词”有反应。核心原因就是语音在用户界面的交互,链路太长,影响因素太多。软件方面,语音助手需要处理多种语音识别、自然语言处理和语音合成等技术,同时需要考虑语音信号的噪声、口音、语调及音量等多个因素。即使终端听出用户的语句,理解用户意图的“文本分析技术”也不够成熟,命令被误判是常有的事。2021年,“挑战者”华为的身影出现在智能座舱领域。当年,华为与赛力斯联合打造的AITO问界品牌即将问世,该产品是华为智选车完成市场化验证的关键一步。而AITO品牌的核心卖点之一,无疑是行业“天花板”HarmonyOS智能座舱。在鸿蒙系统“上车”前,在华为终端内部有过一个共识:如果小艺语音做不好,那鸿蒙座舱再厉害,也无法发挥它最大的价值。年初,车载小艺在华为内部正式立项。小艺的产品负责人向36氪回忆,当时小艺对标了业内“公认”的最佳语音助手,新势力阵营的竞品们很能打,这对刚起步的车载小艺提出了极高的要求——用户希望车内的语音助手能够真正可用、好用,而非只能在发布会PPT上看到花哨的功能。在洞察、挖掘,反复推翻又反复重构后,车载小艺确定了要在一年时间内,做出一款“更快速、更准确、更自然、更流畅”的语音助手,能稳定快速地响应,能精确识别用户意图,能理解自然表达的语言。在下发指令时,用户可以随时打断小艺,即使连续给出数条不同的命令,小艺也能够理解并全部执行,实现人、车之间顺畅的“沟通”。结果不负众望。伴随AITO问界首款车的发布,小艺的表现让人惊喜,这使其在车载语音助手行列迅速占据了一席之地。“随意打断”堪称最惊艳的功能。在一段时间内对小艺连续发出多个指令,小艺都能持续应答并一一完成。对话中,即使改变需求也能随时打断小艺,继续下达新命令。如果用户对小艺的播报不感兴趣,也可以随时插话打断。小艺的“四音区识别”能精准识别来自主驾、副驾、后排等车内各个位置的指令并提供专属服务。同时,小艺具备拟人化的“听觉中枢”,能屏蔽对话过程中的闲聊等无效指令,让人机对话真正变得自然流畅。在AITO App上,有老车主这样评价:“小艺对于后排乘客也非常友好,平常带着老婆孩子出门,她俩在后排既能享受全景天幕,还可以和使用声源定位的小艺对话聊天,后排方便了,我开车不用帮他们切换音乐,开车也更安全。”同时,小艺还拥有业内独有的全界面语音操控能力,只要是显示在车机上的文字、按钮都能通过语音唤醒小艺进行操控,真正释放了用户的双手,不需要点触操控,有效避免驾驶走神和分心。有老车主表示:“我个人由衷喜欢的就是小艺功能,真的好方便啊!就像之前网络上所说的,有了多功能方向盘,就可以双手不离开方向盘,完成对车辆的操作,现在连方向盘都不用了,直接发语音指示就可以了,在开车的同时,提升了便捷性,同时大大也提升了我们用车的安全性。”小艺的其它差异化功能还包括离线使用、多种方言识别、自定义音色,都显著体现出越级的智能化水准。伴随最新AITO问界M5智驾版发布,小艺推出了多模态自适应技术。当用户在描述指令过程中陷入思考,出现卡壳、拖音与语速减慢时,小艺能够理解和识别,给用户更充裕的时间进行表达,不截断、不打扰。在面对语速快的用户,下达指令干净利落,小艺提高了整体响应速度,与用户的交互更流畅、自然。这些功能的出现,也让鸿蒙座舱完成了对人车交互体验的重塑。“快、准、自、畅”的交互体验,让小艺深入众多用户的心,对小艺“爱不释口”。2022年,车载小艺被唤醒超过1.3亿次,86%的座舱操作都由小艺完成。数据之下,车载小艺走完了“0-1”的升级,真正改变了人车交互体验。主动服务,重新定义“真智能”智慧助手
现有的功能,都是人类和机器间“你听我说”的交互。当用户有操作需求,就需要自己发起,并推进每一个节点,导致频繁分心,并且很低效。但数字化时代,用户即使在驾驶过程中,也不能够断掉与外界的联系。被动智能,显然不足以覆盖用户的需求。在华为车载小艺刚问世时,“小艺建议”就作为一个重要功能推出,它能够根据用户习惯和所处场景提供主动的服务。例如,当车辆油、电不足时,小艺会主动提示用户附近有加油站或充电站,给出顺路去加满油或充满电的建议;当进入隧道,小艺会贴心提醒用户打开车辆内循环,避免吸入隧道废气。小艺建议跟业内同类化服务最大的差异在于——基于端侧对用户画像和习惯的智能学习,结合环境感知,从而为用户提供千人千面、个性化的主动服务,同时保证每一项服务都能够在恰当、合适的时机推出,对用户不产生打扰。比如小艺能够智能学习通勤习惯和路线,提前提醒路况异常,让用户决定是否换路而行;还能够学习用户休憩偏好和车内停留的服务画像,在用户驻留车内的合适时机,为用户推荐打开休憩模式,在车内享受放松的时光;小艺建议的智能增程服务,当学习到用户的用车习惯和所设置的车辆模式不匹配时,将向用户推荐使用切换至符合用车习惯、降低用车成本的驾驶模式。在车载智慧助手的价值“升维”之战中,华为走出了差异化竞争力。多年深耕ICT行业,强大的AI基础软硬件平台——昇思AI框架、MindX昇腾应用使能、优选模型库等使华为车载小艺拥有全栈的AI技术积累。行业领先的消费者业务中积淀的To C经验,让华为更懂用户对“真智能”主动服务的需求。在合适的场景,向合适的人,推送合适的服务。这种体验,是让用户从“想得起、用得上,最终做到离不开”的最优路径。能够主动服务用户每一程的小艺,成为用户眼中聪明、能干、贴心的车载智慧助手,更成为HarmonyOS智能座舱的护城河。
生于未来,生活方式的再进化
AI大模型技术的出现,让智能汽车的语音交互有更值得畅想的未来。AI大模型可以通过深度学习等技术,训练出更加准确的语义和意图理解模型,帮助车载系统更好地理解用户的指令和意图。最终让车载语音实现更深层次的个性化和自然拟人的交互,成为车上可替代人类浅层思考的“大脑”。在大模型“世代”,利用其强大的理解力,提供智能化的多模态、多维度的人车交互体验,是汽车品牌领先的关键,也是新的竞争态势下的最大挑战。在大模型的赋能下,车载助手能够提供包括用户自然语义理解、提供创意内容、完成个性交互等一系列功能,覆盖从上车、驾驶、泊车到离车全场景,覆盖出行、娱乐、办公、购物及休憩等等需求。举一个最简单的例子:AI大模型能够了解用户的喜好,能根据语义识别技术,理解用户的环境和情绪状态,并以此推荐相应的音乐、电影、电子书等内容,帮助用户在出行中放松心情,享受充满乐趣的驾驶体验。基于AI大模型对语音及图像的理解能力,座舱内的交互方式能够变得更加多元。语音之外,用户还能够以手势、眼神等方式,创造出更加自然、便捷的交互方式。例如,通过手势控制音乐播放、通过眼神控制导航目的地等。基于历史数据和实时传感器数据,大模型可以训练出预测用户行为的模型,预测用户是否会变道或刹车等,从而提前做出相应的驾驶协助,让出行更加轻松、安全。大型语言模型还可以为电动汽车的智能座舱提供更多科幻式的功能,例如通过虚拟现实技术模拟驾驶场景,让驾驶员在虚拟环境中进行安全驾驶练习。或者通过增强现实技术,为驾驶员提供实景的导航和路线规划信息,让行车过程更具科幻感。4月17日,余承东在华为全场景新品发布会宣布:AITO问界M9将搭载AI大模型,用户可通过小艺智慧助手体验业界最强车载人工智能。同时,在新车问界M9上,小艺预告还将拥有情感可视交互的能力,小艺将在AI智慧水晶体中承载,通过数字光效与用户进行更多维的沟通。随着自然语言处理和情感识别技术的发展,小艺或许能更加准确地识别用户的情感并给出回应。华为的加入,无疑为智能座舱注入更多可能性。在AI大模型技术的加持下,或许未来语音助手都会迭代为数字虚拟“管家”,成为照顾用户生活的全能型助理。华为最终的目标,是让智慧助手影响用户走向一种更智能、更前沿的生活方式。当用户坐进车内,就开启一段充满惊喜、超乎想象的生活方式。不妨想象一下,小艺未来的形态,可能是一个最懂你的“朋友”,可以提供全私人定制化的出行、娱乐建议,在周末和长途旅行能够化身为用户的私人管家,安排好所有行程。在人工智能技术爆发的当下,大模型技术的井喷无疑将成为智能座舱进化的拐点。小艺,以及所有车载智慧助手的未来,绝不只是提供浅尝辄止的对话功能,而是成为用户触达个性化、智能沉浸式驾驶体验的窗口。