大语言模型浪潮之下,家电厂商们面临的是更为多元的技术与落地应用挑战。
自2001年起,美国《时代》杂志开始坚持发布每年的「改变我们生活的 100 个最佳发明」 榜单。试图记录与总结科技发展与人类生活的具象载体。在经历过深度学习、云计算等诸多AI技术的激荡后,在2022,AI正式成为榜单中的一个独立单元。因为「世界在快速改变,发明也迅速发展」。事实也的确如此。生成式AI带来的技术潮汐,牵引着社会走向。一种技术与商业交织的共识已经形成:大模型为代表的AI技术,会是下一个时代的技术入口。上半年,众多厂商推出所谓的自研大模型和AI产品,商业领袖与从业者们许久未如此兴奋:千行百业的大模型轮番出现,「百模大战」的互联网盛景再现。然而,让不少人心存疑虑的是,年初至今,升维式的大模型应用并未持续涌现,更多是诸如妙鸭相机这类更为轻巧的切入口。AI时代,是触手可及的未来,还是望山跑死马的幻觉?未来的问题,要回到现实寻找答案。比预想中更快的,是大模型的整体竞争,已经走向应用与落地的新赛段。我们需要找到一个链接现实与数字世界的载体,作为未来降临的「尺度」。具体到大模型落地的场景与产品服务,遍布在个体周围的家用电器,或许正是绝佳观察窗口。一个可以提前确认的答案是:这场大模型之战,参赛选手不止巨头,也不会是只有一两个幸存者的「生存游戏」。
家电+AI,从被动到主动的进化史
智能家居、智能电器……大众对于这些携带智能前缀的名词,并不陌生。在互联网概念兴起的上世纪末,就有人在思考如何将家庭设备与网络连接,实现远程监测、控制和数据采集等功能——那些停留在科幻作品叙述中,充斥着未来感的画面。比当下AI浪潮更为疯狂的互联网热潮里,一切都在为网络世界的想象力服务。正是Dot-com Bubble(互联网泡沫)前夕的1994年,比尔·盖茨的智能化豪宅完工,首次引入智能化设备与系统(其中包含智能照明、智能温控等系统),算是某种标志。而在五年后,微软发布智能家庭宣传片,构筑了一个设想中的智能家庭——远程开门、智能管理、扫描条型码购物等等,与现在的唯一区别是,一切入口是PC。直到这一阶段,AI技术对家电行业的智能发展并未起到决定性作用。伴随无线通信技术与嵌入式系统的发展,尤其是无线传感器网络(WSN)的出现,使大规模设备连接变得更加便捷和实用,智能家居才正式步入新阶段。与ChatGPT爆火卷起AI浪潮类似的是,2016年人工智能机器人AlphaGO战胜韩国职业围棋棋手李世石的社会新闻,成为深度学习概念出圈的背景事件。对应的,是随之而来的一轮AI浪潮。率先被卷到的,正是家电行业。伴生的云计算和大数据技术,为智能家居提供了强大的支持,使得海量设备数据可以被采集、存储和分析,并实现精准的控制和决策。传统IOT设备也完成了向AIOT设备的进阶。最具代表性的,是智能音箱的出现。通过智能音箱、智能网关等硬件设备,或是搭配语音交互,或是搭配手机App,初步实现「智能」体验。从赛道玩家而言,目前国内智能家电市场参与者,主要有美的、海尔等传统家电企业,华为、小米等3C企业,以及阿里、百度等互联网企业和其他创新企业四类玩家构成。在产品形态上,智能家居产品也开始从单品智能向全屋智能迈进。然而,由于不同类型玩家间平台、协议以及控制方式的不同,且互不打通,绝大多数消费者想要在家中配备完整全屋智能方案,除选用同厂商产品外,鲜有更好的办法。从广义的智能家居出发,典型的家电AI路径分歧也同步出现。一方面,是单一家电产品的AI实现。已经提到的智能音箱、真正加载AI模块的扫地机器人、内嵌系统的智能冰箱等等,围绕家电产品功能性,从操控、响应、交互方式等维度的优化升级。另一方面,则是全屋智能。在许多从业者视野中,互联网企业在其中的角色,并不光彩——「它们并不在乎你的家居是否真正智能,它们需要的只是你的家庭电器能够接入到互联网里而已。」时常被吐槽为人工智障的部分智能家电,根本原因在于其并非传统家电的AI版本,更多是单纯作为智能手机等终端的延伸,响应式的被动服务,并无真正的「中枢大脑」能够做出决策。当生成式AI涌现,其余行业或许面临着前路未知的焦虑与恐慌,但在家电行业技术从业者群体,却是「看见风暴激动如大海」。它,会是补全智能家电的最后一块拼图吗?
机器伦理与智能未来
大语言模型的技术路径,是神经网络模型。而神经网络模型在信息学本质上就是一个函数(function)——接受输入、映射输出。有别于编程语言「过程透明、逻辑严密、确定」等特质,大模型的映射充斥着「过程不可知、直觉性、模糊」的差异,甚至于被认为是基于人类直觉系统而建模的语义函数(semantic function)。大模型应用的路径,可以粗浅理解为语义指令—大模型—推演结果。而大模型的强大之处,在于对几乎任意语义信息都可以一定程度合理地处理(姑且先不讨论幻觉问题)。但问题在于,在「语义」层面的呼风唤雨,始终需要一个呈现的出口。无论是ChatBot的对话,还是产出图片、视频,抑或智能家电需求的人机交互。而人机交互的形式,也依旧值得商榷。回到智能家电领域,共识性的发展路径,是从单品智能到场景智能再到全屋智能。曾有报告指出,当前中国全屋智能行业已发展至以用户为中心的主动智能阶段。这一阶段的智能家居基于个人数据分析、行为习惯理解和自主深度学习,以满足用户需求为核心,实现各智能产品的互联,并提供及时、个性化和智能化的全屋智能服务。从被动到主动的跨越,是大模型为家电领域打开的巨大可能性。但如何真正迈出这一步,却未有商业与技术上的绝对定论。一个顺势的行业迷思是,大众需要什么样的智能家居体验?是类似哆啦A梦(育儿机器人)的专项服务伙伴?是全知全能掌控全屋的智慧管家,抑或变形金刚式可切换主动/被动服务的生活助手?「这不仅是技术选型的取舍问题,更是智能安全与机器伦理问题。」美的集团首席AI官兼AI创新中心总经理唐剑对36氪表示。家电与AI之间的协同,需要确保人机交互的稳定、精准、可控;另外,如问答这类语音交互的形式,所输出的内容需要克服机器幻觉。此前不久,美的对外官宣了自己的自研大模型「美言」,参数量在100亿级别,定位在家居垂直领域。公开资料显示,其主要应用场景,是家居领域的知识问答、可以支持上下文多轮对话的语音控制,及集合其余AI技术能够判断是否发起询问的主动服务。「这是我们认为,当下大模型技术与家电最有可能性的三个落地场景」。唐剑为36氪简述了当下美的的技术路径。一方面是上述以小体量的自研垂直大模型,为用户提供家居领域的专业服务;另一方面则是基于各个大厂通用大模型,进行产品的二次开发。如果按照参数级别,简单将语言模型区分为万亿级别的超大模型,和数百亿级别的普通大模型。那么,传统家电厂商,都纷纷落子在了更轻量级的普通大模型(或者说垂直大模型)上,应用场景主要在垂直领域的问答与人机交互维度,和部分主动式服务。部署场景也主要集中在各自全屋智能「大脑」中。对外表达的核心能力都包含关键词:迅速响应、主动服务。选择轻量级的普通大模型,也是出于这些关键词的考量。唐剑代表的美的AI团队,有一个共识是,真正应用到场景,轻量级的垂直大模型更为实用——「包括响应速度快、更专业、更准确、也更可控。」回到更具体的全屋智能领域,大模型显然正在为家电补上最后一块技术拼图。美的集团中国区域全屋智能负责人尚喆博士曾在媒体采访中提到,实现真正的全屋智能需要三个核心技术:作为基础的感知技术,提升人机交互体验和准确性的大模型,以及链接机器对话的联网技术。这也是美的今年发布全屋智能架构(即其官方介绍的1+3+4+N)背后的技术考量。据尚喆介绍,美的全屋智能的技术架构由1个智能中枢、3大超级终端、4大家电系统组成,通过前三者的技术组合,为用户提供N种情景。其中,美言大模型作为智能中枢的能力底座,让「因人而异」与「智能」更为具象。正如前文所述,大模型在多轮语言分析与逻辑推演方面的能力,恰好挠到当下智能家电不够智能的痒处。美的本身追求的「人感」,结合伦理与法律边界的考量,使得大模型为代表的AI技术,能够为用户提供的服务,是基于环境感知、数据采集与用户习惯「推理」出的建议,而非直接实行的动作。「在产品更新换代成为结构化升级主趋势的今天,家电产品的科技创新应该如何呈现给用户成为了一个行业性课题。美的给出了详尽的解析,那就是人感科技,即人对家电产品感受、感知是科技创新的核心尺度」,尚喆对36氪总结道。事实上,这也是家电领域的一个趋势——在技术发展的前提下,家电智能从简单的工具,向更具服务性质的「场景解决方案」前进。大模型与家电的结合,看似一切都是陌生的。但至少在美的内部,有了两个共识:第一,大模型为全屋智能的实现提供了根本上的帮助;第二,是AI适应人的需求,而不是本末倒置。
具身智能,人与机器共生
当然,生成式AI并不是终点。它更像是一个时代的前序,催生着更多技术的涌来,呼唤着通用人工智能(AGI)的正式实现。多次为AI摇旗呐喊的英伟达创始人兼CEO黄仁勋,在此前喊出「Apple时代」之后,又在ITF World 2023 半导体大会上表示,AI下一个浪潮将是「具身智能(Embodied AI)」。业内一个精确的表达是,具身的含义不是身体本身,而是与环境交互以及在环境中做事的整体需求和功能。通俗来讲,现有的AI大模型,喂养的来源本质是人类整理、打过标签的数据,可以称之为非具身智能(Internet AI)。而具身智能则通过自我学习和进化,达到智能体理解世界,驱动本体互动交互并完成任务的目标——或者用大众更能理解的方式比喻,就是科幻电影中可能带来智械危机的智能机器人们。就现实来看,大模型能力解决的一个核心难题,是人机交互的逻辑。在这部分能力逐步泛化的过程中,为具身方法和智能体提供了更多技术路径。但对唐剑这类站在一线的从业者而言,想要达到能用、好用的具身智能,还会面对算法、工程技术、数据、场景和复杂软硬件等的诸多挑战。这一点,谷歌、微软等互联网大厂的AI团队同样也在尝试,试图以大模型为机器人注入灵魂。比如上半年谷歌推出的多模态具身视觉语言模型(VLM)PaLM-E,以及微软尝试用ChatGPT能力实现语言直观控制机械臂、无人机、家庭辅助机器人等。相较而言,家电领域对于具身智能有相对清晰的路径。如扫地机器人等非人形设备,在大众层面初步普及了概念。这是全屋智能之外,延续单品智能向着机器人化蜿蜒而上的另一条行业路径。「两个技术路线不是背道而驰的,而是相辅相成的任督二脉。」作为人与机器共生的拥趸,唐剑无比坚信AI时代的到来。他曾在多次公开场合表态,认为家居家电行业的智能化路径,会经过被动服务、主动服务和机器人化三个阶段——全屋智能需要大模型赋能的「家居大脑」,能够完成物理世界与现实世界交互的机器人形态,则是「大脑」的最佳载体,「这样的未来,甚至可能在10年内就会真正到来。」就现实环境来说,智能家电市场仍在开拓阶段。各类家电、家居系统与平台间充斥着壁垒,存在严重的行业割据现象。而具身智能机器人的真实落地,或许会成为「一统」行业的创新切口,或是智能生活时代真正到来的标志。而这也意味着,家电厂商面临的AI冲击,或许不只是大语言模型的考验,而是更为多元的技术与落地应用挑战。参考文献:
1.机器之心,《大模型的最大bug,回答正确率几乎为零》,2023.9
2.飞哥说AI,《大模型的下半场:多模态、Agent、ToPC/ToSMB商业模式》,2023.9
3.甲子光年,《稚晖君独家撰文:具身智能即将为通用机器人补全最后一块拼图》,2023.8
4.朱嘉明,横琴数链数字金融研究院学术与技术委员会主席,《人工智能大模型——当代历史的标志性事件及其意义》,香港中文大学《二十一世纪评论》2023.6
5.CSDN,《从AI大模型到 AGI 通用人工智能 “世界模型”的演进路径》,2023.6