从实验室走向规模化应用,是人形机器人当前最紧迫的命题。
文|黄楠
7月初的上海沸热,在WAIC 2024活动会场,人形机器人无疑是今年广受瞩目的赛道。根据官方数据,仅展出的人形机器人就达到25款。虽然外形炫酷,但就现场来看,大部分的机器人展示以静态站立或简单动作互动为主,暂未看到各厂商在应用侧的突破性进展。大模型催化具身智能概念的风靡。人形机器人为大模型提供物理载体,让曾经的虚拟智能走进现实世界;借助大模型,人形机器人的感知、决策与交互能力也得到提升,具备了更强的自主学习性和泛化性。但只停留在Demo阶段的技术愿景,没有应用,人形机器人再具智能化也难以产生实际价值。相比在技术场上竞相秀肌肉,到真实场景中去,探索落地应用更为重要。人形机器人如何从实验室走向规模化应用,成为当前具身智能领域最紧迫的命题。当很多企业还在“拿锤子找钉子”时,近半年来,已经有一批人形机器人公司开始尝试落地:Agility Robotics机器人Digit率先进入亚马逊仓库,替代人工作业,可连续工作7.5小时;Figure AI宣布与宝马签署协议,将在其美国制造工厂部署Figure 01;特斯拉Optimus已进入自家车间,参与电池分拣训练;国内“人形机器人第一股”优必选与多家车企达成合作,其工业版人形机器人Walker S进入多家汽车工厂实训......关于人形机器人,围绕其安全、实时、场景、成本、效率等要素争论不休。但可以肯定的是,场景化落地已经起步,在不确定性中拥抱挑战是必然趋势。
中美人形机器人聚集汽车工厂
诸多场景中,工业制造是人形机器人企业最关注的落地应用之一。其优势在于,对比户外、家庭、商超等复杂场景,工厂环境相对稳定、简单,数据充足,在商业化早期能为企业提供土壤。根据公开报道,硬氪梳理了市面上人形机器人企业在工业场景中的落地情况。可以看到,人形机器人在工业制造领域的落地探索,几乎都发生在汽车制造场景中。从近年来人形机器人的发展境况来看,可以将其落地分为两个阶段。第一阶段的应用是1.0阶段,主要发生在教育科研、展览展示、影视表演等领域,以秀技术为主,人形机器人被用于高校科研项目、产品二次开发以及学校教育课程、开发者比赛等。自去年开始,在大模型的加持下,人形机器人应用迈向2.0阶段,面向工业制造、物流运输等真实场景,开始参与具体岗位的工作。例如美国已有特斯拉、Figure AI、Apptronik三家企业的人形机器人先后走进汽车工厂的产线实训。对比美国,中国研发人形机器人的企业数量更多,优必选、小米、乐聚、智元等公司都表示要将人形机器人应用于工厂,但从落地进度来看,目前仅优必选公布了人形机器人在汽车工厂的实训进展。特斯拉:已有2台Optimus参与车间工作
2022年10月,在人形机器人Optimus首次亮相时,马斯克就提出,未来的Optimus将会到特斯拉工厂内打工,包括搬运、用扳手给汽车安装螺栓等。当前Optimus已更新至第二代,身高1.7米、体重56公斤,最高行走速度达到5英里/小时,搭载了特斯拉自主设计和制造的执行器和传感器驱动。Optimus在特斯拉工厂参与实训(图源:特斯拉官方视频)今年5月,Optimus二代走进特斯拉工厂实训,已经可以进行分拣电池、行走等任务。根据官方介绍,Optimus基于其自身的视觉神经网络和FSD(完全自动驾驶)芯片,能够将电动车电池单元进行分装,精准放到卡槽中。现如今工厂内共两台 Optimus在参与自主工作,马斯克预测,到2025年,或有超过1000台Optimus进入特斯拉车间。Figure AI:完全自主操控
人形机器人初创公司Figure AI于2022年成立,其背后投资人包括OpenAI、英特尔、英伟达、亚马逊、微软、三星、LG等多家头部企业。一年时间内,公司就发布了首款人形机器人Figure 01。这款机器人身高1.68米,重60公斤,最大可负载20公斤重量,最长续航5小时,行走速度为1.2米/秒。今年1月,Figure AI宣布与宝马达成商业合作协议,计划将Figure 01引入宝马的美国制造工厂。根据协议,Figure AI将从部署少量人形机器人开始,逐渐覆盖更多总装车间岗位,整个适配过程将持续12-24个月左右。以Figure AI上周释出的工厂实训视频为例。向Figure 01发出定位指令,要求将汽车挡板放置于对应夹具内,并遮挡住两个需要穿孔的定位销,基于GPT-4o,Figure 01不仅可以理解任务,并转化为具体指令步骤完成任务。当出现抓错汽车零件方向的情况时,Figure 01还可根据夹具角度进行调整,正确地将零件摆放至适当位置。Figure 01在工厂参与搬运(图源:Figure AI)
根据官方介绍,Figure 01采用了“基于AI的视觉模型”,能够实现“完全自主操控”,且适用于所有与抓取相关的神经网络。可以看到,在非结构化环境下,人形机器人能够结合进行自我学习并复制泛化。Apptronik:从运送零件任务开始
Apptronik脱胎于美国得克萨斯大学实验室,自2016年成立后,团队在次年就同NASA联合开发人形机器人。2023年8月,Apptronik正式发布首款人形机器人Apollo,身高约1.76米,体重72.5公斤,最大负载25公斤,可续航为4小时。据Apptronik首席商务官Barry Phillips透露,Apollo采用了独特设计和技术特点。例如可更换电池的设计,只需更换电池即可继续工作,无需长时间充电等待;同时其力控制架构,可在仓库和物流场景中确保安全、高效地完成任务。今年3月,Apptronik宣布与奔驰合作,将在奔驰美国德州奥斯汀工厂引入Apollo,让Apollo参与产线流程工作,比如运送零件到生产线供工人组装、检查组件、以及后期交付成套零件的手提箱等。Apollo参与物流搬运工作(图源:Apptronik)
优必选:Walker S在汽车产线实训
优必选成立于2012年,是国内较早研发人形机器人的企业之一,2023年12月在港交所主板上市,是中国人形机器人第一股。旗下人形机器人产品聚焦工业制造、商用服务和家庭陪伴三大应用场景。其Walker系列是产品中最为大众熟知的,已进驻迪拜世博会中国馆、中国科学技术馆,并出口到沙特NEOM新未来城。2023年,优必选人形机器人Walker X进入工厂训练测试,主要用在SPS智能分拣及设备的老化测试;通过与无人搬运机器人AGV联动,将Walker X嵌入到高重复、低负载的生产中,来提升工厂效率及流程灵活性。同年年底,在优必选港交所上市仪式现场,工业版人形机器人Walker S首次曝光,与创始人周剑一起敲响上市锣,引发关注。Walker S身高1.7米,有41个高性能伺服关节,搭载了多维力觉、多目立体视觉、全向听觉和惯性、测距等感知系统,手部是可替换的末端执行器,方便在工厂不同场景下作业。Walker S在蔚来车间(图源:优必选)
今年2月,在优必选公开的Walker S蔚来合肥基地总装车间的培训视频中,Walker S在汽车工厂流水线上,可以进行门锁质检、车灯盖、板检测、安全带检测、贴车标等工作,覆盖多个生产环节,同时还能与人类员工互相配合,完成汽车装配及质量检查作业。随后,优必选又陆续同东风柳汽、一汽大众青岛公司达成合作。通过组建更多人形机器人产线和工厂,提升人形机器人工具操作与任务执行能力,可进一步加快人形机器人在典型制造场景实现深度应用。优必选创始人周剑透露,2024年Walker S在工厂端进行大量实测,将为未来两年人形机器人在工厂端放量做好准备。如今,2024年已过半,各厂商的人形机器人在工业制造的落地仍处于实训阶段;但多位从业者对此预测较为乐观,认为其最早或可于今年年末初步实现。
让车厂买单,人形机器人需要做到哪几点?
一项颠覆性技术的革新,是一个循序渐进的过程。
从场景属性来看,对比其他领域,工业制造环境相对简单、可控,它通常以效率和精准成本为导向,厂房车间是一个闭合的场景、具有结构化特点,可以为人形机器人应用提供较为稳定的工作环境。另一方面,经过多年发展,工业自动化产业成熟,重型机械臂、协作机器人等设备积累了大量真实场景数据,可直接复用到人形机器人的训练,为其自我学习提供数据支撑,让人形机器人不断迭代、去适配场景需求。工业制造的场景价值不断攀升,几乎所有的人形机器人企业谈及应用落地时都会提到。汽车企业也希望整合最优秀的技术,引入人形机器人参与生产。但论接下来竞争,人形机器人要想在汽车工厂发挥真正的能力,还有诸多问题要解决。优必选研究院执行院长、人形机器人团队的负责人焦继超表示,他今年的主要工作是与汽车厂商沟通人形机器人的应用,目前已调研国内十几家车厂的真实需求。他了解到,在汽车制造场景中,不需要人形机器人展示奔跑、跳跃等单一的运动能力,而更强调其技术的实用性。比如要有智能的大脑、能进行灵巧操作、运行稳定、能量产交付、以及合适的成本。过去,传统机器人的技术路径是围绕单一场景、具备基础算法能力。即通过预先编程的方式,能识别简单环境、完成简单任务。而现实场景中,人形机器人要具备自主决策以应对突发性事件。这对人形机器人的智能化水平,理解、处理多种任务的能力要求极高。其中,算力发展及AI大模型等技术成熟发挥了重要作用。例如特斯拉Optimus所使用的FSD技术,在电动汽车上已有成熟应用。嫁接到Optimus身上后,利用FSD端到端高速大模型推理,将足够多的用户数据清理干净后喂给模型,可以解决人形机器人在线迭代学习问题,从而能够更快地对环境作出反应,进行敏捷决策。OpenAI基于GPT-4o,为Figure 01构建了一个具身智能AI模型,从大脑层面,令其具备对事物及自然语言的感知、识别和理解能力,能对任务指令进行逻辑推理和自主决策。优必选采用的方案是大模型+小模型的架构,由大模型作为“大脑”对多模态信息进行处理,理解场景与任务,给出规划,再由小模型进行具体执行。这种方案不仅能发挥大模型的理解与泛化能力优势,还能发挥小模型能耗低、针对特定任务效果好的特点,适配人形机器人各种任务需求。从硬件侧来看,在核心零部件伺服驱动器方面,人形机器人企业大多投入了较多的研发。比如,针对工业场景,优必选研发了谐波旋转伺服驱动器,其扭矩密度大,体积小,重量轻,回差小,能够支持高精度灵巧操作;让人形机器人在复杂多变的环境中能够稳定行走,同时胳膊也可以承担重载劳动。特斯拉为Optimus研发了线性驱动器,通过集成伺服电机、减速器、丝杠、传感器、一体化运动单元等零部件,做到了精准的速度控制、位置控制和力控制,让Optimus可以完成推拉等动作,赋予了Optimus灵活的操作能力。在上肢方面,当前已在工厂参与实训的人形机器人均在灵巧手操作上有一定的研发进展。以前述四家人形机器人厂商为例:Optimus二代手指具有触觉感应和11个自由度,可处理鸡蛋等易碎物品。此前5月,马斯克在公开平台透露,预计今年晚些时候,Optimus的灵巧手自由度将增加至22个,且将执行器放到前臂,以便模拟人类的工作方式;Figure 01手部具有4个手指和1个可对折的拇指,共6个自由度,可以用于开门和使用工具;Apollo的手部除5指手外,还能使用单自由度的末端执行器或不同的执行器组合完成任务;优必选Walker S采用了自研的灵巧手,能够完成灵活操作,同时也能通过更换不同的执行器完成重负载任务。其为工业场景设计的用于手臂的驱动器能进行高精度位置的控制,使Walker S能从事如分拣、插装、打螺丝等更精细化的工作。长期稳定运行十分考验人形机器人的综合技术实力,这对企业自身的技术积累提出了极高要求。同时,汽车厂商对数据安全的要求和治理等级极高,对于不具备全栈自研技术的人形机器人厂商来说,外购第三方的视觉等技术,会导致数据泄露的风险大大增加。以优必选为例。作为国内较早投身人形机器人的企业,优必选自主完成了人形机器人全栈式技术的积累。面向工业场景的实际需求,不仅算法,优必选还进行了核心零部件的自研,并持续保持技术迭代和工艺优化,解决实时反馈问题,以确保真实场景作业的稳定性。从Walker S在工厂的实训工作来看,它所完成的装配和质检工作背后,是人形机器人将感知、手眼协调、定位导航、步态控制等技术能力,与硬件、场景打磨融合的体现。即便是规模相对较小的Apptronik公司,其发展过程中也有NASA等机构参与的身影,以帮助在双足运动、感知、抓取等基础能力上加快突破,满足奔驰汽车工厂内的多任务需求。对具体场景Know-How掌握程度,也是影响人形机器人表现的一个重要因素。眼下人形机器人的应用落地更多是一个“单点突破”的过程,需要企业对单一场景有充分了解,例如收集到足够的场景数据,才能更准确地了掌握落地行业的实际需求,从而实现更广泛的产品落地应用。在这方面上,特斯拉具有天然优势,其汽车工厂已经成为了Optimus成熟的应用试验场。Optimus能真实的工厂环境中每天接受训练、收集数据,并不断改进迭代表现。这一过程十分贴近人类员工接受工作培训的真实过程。优必选与汽车制造供应链企业天奇股份成立合资公司,为其向汽车制造领域提供了关键切入点,这也让优必选成为业内少有的一家不造车、但参与造车的人形机器人企业,与其合作的车企范围更广、程度更深。目前,优必选已公布3家车企的合作,为人形机器人拿到了真实场景数据。最后,人形机器人的成本控制能力,是其落地过程中不可忽视的一点。回归商业本质,一项新技术需要能够在可见的未来带来收益,才能被应用者买单。供应链国产化有助于帮助人形机器人企业实现成本优化。国产硬件供应商具备很强的低成本、大规模量产能力,其中人形机器人所用到的控制器、传感器、电池系统等,和工业机器人和新能源车等有较大重复性,通过复用部分传统制造业的供应链资源,可有效降低人形机器人的整机成本。焦继超表示,优必选将自家核心零部件伺服驱动器的国产化,从几年前的40%到现在已增加至90-95%。在大功率及小功率的伺服驱动器零部件上,国内已经分别实现了90%及95%的国产化率,让人形机器人的成本大幅降低。目前,优必选大型人形机器人的成本已经降至4-5万美元。目前特斯拉尚未公布Optimus成本,但仍持续在中国挑选供应链。马斯克曾多次表示,未来将把人形机器人的价格控制在2万美元左右。从行业信息来看,考虑到成本控制要求,中国厂商有望凭借成本优势切入其供应链。另一个对国内厂商较为有利的现状是,北京、上海、深圳、杭州等多地政府正在积极推动人形机器人产业链的合作。以北京为例,去年,由优必选、小米、京城机电等牵头成立了北京人形机器人创新中心,致力于行业关键共性核心技术研发,打造软、硬两个通用母平台,推动产业整体发展。目前,在亦庄的北京经济技术开发区内,不仅集聚了优必选、小米机器人等人形机器人整机企业,还有京城机电、清能德创、灵足时代、犀灵视觉等行业关键零部件配套企业,形成了协同产业生态。除此之外,汽车厂商在选择供应商时,还会考虑企业的资质以及项目经验,强调人形机器人企业是否具备提供长期稳定服务的能力。其原因在于,汽车工厂所购买的生产设备使用及维护周期多为3年至10年,因此在合作伙伴的挑选上,企业能否提供长期稳定的售后服务十分关键,但这对当前大部分人形机器人初创公司门槛较高。人形机器人要发挥真正价值,最终必然要从实验室走向现实场景。以汽车制造为代表的工业场景点亮了人形机器人落地的一盏明灯。如今,虽然人形机器人还没正式上岗,但从已在汽车工厂率先起跑应用的企业来看,可以窥见人形机器人商业化应用所必需的素质。处于这个周期的企业需要做的是,在现有场景中练好技术基座和拳头产品,静待商业化临界点,一跃而起。