奇妙的旅程:人形机器人过去和现在的故事
2022年11月,ChatGPT的出现让人工智能领域再度出圈。大模型可以更准确更深入地理解人们的意图,在知识问答与陪伴娱乐领域出现的ChatGPT和Character.ai的用户量与留存率令人欣喜。尽管多模态大模型还在紧锣密鼓的研发过程中,但接入现有大模型已经给许多行业带来了前所未有的想象空间。
随着RT-2的发布,人形机器人和具身智能领域也成为了创业者和投资者热议的话题。高盛最近的研究表明在未来10年内,美国人形机器人市场大小可达60亿美金,将弥补美国40亿美元的制造业劳动力短缺(2030年)和全球2%的老年护理劳动力市场的短缺(2035年)。Precedence Research更是预测全球人形机器人市场在2032年会达到286亿美金。
人形机器人的概念最早可以追溯到十五世纪达芬奇的笔记中写到的自动化骑士。近十年来,不断有高校研究机构、创业公司和大厂加入到研究人形机器人的行列里,比如特斯拉、Figure、优必选、小米等等。在北美市场,自从1992年Boston Dynamics成立以来,一直是行业领头羊。不时发布一个Atlas的运动demo或者任务demo就能让行业惊叹。2021年马斯克也在Tesla Day上公开了特斯拉的人形机器人Optimus,目标是可以在仓库和工厂里替代人类来做重复性高或者危险的工作。众多北美的大学,比如MIT,UCLA,Stanford和UT Austin等,在人形机器人方向也投入了很多资源。其中比较有名的有斯坦福的OceanOne(执行水下任务的机器人),UCLA的Artemis和UT Austin的DRACO 3。
在国内,北京理工大学黄强教授的团队是最早研究人形机器人的团队之一,从2000年开始便研发“汇童”机器人系列,现在已经研发至第七代。此外,清华、浙大等高校的研究也迅速跟上。国内的人形机器人目前已经实现了室外草地快速行走,单腿测试跳跃0.7m高度,太极拳和刀术表演及对打乒乓球、“摔滚走爬”等多模态运动。小米也在2022年推出了自己的人形机器人CyberOne,同时许多创业公司也在开始了人形机器人研究的征途,比如智元、银河通用、傅立叶智能等。
图1: 人形机器人行业发展大事件
人形机器人的技术模块主要由环境感知模块、运动控制模块和人机交互模块构成,与自动驾驶的模块高度相似。人形机器人通过各种传感器(如电机编码器、力传感器、视觉或深度传感器等)收集的数据对外部环境进行Mapping和定位,然后通过运动控制模块进行指令、动作和数据的传输与执行。
图2:机器人的结构构成(来源:高盛人形机器人报告)
相比工业机器人和协作机械臂有限的关节与自由度,人形机器人平均有40个关节左右,硬件部分主要由电机、传感器与执行器组成。从成本来看(Macquarie Research, 2022), 电机与执行器占大约25%的成本,传感器占用大约35%的成本。
图3: Macquarie Research人形机器人成本分析
软件部分是人形机器人的控制大脑,环境感知模块、运动控制模块和人机交互模块最主要的核心还是软件算法。近年来,强化学习(简称RL)被不断应用到机器人AGI领域,训练机器人的步态、自主导航、物体操控、人机互动、技能习得、自适应行为等各个方面的优化,让机器人能从示范与不断的反馈中学习以及动态响应。正是由于机器人大模型的飞速发展,才使得人形机器人在半开放和开发式的环境中理解人类意图、与人类进行更深入的互动与协作成为可能。
早在GPT3.5还没有出圈之前,Everyday robotics发布的PaLM-SayCan就将大规模语言与机器人动作结合,使得机器人在执行复杂的自然语言命令方面有了非常不错的提升,22年发布的RT-1将Transformer与自然语言和感知数据融合,使机器人以指数方式提高新任务的学习速度。今年7月底,Deepmind发布的RT-2更是一个全新的视觉-语言-动作(VLA)模型,可以从网络和机器人数据中进行学习,并将这些知识转化为机器人控制的通用指令,并同时保留了Web-scale的能力,比RT-1有更好的泛化能力和语义与视觉理解的能力。
能否找到高价值的商业化场景且能实现大规模的应用才是人形机器人找到PMF的重要里程碑。在这之前,都只是人形机器人在寻找PMF过程中的探索、尝试与技术经验的积累。
从Boston Dynamics 13年发布Atlas开始,人形机器人经过了10年的时间,得益于机器人、自动驾驶和AI行业的不断迭代创新,我们欣喜的看到它终于从少量的研究机构走向了商业化的开端。特别是今年,随着国内人形机器人科研政策的支持和大模型在垂直行业的应用不断深化,2023年可以说是国内人形机器人团队创业遍地开花的第一年。
图4:OpenAI的被投公司1X Technology
尽管现在众多巨头和创业公司都在探索人形机器人在不同商业场景的应用,美国的人形机器人团队比如OpenAI投资的1X Technology便在探索电商仓储物流场景,国内人形机器人团队也在尝试探索制造业场景。但在未来3年内,人形机器人最大的市场可能仍然集中在科研和教育领域。全球各大高校和研究机构是人形机器人买单的最大用户群体。
除了国内高校外,海外很多高校现在也很open地希望采购国内便宜好用的人形机器人产品。基于上述使用场景和需求,现在的人形机器人主要还是卖硬件为主,高校和研究机构在其硬件基础上进行算法的研发和优化。
所以在人形机器人找到PMF之前,团队的融资能力和经营现金流的控制能力非常重要,未来能够支撑到商业化PMF的团队才是笑到最后的团队。
人形机器人的制造成本也是其产品能顺利找到商业化PMF中非常重要的一环。我们看到部分国内优秀团队能在6个月内做出可对外展示且成本可控的产品demo,尽管产品demo与能够支撑商业化量产还有很长一段路,但这个产品迭代速度和成本控制能力在全球范围内都是绝无仅有的。
特别是当行业里的众多创业者都比较偏科研背景的时候,能够很好的控制量产产品的质量控制和成本控制、供应链的优化与风控的团队是行业里非常稀缺和珍贵的。如果人形机器人的成本能迅速的从Macquarie Research分析里的4万美金成本降低到马斯克口中的2万美元左右的售价,机器人产业就能够从技术和产品的闭环达到一些高价值场景商业的闭环,对于人形机器人的商业化应用将是极大的促进作用。
无疑,未来的人形机器人将面临各种挑战,其中最主要的是寻找高价值的商业应用场景和降低制造成本。当前,人形机器人在开放和半开放环境中的感知、自由导航和移动等技术方面仍有待突破,而与环境中的物体和人进行广泛的动作和语言交互则是一个新兴课题。尽管如此,我们期待并坚信在未来十年里,更多精彩的人形机器人故事将逐渐展开……
金沙江创投
专注互联网早期投资
本公众号内容未经允许请勿转载,但欢迎转发朋友圈。
微信扫码关注该文公众号作者