机械臂有了个大模型,1个晚上就能学会削土豆皮!
你好,我是王煜全,这里是王煜全要闻评论。
教机器人学会新技能,一直是个老大难问题,既耗时又费力,这也是制约机器人产业发展的重要因素,但是,生成式AI有可能加速机器人的训练进程。
10月15日,美国科技媒体techcrunch发表了一篇文章,题目是《机器人专家如何看待生成式人工智能》,记者Brian Heater把他采访过的几位机器人专家的观点做了汇总,他们认为生成式AI将在机器人未来发展中发挥重要作用。
比如,丰田研究所的CEO Gill Pratt认为,他们已经研究清楚如何用生成式AI训练机器人了,不用重新写代码,就已经教机械臂学会了60 种不同的技能。
麻省理工学院人工智能实验室主任Daniela Rus认为,生成式AI可以解决机器人的运动规划问题,未来机器人做出的动作将不再那么机械和迟钝,而会更加流畅,更加像人类。
机器人数据平台Formant的CEO Jeff Linnell还做出了进一步预测,未来生成式AI将和机器人形成共生关系,人们不必对机器人进行编程,只需要和机器人聊天,它就会学习完成特定的任务。
但问题是,除了表态和预测,生成式AI在机器人领域的应用有什么实质性的进展吗?
其实,在这几位专家之中,最值得注意的是丰田科学家Gill Pratt所做的工作。
具体来说,丰田研究所与麻省理工学院和哥伦比亚工程公司合作,开发了一种新的机器人训练模型,称为“大型行为模型”Large Behavior Models,简称LBM,这个模型的基本原理与大语言模型LLM相似,都是生成式AI模型,但也有所不同。
大语言模型是基于数十亿人类文字形成的模型,表现出来的是语言生成能力。“大型行为模型”是人工智能先学习人类在现实世界中做出的动作,然后对自己进行编程,再用机械臂以更灵活的方式完成现实任务。
那么,这与以前的机械臂训练有什么不同呢?
以往,机器人工程师需要花费大量时间编写复杂的代码,还要用大量的实验和试错来训练机器人,效率非常低。
前谷歌机器人高级研究员Eric Jang曾说,单单训练机器冲咖啡,就需要训练5000次,准确率也只有50%。
市面上很多机器人在做演示的时候,大部分都是抓取一些形状规则、质地坚硬的物体,比如移动不同颜色的积木等等,这是因为移动坚硬物体不需要考虑抓取力度,训练起来也就相对简单。
但现实生活并非如此,比如人们在洗菜做饭时,需要操作不同软硬程度和不规则的食材,力度和角度也就会有更多变化。
丰田研究所已经用“大型行为模型”教机械臂学会了60种需要灵活应变的技能,比如打鸡蛋液、往面包上抹果酱、削土豆皮等等。
要知道,土豆本身就是不规则物体,削土豆皮还要尽量削得薄一些,这就需要灵活应变能力和精准性。在宣传片中可以看到,丰田机械臂削土豆的效果已经和人手差不多了。
丰田研究院副总裁Russ Tedrake说,当他看到机器人完成如此灵巧的工作时感到非常惊叹,即使在一年前,他也没有预料到机器人可以做到这样的程度。
最关键的是,机器人工程师不需要写任何编程代码,只需要输入文字任务信息,再操作机械臂做一次实际示范,之后大行为模型就开始自主学习了,他们说只需要一个晚上的自主学习,第二天机械臂就学会操作了。
这就像是大人在教小孩写字、弹钢琴一样,先讲解一下原理,再手把手教孩子实操一遍,之后就让孩子自己练习了。
因此,丰田研究所把他们的机器人实验室称为“机器人幼儿园”,里面的机器人工程师就像幼教一样,手把手教机械臂完成各种现实生活中的任务。他们预计,到2024年,机械臂可以学会1000种灵巧又实用的技能。
他们把“大型行为模型”的核心称为“扩散策略”Diffusion Policy,是一种以视觉和运动为基础,生成机器人行为的新方法,还将公开代码、数据和培训细节。
而且,用生成式AI训练机械臂的不只丰田一家,Google DeepMind就训练了一款机器人模型Robotic Transformer 2,让机械臂更好地理解人类的自然语言指令。
那么,这对人们的日常生活和机器人创业公司来说意味着什么呢?
大语言模型让人工智能真正开始进入人们的日常生活,而生成式AI加上机械臂,很可能会催生大量的机器人现实应用。
我们已经看到了大模型经过技术调优之后涌现出来的强大能力。
现在,AI+机械臂已经学会削土豆了,未来随着技术调优,很可能完成炒土豆丝等更加复杂的任务,而且,人们在家就可以自己训练机械臂来完成。
其实,对人类来说,日常生活中的很多复杂任务都是用手来完成的,双腿主要负责走动。
这就意味着,机械臂有着巨大的应用前景,机器人研发和创新的重心,很可能从吸引眼球的人形机器人,转向生成式AI+机械臂。
未来最先走进客厅的机器人,很可能是外表朴实无华,却能帮人下厨做饭,整理家务的灵巧机械臂,现在看来,这将是机器人领域巨大的产业机遇。
更重要的是,未来很多担心自己手艺失传的手艺人,可以培训机器人掌握自己的手艺,甚至可以让自己的手艺到处发扬光大,也就是说,在庙会上看到吹糖人的机器人的那一天也许不远了。
以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!
王煜全要闻评论,我们明天见!
1. 前哨科技特训营直播课程第四季(2023年)共50讲+,除此之外还有5节加餐+公开课。 2. 每讲承诺为1小时视频内容,实际平均时长为2小时。 3. 每周四晚八点准时直播,会员可无限次观看回放。 4. 新入会员,可以无限次回看之前所有视频课程。 5. 成为会员即可使用【AI王煜全】,最新AI大模型开发的专属科技分析助手
6. 每周组织【前哨·创新启发局】,链接科技/产业一线人士,打开技术/应用前沿视野
7. 优先获取全球科技产业一线游学、访问机会,接触科技/产业专家,获取最新、最前沿的趋势洞察,人脉链接
8. 本课程为虚拟内容服务,年费订阅服务制。一经订阅概不退款,线下活动需另行支付差旅成本,请您理解。
微信扫码关注该文公众号作者