Redian新闻
>
机器人也不怕被忽悠瘸了(doge)

机器人也不怕被忽悠瘸了(doge)

公众号新闻
丰色 发自 凹非寺
量子位 | 公众号 QbitAI

四足机器人走着走着突然断了一条腿,还能继续前进吗?

来自谷歌和密歇根大学的最新成果,给出了非常肯定的答案。

他们发明的一种叫做AutoRobotics-Zero (ARZ)的搜索算法,既不靠大模型,也不用神经网络,可以让机器人一旦遇到剧烈的环境变化,就立刻自动更改行动策略。

譬如断腿照样走:

相比之下,别的神经网络方法还是这样婶儿的(手动狗头)

英伟达AI科学家Jim Fan评价:

这个方法非常令人耳目一新。

机器人再也不怕被忽悠瘸了

具体如何实现?

让机器人断腿继续走的秘密

快速适应环境变化是机器人部署到现实世界中非常重要的一项技能。

但目前常用的循环神经网络(RNN)技术存在策略单一、重参数化导致推理时间长、可解释性差等问题。

为此,作者直接“另起炉灶”,基于AutoML Zero技术开发了这项全新的四足机器人环境自适应策略:AutoRobotics-Zero (ARZ)

关于AutoML Zero,不熟悉的朋友再了解一下:

它是2020年诞生的一种“从零开始的自动机器学习”算法,出自谷歌大脑Quoc V.Le大神等人之手,仅使用基本数学运算为基础,它就能从一段空程序开始,自动发现解决机器学习任务的计算机程序。

在此,作者也将各种机器人行动策略表示为程序,而非神经网络,并仅使用基本的数学运算作为构建块,从头开始演化出可适应性策略及其初始参数。

随着不断的进化,该方法能够发现控制程序(即Python代码,如下图所示),从而在与环境互动的同时,利用感觉运动经验来微调策略参数或改变控制逻辑(也就是当随机分支在随机时间突然中断时运行新的分支)。最终就可以在不断变化的环境下实现自适应。

具体而言,ARZ的算法由两个核心函数组成:StartEpisode()和GetAction(),前者在机器人与环境交互的每个阶段开始时就开始运行,后者负责调整内存状态(因为策略被表示为作用于虚拟内存的线性寄存器)和代码修改。

在进化搜索上,ARZ则采用两种控制算法:负责多目标搜索的非支配排序遗传算法II(NSGA-II)和负责单目标搜索的正则化进化算法(RegEvo)

如下图所示进化控制算法的评估过程,单目标进化搜索使用平均情节奖励作为算法的适应度,而多目标搜索优化了两个适应度指标:平均奖励(第一个返回值)和每次episode的平均步数(第二个返回值)。


以及作者介绍,为了预测动态环境中给定情况下的最佳行动,策略必须能够将当前情况与过去的情况和行动进行比较。

因此,ARZ所有策略都被设计为“有状态的”,即内存内容在一个事件的时间步长内是持续存在的,由此才得以完成自适应。

此外,有所不同的是,该方法还去掉了原始AutoML Zero技术中的监督学习模式,最终无需明确接收任何监督输入(如奖励信号)就可以让进化程序在整个生命周期内进行调整。

比神经网络更有效

作者用宇树科技的“莱卡狗”(Laikago)四足机器人模拟器在模拟环境中进行了效果测试。

最终,只有ARZ可以进化出在随机断腿情况下保持向前运动和避免摔倒的自适应策略。

相比之下,进行了全面超参数调整并使用最先进强化学习方法完成训练的MLP和LSTM基线都失败了:

要么不具有鲁棒性,不能每次都成功;

要么一次都没有成功过。

需要注意的,这还是在ARZ使用的参数和FLOPS比MLP和LSTM都少得多的情况下。

下图则是统计数据:只要任何一列中的reward<400就表示该腿的大多数测试都以摔倒告终。

我们可以再次看到,除了ARZ,只有MLP方法能够在右后腿成功一次。

除了以上这些,ARZ还显现出了目前的RNN技术都做不到的可解释性

如图所示,它在断腿案例中发现的各种策略可以都符号化为如下表示:

最后,除了机器人断腿走路,ARZ还可以在“具有随机倾斜轨道的cartpole系统”中自动保持平衡。

论文地址: 

https://arxiv.org/abs/2307.16890

报名开启!8月9日

欢迎参加「AIGC时代的算力基石」

8月9日15:00量子位行业沙龙「AIGC时代的算力基石」将为你全景解读AIGC算力的发展机遇,邀请到来自昆仑芯、天数智芯、联想集团、首都在线、潞晨科技等代表性企业的嘉宾,聊聊行业的最新趋势!

点击“阅读原文”,报名线下参与AIGC算力沙龙吧 


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
场面震撼!9个「世界最强」机器人同登台,亮相联合国AI机器人发布会腾讯机器人实验室一号员工创业,人形机器人又添重磅玩家「图灵机器人」完成近亿元A轮融资,专注工业机器人研发与应用|36氪首发两情难相知华人快来领!纽约发100万个N95口罩!​8大道因毒气狂飙取消活动!存好这张图不怕被毒死!「图灵机器人」完成近亿元A轮融资,专注工业机器人研发与应用|早起看早期哈佛启用AI教授,机器人教人制造机器人?!机器人可“自我学习”!谷歌DeepMind发布首个机器人算法模型,“潘多拉魔盒”打开了?从电影“满江红”看老谋子的闹剧新能源汽车,智能房车,宠物机器人,扫地机器人…各种新鲜的高科技智造,9月15日,澳中博览会让你大开眼界!有了这款澳洲驱蚊“神器”,再也不怕被蚊子咬啦~机器人迎来ImageNet时刻!谷歌等新作Open X-Embodiment:机器人学习数据集和 RT-X 模型项目报名|“我不怕被AI淘汰,但怕被掌握AI的人淘汰”地平线机器人生态负责人胡春旭:打造智能机器人开发新范式|直播预告人工智能与机器人研究国际期刊(IJAIRR)正式成立,重点关注AI、机器人及基础科学交叉学科丨 GAIR 2023还分不清bin log 、redo log 跟 undo log?曾扬言灭掉中国,如今要当一家人,网友:别被忽悠!热!英国空调风扇买哪些?今夏最强降温推荐清单:再也不怕被40度英国热哭!北京机器人新政策来了!支持开发机器人通用AI大模型「智世机器人」获数千万元天使轮融资,主打基于四向穿梭机器人的智能仓储解决方案|早起看早期人工智能与机器人研究国际期刊(IJAIRR)正式成立,重点关注 AI、机器人及基础科学交叉学科丨 GAIR 2023大模型加持的机器人有多强,MIT CSAIL&IAIFI用自然语言指导机器人抓取物体人形机器人成新风口!探馆世界机器人大会:"机器人+制造业"国产替代加速理想汽车把消费主义忽悠瘸了入金砖未遂,该国和美国一起给中国唱了一出大戏,好多中国人被忽悠!宝宝黑眼圈、鼻梁有青筋怎么回事?别再被忽悠了《草原心》&《几度夕阳红》何三坡:美国最好的诗人们8大人形机器人参数对比来了!特斯拉、稚晖君的机器人究竟如何?|前哨分享这届年轻人真被忽悠瘸了?格拉古:为无土地自由民奋斗的激进改革者「智世机器人」获数千万元天使轮融资,主打基于四向穿梭机器人的智能仓储解决方案|36氪首发能站、跳、飞、蹲的全能机器人!加州理工发布变形轮式机器人M4:实现八种运动模式,AI加持自主导航全球最新机器人都在这了!马斯克:未来机器人会比人多...谷歌正在像训练人工智能聊天机器人一样训练机器人
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。