Redian新闻
>
CMU&ETH实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

CMU&ETH实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

公众号新闻

机器之心报道

机器之心编辑部

足式机器人领域又一次迎来创新!CMU 与 ETH Zurich 团队联合研发了一个名为 「敏捷但安全」(ABS,Agile But Safe)的新框架,为四足机器人在复杂环境中实现高速运动提供了解决方案。ABS 不仅在避免碰撞方面展现出高效能力,还在极速上达到了前所未有的 3.1 米秒!

在高速机器人运动领域,实现同时兼顾速度和安全一直是一大挑战。但现在,卡内基梅隆大学(CMU)和苏黎世联邦理工学院(ETH)的研究团队带来了突破性进展。他们开发的新型四足机器人算法,不仅能在复杂环境中高速行进,还能巧妙避开障碍,真正做到了「敏捷而安全」。



论文地址: https://arxiv.org/pdf/2401.17583.pdf


在 ABS 的加持下,机器狗在各种场景下都展现出了惊艳的高速避障能力:


障碍重重的狭窄走廊:



凌乱的室内场景:



无论是草地还是户外,静态或动态障碍,机器狗都从容应对:



遇见婴儿车,机器狗灵巧躲闪开:



警告牌、箱子、椅子也都不在话下:


对于突然出现的垫子和人脚,也能轻松绕过:



机器狗甚至还可以玩老鹰捉小鸡:



ABS 突破性技术:

RL+ Learning model-free Reach-Avoid value


ABS 采用了一种双策略(Dual Policy)设置,包括一个「敏捷策略」(Agile Policy)和一个「恢复策略」(Recovery Policy)。敏捷策略让机器人在障碍环境中快速移动,而一旦 Reach-Avoid Value Estimation 检测到潜在危险(比如突然出现的婴儿车),恢复策略就会介入,确保机器人安全。



创新点 1:怎么训练一个敏捷策略 Agile Policy?

敏捷策略的创新之处在于,与以往简单地追踪速度指令不同,它采用目标达成(position trakcing)的形式来最大化机器人的敏捷性。这一策略训练机器人发展出感知运动技能,以在没有碰撞的情况下达到指定目标。通过追求基座高速度的奖励条件,机器人自然学会在避免碰撞的同时实现最大敏捷性。这种方法克服了传统速度追踪(velocity tracking)策略在复杂环境中可能的保守限制,有效提高了机器人在障碍环境中的速度和安全性。Agile Policy 在实机测试中极速达到了 3.1m/s


创新点 2:学习 Policy-conditioned reach-avoid value

「达防」(Reach-Avoid, RA)值学习的创新之处在于,它采用了无模型的方式学习,与传统的基于模型的可达性分析方法不同,更适合无模型的强化学习策略。此方法不是学习全局 RA 值,而是使其依赖于特定策略,这样可以更好地预测敏捷策略的失败。通过简化的观测集,RA 值网络可以有效地概括并预测安全风险。RA 值被用于指导恢复策略,帮助机器人优化运动以避免碰撞,从而实现在保证安全的同时提高敏捷性的目标。

下图展示了针对特定障碍物集合学习到的 RA(达防)值。随着机器人速度的变化,RA 值的分布景观也相应变化。RA 值的符号合理地指示了敏捷策略的安全性。换句话说,这张图通过不同的 RA 值展示了机器人在不同速度下,面对特定障碍物时的安全风险程度。RA 值的高低变化反映了机器人在不同状态下执行敏捷策略时可能遇到的安全风险。



创新点 3:用 Reach-Avoid Value 和恢复策略来拯救机器人

恢复策略的创新之处在于,它能使四足机器人快速追踪线速度和角速度指令,作为一种备用保护策略。与敏捷策略不同,恢复策略的观测空间专注于追踪线速度和角速度命令,不需要外部感知信息。恢复策略的任务奖励专注于线性速度追踪、角速度追踪、保持存活和保持姿势,以便平滑切换回敏捷策略。这种策略的训练同样在仿真环境中进行,但有特定的域随机化和课程设置,以更好地适应可能触发恢复策略的状态。这种方法为四足机器人提供了在高速运动中快速应对潜在失败的能力。


下图展示了当恢复策略在两个特定情况(I 和 II)下被触发时,RA(达防)值景观的可视化展示。这些可视化展示是在 vx(沿 x 轴的速度)与 ωz(绕 z 轴的角速度)平面以及 vx 与 vy(沿 y 轴的速度)平面上进行的。图中显示了搜索前的初始旋转状态(即机器人基座当前的旋转状态)和通过搜索得到的命令。简单来说,这些图表展示了在特定条件下,通过恢复策略搜索得到的最佳运动指令,以及这些指令如何影响 RA 值,从而反映机器人在不同运动状态下的安全性。




鲁棒性测试

作者在「12kg 负载 / 篮球撞击 / 脚踢 / 雪地」的四个场景下测试了 ABS 框架的鲁棒性,机器狗都从容应对:


研究团队

这项研究是由 CMU 和 ETH 的研究团队共同完成。团队成员包括 Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu 和 Guanya Shi。他们的合作不仅在机器人技术领域取得了重大突破,更开启了四足机器人新的应用可能。这项技术的成功展示了四足机器人在高速移动和安全避障领域的巨大潜力。未来,这种高速且安全的四足机器人有望在搜救、探险甚至是家庭服务等多个领域发挥重要作用。

【关注机器之心视频号,第一时间看到有趣的AI内容】



© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
机器狗首次阵亡!美国警方披露详情老钱:不带他玩了,可以吧【宾州滑雪】一起去滑雪玩雪胎!三组套餐任你选~体验速度与激情!【宾州滑雪】一起去滑雪~体验速度与激情,畅享自由风!零一万物Yi-VL多模态大模型开源,MMMU、CMMMU两大权威榜单领先为进豪门浪费天赋,她可惜吗?广播体操与长寿《田野的春天》&《怕梦》AI读心术再升级!一副眼镜直接控制波士顿机器狗,脑控机器人成真CMU 读 CS 比 Yale 更难吗?拿到苹果Vision Pro玩疯了!戴着它遛机器狗开特斯拉,住在里面打工和生活,仿佛未来世界又一互免签证来了!热情夏日+遍地美食,还没有语言障碍,这个亚洲最出片的国家可以安排了!【宾州滑雪】下雪啦!一起去滑雪~体验速度与激情,畅享自由风!CMU, GIT& Boeing EVP, CEO of Defense, Space, DEI我的儿子从被诊断为学习障碍,到斩获普林斯顿大学,一路都经历了什么?推荐中学生挑战的10大国际诗歌写作竞赛!展现诗意天赋,总有一项适合你!赴美:淡季机票,中国内地,1停到洛杉矶单程含税不到3000元,有行李,无语言障碍,还不用去港澳~【广而告之】3分靠天赋,7分靠努力,剩下的90分你可以靠CUSSA【宾州滑雪】1.28周日出发!一起去滑雪~体验速度与激情,畅享自由风!此前只有两个国家掌握这一技术,我国实现突破→CMU CS 大战 耶鲁CS, 计算机水平上说CMU中值厉害还是耶鲁TOP 10%厉害? 如果一样厉害。。哈哈好奇心 ——我没有特别的天赋,我只有强烈的好奇心【深圳】活动报名 | 超越内卷,实现人才效能的敏捷跃迁穿上“运动裤”便能解决行动障碍,它凭此A轮融了一个亿CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门个人感慨之七十三 什么都不懂【宾州滑雪】1.28本周日出发!一起去滑雪玩雪胎~体验速度与激情,畅享自由风!中俄联手突破:开拓信息安全新领域!Meta发布抽象链,大模型工具利用精度+6%,速度+40%!G3-G6超专业美术夏令营:艺术职业大体验!挖掘兴趣&天赋,超好玩,收获大!CMU vs UCLA奇瑞的速度与高度:成为销量黑马之后,开始抢滩新能源头部阵营李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了来场速度与激情!推荐|“打破障碍,建立桥梁”波士顿三八国际妇女节论坛被央视点赞、破解精度与速度悖论,普利生用微纳3D打印点亮医疗新思路对机器学习感兴趣?不如先来实践一下!|《基于机器学习的智能机器狗巡检系统》丰满敏敏原来是强总卧底,可惜脑子不够最近发生在的Texas的Law and Order的具体案例,你觉得和你想象的一样吗?你会支持这样的Law&order吗82、长篇民国小说《永泰里》第十六章 生死一线(6)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。