Redian新闻
>
仅用7500条轨迹数据训练,CMU、Meta就让机器人「上得厅堂、下得厨房」

仅用7500条轨迹数据训练,CMU、Meta就让机器人「上得厅堂、下得厨房」

公众号新闻
机器之心报道
编辑:Rome Rome
创造一个能够在各种情境中展现多种技能的机器人,似乎是一个遥不可及的目标,而 RoboAgent 的出现或许将这个目标拉近了一步。


仅在 7500 条轨迹数据上进行训练,能够在 38 个任务中展示 12 种多样的操作技能,不仅限于拾取 / 推动,还包括关节对象操纵和物体重新定位,并能将这些技能推广应用于数百个不同的未知情境(未知物体、未知任务,甚至完全未知的厨房环境),这样的机器人够不够酷?


几十年来,创造一个能够在不同环境中操纵任意物体的机器人一直是一个遥不可及的目标。一部分原因是,缺乏多样化的机器人数据集,无法训练这样的智能体,同时也缺乏能够生成此类数据集的通用智能体。

为了突破这一困境,来自 CMU、Meta AI 的作者历时两年开发了一个通用的 RoboAgent。他们将重点放在开发一种高效的范例上,能够在实际数据有限的情况下训练一个能够获得多种技能的通用智能体,并将这些技能推广应用于多样的未知情境。


RoboAgent 由以下模块化构成 :

  • RoboPen - 一个采用通用硬件构建的分布式机器人基础设施,能够长期不间断运行;
  • RoboHive - 一个统一的框架,用于在模拟和真实世界操作中进行机器人学习;
  • RoboSet - 一个高质量的数据集,代表了各种场景中使用日常物品的多种技能;
  • MT-ACT - 一种高效的语言条件多任务离线模仿学习框架,通过在现有机器人经验的基础上创建多样的语义增强集合,从而扩大了离线数据集,并采用了一种新颖的策略架构和高效的动作表示方法,在有限的数据预算下恢复出性能良好的策略。

RoboSet:多技能、多任务、多模态数据集

构建一个能够在许多不同情境下推广的机器人智能体,首先需要一个具有广泛覆盖范围的数据集。鉴于扩大规模的努力通常会有所帮助(例如,RT-1 展示了约 130,000 条机器人轨迹的结果),因此需要在数据集有限的情况下理解学习系统的效率和泛化原则,低数据情境往往会导致过拟合。因此,作者的主要目标是开发一种强大的范例,可以在低数据情境下学习可推广的通用策略,同时避免过拟合问题。

机器人学习中的技能与数据全景。

用于训练 RoboAgent 的数据集 RoboSet(MT-ACT)仅包括 7,500 条轨迹(比 RT-1 的数据少 18 倍)。该数据集提前收集并保持冻结状态。该数据集由在多个任务和场景中使用商品机器人硬件(Franka-Emika 机器人配备 Robotiq 夹具)进行人类遥操作收集的高质量轨迹组成。RoboSet(MT-ACT)在几个不同的情境下稀疏地涵盖了 12 种独特技能。数据通过将日常厨房活动(如泡茶、烘焙)分为不同的子任务来收集,每个子任务代表一个独特的技能。数据集包括常见的拾取 - 放置技能,还包括接触丰富的技能,如擦拭、盖盖子,以及涉及关节物体的技能。


MT-ACT:多任务动作分块 Transformer

RoboAgent 基于两个关键洞察在低数据情境下学习通用策略。它利用基础模型的世界先验知识以避免模式崩溃,并采用了一种新颖的高效策略表示,能够摄取高度多模态的数据。
 
1、语义增强:RoboAgent 通过对 RoboSet(MT-ACT)进行语义增强,将来自现有基础模型的世界先验知识注入其中。由此产生的数据集将机器人的经验与世界先验知识相结合,而无需额外的人力 / 机器人成本。使用 SAM 对目标物体进行分割,并在形状、颜色、纹理变化方面对其进行语义增强。
 
2、高效策略表示:由此产生的数据集是严重多模态的,包含丰富多样的技能、任务和情景。将动作分块方法适应于多任务设置,开发了 MT-ACT 一种新颖的高效策略表示,能够在低数据量情境中摄取高度多模态的数据集,同时避免过拟合问题。


实验结果

RoboAgent 比现有方法更具样本效率

下图比较了作者提出的 MT-ACT 策略表示与几种模仿学习架构。作者仅使用了包括物体姿态变化和部分光照变化的环境变化。与之前的研究相似,作者将此归于 L1 泛化。从 RoboAgent 的结果,可以清楚地看到,使用动作分块来建模子轨迹明显优于所有基准方法,从而更证明了作者提出的策略表示在样本效率学习方面的有效性。


RoboAgent 在多个泛化层面上表现出色


上图展示了作者在不同泛化层次上测试方法的结果。并且可视化了泛化级别,L1 表示物体姿态变化,L2 表示多样的桌面背景和干扰因素,L3 表示新颖的技能 - 物体组合。接下来,作者展示了每种方法在这些泛化层次上的表现。在严格的评估研究中,MT-ACT 比其他方法中表现显著优异,特别是在更困难的泛化层次(L3)上。


RoboAgent 具有高度的可扩展性
 
作者评估了在不断增加的语义增强级别下 RoboAgent 的表现。并且在一个活动(5 项技能)上进行了评估。下图显示,随着数据的增加(即每帧更多的增强),在所有泛化级别上性能显著提升。重要的是,对于更难的任务(L3 泛化)来说,性能提升要大得多。


RoboAgent 能够在多样的活动中展示其技能





© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
MIT推出拾物机器人「最强辅助」,少量训练样本即可实现自然语言控制仅用7分钟!“女外卖员深夜送餐回来车子被偷”的视频就成了爆款....ChatGPT不再局限于2021年之前的数据;Meta发布AI聊天机器人;李嘉诚捐6000万港元发展AI医疗教学丨AIGC日报机器人迎来ImageNet时刻!谷歌等新作Open X-Embodiment:机器人学习数据集和 RT-X 模型「简报」CMU 校长 Jahanian 致词欢迎 2027+ 届学生;新任 LTI 主任将在 CMU 探索更负责任的人工智能九剑一魂 - 第24回 汉胡同源 九剑一魂(九)CS课程要求, Georgia tech vs MIT, CMU, Princeton学习村上春树、史蒂芬·金盗版书,AI巨头的数据训练能否被信任?NYU、哥大、JHU、USC…美国大学正版教科书,现在打包免费送!人类首个沙雕视频数据集!FunQA:让机器成为喜剧之王《美好的期待》&《千年守候》商用清洁机器人「冰火两重天」:资本热炒、巨头涌进、市场寒冬漫游大华府(11)大使馆开放日(中)媲美GPT-4V,仅使用1.2M数据、8个A100,一天内完成训练,LLaVA-1.5刷新11个基准SOTA人类创造的数据太贵了!开发者悄悄使用AI合成数据训练模型谷歌正在像训练人工智能聊天机器人一样训练机器人四足机器人「技术跃变」:如何成为「地面的大疆」?老钱:为什么有这么多糊涂的海外华人?又一名校加入!CMU、威斯利安、匹兹堡取消Legacy录取!传承百年的美国大学“潜规则”即将被打破?斯坦福三申三录,哥大连中三元,哈耶普斯麻申四录四,斯坦福、MIT、CIT、CMU等九大理工强校理工专业大满贯,是怎么做到的?人形机器人成新风口!探馆世界机器人大会:"机器人+制造业"国产替代加速CMU、卫斯理安、匹兹堡取消“传承录取”政策!“校二代”的特权将被彻底终结?智能周报|OpenAI收购一家游戏制作公司;稚晖君发布人形机器人「远征 A1」;字节跳动测试多个类ChatGPT产品...5099 血壮山河之武汉会战 浴血田家镇 7马斯克承认用X数据训练AI:微软别想用,但我自己能用耗时2年,Meta联手CMU打造最强「通用机器人智能体」!上茶擦碗多面手,轻松泛化100多种未知任务美国新生群官方上线:哥大、USC、NYU、JHU、UCB...来找组织!ICML 2023|CMU大牛全面总结「多模态机器学习」六大挑战:36页长文+120页PPT,全干货!稚晖君半年干出个人形机器人!有脑有手步伐稳健,上得实验室下得厨房,价格20万以内马斯克xAI创始成员国内首发声:ChatGPT时代「乱世出英雄」,下一步要多用数学科学数据训练美国新生官方群来咯:哥大、USC、NYU、JHU、UCB...来找组织!消息称OpenAI年营收达13亿美元,同比增长4500%;AI仅用26秒就设计了一款可行走的机器人丨AIGC日报天才少年稚晖君首秀:首款人形机器人亮相,上得厨房入得工厂,成本价不到20万元|FutureAI会让机器人更聪明吗?乾隆退位的时候双手紧握玉玺,刘墉仅用了八个字,就让乾隆交出CMU、卫斯理安、匹兹堡宣布取消“传承录取”优势,关系户彻底终结?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。