Redian新闻
>
Eureka!NVIDIA 研究突破为机器人学习注入新动力

Eureka!NVIDIA 研究突破为机器人学习注入新动力

公众号新闻

AI 智能体利用 LLM 自动生成奖励算法,训练机器人完成复杂任务。



NVIDIA Research 开发的一款名为 Eureka 的新型 AI 智能体可以教机器人复杂的技能,它教会了机器人手快速转笔,并且第一次转得像人类一样好。


上面视频中所展示的令人惊叹的“魔术”是机器人通过 Eureka 学会熟练完成的近 30 项任务之一,Eureka 可以自动编写奖励算法来训练机器人。


Eureka 还教会了机器人完成打开抽屉和柜子、抛接球、操作剪刀等任务。


于 10 月 20 日发布的这一 Eureka 研究包含一篇论文和该项目的 AI 算法,开发者可以使用 NVIDIA Isaac Gym(一款用于强化学习研究的物理模拟参考应用)进行实验。Isaac Gym 基于 NVIDIA Omniverse 而构建,后者是一个用于基于 OpenUSD 框架构建 3D 工具和应用的开发平台。Eureka 自身是由 GPT-4 大型语言模型驱动的。


NVIDIA AI 研究高级总监、Eureka 论文作者之一的 Anima Anandkumar 表示:“在过去十年,强化学习取得了空前成功,但依然面临许多挑战,比如奖励设计需要不断试错才能完成。Eureka 是朝着开发将生成式和强化学习方法结合以解决这些艰巨的任务的新算法迈出的第一步。”



点击视频,观看 Eureka 用 LLM 训练机器人灵巧操作


AI训练机器人


据该论文介绍,Eureka 生成的奖励程序(可让机器人进行试错学习)在超过 80% 的任务上优于人类专家编写的程序,这使得机器人的平均性能提高了 50% 以上。



Eureka 教机械臂打开一个抽屉。


该 AI 智能体使用 GPT-4 LLM 和生成式 AI 编写软件代码,为机器人进行强化学习提供奖励。它不需要任何特定任务提示或预定义的奖励模板,并且能够随时结合人类的反馈改进其奖励,使结果更加精准地符合开发者的愿望。


利用 Isaac Gym 中的 GPU 加速模拟,Eureka 能够快速评估大批奖励候选者的质量,从而提高训练效率。


Eureka 随后会基于训练结果汇总关键统计数据,并指导 LLM 改进其奖励函数的生成。通过这种方式,AI 可以自我完善。Eureka 教会了各类机器人,包括四足机器人、双足机器人、四旋翼机器人、灵巧手、协作机器人臂等,来完成不同类型的任务。


该研究论文对 20 个 Eureka 训练任务进行了深入评估,这些任务基于开源的灵巧性基准,要求机器人手展示一系列复杂的双手任务。


这些来自九个 Isaac Gym 环境的测试结果通过使用 NVIDIA  Omniverse 生成的可视化进行了展示。



类人型机器人通过 Eureka 学习跑步步态。


该项目的贡献者之一、NVIDIA 高级研究科学家 Linxi “Jim” Fan 表示:“Eureka 是一个独特的组合,将大型语言模型与 NVIDIA GPU 加速的模拟技术相结合,可以实现灵巧的机器人控制,并且为艺术家提供了一种制作物理逼真动画的新方法。”


除了 NVIDIA Research 最近取得的进展(比如使用 GPT-4 构建的能够自主玩 《我的世界》的 AI 智能体 Voyager)之外,这项突破性的研究成果也必将让开发者们脑洞大开。


NVIDIA Research 由全球数百名科学家和工程师组成,团队专注于 AI、计算机图形学、计算机视觉、自动驾驶汽车、机器人学等领域的研究。


了解 Eureka 与 NVIDIA Research 的更多信息,请查看:


  • Eureka: 

https://eureka-research.github.io/


  • NVIDIA Research: 

https://www.nvidia.com/en-us/research/


来源:NVIDIA英伟达


版权声明:部分文章在推送时未能与原作者取得联系。若涉及版权问题,敬请原作者联系我们。联系方式:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
写作的意义(小说)NeurIPS 2023 | LIBERO:机器人持续学习基准环境对话张晓强:重回盈利高地后,锦江还要给发展注入新动能韩国斗山机器人上市首日股价翻倍,工业机器人投资潮要来了?机器人瓦力来了!迪士尼亮出新机器人,用RL学习走路,还能进行社交互动腾讯机器人实验室一号员工创业,人形机器人又添重磅玩家早练,听电台知某外企搬迁短短三年儿子打入机器人“奥运会”比赛?法拉盛专业级机器人编程课免费体验!年代剧如何注入新活力?机器人也能做美食?从机器人厨师到AI定制餐食再迎突破!司羿智能脑机接口康复机器人获国家药监局批准,新一代上肢康复机器人全球同步上市[旅游] 旅行第15季088城 冰岛首都 Reykjavík 的冬天Nature重磅突破:华人学者首次证实,改变心肌细胞能量代谢,可实现心脏再生[旅游] 旅行第15季085城 - 冰岛Keflavík小镇 蓝湖温泉 地热发电站真实再现生物脊柱功能,老鼠机器人也能像杰瑞一样灵活,Science Robotics 发布老鼠机器人最新研究成果录用率26.1%!NeurIPS 2023论文放榜,马毅田渊栋团队研究被接收Transformer+强化学习,谷歌DeepMind让大模型成为机器人感知世界的大脑酒与诗的魅力:国际诗酒文化大会为泸州文旅经济注入新活力盖格计数器,新时代的安全标配我曾经所迷恋的和至今不能忘却的原华为机器视觉总裁加入依图;月之暗面推出首款智能助手;微软GitHub Copilot每月倒贴用户20美元丨AIGC大事日报小鹏人形机器人首秀,明年或现身门店卖车;波士顿动力使用ChatGPT训练出导游机器狗;联想AI PC明年9月上市丨AI周报国家重点研发计划项目成果发布——五项循证研究突破心血管事件链单病种防治瓶颈新能源汽车,智能房车,宠物机器人,扫地机器人…各种新鲜的高科技智造,9月15日,澳中博览会让你大开眼界!Nature BME | 双管齐下增强疫苗效果,华人学者引领mRNA技术新突破Transformer+强化学习,DeepMind让大模型成为机器人感知世界的大脑用GPT-4训练机器人!英伟达最新工作Eureka:转笔转到离谱!短短三年儿子打入机器人“奥运会”?法拉盛专业级机器人编程课助你登顶!红色日记 12.21-31从“轮子上的机器人”到“人形机器人”,车企跨界胜算几何?对机器学习感兴趣?不如先来实践一下!|《基于机器学习的智能机器狗巡检系统》新华网博鳌新国货峰会:李佳琦分享,直播电商为国货发展注入新动能当代“离朱”凌云光,为机器植入“眼睛”机器人迎来ImageNet时刻!谷歌等新作Open X-Embodiment:机器人学习数据集和 RT-X 模型让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法,准确率提升7.8%
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。