Redian新闻
>
谷歌推出RT-2,能够像人类一样思考和行动

谷歌推出RT-2,能够像人类一样思考和行动

公众号新闻
出品 | OSC开源社区(ID:oschina2013)
谷歌宣布推出首个 Robotics Transformer 2 (RT-2) 视觉 - 语言 - 动作 (VLA) 模型。可以从网络和机器人数据中学习,并将这些知识转化为用于机器人控制的通用指令,同时保留 web-scale 能力。
“RT-2 显示出超越其所接触的机器人数据的泛化能力以及语义和视觉理解能力。这包括解释新命令并通过执行基本推理(例如关于对象类别或高级描述的推理)来响应用户命令。”
根据介绍,RT-2 是一个基于 Transformer 的模型,通过网络上的文本和图像进行训练,并能直接输出机器人行为指令。就如同语言模型从网络文本中学习通用概念和思想,RT-2 也从网页数据中吸取知识以驱动机器人行为。“换句话说,RT-2 可以说机器人语言。”
去年,谷歌 DeepMind 的机器人团队曾展示了 Robotics Transformer (RT-1),可训练日常机器人系统执行诸如拾放和开启抽屉等任务。该系统基于包含 130,000 次演示的数据库,据团队称,有 “超过 700” 项任务的成功率达到 97%。
谷歌 DeepMind 机器人技术主管 Vincent Vanhoucke 在博客中表示,RT-1 表明,以跨系统泛化信息能力而著称的 Transformer 甚至可以帮助不同类型的机器人相互学习。
RT-2 建立在 RT-1 模型的基础上,消除了一些复杂性;使单个模型不仅能够执行基础模型中看到的复杂推理,而且还可以输出机器人动作。最重要的是,它表明在少量的机器人训练数据下,该系统就能够将其语言和视觉训练数据中嵌入的概念转移到指导机器人行为 —— 即使是对于从未接受过训练的任务。
“例如,如果想要以前的系统能够执行丢弃垃圾的行为,必须明确训练它识别和处理垃圾。然而,RT-2 可以从大量网络数据中学习并理解什么是垃圾,并在未经特定训练的情况下进行识别。尽管未曾接受过相关动作训练,但它甚至掌握了如何丢弃垃圾的方法。考虑到垃圾的抽象性 —— 比如各种薯片包或香蕉皮在你食用后就成为了垃圾,RT-2 能通过其视觉语言培训数据理解这个概念,并完成任务。”
Vincent 称,RT-2 的能力在于将信息转化为行动,这显示了其快速适应新环境和情况的潜力。经过 6000 次的测试试验表明,RT-2 在训练数据中的任务或 "seen" 任务上的表现与 RT-1 模型相当。而在未见过的新场景中,RT-2 的性能表现几乎翻了一番,从 RT-1 的 32% 提高到了 62%。
“换句话说,通过 RT-2,机器人能够像我们一样学习更多内容 —— 将学到的概念迁移到新的情境中。RT-2 不仅展示了人工智能的进步如何迅速渗透到机器人领域,而且还展示了更多通用机器人的巨大前景。虽然要在以人为本的环境中打造有用的机器人还有大量工作要做,但 RT-2 向我们展示了机器人技术令人兴奋的未来。”
更多详情可查看官方博客:https://www.deepmind.com/blog/rt-2-new-model-translates-vision-and-language-into-action?utm_source=keywordblog&utm_medium=referral&utm_campaign=rt2


END



国粹AI —— 一个飙脏话的机器人




这里有最新开源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
蝙蝠宝宝也会像人类幼崽一样“牙牙学语”《人类简史》作者:人类一心追求更轻松的生活,但结果不是大部分人乐见的……10行代码媲美RLHF!谷歌DeepMind用游戏数据让大模型更像人类日线和小时线(续1)日本要祸害人类一万年啊!苏轼:人活到极致,能忍,能让,能原谅CVPR 2023 | LeCun世界模型首个研究!自监督视觉像人一样学习和推理!傅盛的大模型创业思考:好奇心和行动力才是竞争根本限时领 | 点击量过亿的纪录片《像乌鸦一样思考》,让孩子学会如何独立思考!谷歌机器人大模型RT-2,李飞飞具身智能新成果,Cathie Wood访谈,特斯拉Ashok演讲昆德拉:人类一思考,上帝就发笑富滇银行:中小金融机构该如何思考和落地AIGC应用?免费领资源 | 9部适合开学前观看的动画&纪录片,激发求知欲,爱上思考和学习,跑赢新学期K8s多集群实践思考和探索知识分子三要素:知识、思考和坚持 |饶毅郁金香,高雅富贵人类一恐惧,愚昧就狂笑姚期智领衔提出大模型「思维」框架!逻辑推理正确率达98%,思考方式更像人类了ChatGPT突破图灵测试:在“像人”和“不像人”方面都很行 |《自然》长文谷歌的 RT-2,是不是机器人的 GPT-3 时刻?LeCun世界模型首项研究来了:自监督视觉,像人一样学习和推理,已开源市委常委会举行会议:坚决拥护党中央决定,坚决把思想和行动统一到党中央决定精神上来Transformer取代者登场!微软、清华刚推出RetNet:成本低、速度快、性能强I am a proud mama today【炜炜道来】​聊聊这两天大震荡后的思考和策略谷歌推出新搜索功能,支持边看边搜索每日原则:像公司的拥有者那样思考,要求你的同事也这样做牛大吉吴海金:从产品经理到创业者,创业这10年,我是如何思考和实践的支持全栈编程语言、随取随用、一键部署,谷歌推出浏览器AI开发环境IDX谷歌推出 3个新的云存储选项:Cloud Storage FUSE、Parallelstore 和 NetApp Volumes杂感去希腊旅游不可错过的六大景点谷歌DeepMind发布机器人大模型RT-2,提高泛化与涌现能力|甲子光年上海市委常委会举行会议:坚决拥护党中央决定,坚决把思想和行动统一到党中央决定精神上来大模型速度狂飙2.39倍!清华联手微软首提SoT,让LLM思考更像人类
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。