Redian新闻
>
意念操纵机器人成真!李飞飞团队打造,做家务玩游戏样样能行

意念操纵机器人成真!李飞飞团队打造,做家务玩游戏样样能行

公众号新闻
西风 发自 凹非寺
量子位 | 公众号 QbitAI

斯坦福李飞飞、吴佳俊带队让《阿凡达》意念操控照进了现实!

现在,只需要动动脑子就能操纵机器人

想吃寿喜锅不用自己动手,切菜备菜、倒入食材,机器人一气呵成:

做饭、烹茶样样都行:

忙完顺便还能把桌面清理了:

你以为这就完了?这个机器人玩起游戏来也是一把好手:

甚至还能帮你熨衣服:

关键是,旁边的操纵者只需要坐在那里“冥想”即可,无需手摇摇杆🎮。

能做到这些,都要得益于研究团队最新开发的脑机接口系统——NOIR

这是一个通用的智能系统,使用者无需佩戴侵入性设备,机器人可以从脑电信号中解码人类意图

并且它还配有一个“技能库”,可以随意组合各种技能完成人类指令,轻松应对高达20项日常任务

要知道,常规脑机接口系统一般只专注于一项或几项任务。

目前这项研究已收录于机器人顶会CoRL 2023:

围观网友一口一个哦买噶:

哦买噶,游戏规则改变者!

清华叉院助理教授许华哲也来评论区捧场:

哦买噶,赛博朋克!

这个NOIR系统究竟是什么?机器人为何能完成这么多任务?

20项任务轻松拿下

正如上文所说,这个机器人能干的事儿多着呢。

干酪撒粉这种细活也能轻松完成:

拆包裹、整理桌面这种活就更不在话下:


而其背后的这个NOIR系统,简单来说可以分为两部分:模块化解码管线、有原始技能库的机器人系统。

主打一个让机器人自动学习预测人类意图。

具体来说,模块化管线将解码人类意图过程分为三个模块:

1)选择什么对象?

方法是在屏幕上显示任务场景,利用对象的闪烁刺激产生SSVEP信号;每个对象以不同频率闪烁,人类注视某对象时,脑电信号中该频率成分增强。

然后用Canonical Correlation Analysis(CCA)方法,分析不同频率的相关性,确定人类注视的对象。

2)如何交互?

这部分是通过提示人类想象执行某些技能(左手、右手等)产生运动意象信号,然后使用滤波和Common Spatial Pattern (CSP)算法预处理信号。

最后利用Quadratic Discriminant Analysis (QDA)进行4类识别,确定技能选择。

3)在哪交互?

人类想象控制光标的左右运动来选择技能执行的具体参数。同样通过CSP和QDA处理并解码脑电信号,判断人类是左还是右。

研究人员还设置了安全机制,采用肌肉紧张信号来确认或拒绝脑电信号解码结果,避免解码错误导致的风险。

之后,机器人配备了一系列参数化的基本技能,例如Pick(x,y,z)、Place(x,y,z)、Push(x,y,z,d)。

可以组合使用这些技能来完成人类指定的各种任务。

在这个过程中,解码人类意图既费时又费钱。所以研究团队选择让机器人用基于检索的少样本学习,来学习人类的对象、技能和参数选择。

这样一来,在给定一个新的任务时,机器人会在记忆中找到最相关的经验,并选择相应的技能和对象。

举个例子,假设人类在执行抓取杯子的任务,选择了在杯子的某个特定位置抓取(比如杯子的把手)。机器人会记录下当时的图像,以及人类选择的抓取点。

在之后的任务中,当机器人看到新的杯子图像时,它会首先根据预训练模型来分析这个新图像,提取图像的语义特征。

然后计算新图像的特征和之前记录的训练图像特征之间的相似度,找出最相似的一个点,作为它预测的抓取位置。

通过这种匹配图像特征的方式,机器人只需要人类示范一次参数选择,就可以在未来自己预测参数,而不需要人类每次都完全重新选择一遍。

使用NOIR系统,3名人类参与者完成了上面我们所介绍的20项日常活动任务,其中包括16个桌面操作任务和4个移动操作任务。

在测试中,每个任务平均需要尝试1.8次就能成功,平均完成时间为20.3分钟,这其中主要是人类决策和解码耗时,占总耗时的80%。

实验各阶段的解码准确率和其它脑机接口研究差不多,但使用这种方法可以将对象和技能选择时间降低60%,从45.7秒缩减到18.1秒。

作者简介

除了李飞飞教授、吴佳俊教授带队,论文共同一作有四位,分别是:

Ruohan Zhang

Ruohan Zhang是斯坦福视觉与学习实验室(SVL)博士后研究员,同时也是Wu Tsai Human Performance Alliance研究员。

主要研究方向为机器人技术、人机交互、脑机接口、认知科学和神经科学。

Sharon Lee

Sharon Lee是斯坦福大学视觉与学习实验室(SVL)研究生研究员。

Minjune Hwang

Minjune Hwang是斯坦福大学计算机科学研究生,于加州大学伯克利分校获得计算机科学和统计学本科学位,曾在亚马逊、微软和苹果进行研究。

Ayano Hiranaka

斯坦福大学研究生,本科毕业于伊利诺伊大学香槟分校。

论文链接:https://arxiv.org/abs/2311.0145

参考链接:
[1]https://twitter.com/drjimfan/status/1722674119794434187
[2]https://twitter.com/ruohanzhang76/status/1720525179028406492

《2023年度十大前沿科技报告》案例征集

量子位智库《2023年度十大前沿科技报告》,启动案例征集。诚邀顶级研究机构、一流投资大咖、前沿科技创新公司,参与共创,分享案例。

扫描图片二维码参与前沿科技案例征集。了解更多细节可联系报告负责人:郑钰瑶(微信:CarolineZheng_,请备注企业+姓名)。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
金星人告诉你真理:癌症是思想造成的AI「脑补」画面太强了!李飞飞团队新作ZeroNVS,单个视图360度全场景生成李飞飞团队新作:脑控机器人做家务,让脑机接口具备少样本学习能力谷歌DeepMind机器人成果三连发!两大能力全提升,数据收集系统可同时管理20个机器人解决大模型复现难、协作难, 这支95后学生团队打造了一个国产AI开源社区要不是有了“第三只手”,谁愿意做家务啊!!很绅士、做家务、不骚扰,我为什么也要被“厌男”?李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了李飞飞朱松纯把《我的世界》变AI的世界,微软Xbox组参与,游戏Agent协作框架来了成绩是一时的,但生活能力是一辈子的,父母一定要从小教孩子做家务的能力李飞飞团队新作:AI透视眼!渲染遮挡人体有了新突破!劝你偷懒不做家务的理由,我又又又给你找到了【评论抽奖送取暖器!】斯坦福华人团队炒菜机器人爆火:成本仅3万美元,滑蛋虾仁、干贝烧鸡轻松做!谷歌家务机器人拿放物品越来越溜,解放双手的时代真的来了?西南航空促销又来!半价机票飞飞飞~叠加deal其实半价都不到用内务标准做家务!“90后”退役士兵成家政业清流从小让宝宝做家务,竟然有这些好处?NeurIPS 2023 | 李飞飞团队提出SiamMAE:孪生掩码自编码器,刷榜视觉自监督方法!谷歌家务机器人单挑斯坦福炒虾机器人!端茶倒水逗猫,连甩三连弹开打斯坦福爆火机器人自爆失败内幕!炒虾做家务逗猫都是人类遥控的,AI厨师和女仆还很遥远美女网红玩游戏不用手,凭意念杀敌,艾尔登法环都打通关了!李飞飞新书《我看到的世界》正式发售!忧心斯坦福没有训练ChatGPT算力,自称不是AI毁灭派我的眼睛就是尺!80亿参数OtterHD带你「清明上河图」数骆驼!南洋理工华人团队打造Meta重磅更新,小扎在元宇宙里养了会做家务的狗!人形化身超逼真,AI智能体在真实物理世界和人互动911, 美中反恐的结果2023回国 走走看看,上海街拍(图)从洗碗工到斯坦福教授,“AI女神”李飞飞谈逆袭:找到自己的“北极星”最重要戏回杜甫李飞飞团队实现“隔空建模”,透过遮挡物还原完整3D人体模型我是销售冠军(3)斯坦福机器人炒虾爆火网络,谷歌DeepMind发布机器人最新进展,2024智能机器人元年到来?成本3万美金的机器人能自己炒菜做家务了!斯坦福华人团队项目引全网热议GPT-4成功得出P≠NP,陶哲轩预言成真!97轮「苏格拉底式推理」对话破解世界数学难题大模型勇闯洛圣都,加封「GTA五星好市民」!南洋理工、清华等发布视觉可编程智能体Octopus:打游戏、做家务全能干Cell Research|西湖大学高晓飞团队开发红细胞载药平台用于治疗血栓性疾病GPU短缺、Agent兴起、虚假信息扩散,李飞飞&斯坦福HAI对24年的AI预测
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。