Redian新闻
>
斯坦福超火机器人大翻车!研究者自曝内幕

斯坦福超火机器人大翻车!研究者自曝内幕

科技新闻

爆火的斯坦福全能家务机器人Mobile ALOHA

,大!翻!!车!!!

你以为它擦个红酒轻而易举,但实际上却是这样的:

全给你弄撒喽,顺带碎个杯子

……

你以为它能化身大厨娴熟烹炒,结果给你上演一个炒锅底:

Mobile ALOHA的翻车大合集还不止这些。

例如刚才炒完虾的锅,哎呦喂,一不小心没拿住:

即使小哥一个箭步冲上去也没阻止“悲剧”的发生(好像还烫到手了)。

这画面,真是像极了庄嫂摔碗……

昨天还在“神坛”上的Mobile ALOHA,一夜之间便被曝出了这么多“笨手笨脚”的样子,也是引来不少网友的围观。

然而,这次即使面对翻车铁证,网友们的画风却是一反常态:

它并不完美,不过很可爱。

总会有犯错的余地。

最重要的是:

放心了。(手动狗头)

这到底是怎么回事?

斯坦福团队自曝“丑闻”

原来,这段机器人大翻车的视频,就是由斯坦福Mobile ALOHA的作者Tony Z. Zhao发布的。

并且他还直言不讳地说道:

机器人还没有做好准备接管这个世界。

而这段翻车视频,正是机器人完全在自主模式下所犯的。

用作者的话来形容,就是“最愚蠢的错误”。

毕竟除了刚才我们展示的几个例子之外,Mobile ALOHA甚至连锅都放不进橱柜里:

炒完的虾粘锅倒不出来不说,连碗的位置也找不到:

拿支笔也没法找对位置下手:

面对失败合集,作者却是打趣道:

这是我目前为止最喜欢的视频了,(不过)当机器人在你面前犯错的时候,你就不会觉得那么有趣了。

确实,毕竟手都被烫了……

不过作者今天自曝这段视频其实应该还有另外一个原因。

因为前两天Mobile ALOHA神级现场的视频确实引来了不小的关注度,不过很多人误以为这是它在自主模式下完成的。

但其实,Mobile ALOHA采用的是混合模式,并非完全自主,作者也呼吁网友们在吃瓜的同时认真看下论文和代码。

值得一提的是,作者还引用了2015年波士顿动力Atlas人形机器人“翻车合集”并向它致敬。

或许这也正如英伟达科学家Jim Fan说的那样:

一步一个脚印。

学习50次,成功率能到90%

就在这两天,Mobile ALOHA团队连续放出三个爆火视频,展示了该机器人敏捷灵巧的家务能力,看呆网友。

包括做满汉全席(磕鸡蛋、给鸡肉翻面这种细活都信手拈来):

套枕套铺床单:

浇花、拖地板、开瓶盖,甚至逗猫猫:

那叫一个人模人样,上得厅堂下得厨房。

不过,大部分都是真人操控的,比如上面这些。

更直观的可以看下面这个抽纸擦玻璃的动图,背后直接站了个人类1:1示范:

不过,对于一些相对简单的任务,例如这个单炒虾仁:

还有刷锅、将餐椅归位、呼叫并乘坐电梯、擦桌子等等,只需真人少量示教,它就可以学会,然后脱离人类进行自主操作。

具体而言,作者介绍,上面这些简单动作目前只需要学习50次就可以做到90%的成功率——

经测试,Mobile ALOHA可以连续9次擦干倒洒了的酒、连续呼叫5次电梯都不会出错,能够保持一定的稳定性。

除此之外,它还能抗干扰,在完成归置锅具到柜子之中时,实验人员不停向它面前投掷杂物,都完全没有影响它发挥:

在训练期间根本看不见的椅子?它也能准确识别并完成归位任务。

那么,作者是如何仅通过50个演示就让Mobile ALOHA实现自主任务的呢?

最关键的是通过ACT或扩散策略进行模仿学习,然后和静态操作数据一起对机器人系统进行联合训练。

有了这一联合训练方式,机器人的性能可以显著提高,尤其是那种需要精确操作的任务。

最后,也再次为介绍一遍斯坦福大学的这个机器人成果:

它于今年3月底正式发布,历经了8个月的迭代和2个月的测试。

一共三位作者,其中两位为斯坦福计算机科学专业的华人博士生(最后一位是导师):

当时的这位机器人,就已经能够利用工具完成各种精密细活了,只不过只能在固定的位置:

当然,背后也是真人遥控的。

而正如其名ALOHA全称是“???? ????ow-cost ????pen-source ????????rdware System”,这款机器人主打的就是开源和低成本:

全部软硬件设计包括代码和数据都一并发布,而搭建这一个系统“只”需3.2万美元(约合22.7万人民币),具体需要哪些硬件,作者还列了个清单,感兴趣的朋友可以照着DIY。

机器人元年?

几乎和斯坦福的爆火机器人同一时间,谷歌也发布了自家最新的研究成果,并且是一气发了仨:

一个是将机器人决策速度提高14%,同时保持操作准确率不变并增加了10.6%的改进模型;

一个是专攻泛化能力的新框架,用了一种全新方法让机器人完成从未见过任务的成功率从29%提升至63%;

以及一个可以同时容纳20个机器人的收据收集系统,将用于加快机器人理解人类指令的能力的训练。

这些新成果全部用于升级谷歌的机器人大模型RT-2。

和斯坦福的Mobile ALOHA对比起来,谷歌的RT-2表现还是高冷一些,但它所有效果都是全自主的。

除了这两家,李飞飞团队也一直在跟进,其名为VoxPoser的机器人系统也已经可以听懂人话完成各种指令,并且无需额外训练。

这不由地让人想到,不少人那句“2024会是机器人元年”的预言:

你觉得会成真吗?

参考链接:

戳这里提交新闻线索和高质量文章给我们。
来源: wenxuecity
相关阅读
骚乱大爆发! 全美高校冲突升级, 斯坦福超300人罢课…全球首个OpenAI机器人诞生!Figure 01碾压马斯克擎天柱,10亿机器人大军正式启动笑喷了!加拿大Costco春节年货新品大翻车!华人集体炸锅GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智日本小林制药大翻车!保健品已致1人死亡,更有食品、饮品也中招!武汉商场惊现女子裸奔,警方介入,知情人曝内幕,律师称违法高管朋友圈自曝内部矛盾 ,这家公司业绩下滑又遭“内讧”扰动斯坦福爆火家务机器人升级二代!双手稳到能偷钱包,成本降至19万波士顿动力抛弃液压机器人Atlas,推出全新电动化机器人,动作超灵活波士顿动力转向纯电机器人,电动为什么是机器人唯一方向?国产大模型卷翻机器人!这些火遍全网的机器人,都装上了星火「大脑」传马斯克 AI 公司将获 60 亿美元融资;谷歌一季度净利润增 57%;「喷火机器狗」开售,1 万美元抱回家 | 极客早知道顶尖AI研究者,中国贡献26%:全球人才智库报告出炉全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报给某些历史研究者科普:直立人不是中国人的祖先苹果跨时代新品大翻车?!Apple Vision Pro这视频效果,把网友看懵了...苹果跨时代新品大翻车?Apple Vision Pro这视频效果,网友笑拉了!苹果跨时代新品大翻车?Apple Vision Pro 10天内卖出20万台GPT-4/Gemini大翻车,做旅行攻略成功率≈0%!复旦OSU等华人团队:Agent不会复杂任务规划红毯大翻车,她身材怎么这么虐了?
原创公众号
校庆日将至,北大欢迎你斯里兰卡|康提:七年后的旧地重逢,我拿起几朵莲花,用最真挚的心献佛最新研究报告解读:星链已与全球15家运营商合作卫星通信判例译析 | 环联公司案深度解析:董事信义义务标准的建构与反思细思恐极的侠客行MJ11-权力的游戏角色卡牌创作手记(上)个人可以买地建房,自行设计施工,产权还独立!这个城市要放大招了恒大地产,欠税752万余元!34年最低,日元极速贬值还将持续多久?马斯克首次抛出特斯拉全生态系统;美国高校反战浪潮会冲击拜登选情吗?|一周国际财经杨晓明被罢免!他带队研发新冠灭活疫苗,曾“以身试药”,9个月抽约60管血以太坊现货ETF悬了吗?纪云浩书记,越扒越有意思!2024牛剑夏令营2周,适合14-18岁,第二期招募啦!预算吃紧?背景一般?推荐3所高性价比的英国大学!G5终于疯了!2025本科入学要求集体上涨!新增专业、入学笔试调整,申请难度再升级...艺术生进“体制内”,哪些专业更有优势?被骗150万!22岁中国女留学生在澳失联,现身泰国,又是虚拟绑架!我们往春天里赶,看六载美育花开每天300个俯卧撑,一个月之后会怎样??你上的哪里是大学,不过是大一点的小学头痒头屑出油多,用它就对了!女友遭技师亲犯45分钟,身旁男友却未发觉,现场视频曝光,网友:为什么不喊?活该!突发!母女二人双双失联!突发!一中学生跳楼身亡?紧急通报:确诊1例!布林肯结束访华,中美达成五点共识谁能挑战英伟达?存款继承手续简化:限额提至5万元,新增黄金国债理财行业观察|引领下一个十年,乳业新质生产力正加速形成行业观察 | 营收135.12亿,正增长的居然之家要当传统家居挑战者
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。