斯坦福爆火机器人自爆失败内幕!炒虾做家务逗猫都是人类遥控的,AI厨师和女仆还很遥远
作者 | 王二狗
大家好,我是二狗。
这两天,想必大家都看到了斯坦福华人团队的 ALOHA 机器人爆火网络。
既能炒虾仁滑蛋、干贝烧鸡和耗油生菜:
又能洗衣服、扔垃圾、浇花做家务甚至还能逗猫猫,那叫一个厉害啊!
但事实上,以上展示的视频都是由人类远程遥控操控的!
而不是大部分人认为的机器人完全自主完成的。
人类遥控操控机器人的画面是什么样的?如下面擦玻璃的场景可以看出来,每一个动作都要由人在机器人背后操控才行:
机器人团队成员Zhao博士今天自爆了机器人在“自主情况下”失败的视频:
看完下面的视频你就能发现,没有人类的遥控操控,机器人只靠自己还是很笨的,红酒杯都拿不了,平底锅直接“翻锅”:
机器人能力被误会夸大
虽然该机器人研发团队在项目网站上有明确表明该视频是由人类远程操控的:
但团队研发成员Zhao博士最早在推特上宣传时并没有直接挑明这点:
而且机器人炒虾做饭场景的镜头很像是机器人自主完成的,看不出来有人类在后面遥控操控:
虽然在视频的结尾有出现机器人操作员的说明:
但很明显大部分人只关心视频前面吸人眼球的内容,并不会认真看到最后的细节,更不会去看项目网站和原论文。
种种原因就导致了视频在经过各种传播之后,该机器人的能力某种程度上被误会夸大了,大众会下意识认为ALOHA机器人能够完全自主地炒虾仁滑蛋、做家务逗猫等任务。
在zhao博士发布了失败视频之后,有网友表示感谢澄清,zhao博士也鼓励大家去项目网站看原论文。
Zhao博士还说,虽然失败,但这可能是他最喜欢的视频:
网友表示认可:
英伟达AI科学家Jim Fan今天也为此事做了澄清,并表示我们距离拥有完全自主的机器人厨师和女仆还很遥远。
一个非常重要的澄清:ALOHA机器人令人印象深刻的烹饪技巧不是独立自主完成的,而是由人类远程操控的。我们应该将 ALOHA 视为一款制作精良的跑车硬件。但高超的赛车技巧是由驾驶者展现的,而不是自动驾驶AI。
论文中有一些模仿学习的内容,但它还远远不能泛化到任意的厨房、物体、烹饪食谱或语言命令。我们距离拥有完全自主的机器人厨师或女仆还很遥远。
我对这项新研究感到兴奋,但我们需要从媒体炒作中看出真正的进展。
尽管传播过程中存在了一些误会,但不可否认ALOHA机器人本身还是有很多厉害之处的,下面是在ALOHA机器人在经过几十个样例的模仿学习后,能够凭自己自主完成的good case,可以说能做到这样的地步还是很牛的,详细演示可以在项目网站上查看。
项目地址:https://mobile-aloha.github.io/
虽然ALOHA机器人22万的成本比较贵,但它是完全开源的,要是再经过一段时间的成本降价后,还是能给人带来很多想象空间的。
视频传播误导大众这事,谷歌更擅长
这次ALOHA机器人传播事件怎么说都算不上视频造假,只能算是传播过程中存在了误会,但是要说起视频传播误导大众这事,明显谷歌更擅长。
想必大家都还记得上个月谷歌在发布Gemini模型的时候,展示出来的演示视频,那效果叫一个丝滑和惊艳啊!
然而,第二天该视频就被爆料展示的是精心挑选的好结果,而且视频并不是实时录制而是事后剪辑的。
后来谷歌也在一篇博客文章中解释了多模态交互过程,隐隐约约地承认使用静态图片和多段提示词拼凑,才能达成这样的效果。
谷歌最终承认Gemini视频是“剪出来”的,而不是实时互动进行的。
说起来谷歌,虽然在Gemini视频上有小心思,但在机器人方面,谷歌 DeepMind 昨天也趁热打铁,po 出了一系列关于智能机器人的前沿研究进展:
详细内容可以查看夕小瑶科技说文章:谷歌DeepMind发布机器人最新进展。
2024 可能真的是未来的机器人元年,让我们一起期待吧!
参考链接:
[1]https://twitter.com/tonyzzhao/status/1743378437174366715微信扫码关注该文公众号作者