Redian新闻
>
马斯克机器人大进化!全新技能解锁,启用端到端神经网络

马斯克机器人大进化!全新技能解锁,启用端到端神经网络

公众号新闻
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

马斯克的机器人大进化。

一年前首次上台时动作还略显僵硬,现在居然成了瑜伽大师

还用上了自动驾驶系统同款的端到端神经网络架构,无需任何规则代码就学会分拣物品。

用马斯克自己的话说:

光子进,行为出。

网友表示:动作如此优雅流畅,很难相信视频是真的。

马斯克回复:执行器、传感器和整体机械结构更多升级还在后面。

有人注意到机器人脖子后面有个红色按钮,“如果机器人要统治世界了,别忘了按这个”。

对此,马斯克表示会致力于最大限度地提高安全性,用遥控器或手机就能轻松暂停机器人

马斯克发这个视频,除了公布进展,更大的目的在于为机器人团队招聘,也展示了𝕏平台的招聘功能。

这次特斯拉机器人团队招聘各类硬件工程师及机器学习工程师、实习生,总计51个职位。

年薪范围在8万美元到36万美元(约人民币60万元-260万元)。

动图拆解

这次特斯拉擎天柱官方号只放出1分钟视频,没有更多技术细节资料。

但特斯拉机器人团队资深主任工程师Julian Ibarz透露,现在擎天柱已经能完成长期任务。

并且只要收集更多数据,就可以训练新的复杂任务,无需更改任何代码。

第三方观点中,最详细的是英伟达科学家范麟熙纯基于视频的长篇逆向分析。

他推测:

  • 流畅的手部动作几乎肯定是通过模仿人类(行为克隆)训练出来的。

另一种选择是模拟环境中的强化学习,但通常会导致抖动和不自然的手部姿势。

至少有4种方法可以收集人类演示数据,其中最有可能的是远程控制。

可以参考斯坦福开源的ALOHA系统,可以控制机械臂把AirPods放到充电盒里。

另外三种方法是电影游戏常用的动作捕捉、深度摄像头和计算机视觉、VR模拟。

四种方法并不相互排斥,可以结合使用兼顾不同的优缺点。

  • 神经网络架构,很可能是多模态Transformer。

图像、视频、动作、语言(不确定有没有)统一表征,其中动作部分需要将连续的信号转为离散的token,

最终每次输入一个视频token(或可选的语言token),输出动作token。

最接近的系统可以参考Google RT-1以及英伟达的VIMA。

  • 波士顿动力的Atlas机器人只有简单的抓手,而特斯拉擎天柱有5根灵巧的手指,将来在日常任务中表现会更加出

不过也有人批评视频其实有约2-3倍的加速,只有机器人的时候看不出来,人类一出镜就比较明显了。

端到端架构:机器人的ChatGPT

端到端神经网络架构,特斯拉首先在自动驾驶FSD上实现——

前不久马斯克自己直播演示了一把自动驾驶去小扎家,引发轰动。

具体说来,端到端架构用在自动驾驶系统上,可以减少30万行规则代码,让运行速度快了10倍

负责该项目的工程师Dhaval Shroff曾对马斯克说:这相当于车上用的ChatGPT

Shroff这次对机器人的评价是“端到端,FTW”。也不知道FTW是指“For the win”还是“F* the world”。

就在刚刚,还有一段特斯拉汽车无导航情况下在湖边自动驾驶的视频传出,不过不确定是否运行了最新端到端架构的FSDv12。

One More Thing

这个周末,旧金山街头也出现赛博皮卡的身影。

预计在9月底,特斯拉将召开一年一度的AI Day活动,我们也会持续关注。

不知道这次又将带来哪些惊喜。

参考链接:
[1]
https://x.com/Tesla_Optimus/status/1705728820693668189
[2]https://x.com/DrJimFan/status/1705982525825503282
[3]https://x.com/AviSchiffmann/status/1705743064336384506

「量子位2023人工智能年度评选」开始啦!

今年,量子位2023人工智能年度评选从企业、人物、产品/解决方案三大维度设立了5类奖项!欢迎扫码报名  

最具影响力的年度智能商业峰会MEET 2024智能未来大会已启动!点此了解详情


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
预训练通用神经网络CHGNet,实现基于电荷的原子模拟马库斯总结16项「可信AI」要求,符号主义+神经网络携手打造AGI!40年前的Cyc成版本答案用别的模型权重训练神经网络,改神经元不影响输出:英伟达神奇研究ICML 2023 | 英伟达神奇研究:用别的模型权重训练神经网络,改神经元不影响输出!土耳其索菲亚大教堂挑战英伟达H100霸权!IBM模拟人脑造神经网络芯片,效率提升14倍,破解AI模型耗电难题特斯拉「擎天柱」机器人视频爆了!端到端AI大脑加持,挑战高难度瑜伽减肥困难的原因找到啦!Nature研究揭示肥胖损害人类海马体中的促食欲神经网络,或为极具潜力的肥胖治疗新靶点!5123 血壮山河之武汉会战 富金山战役 11ICML 2023 | 英伟达神奇研究:用别的模型权重训练神经网络,改神经元不影响输出特斯拉官方解释:FSD不使用高清地图,靠的是神经网络和海量数据🤤因为喝醉酒解锁的新技能:Nat. Commun.: 机器人模仿蝌蚪进化获得新技能!吴雷钧博士:A.I.神经网络赋能营销新玩法(I) | 深度观点跨越周期:进化、进化、进化!图神经网络还有搞头?对抗“机器人大军” 马斯克拟向“X”所有用户收费LLaMA 2端到端推理打通!来自中国团队MIT研究人员将Transformer与图神经网络结合,用于设计全新蛋白质上海交大团队发现频率原则,开启理解神经网络的新方向ICML 2023 | 神经网络大还是小?Transformer模型规模对训练目标的影响马斯克直播试驾特斯拉FSD V12!世界首个端到端AI自动驾驶,1万块H100训练深度神经网络压缩与加速技术当我们说起神经网络的等变性,我们在谈论什么?工作重要,还是妻子重要原创《思考陆扬的“晚唐清流文化”》单点端到端文本检测识别框架速度提升19倍!华科、华南理工等联合发布SPTS v2首富的傲娇和价值观NeurIPS 2023 | 结合脉冲神经网络和Transformer的纯加法Transformer大规模神经网络优化:神经网络损失空间“长”什么样?人形机器人成新风口!探馆世界机器人大会:"机器人+制造业"国产替代加速AI生图太诡异?马里兰&NYU合力解剖神经网络,CLIP模型神经元形似骷髅头最后机会|《数据/商业分析求职实战营》马上开课,三大跨行业名企实战项目,拓展视野,提升端到端项目完成能力!「专题速递」JPEG AI、端到端图像编码的标准化及产品落地、深度学习​ICLR 2023 高分论文 | 基于子图草图的图神经网络用于链路预测
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。