Redian新闻
>
AI无人机竞速击败人类冠军,Nature封面:将AlphaGo成果带到物理世界

AI无人机竞速击败人类冠军,Nature封面:将AlphaGo成果带到物理世界

公众号新闻
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

AI再一次击败人类世界冠军,登上Nature封面

与上一次AlphaGo下围棋不同,这次不是脑力运动,而是在真实物理环境中的竞技体育项目——“空中F1”无人机竞速

与AlphaGo也有相同之处,核心技术都是深度强化学习。

成果来自苏黎世大学,作者之一Davide Scaramuzza认为,这是国际象棋的深蓝、围棋的AlphaGo之后的又一大突破。

这标志着自主移动机器人首次在为人类设计由人类设计物理环境体育运动中击败人类冠军。

微软高级研究工程师Shital Shah认为这比AlphaGo更难,也更难获得认可,但仍是历史性的里程碑。

深度强化学习,又一次胜利

先介绍一下这个运动项目:FPV(第一人称视角)无人机竞速。

人类选手会通过机载摄像头传输的视频,从无人机的视角观察环境,穿越障碍。

赛道由七个方形大门组成,每一圈都必须按顺序通过。要赢得比赛,参赛者必须连续领先对手完成三圈

两台无人机同时出发,正面对决,最高速度可达每小时100公里,同时承受数倍于重力的加速度。

这次与AI同台的是2019年无人机竞速联盟世界冠军Alex Vanover、MultiGP国际公开赛世界杯冠军Thomas Bitmatta和三届瑞士全国冠军Marvin Schaepper。

对AI来说,要达到专业人类选手的水平非常有挑战性,因为无人机需要在物理极限下飞行,同时仅通过机载传感器估计速度和位置。

为解决这些挑战,苏黎世大学设计了Swift,由两个关键模块组成:

  • 感知系统,将高维视觉信息和惯性信息转换为低维表示。

  • 控制策略,感知系统产生的低维表示并产生控制命令。

其中,感知系统主要是一个VIO(Visual-Inertial Odometry)模块,同时利用视觉和惯性传感器对自身定位和对环境建模。

VIO估计与神经网络相结合,用于检测障碍门的四个角点。

控制策略是一个前馈神经网络,使用无模型的On-policy深度强化学习进行模拟训练,奖励目标结合了向下一个门的中心前进,和保持下一个门在摄像机视野内。

为了弥合模拟和物理世界之间感知和动力学上的差距,使用了从物理系统中收集的数据,驱动一个MLP残差模型。

在比赛开始前,人类选手在指定赛道上有一周的练习时间,赛道包含“Split-S”等高难度机动动作。

具体规则还有:由声学信号(发令枪)开启比赛,如果发生碰撞也可以继续比赛,如果两架无人机都坠落则飞得远的获胜。

最终在与三位人类选手的比赛中,Swift分别拿下了9局5胜,7局4胜,和9局6胜的成绩。

在Swift输掉的比赛中,有40%是因为与对手发生碰撞,40%是因为与门发生碰撞,20%是因为速度比人类慢。

Swift还在比赛中取得最快记录,人类选手的最佳时间领先半秒。

在累计300圈的数据中,Swift平均时间更短,方差更低,代表AI每圈都稳定追求更快圈速。

而人类则会在自己领先时保持一个较慢的速度,降低碰撞的风险,表现出更大的方差。

这也体现出当前的Swift系统无法得知对手的情况,在领先时不够稳,落后时又不够浪。

AI与人类选手,哪里不同?

在论文中,团队还讨论了AI与人类选手的更多对比。

首先,Swift利用了机载惯性传感器,这类似于人类的前庭系统。

但反而是人类在这个项目上无法使用前庭系统,因为他们不随无人机一起移动,感受不到加速度。

另外,Swift的传感器延迟更低为40毫秒,专业人类选手平均能做到220毫秒。

但Swift的摄像头刷新率有限,只有30Hz,人类使用的摄像头则120Hz。

最后,人类有更高的韧性。

比如即使在全速坠机了只要设备没坏就能继续比赛,但Swift没有接受碰撞后恢复的训练。

如果改变比赛现场的光照环境,Swift的感知系统就会失效。

作者认为,这项研究可能会激发在其他物理系统(例如自动驾驶汽车、飞机和机器人)中跨广泛应用部署基于混合学习的解决方案。

论文地址:
https://www.nature.com/articles/s41586-023-06419-4
参考链接:
[1]
https://x.com/davsca1/status/1696938013421429111

报名开启!9月6日

「具身智能前夜」仿生机器人沙龙
9月6日 14:30,量子位智库行业沙龙「具身智能前夜」将为你解读仿生机器人的崛起与挑战,邀请到来自云深处科技、帕西尼感知科技、大象机器人等企业代表,聊聊仿生机器人行业最新趋势~

后台回复「仿生机器人」,报名线下参与仿生机器人行业沙龙 


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
刺激,无人机竞速超越顶级人类玩家,强化学习再登Nature封面刘永好:将中国企业精神带到“一带一路”;金山办公与科大讯飞达成战略合作|绿研院日报韩国版哈比自杀无人机亮相!韩国ADEX2023展会展出多种新型无人机免费领 | BBC经典动画片,孩子也能看的懂的哲理—《雨果带你看世界》52集全Nature | 人类基因BTN3A3可以防止大多数禽流感病毒变种跳跃到人类中莫斯科再遭无人机袭击、美军重启战机竞赛、故宫辟谣600年不积水等丨今日天下Meta重磅更新,小扎在元宇宙里养了会做家务的狗!人形化身超逼真,AI智能体在真实物理世界和人互动Nature封面:AI提高自动驾驶夜视能力,检测黑夜、雾天场景和白天一样华为Mate 60、苹果iPhone 15纷纷加单,高端智能手机竞争加剧文心一言登顶 Apple Store 免费榜 / AI 在无人机竞速中战胜人类冠军 / 茅台瑞幸将上线联名款酱香拿铁“物理网红”张朝阳重庆大学讲物理:现代人需要对物理有所了解德扑AI之父转投OpenAI!Science封面研究大牛,顶会拿到手软历史名城耶路撒冷explain benefits of focusing on underrepresented groups in colle击败3位人类世界冠军,登上Nature封面!AI无人机极限竞速开启自动驾驶新纪元传《安乐传》711播出多家大模型首批通过备案向公众开放;AI在无人机竞速领域战胜人类冠军;OpenAI有望实现10亿美元年收入|AIGC周观察第十七期一文看懂什么是物联网预言机:DePIN的重要基石,连接物理世界与Web3.0的桥梁Alphabet旗下Wing与沃尔玛合作 在达拉斯开展无人机送货业务MLPerf放榜,中国AI芯片公司再获世界第一!大模型推理三项冠军,性能超越H100首批AI大模型获批上线,BATH在列;华为Mate 60开售即火,接入盘古大模型;AI操控无人机能力超越人类冠军丨AI周报算法操控2020美国总统大选登Science封面!Meta首次祭出4篇研究,自证清白,两极分化无解𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶内衣裤,软弹有度,上身0束缚~诺贝尔物理学奖揭晓:超快科学和阿秒物理——人类探究微观世界的利器自动驾驶新方法登Nature封面:让黑夜如白昼般清晰,浙大博士一作上百架无人机表演中紧急坠落:无人机使用规则亟待清晰化长篇小说《如絮》第一百四十八章 哈尔滨-1960年 山雨欲来AI机器识别突破登Nature封面,加速第四次工业革命,论文一作为浙大校友推广|| 双11买秋冬外套必逛这家!质感好到物超所值1篇Nature和两篇Nature子刊揭示血液因子PF4让大脑返老还童之谜英国皇家工程院国际院士、欧洲科学院院士许彬:未来虚拟世界将以沉浸式方式与物理世界共存双林奇案录第三部之川黔连环案: 第三十八节与AIoT结合是GPT大模型从数字世界走向物理世界的必经之路朝鲜7·27阅兵展示无人机,韩军将装备反无人机枪Nature:揭示人类冠状病毒进入宿主细胞之谜
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。