Redian新闻
>
西工大提出全新「群聊式」无人机控制框架!类人对话交互、主动环境感知、自主实体控制

西工大提出全新「群聊式」无人机控制框架!类人对话交互、主动环境感知、自主实体控制

公众号新闻



  新智元报道  

编辑:LRS
【新智元导读】在线群聊极大地方便了人们的沟通方式,能否把机器也拉进群,让它们组团商量着干活,并和人类无障碍地沟通和交流,更好地服务于生产生活?

 

超强的泛化能力,让大模型成为「通用人工智能」的一缕曙光。

 

然而,读万卷书,不如行万里路,在开放环境中,大模型需要真正地「走」进物理世界,才能切实地理解复杂任务、解决实际问题。

 

近日,李学龙教授团队在开放环境中的自主无人机集群方面开展了创新研究,基于国产大模型,实现了开放环境下「人机」和「多机」的对话交互,打破人类和机器的交互壁垒,进一步拓展了临地安防的应用场景,让大模型插上翅膀,飞入我们的现实生活中。



受人类的认知模式启发,团队将认知形成的高度自主性凝练为「思维计算—实体控制—环境感知」的三元交互,建立了「书生·浦语」开源大模型驱动的自主无人机「群聊式」控制框架,给每架无人机装上了大脑,让无人机集群在语言沟通中动态协同,实现了开放环境和复杂任务中的智能交互、主动感知和自主控制,提高了无人机任务执行的自主性。

 

总体而言,类人对话交互、主动环境感知、自主实体控制,是自主无人机集群的主要能力。

 

类人对话交互

 

图1 无人机群聊沟通

 

探索人类用户与无人机的交互方式,让无人机理解复杂任务中的用户需求,是实现自主无人机的前提条件。

 

针对此,团队提出「群聊式」对话交互方法,将声音、图像和无人机自身状态等多种信息,通过大模型转换为自然语言的对话形式,实现了用户与无人机,以及无人机与无人机之间自主和直观的交互方式。

 

同时,团队设计了一套高效的实时反馈机制,使得无人机能够在任务执行的关键节点通过对话报告自身状态、寻求用户确认,大大提高了复杂任务执行的稳定性和安全性。

 

主动环境感知


 图2 主动发现并靠近目标

 

图3 动态环境避障


在飞行过程中,无人机主动感知外部环境,实时调整任务规划,是完成复杂任务的关键环节。

 

针对此,团队设计了任务引导的主动感知机制,提出了多传感器融合的低空搜索、动态避障和视觉定位算法。

 

在实际任务执行中,根据感知信息和任务目标,动态调整无人机飞行路径和观测位姿,尝试从不同角度和位置感知周围世界,逐渐降低环境中的不确定性,实现高效的信息采集和任务执行。

 

自主控制

 

图4 自主目标抓取

 

图5 异构无人机集群协同控制


探索复合智能体形态,增强复杂任务处理能力,是大模型时代新型智能体的研究重点。

 

针对此,团队依托无人机平台设计了夹爪等末端执行器,将传统无人机拓展为「飞行机器人」,长出「手」来,具备抓取能力。

 

同时,构建了异构无人机集群协同控制机制,结合环境感知反馈,实时调整无人机编队的飞行状态,使集群分工执行区域搜索、目标定位和抓取等任务。

 

大模型自主无人机集群是团队将生物智能「思维计算—实体控制—环境感知」的三元交互模式应用于自主智能体的一次成功尝试,依托大语言模型、无人机平台和多种传感器,实现对话交互、主动感知和自主控制,对安防巡检、灾害救援、空中物流等临地安防场景下的应用具有重要意义。


参考资料:
李学龙, 临地安防(Vicinagearth security), 中国计算机学会通讯, 18(11), 44-52, 2022.




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
网攻西工大的黑客身份被锁定!这款软件是网络间谍武器→新证据!网攻西工大的黑客身份被锁定→韧性成长24年,邯郸新世纪中心找到了新「生活方式」把ChatGPT塞进副驾驶!清华、中科院、MIT联合提出Co-Pilot人机交互框架北大提出RestGPT框架,通过RESTful API控制真实应用的Agent别用GPT-4直出文本摘要!MIT、哥大等发布全新「密度链」提示:实体密度是摘要质量的关键黑科技自清洁蓄能衣!免搓洗一冲即净,蓄能保温又透气,温度感知、NFC!美方网攻西工大再添新证!“二次约会”软件是关键成果产业化项目路演第二期:人机交互、脑机接口、工业自动化、全固态电池4四个早期项目 | 路演限时报名中A股绿色周报|15家上市公司暴露环境风险,江特电机控股公司被罚513万元网攻西工大黑客身份被锁定!早报|官方回应“北极鲶鱼事件调查结果不公开”;iPhone 14价格不降反涨;央行降准0.25个百分点;网攻西工大黑客身份已锁定扒一扒航拍和无人机的历史,这些无人机你都听过吗?卫网君:清华震撼世人的EUV光刻厂方案?让子弹再飞一会儿;网攻西工大的神秘黑客身份已被锁定;美持续炒作对华科技制裁,效果适得其反LLM准确率飙升27%!DeepMind提出全新「后退一步」Prompt技术清华&港大提出LanguageMPC:将大语言模型和MPC相结合的新型类人智驾系统鸢尾花,静静观赏ICCV 2023 最佳论文候选!北大提出UniDexGrasp++:基于几何感知课程和迭代通用-专家策略学习的灵巧手抓取算法火星乐园第三部《灰界》第五十章 彩虹之心“向后看”和“回不去”自主研发!西工大为水下无人潜航器戴上AI眼镜……听,教育早新闻来了把ChatGPT塞进副驾驶!清华、中科院、MIT联合提出Co-Pilot人机交互框架:完美把控乘客意图新证据!网攻西工大的神秘黑客,身份已被锁定→浙大提出KnowPAT框架:大模型的知识偏好对齐与垂域应用墨西哥展出疑似“外星生物”遗骸、美方网攻西工大再添新证、李在明绝食15天等丨今日天下新证据!网攻西工大的神秘黑客身份被锁定LLM准确率飙升27%!谷歌DeepMind提出全新「后退一步」提示技术后门准确率降至3%,主任务性能几乎不变!华工JHU提出全新「联邦学习后门攻击识别」解决方案|ICCV2023老海归和她的洋老公首个精通3D任务的具身通才智能体:感知、推理、规划、行动统统拿下网攻西工大的神秘黑客,身份已被锁定!很多种业余参与都可以点赞,唯独这个不行 !工业异常检测大模型来了!哈工大提出Myriad:利用视觉专家进行工业异常检测的大型多模态模型韩国版哈比自杀无人机亮相!韩国ADEX2023展会展出多种新型无人机ICCV 2023 | 即插即用!上海交大提出AccFlow:跨帧光流估计框架
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。