Redian新闻
>
大模型与具身智能的火花,ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

大模型与具身智能的火花,ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

公众号新闻


Workshop主页:https://icml-mfm-eai.github.io/


概述


近年来,多模态基础模型(MFM),例如 CLIP、ImageBind、DALL・E 3、GPT-4V、Gemini 和 Sora,已成为人工智能领域最引人注目且发展迅速的领域之一。同时,MFM 的开源社区也涌现出了诸如 LLaVA、LAMM、MiniGPT-4、Stable Diffusion 和 OpenSora 等具有代表性的开源项目。


不同于传统计算机视觉和自然语言处理模型,这类 MFM 正在积极探索通用问题解决方案。通过引入 MFM,具身智能(EAI)能够在模拟器和现实世界环境中更好地处理各种复杂任务。然而,在 MFM 和 EAI 的交叉领域,仍有许多尚未探讨和解决的问题,包括智能体长期决策、智能体运动规划、新环境泛化能力等。


本次 Workshop 将致力于探讨几个关键问题,包括但不限于:


  1. MFM 的泛化能力;

  2. 用于具身智能的 MFM;

  3. 基于生成模型的世界模型;

  4. 模仿学习数据收集。


Workshop 征稿


该 workshop 聚焦于多模态基础模型(MFM)、具身智能(EAI)以及两项研究的交叉领域。本次征稿主题包括但不限于:


  • Training and evaluation of MFM in open-ended scenarios

  • Data collection for training embodied Agents

  • Framework designs for MFM-powered embodied agents

  • Perception and high-level planning in embodied agents empowered by MFM

  • Decision-making and low-level control in embodied agents empowered by MFM

  • Evaluation of the capability of embodied agents

  • Generative model as world simulator

  • Limitations of MFM in empowering EAI


投稿规则


本次投稿将通过 OpenReview 平台实行双盲审稿。投稿的正文篇幅为 4 页,参考文献和补充材料篇幅不限。


  • 投稿格式和模板遵循 ICML 2024 投稿指南:https://icml.cc/Conferences/2024/CallForPapers

  • 投稿入口:https://openreview.net/group?id=ICML.cc/2024/Workshop/MFM-EAI


时间节点


所有时间节点均为 [AoE] (Anywhere on Earth)。



MFM-EAI 挑战赛


三个赛道(可以同时参与)


  • EgoPlan 挑战

    

EgoPlan 挑战赛致力于评估多模态大模型在复杂的现实世界场景中,针对人类日常活动所涉及的真实任务的规划能力。在比赛中,模型需要依据开放式的任务目标描述、第一人称视角下的任务进度视频和当前环境观察,从多样化的动作候选集合中选择出最合理的下一步,以有效推进任务的完成。

    

  • 比赛官网:https://chenyi99.github.io/ego_plan_challenge/

  • 即日起 - 2024 年 7 月 1 日  通过填写 [Google 表单]报名参赛(https://docs.google.com/forms/d/e/1FAIpQLScnWoXjZcwaagozP3jXnzdSEXX3r2tgXbqO6JWP_lr_fdnpQw/viewform?usp=sf_link

  • 奖项设置


  • 冠军:800 美元

  • 亚军:600 美元

  • 创新奖:600 美元


  • Composable Generalization Agent 挑战


Composable generalization 挑战赛致力于评估由多模态大模型进行规划、low-level 控制器进行执行的组合系统在开放场景下的任务规划能力、任务执行能力和对 novel 场景、物体和技能的泛化能力。在比赛中,模型会根据语言形式的任务描述、多模态视觉输入(RGB 图片 + 深度图片),对任务进行拆解,并由控制器完成对拆解后子任务的执行。

  • 更多信息将于 7 月公布


  • World Model 挑战

    

World Model 挑战赛致力于评估 world simulator 在多种具身智能场景(机械臂,自动驾驶,Minecraft 等)中的应用表现。在比赛中,模型需要在不同具身智能场景下根据具身任务的描述以及实时场景观测生成一段符合任务指令的视频,评估将从:1)具身角度评价视频生成质量;2)视频指导 agent 产生控制信号完成任务两个角度进行。

  • 更多信息将于 7 月公布


委员会成员


Workshop组织者



指导委员会



联系方式


Workshop 相关问题



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
冰岛冰川泻湖(Glacier Lagoon),无声表达专访 OmniH2O 项目发起人何泰然:探索人形机器人遥操作通向具身智能的可行之路春季观鹤:2024 科州HANDS@ECCV24 手部研讨会和挑战赛,诚邀投稿和参与竞赛有不烦车子的自动停启功能的吗?2024 BMW X5上海内推 | ​上海人工智能实验室招聘多模态与具身智能方向算法实习生我参加了一个“床戏指导” workshop,这职业没你想象中性感让AI进入物理世界,首届中国具身智能大会展望智能新纪元多模态大模型+自动驾驶=?ECCV'24这场Workshop开启招募啦李小牧畅销书自传《歌舞伎町案内人》而闻名日本跑步看世界-奥兰多哈工深聂礼强:多模态大模型是具身智能发展的关键动力丨具身智能十人谈大模型、自动驾驶、具身智能最头部企业都用飞书英伟达 Jim Fan:具身智能的难点不是硬件,而是「Foundation Agent」愚人节(4/1/2024)戴盟机器人王煜:「具身技能」才能发挥人形机器人的作用 | 具身智能十人谈具身智能体三维感知新链条,TeleAI &上海AI Lab提出多视角融合具身模型「SAM-E」银河通用王鹤:让具身智能机器人“言出法随”,需攻克两大局限性丨GenAICon 2024直播 | 通用人工智能新路径:具身智能从空间智能到具身智能,跨维践行Sim2Real AI最高效路径AI应用、具身智能、大模型......「AI Partner氪话未来直播间」究竟聊了啥?狗引儿【长篇】(七十五)北京海淀出圈,14个大模型玩家论剑2024全球数字经济大会,仿生机器人大赛启动ICRA 2024:「具身智能」热度飙升,「学习」成机器人行业共识Best CD Rates Of April 2024: Up To 5.42%Ada Workshop 2024精彩抢先看,特别开放线上直播!生成式AI大会沸腾北京!从Sora到具身智能,25位大佬密集输干货WAIC2024三大趋势盘点:智能体、具身智能、算力风暴|亮马桥小纪严选大模型助力具身智能、电池研发与蛋白质研究,讯飞、深势科技、字节专家齐聚分享|AICon100%合成数据实现99.9%抓取成功率,通用具身智能技术公司「跨维智能」完成战略轮融资|36氪首发空间智能:能否成为具身智能技术的下一个里程碑?ICML 2024 | 清华提出DecisionNCE,用多模态表征预训练加速具身智能【友情转发】【TBA Workshop】从零开始, 建立你的个人网站!从WAIC2024看人工智能三大趋势:智能体、具身智能、算力风暴《面向具身智能的视觉-语言-动作模型》综述42、长篇家庭伦理小说《嫁接 下》第十四章 缘起缘灭(3)2024,哪个包会是LV的断货王?李开复提出「PMF 不再适用大模型 AI-First 创业,要追求 TC-PMF」,如何理解?AI Pioneers|星海图高继扬:人形机器人不是具身智能的唯一答案深入研讨语言模型中知识的生命周期,ACL 2024 Workshop征稿启动
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。