ACM MM 2023 Workshop|多模态信息检索研讨会
点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
摘要:
信息检索 (IR) 是一项基本技术,旨在从文档、网页或其他来源的集合中获取信息。虽然传统的基于文本的 IR 取得了巨大的成功,但不同模式(即文本、图像、音频和视频)的各种数据源的利用不足会阻碍 IR 技术的全面发展,从而限制其在 IR 中的应用。真实世界。近年来,深度多模态学习的快速发展为推进多模态 IR 铺平了道路。受益于各种数据类型和模态,一些最新的流行技术被发明出来,以显示对多模态和 IR 学习的极大促进,例如 CLIP、ChatGPT、GPT4 等。在 IR 的背景下,深度多模态学习显示出突出的潜力 提高检索系统的性能,使它们能够更好地理解和处理它们遇到的各种类型的数据。鉴于多模式授权的 IR 显示出的巨大潜力,相关方向仍然存在未解决的挑战和悬而未决的问题。通过本次研讨会,我们的目标是为学者、从业者和其他感兴趣的各方提供一个讨论多模态 IR 的平台。
Workshop主页:
https://videorelation.nextcenter.org/MMIR23/
时间节点:
Paper Submission: July 6, 2023 (AoE)
Notification of Acceptance: July 30, 2023 (AoE)
Camera-ready Submission: August 6, 2023 (AoE)
Workshop dates: October 28, 2023 - November 3, 2023 (AoE)
主题:
可能的主题列表包括但不限于:
图像-文本多模态学习与检索;例如
- 视觉-语言对齐分析
- 多模态融合和嵌入
- 视觉-语言预训练
- 结构化视觉语言学习
-常识感知视觉语言学习
视频文本理解与检索;例如
- 视频文本检索
- 视频(语料库)时刻检索
- 视频关系检测
- 视频问答
- 视频对话
对话多模式检索;例如
- 对话中的多媒体预训练
- 多媒体搜索和推荐
- 多模式响应生成
- 以用户为中心的对话检索
- ChatGPT\&Visual-GPT 及以后的新应用
可靠的多模式检索;例如
- 可解释的多模式检索
- ChatGPT 等大型模型的典型故障
- 对抗性攻击和防御
- 新的评估指标
多媒体检索应用;例如
- 基于多模态的推理
- 未公开的图片说明
- 多模态信息抽取
- 多模态翻译
- 针对 IR 的面向意见/情感的多模态分析
提交:
页数不超过8页,限制包括图表和附录,但参考文献不限。提交的内容应以英文撰写,并根据当前的 ACM 两栏会议格式进行格式化。作者负责匿名提交。合适的 LaTeX、Word 和 Overleaf 模板可从 ACM 网站获得(使用 LaTeX 的“sigconf”会议记录模板和 Word 的临时模板)。
投稿链接:
https://openreview.net/group?id=acmmm.org/ACMMM/2023/Workshop/MMIR
点击进入—>【计算机视觉】微信技术交流群
最新CVPR 2023论文和代码下载
后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集
后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF
多模态和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-多模态或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如多模态或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲扫码或加微信号: CVer333,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!
▲扫码进星球
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看
微信扫码关注该文公众号作者