Redian新闻
>
大模型时代的计算机视觉!CVPR 2024线上分享会全日程公布

大模型时代的计算机视觉!CVPR 2024线上分享会全日程公布

公众号新闻


自从 OpenAI 发布 ChatGPT 以来,整个技术社区对大模型、AIGC 的关注越来越高。


大模型时代,计算机视觉(CV)领域的热点话题也在不断的发生着变化。


面对应接不暇的研究,我们如何才能以最快的时间了解 AI 领域的最新科研成果与发展趋势?参加顶会论文分享会就是一个不错的选择。


作为计算机视觉领域的顶级会议,CVPR 每年都会吸引大量研究机构和高校参会。据统计,今年共提交了 11532 份论文,2719 篇被接收,录用率为 23.6%。


为了给国内 CV 社区从业者搭建一个自由轻松的学术交流平台,机器之心计划于 2024 年 6 月 1 日 9:00-17:00 组织「CVPR 2024 线上论文分享会」,广邀 AI 社区成员参与学习。


本次论文分享会设置 Keynote、 论文分享环节,就业内关注的 CV 热门主题邀请顶级专家、论文作者与观众做学术交流。


今天,分享会全日程、Keynote 分享嘉宾及演讲主题正式公布。



Keynote 嘉宾及演讲主题


上午 Keynote 1:金小刚 数字人建模动画关键技术


分享人介绍:金小刚,浙江大学计算机科学与技术学院教授,博士生导师。浙江大学 - 腾讯游戏智能图形创新技术联合实验室主任,浙江省虚拟现实产业联盟理事长。第九届霍英东青年教师基金、浙江省杰出青年基金获得者,入选教育部新世纪优秀人才支持计划。在 ACM TOG (Proc. of Siggraph) 等国际重要学术刊物上发表论文 180 多篇。获省部级一等奖一次,二等奖二次。


分享摘要:数字人是近年来的研究热点,可广泛用于计算机动画、计算机游戏、虚拟主播、虚拟客服等领域。报告将介绍本人所在研究小组在视频肖像的胖瘦调整、肖像双下巴去除、肖像头发去除、用于睫毛抠图的数据集与基线方法、基于扩散模型的文生三维肖像、高精度人体运动神经求解器、实时人体运动补间等方面的一些最新研究进展。


上午 Keynote 2:朱俊彦 Enabling Collaboration between Creators and Generative Models


分享人介绍:Jun-Yan Zhu is an Assistant Professor at CMU’s School of Computer Science. Prior to joining CMU, he was a Research Scientist at Adobe Research and a postdoc at MIT CSAIL. He obtained his Ph.D. from UC Berkeley and B.E. from Tsinghua University. He studies computer vision, computer graphics, and computational photography. His current research focuses on generative models for visual storytelling. He has received the Packard Fellowship, the NSF CAREER Award, the ACM SIGGRAPH Outstanding Doctoral Dissertation Award, and the UC Berkeley EECS David J. Sakrison Memorial Prize for outstanding doctoral research, among other awards.


分享摘要:Large-scale generative visual models, such as DALL・E and Stable Diffusion, have made content creation as little effort as writing a short text description. Meanwhile, these models also spark concerns among artists, designers, and photographers about job security and proper credit for their contributions to the training data. This leads to many questions: Will generative models make creators’ jobs obsolete? Should creators stop publicly sharing their work? Should we ban generative models altogether?


In this talk, I argue that human creators and generative models can coexist. To achieve it, we need to involve creators in the loop of both model inference and model training while crediting their efforts for their involvement. I will first explore our recent efforts in model customization, which allows creators to freely control the model’s behavior by adding, altering, or removing concepts and rules. I will demonstrate several applications, including customizing models with multiple personal concepts and removing copyrighted content. I will then discuss our data attribution algorithm for assessing the influence of each training image for a generated sample. Collectively, we aim to allow creators to leverage the models while retaining control over the creation process and data ownership. 


下午 Keynote 1:芦清林 腾讯混元文生图的算法核心 ——DIT 架构解读


分享人介绍:芦清林博士,带领多媒体创作团队,负责腾讯混元文生图模型及广告创意 AI 算法研发工作。在计算机视觉,机器学习,AIGC 方面有丰富的研究经历,曾发表 10 余篇会议和期刊论文,数十项专利,支撑腾讯广告业务发展。


分享摘要:


1、趋势:视觉生成技术的新篇章 ——DIT

2、混元 DIT 三大升级

3、效果展示 & 定量分析 ——demo

4、全面开源


下午 Keynote 2:盛律 Multimodal Large Language Models Meets Embodied Agents


分享人介绍:盛律,北京航空航天大学 “卓越百人” 副教授,入选北航青年拔尖计划。研究方向是三维视觉、多模态大模型和具身智能。在 TPAMI/IJCV 以及 CVPR/ICCV/ECCV 等重要国际期刊和会议发表论文 50 余篇,含多篇会议口头报告或亮点论文。谷歌引用超 4900 次。担任 ACM Computer Surveys 副编,CVPR 2024/ECCV 2024/ACM MM 2024 领域主席等。主持或参与多项国家自然科学基金、科技部重点研发计划等项目。


分享摘要:在多模态大模型和生成模型的加持下,围绕具身智能体的研究工作从传统的抓取、导航等任务,扩展到在复杂多模态环境中通用交互任务的解决。在本次报告中,讲者将介绍面向具身智能体的多模态大模型及其多模态多任务高效微调方法,并以此为基础探讨在以 Minecraft 为代表的仿真环境中实现具身智能体的设计思路,和在真实环境下实现具身机器人泛化操作的有益尝试。最后,报告将展望端到端具身大模型,讨论其中的机会和挑战。


参与方式


此次线上论文分享会将在机器之心以及黄大年茶思屋两个平台进行直播,欢迎大家关注、预约。




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
《梦圆》&《貌美如花》“ 计算机视觉女神 ” 被 IEEE 期刊封杀CVPR 2024|让图像扩散模型生成高质量360度场景,只需要一个语言模型章文嵩、蒋晓伟、李飞飞、张凯巅峰对谈:大模型时代的数据智能新趋势中科曙光智能计算产品事业部胡晓东:大模型时代的AI全栈软件能力应用实践 | GenAICon 2024谈谈对哈佛斯坦福学生的印象IEEE“封杀”计算机视觉女神;微软被曝1000亿AI超算计划;OpenAI首个亚洲基地本月启动丨AIGC大事日报CVPR 2024 满分论文!LiSA:引入语义感知的激光雷达点云视觉定位网络CVPR 2024 | OmniParser:统一图文解析模型:文字检测识别、视觉信息抽取和表格识别深度探索大模型时代的软件架构最佳范式,攻略就绪、就等你来|ArchSummitCVPR 2024 | 通用视觉新突破!UC伯克利提出首个无自然语言的纯视觉大模型重磅!2024智源大会完整日程公布——全球大模型先锋集结会议推荐丨2024CMC-China博览会全日程曝光,贯通生物医药全产业链,限量门票免费领!李飞飞「空间智能」系列新进展,吴佳俊团队新「BVS」套件评估计算机视觉模型大模型时代的计算机视觉!CVPR 2024线上论文分享会启动视觉 AI 的「Foundation Model」,已经发展到哪一步?丨CVPR 2024 现场直击YSSNLP2024注册开放丨第二十一届自然语言处理青年学者研讨会全日程公开全日程发布|AI 大模型如何赋能智能网联车技术创新与产业应用?大模型时代的芯片机遇雨水字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024CVPR 2024 | 字节提出视觉基础模型:ViTamin,实现多项SOTA!CVPR 2024 中科院自动化所36篇入选!新主干/多模态/3D视觉/自动驾驶等全都有!美国文化探究,我喜欢的瞬间:首发日程公布!疾病建模、药物筛选、临床转化、保健医美等主题全覆盖!就在5月17-18日2024(第十五届)细胞治疗大会博士申请 | 南方科技大学张建国教授团队招收2024级计算机视觉方向博士生今日arXiv最热CV大模型论文:国产开源视觉大模型InternVL 1.5发布,赶超GPT-4V水准CVPR 2024 | 中大哈佛等提出全新训练方法CLoT,探究大模型幽默创新力今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理个人感慨之125 坏分子“计算机视觉女神”被IEEE期刊封杀CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题博士申请 | 中山大学网络空间安全学院苗嘉旭教授招收计算机视觉方向博士/实习生​CVPR 2024 | 迁移预训练生成模型中的知识到边缘小模型CVPR 2024 | 李飞飞和吴佳俊团队新作「BVS」套件评估计算机视觉模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。