Redian新闻
>
最新综述!3D生成进展的全面调研

最新综述!3D生成进展的全面调研

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【3D生成】交流群

扫描下方二维码,加入CVer学术星球可以获得最新顶会/顶刊上的论文ideaCV从入门到精通资料,及最前沿应用!发论文搞科研,强烈推荐!

论文题目:Advances in 3D Generation: A Survey

论文链接:https://arxiv.org/abs/2401.17807     

随着EG3D、DreamFusion和Instant3D的发布,3D生成技术实现了令人惊叹的建模质量并在全球范围内迅速普及。这些技术拓展了人们对生成式AI和神经渲染能力的认识。那么,这些先进的3D生成技术是如何构建方法论及路线图以生成高质量且多样的3D模型?它们又是如何结合3D表征和生成式AI技术实现人脸、人体和物体的生成、编辑以及其他创造性任务呢?我们的综述论文将会给您提供这些问题的答案。 

在本篇综述中,我们旨在深入探讨3D生成的方法论,并建立了包括三维表征、生成方法、数据集及相应应用在内的结构化路线图。我们希望通过该综述,能够引导读者们更全面地了解3D生成的相关方向以及最新进展。此外,我们还着重讨论了3D生成领域所面临的挑战,诸如如何确保生成的3D模型在质量、真实性和多样性方面达到更高标准, 以期推动3D内容生成领域的进一步发展。

在本综述的第一章中,我们首先介绍了3D生成的意义和相关技术的整体发展,并讨论了本论文的贡献和整体结构,便于读者快速定位相关研究问题。

图1  综述的主要结构,内容包括3D表示、3D生成方法、数据集和应用。

接下来本文介绍了主要神经场景表示。在3D生成领域中,采用适当的3D表示至关重要。生成过程通常涉及相关的场景表示和可微渲染算法。本文将场景表示分为三类分别进行介绍:显式场景表示、隐式表示和混合表示,并展示了相应的可微渲染方法(如光线投射、体积渲染、光栅化等),以便优化场景表示。         

图2  用于3D生成的主要神经场景表示以及可微渲染算法。

文章随后探讨了各种算法范式的3D生成方法,主要包括四个类别:前馈生成(通过前向传递中直接生成结果)、基于优化的生成(每次生成需要迭代优化)、程序生成(根据规则创建3D模型)以及生成式新视图合成(生成多视角图像)。基于这四个类别,本文描绘了生成技术的主要分支,以及相关工作和随后的发展。   

图3  3D生成的进化树,展示了3D生成方法的主要分支及其的发展。

在前馈生成章节,本文介绍了各类生成方法的模型,并按照这些模型分别进行了介绍。   

图4  用于3D生成的主要生成方法。包括 (a)生成对抗网络,(b)扩散模型,(c)自回归模型,(d)变分自编码器和(e)归一化流。     

文章也详细列出了用于3D生成的相关数据集,根据数据类型,发表年份,样本数量以及样本内容进行了整理。

此外,文章讨论了3D生成的各种应用,包含人体生成,人脸生成,场景/物体生成以及3D编辑。   

图5  3D生成的相关应用。

生成式AI和神经渲染技术的快速发展,使得高质量且多样化的3D模型得以生成,进而广泛应用于各类内容制作。这些技术的应用不仅丰富了娱乐产业,还为虚拟现实、增强现实、工业设计等领域带来了前所未有的创新。然而,随着3D生成技术的普及,如何确保生成的3D模型在质量、真实性和多样性方面达到更高标准,成为研究人员和技术人员面临的重要挑战。我们在最后阐述了3D生成领域潜在的挑战,并总结了文章的内容与贡献。

在CVer微信公众号后台回复:论文,即可下载论文和代码链接!快学起来!


3D生成和扩散模型交流群成立

扫描下方二维码,或者添加微信:CVer444,即可添加CVer小助手微信,便可申请加入CVer-3D生成/扩散模型微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。


一定要备注:研究方向+地点+学校/公司+昵称(如3D生成/扩散模型+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer444,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!


扫码加入星球学习


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
PLOS发布关于下一代COVID疫苗最新进展的新闻汇编【老照片】活动合集让3D编辑像PS一样简单!GaussianEditor:在几分钟内完成3D场景增删改!重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型两首《生命的阳光》LeCun转发!大连理工卢湖川、贾旭团队提出可插入图像/视频/3D生成的StableIdentity3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速可控图像生成最新综述!北邮开源20页249篇文献!免训练!单图秒级别生成AI写真,人像生成进入无需训练的单阶段时代个人感慨之六十六 双赢Stable Video 3D重磅开源!3D生成迎来新突破!个人感慨之六十七 蠢AVR收藏版综述 | 孙晓玉团队合作发表流感病毒广谱中和抗体研究综述上海际舟化学:核芯4D生物酶引领护肤新纪元Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」ICLR 2024 | Adobe提出DMV3D:3D生成只需30秒!让文本、图像都动起来的新方法!大模型如何用因果性?最新《大型语言模型与因果推断在协作中的应用》全面综述弥合2D和3D生成之间的次元壁!X-Dreamer:高质量的文本到3D生成模型一条命令生成属于自己的工具站(json格式化、编码转换、UUID生成等)绿卡升价!美国移民局「全面调整费用」最高涨价20倍!学会用ChatGPT,10s提炼文献重点,3分钟写完1篇综述!含实操演示【建议收藏】​249篇文献!北邮发布文本到图像Diffusion可控生成最新综述,已开源!腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法个人感慨之六十五 人体器官指导价格陶大程团队联合港大等发布最新综述:374篇文献全面解析大模型知识蒸馏Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩编码数据集生成框架 UnitGen 0.4.0:代码文档生成、测试代码生成Suno v3音乐生成模型发布,几秒钟生成完整歌曲;富士通用生成式AI加速药物研发丨AIGC日报绿卡升价!越排越久 美移民局全面调整费用 申请要多交$1600美元知名学者与顶级投资人领衔!视频、3D、音乐生成玩家都来了,中国生成式AI大会嘉宾阵容更新,4月开启!3D重建范式变革!最新模型MVDiffusion++:刷新视图合成和3D重建SOTA!警察突袭搞错地址?1岁婴儿被闪光弹烧伤,市长敦促全面调查!商务部稳外贸促消费;始祖鸟将全面调涨价格;英菲尼迪濒临退出中国市场... | 刀法品牌热讯
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。