Redian新闻
>
AI生成3D主题乐园,角色建筑批量生成,风格保持一致 | SIGGRAPH 2024

AI生成3D主题乐园,角色建筑批量生成,风格保持一致 | SIGGRAPH 2024

公众号新闻
王振伟 投稿
量子位 | 公众号 QbitAI

最少只需1个3D样例,即可生成3D主题乐园。

来自香港城市大学、上海人工智能实验室和南洋理工大学S-Lab的研究人员提出了一种名为ThemeStation的新颖框架。

它可以从少量3D样例中生成主题一致的高质量3D画廊。

还能基于文本控制,生成想要的3D资产。比如“穿正装的猫头鹰”。

要知道,虚拟世界和游戏等应用中,常常需要大规模主题一致的3D模型,如古城中的建筑群、虚拟生态系统中的怪物阵容。

尽管一位资深3D建模师可以创作出若干主题一致的作品,但要创建大规模内容丰富、风格一致的3D画廊却是一大挑战。

即便最近的3D内容生成(3D AIGC)在文本到3D、图像到3D等领域取得了长足进展,大大降低了3D内容创作的门槛。但由于输入模态中3D信息有限,它们仍然存在3D模糊和不一致的问题,且无法充分保证与输入样例主题的一致性。

因此研究人员提出了这项工作。目前该论文已被SIGGRAPH 2024接收,方法已开源。

由主题驱动的3D到3D生成

ThemeStation的主要贡献包括:

  • 提出了一种用于主题驱动3D到3D生成的两阶段框架,其目标是仅从一个或几个3D样例生成在主题一致性和内容多样性方面均符合要求的新3D资产。

  • 首次尝试将扩散先验扩展到3D到3D内容生成这一挑战性任务上。

  • 引入了双重分数蒸馏(DSD),通过在不同噪声水平应用参考先验和概念先验,实现了在3D到3D生成中同时使用两种互相冲突的扩散先验。

与现有的文本到3D、图像到3D的技术不同,ThemeStation接受3D样例作为输入。与文本和图像相比,3D样例可以提供更多关于几何和纹理的3D信息,大大减少了3D生成中的多视角不一致问题,使得生成更高质量的3D模型成为了可能。

然而,直接在少量3D样例上训练的3D生成器缺乏先验信息,只能简单地重复、缩放和微调输入样例,无法生成多样化且主题一致的3D资产。为此,ThemeStation采用了一种两阶段的生成方案,模仿了实际3D建模工作流程:

第一阶段:主题驱动的概念图像生成

在第一阶段,ThemeStation利用给定3D样例的多视角渲染图像对预训练的文本到图像(T2I)扩散模型进行了微调,以生成一系列与输入3D示例保持一致主题的概念图像,类似于实践中的概念草图设计过程。与DreamBooth等主体驱动的微调技术不同,该阶段的目标并非完全拟合给定3D样例。

因此,在该阶段,研究人员使用低学习速率和少训练步骤来微调预训练的扩散模型以提取3D样例中的主题信息并避免过拟合,最终实现了主题一致且多样化的3D变体概念草图生成。

第二阶段:参考信息驱动的3D资产建模

在第二阶段,ThemeStation进行参考信息驱动的3D资产建模。给定一张第一阶段生成的概念草图和输入的3D样例,ThemeStation,首先使用现有的图像到3D技术生成粗糙的3D模型作为初始化。然后,它使用所提出的双重分数蒸馏(DSD)损失函数来逐步优化这个初始模型。

双重分数蒸馏(DSD)损失是ThemeStation的技术核心,它结合了两种扩散先验:概念先验和参考先验。概念先验来自第一阶段合成的概念草图,通过整体调整布局和颜色来确保概念图的重建。参考先验则来自输入的3D样例,通过利用多视角渲染图像和法线图中的3D一致信息来恢复更丰富的高频细节。

具体而言,研究者分别使用概念草图和输入3D样例的渲染图片微调了两个定制化的T2I扩散模型来提供不同的扩散先验。

值得注意的是,由于概念图和输入的3D样例并非同一3D物体,同时使用这两种互相冲突的先验信息作为优化目标并非易事。与简单组合这两种先验(可导致严重的损失冲突)不同,ThemeStation的研究者创新性地根据扩散模型的去噪时间步分配不同的先验损失——在高噪声下控制全局布局(概念先验)并在低噪声下精雕细琢(参考先验)。

在这样的设计下,两个冲突的先验得以融合,避免了信息损失。这一设计灵感来自图像风格迁移算法和T2I扩散模型中反向扩散过程的基于时间步长的由粗糙到细致的动态变化,如下图所示:

由此基于ThemeStation,就能快速得到主题风格一致的大量3D资产。


项目主页:https://3dthemestation.github.io/ 

代码:https://github.com/3DTopia/ThemeStation

论文:https://arxiv.org/abs/2403.15383

—  —


投稿请发邮件到:

[email protected]

标题注明【投稿】,告诉我们:

你是谁,从哪来,投稿内容

附上论文/项目主页链接,以及联系方式哦

我们会(尽量)及时回复你


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
打破进口依赖,我国首次批量生产!美股基本面 - 2024_03_12 * 晚报 * 美国核心通胀高于预期 市场仍预测6月最可能降息 欧洲股指创新高 丰田成亚洲动物世界,水上表演无障碍化身小黑子只需6枚传感器,来自清华轻量化动捕新成果|SIGGRAPH 20245/26出发!巧克力世界,巧克力游乐场,巧克力水上乐园,好时主题乐园全开!※※※2024【花样女神节】活动合辑※※※8090后的童年回忆杀!全球首座《七龙珠》主题乐园曝光,开在最富国家!逼真神龙过山车、还原胶囊公司场景,展开与悟空的冒险之旅!外企社招丨Dräger德尔格,行业全球领导者,15薪,六险一金,多样福利,偏爱留学生T100比赛,pro们惊人的实力打破垄断!我国首次,成功实现批量生产→批量生产的俄罗斯美女,正在收割咱爸福建贫困小渔村,批量生产“霸道总裁”【酷玩亲子】6.18 周二出发,陪着孩子过假期!芝麻街主题乐园等你来!3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D我兒子今年(2024)進了MIT有一个读法的儿子真好!英国境内自由行全攻略!周边游、主题乐园、小众景点…一文包揽!春季观鹤:2024 科州5秒完成3D生成,真香合成数据集已开源,上交港中文新框架超越Instant3D本周六3/30出发!纽约乐高游乐园今年首开!!全球最大乐高乐园,7大主题小世界!“演员医生”批量生产谣言?大V医生:做科普不能一味追求流量SIGGRAPH 2024 | AI可以生成3D主题乐园啦!角色建筑批量生成熵泱——第四十一章有不烦车子的自动停启功能的吗?2024 BMW X5【酷玩亲子】5.28周二出发,陪着孩子过假期!芝麻街主题乐园等你来!我不相信有人会不喜欢阿凡达!迪士尼阿凡达主题乐园即将登陆!江浙沪服务区,已经卷成了 5A级主题乐园统一角色、百变场景,视频生成神器PixVerse被网友玩出了花,超强一致性成「杀招」短视频,正在批量生产整活老登人工智能通过单张雷达图像生成3D城市地图【酷玩亲子】特价$68起!陪着孩子过假期!芝麻街主题乐园等你来!SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片2024,哪个包会是LV的断货王?BCG与世界经济论坛联合报告:绿色建筑有望释放1.8万亿美元市场机遇2D头像生成3D虚拟人开视频会,谷歌新作让人难绷蓝翔技校!挖掘机主题乐园出发!春假来疯狂一下吧!纽约乐高游乐园特价$108出发!!全球最大乐高乐园,7大主题小世界!全球TOP25最佳主题乐园出炉!美国3个上榜,迪士尼仅排13!纽约乐高游乐园开放!!全球最大乐高乐园,7大主题小世界!新泽西特有!挖掘机主题乐园,还有水上乐园全新开放!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。