Redian新闻
>
5分钟生成漫威3D数字人!美队蜘蛛侠小丑都能搞定,高清还原面部细节丨SIGGRAPH 2023

5分钟生成漫威3D数字人!美队蜘蛛侠小丑都能搞定,高清还原面部细节丨SIGGRAPH 2023

公众号新闻
允中 发自 凹非寺
量子位 | 公众号 QbitAI

随着计算机图形学的发展,3D生成技术正逐渐成为研究热点。然而,从文本或图像生成3D模型仍然存在许多挑战。

近期,Google、NVIDIA和微软等公司推出了基于神经辐射场(NeRF)的3D生成方法,但这些方法与传统的3D渲染软件(如Unity、Unreal Engine和Maya等)存在兼容性问题,限制了其在实际应用中的广泛应用。

为此,影眸科技与上海科技大学的研发团队提出了一种文本指导的渐进式3D生成框架,旨在解决这些问题。

根据文字描述生成3D资产

该研究团队提出的文本指导的渐进式3D生成框架(简称DreamFace),结合了视觉-语言模型、隐式扩散模型和基于物理的材质扩散技术,生成符合计算机图形制作标准的3D资产。

这一框架的创新之处在于其几何体生成、基于物理的材质扩散生成和动画能力生成三个模块。

这项工作已被顶级期刊Transactions on Graphics接收,并将在国际计算机图形学顶级会议SIGGRAPH 2023上展示。

项目网站:https://sites.google.com/view/dreamface
预印版论文:https://arxiv.org/abs/2304.03117
Web Demo: https://hyperhuman.top
HuggingFace Space:https://huggingface.co/spaces/DEEMOSTECH/ChatAvatar

如何实现DreamFace三大功能

DreamFace主要包括三个模块,几何体生成,基于物理的材质扩散和动画能力生成。相比先前的3D生成工作,这项工作的主要贡献包括:

  1. 提出了DreamFace这一新颖的生成方案,将最近的视觉-语言模型与可动画和物理材质的面部资产相结合,通过渐进式学习来分离几何、外观和动画能力。

  2. 引入了双通道外观生成的设计,将一种新颖的材质扩散模型与预训练模型相结合,同时在潜在空间和图像空间进行两阶段优化。

  3. 使用BlendShapes或生成的Personalized BlendShapes的面部资产具备动画能力,并进一步展示了DreamFace在自然人物设计方面的应用。

几何体生成:该模块通过CLIP(Contrastive Language-Image Pre-Training)选择框架根据文本提示生成几何模型。

首先从人脸几何参数空间随机采样候选项,然后根据文本提示选择匹配得分最高的粗略几何模型。

接下来,使用隐式扩散模型(LDM)和得分蒸馏采样(SDS)处理,从而在粗略几何模型中添加面部细节和详细的法线贴图,生成高精度几何体。

基于物理的材质扩散生成:该模块针对预测几何体和文本提示生成面部纹理。首先,对LDM进行微调,得到两个扩散模型。

然后,通过联合训练方案协调这两个模型,一个用于直接去噪U纹理贴图,另一个用于监督渲染图像。此外,还采用了提示学习策略和非面部区域遮罩以确保生成的漫反射贴图的质量。

最后,应用超分辨率模块生成4K基于物理的纹理,以进行高质量渲染。

动画能力生成:DreamFace生成的模型具备动画能力。与传统基于BlendShapes的方法不同,该框架通过预测独特的变形为静息(Neutral)模型赋予动画效果,从而生成个性化的动画。

首先训练几何生成器学习表情潜在空间,然后训练表情编码器从RGB图像中提取表情特征。最终,通过使用单目RGB图像生成个性化的动画。

5分钟生成指定3D资产

DreamFace框架在名人生成、描述生成角色等任务上取得了良好的效果,并在用户评估中获得了超过先前工作的成绩。

同时,与现有方法相比,运行时间上具有明显优势。

此外,DreamFace支持使用提示和草图进行纹理编辑,实现全局编辑效果(如老化、化妆)和局部编辑效果(如纹身、胡须、胎记)。

可用于影视、游戏等行业

作为一种文本指导的渐进式3D生成框架,DreamFace结合了视觉-语言模型、隐式扩散模型和基于物理的材质扩散技术,实现了高精度、高效率和良好兼容性的3D生成。

该框架为解决复杂的3D生成任务提供了有效解决方案,有望推动更多类似的研究和技术发展。

此外,基于物理的材质扩散生成和动画能力生成将推动 3D生成技术在影视制作、游戏开发和其他相关行业的应用。

*本文系量子位获授权刊载,观点仅为作者所有。


—  —

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
GraphPad Prism 9 入门,3分钟上手,5分钟出图,半年发了5.25分SCI!(含数据统计)科大讯飞招聘:校招与社招全职,大模型/NLP/计算机视觉/3D数字人等方向2022&2023 Subaru Outback 和 2023 Honda CRV Hybrid二选一【庭院种菜】茭白植株不结茭白,怎么破?惊! “蜘蛛侠”空降了?!Eruope 2023GraphPad Prism 9 入门,3分钟上手,5分钟出图,分分钟搞定CNS级美图!不愧是蜘蛛侠,年度必看电影来了!六亲不认被立跪像的是善还是恶《蜘蛛侠:纵横宇宙》内地定档;《变形金刚7》发布正式预告​坂本龙一去世;​《蜘蛛侠:纵横宇宙》发布先导预告哈佛研究:活过90岁的人有29项共同特征(你达到了几项?)明天上街做好事, 不要忘记带照相机, 回家日记要写好, 放在容易被领导发现的地方首部AI生成漫画出版,创作魔法也是搞钱大法SIGGRAPH2023|DreamFace:一句话生成 3D 数字人?外卖小哥化身蜘蛛侠,上屋顶解救客户!"记得给我五星好评哦!"导筒现场 · 上海 |《蜘蛛侠:纵横宇宙》上海杜比剧场首映微软3D生成扩散模型RODIN,秒级定制3D数字化身无需任何3D数据,直接文本生成高质量3D内容,清华朱军团队带来重大进展证件照转数字人只需几秒钟,微软实现首个3D扩散模型高质量生成效果,换装改形象一句话搞定 | CVPR 2023突发!“蜘蛛侠”荷兰弟自曝人格分裂!走不出,在家崩溃了:希望大家能对遭遇心理问题的人多点尊重和同理心!过不在乎钱财的时光国际要闻简报,轻松了解天下事(03早上给娃一碗它,胜过10杯牛奶!5分钟就能搞定,简单营养还健康触摸地形起伏,2023北斗重磅,高清3D立体精雕地图~等比例还原地貌,从小学用到高中!蜘蛛侠设施将永久关闭!2023年大阪环球影城洗牌,近期还有哪些变化?澳洲$2亿Medicare退款无人领!快看看你有份吗?很多人因一个细节错过领钱,几分钟就能搞定国际要闻简报,轻松了解天下事(03C919客舱内部细节曝光;大熊猫“丫丫”返回北京丨科技早新闻全球粉丝都在给蜘蛛侠在森林小丘的地址写信,现在这所房子在售 | 浮世绘《蜘蛛侠:纵横宇宙》的15个彩蛋,你发现了吗?美国5月新增就业33.9万人 失业率升至3.7%!美国总统拜登签署债务上限法案!《蜘蛛侠:纵横宇宙》助北美周末票房破两亿美元SIGGRAPH 2023|DreamFace:一句话生成3D数字人?单卡30秒跑出虚拟3D老婆!Text to 3D生成看清毛孔细节的高精度数字人,无缝衔接Maya、Unity等制作工具蜘蛛侠的蛛丝能粘住不粘锅吗?纽约外卖小哥化身蜘蛛侠,解救屋顶被困客户! "你五星好评有了!"​《蜘蛛侠:纵横宇宙》新预告联动《毒液》;第25届上海国际电影节片单全球口碑炸裂!一次看一百部蜘蛛侠电影,网友:秒杀漫威所有!2023 春 祝姐妹们周末快乐!纽约博物馆趣味展览:世界各地寄给“住在皇后区的”蜘蛛侠的信
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。