Redian新闻
>
华南理工TANGO项目原作解读: 文本驱动的三维物体风格化模型

华南理工TANGO项目原作解读: 文本驱动的三维物体风格化模型

公众号新闻

根据给定输入创建 3D 内容(例如,根据文本提示、图像或 3D 形状)在计算机视觉和图形领域具有重要应用。现实中通常需要专业艺术(Technical Artist)耗费大量的时间成本去创作 3D 内容。

为了减少人力消耗,实现整个流程的自动化,华南理工等机构的研究人员提出了TANGO — 一种根据文本指导三维物体风格化的方法。这一领域目前最相关的工作是 Text2Mesh,它使用了预训练模型 CLIP 作为指导,预测三维模型表面顶点的颜色和位置偏移,从而实现风格化。然而简单地预测表面顶点颜色通常会产生不真实的渲染效果,且不规则的顶点偏移会造成很严重的自交。因此,该研究借鉴传统的基于物理的渲染管线,将整个渲染过程解耦为 SVBRDF 材质,法向贴图和灯光的预测过程,并分别用球高斯函数表达解耦的元素。这种基于物理的解耦方式使得 TANGO 可以正确产生具有真实感的渲染效果,并具有很好的鲁棒性。

对于给定的文本输入和三维模型,TANGO 可以产生精细程度较高的具有照片级真实感的细节,并且不会在三维模型表面产生自交问题。同时,得益于 TANGO对渲染方程的物理解耦,我们能够对材质进行编辑和重新打光,实现对输出结果的控制。另外,由于 TANGO 采用预测法向贴图的方式增添物体表面细节,因此对于顶点数较少的三维模型也有很好的鲁棒性。

机器之心最新一期线上分享邀请到了华南理工大学 Gorilla Lab 一年级博士生陈永炜(导师为贾奎教授),为大家解读他们提出的文本驱动三维模型风格化方法——TANGO。

分享主题:TANGO: 文本驱动的三维物体风格化模型

分享嘉宾:陈永炜,华南理工大学 Gorilla Lab 一年级博士生。师从贾奎教授,研究方向为三维视觉,多模态学习,可微渲染,扩散模型等,相关研究工作曾在 CVPR、ECCV、NeurIPS 等计算机视觉和人工智能顶级会议上发表

分享摘要:本次分享将介绍一种基于文本驱动的三维模型风格化方法——TANGO,该方法对于给定的三维模型和文本,可以自动生成更具有真实性的 SVBRDF 材质,法向贴图和灯光,并且对低质量三维模型有更好的鲁棒性。该研究已被 NeurIPS 2022 接收为 spotlight。

相关链接:

1)SOTA!模型平台项目主页链接:

https://sota.jiqizhixin.com/project/tango

2)论文链接:

https://arxiv.org/abs/2210.11277

3)项目主页:

https://cyw-3d.github.io/tango/

4)机器之心推文:

https://mp.weixin.qq.com/s/ZCD1wk9Ox_cs3bmCYtA1SA

加群看直播
直播间关注机器之心机动组视频号,北京时间 11 月 30 日 19:00 开播。
交流群:本次直播设有 QA 环节,欢迎加入本次直播交流群探讨交流。


如群已超出人数限制,请添加机器之心小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「TANGO」即可加入。
如果你也有最新工作希望分享或提交你感兴趣的内容方向,随时告诉我们吧:https://jiqizhixin.mikecrm.com/fFruVd3

机器之心 · 机动组
机动组是机器之心发起的人工智能技术社区,聚焦于学术研究与技术实践主题内容,为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
怪人Uni-Mol:分子3D表示学习框架和预训练模型项目原作解读河南理工大学2023年高水平运动员招生简章【首发】深耕双人源化模型,创建仿临床研究平台,创模生物再获数千万融资NeurIPS 2022 | 文本图片编辑新范式:单个模型实现多文本引导图像编辑南洋理工大学 MMLab 团队分享 | 元宇宙基石:文本驱动的数字内容生成华南理工大学2023年高水平运动队招生简章UniMatch项目原作解读:统一光流、立体匹配和深度估计三个任务深度好文|如何优雅的搞砸一个IPO项目?NIPS 2022 | 文本图片编辑新范式:单个模型实现多文本引导图像编辑刚刚,彻底炸了!现场督导当场发现头部券商IPO项目严重造假一颗GPU,秒出3D模型!OpenAI重磅新作:Point-E用文本即可生成三维点云模型华南理工大学国际交流与合作处招聘IPO项目又失败了,只因他们忽视了这八点清华CodeGeeX项目原作解读:大规模多语言代码生成模型【一对一介绍】珠海3号男同学,92年生,身高173,华南理工大学硕士,嵌入式软件工程师,月入1.4W,珠海金湾NeurIPS 2022 | 文本图片编辑新范式,单个模型实现多文本引导图像编辑北交所迄今最大IPO项目:83岁老爷爷携77岁老伴成功过会!龙卷风健康快递 216突发!一券商被暂停保荐资格3个月,13名责任人一同被罚,目前在审IPO项目2单hǎo xiǎng “rua” 🤩端到端音视频说话人日志网络,一作解读INTERSPEECH 2022论文Daisy Li,女,华南理工大学,芯片采购,月入1.5万,93年,高168,深圳南山3D版DALL-E来了!谷歌发布文本3D生成模型DreamFusion,给一个文本提示就能生成3D模型!Galvatron项目原作解读:大模型分布式训练神器,一键实现高效自动并行搬到美东,在美国的第二份工作美国的鼎泰丰@全球英才 华南理工大学邀您依托学校申报海外优青项目!想一撤了之?IPO项目主动撤回后,现场检查竟发现多项违规,全部被罚DiffusionBERT项目原作解读:掩码预训练语言模型的扩散生成探索布达佩斯还是哈尔滨? 大快朵颐出了洋相 奥匈帝国4日游(3)长丰,女,华南理工大学,财税顾问,月入1.5万+,88年,高160,广州黄埔NeurIPS 2022 | 一句话让三维模型生成逼真外观风格,精细到照片级细节跨端动态化模板引擎详解,看完你也能写一个 | GaiaX 开源解读Adv. Mater.: 南大梁世军/缪峰与南理工程斌合作团队在高灵敏弱光探测器领域取得重要进展
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。