Redian新闻
>
AI研究也能借鉴印象派?这些栩栩如生的人竟然是3D模型

AI研究也能借鉴印象派?这些栩栩如生的人竟然是3D模型

公众号新闻

机器之心报道

编辑:rome rome

创建逼真的动态虚拟角色,要么在训练期间需要准确的 3D 配准,要么在测试期间需要密集的输入图像,有时则两者都需要,也许 D3GA 是你需要的。


在 19 世纪,印象主义的艺术运动在绘画、雕塑、版画等艺术领域盛行,其特点是以「短小的、断断续续的笔触,几乎不传达形式」为特征,就是后来的印象派。简单来说印象派笔触未经修饰而显见,不追求形式的精准,模糊的也合理,其将光与色的科学观念引入到绘画之中,革新了传统固有色观念。

在 D3GA 中,作者的目标反其道而行之,是希望创建像照片般逼真的表现。在 D3GA 中,作者对高斯泼溅(Gaussian Splatting)进行创造性的运用,作为现代版的「段笔触」,来创造实时稳定的虚拟角色的结构和外观。

印象派画家莫奈代表作《日出・印象》。


对于虚拟形象的构建工作来说,创造驱动型(即可以生成动画新内容)的逼真人类形象目前需要密集的多视角数据,因为单目方法缺乏准确性。此外,现有的技术依赖于复杂的预处理,包括精确的 3D 配准。然而,获取这些配准需要迭代,很难集成到端到端的流程中去。而其它不需要准确配准的方法基于神经辐射场(NeRFs),通常对于实时渲染来说太慢,或者在服装动画方面存在困难。

Kerbl 等人在经典 Surface Splatting 渲染方法基础上引入了 3D Gaussian Splatting(3DGS)。与基于神经辐射场的最先进方法相比,这种方法在更快的帧率下呈现更高质量的图像,并且不需要任何高度准确的 3D 初始化。

但是,3DGS 是为静态场景设计的。并且已经有人提出基于时间条件的 Gaussian Splatting 可用来渲染动态场景,这些模型只能回放先前观察到的内容,所以不适用于表达新的或其未曾见过的运动。

在驱动型的神经辐射场的基础上,作者对 3D 的人类的外观及变形进行建模,将其放置在一个规范化的空间中,但使用 3D 高斯而不是辐射场。除性能更好以外,Gaussian Splatting 还不需要使用相机射线采样启发式方法。

剩下的问题是定义触发这些 cage 变形的信号。目前在驱动型的虚拟角色中的最新技术需要密集的输入信号,如 RGB-D 图像甚至是多摄像头,但这些方法可能不适用于传输带宽比较低的情况。在本研究中,作者采用基于人体姿势的更紧凑输入,包括以四元数形式的骨骼关节角度和 3D 面部关键点。

通过在九个高质量的多视图序列上训练个体特定的模型,涵盖各种身体形状、动作和服装(不仅限于贴身服装),以后我们就可以通过任何主体的新姿势对人物形象进行驱动了。



方法概览


  • 论文链接:https://arxiv.org/pdf/2311.08581.pdf
  • 项目链接:https://zielon.github.io/d3ga/

目前用于动态体积化虚拟角色的方法要么将点从变形空间映射到规范空间,要么仅依赖正向映射。基于反向映射的方法往往在规范空间中会累积误差,因为它们需要一个容易出错的反向传递,并且在建模视角相关效果时存在问题。

因此,作者决定采用仅正向映射的方法。D3GA 是基于 3DGS 的基础上通过神经表示和 cage 进行扩展,分别对虚拟角色的每个动态部分的颜色和几何形状进行建模。


D3GA 使用 3D 姿势 ϕ、面部嵌入 κ、视点 dk 和规范 cage v(以及自动解码的颜色特征 hi)来生成最终的渲染 C¯ 和辅助分割渲染 P¯。左侧的输入通过每个虚拟角色部分的三个网络(ΨMLP、ΠMLP、ΓMLP)进行处理,以生成 cage 位移∆v、高斯变形 bi、qi、si 以及颜色 / 透明度 ci、oi。

在 cage 变形将规范高斯变形后,通过方程式 9,它们被光栅化成最终的图像。


实验结果

D3GA 在 SSIM、PSNR 和感知度量 LPIPS 等指标上进行评估。表 1 显示,D3GA 在只使用 LBS 的方法中(即不需要为每个帧扫描 3D 数据)其在 PSNR 和 SSIM 上的表现是最佳的,并在这些指标中胜过所有 FFD 方法,仅次于 BD FFD,尽管其训练信号较差且没有测试图像(DVA 是使用所有 200 台摄像机进行测试的)。


定性比较显示,与其它最先进方法相比,D3GA 能更好地建模服装,特别是像裙子或运动裤这样的宽松服装 (图 4)。FFD 代表自由形变网格,其包含比 LBS 网格更丰富的训练信号 (图 9)。



与其基于体积方法相比,作者的方法可以将虚拟角色的服装分离出来,并且服装也是可驱动的。图 5 显示了每个单独的服装层,可以仅通过骨骼关节角度控制,而不需要特定的服装配准模块。




© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
黄奇帆:金融的本质,就是3句话主人用雪堆出走失一年的狗子,栩栩如生…这就是想念的形状吧ICLR 2024 | 高分工作!Uni3D:3D基础大模型,刷新多个SOTA!光的哲学与艺术:从印象派讲起以色列和哈马斯的地道战为什么可怕?新旧文明社会制度的生死搏斗重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型中国最好吃的水果,99%的人竟然都不知道拿撒勒人》3D沉浸式体验让《新约全书》栩栩如生刷新多个SOTA!腾讯优图提出统一模态新架构UniM-OV3D:3D开放词汇场景理解穷养儿子富养女?这个刻板印象,可能是资本的陷阱崩!现在贷款买房的澳洲人,是30年来最惨!“煤老板”回归房地产?神秘富豪41亿拿下上海陆家嘴顶级豪宅!一买就是3栋楼首次明确!亲属间股票账户也不能借,证监会开出顶格罚单!他被罚款50万本田又召回!这次是30万辆雅阁和HR-V车,因安全带缺了…让3D编辑像PS一样简单!GaussianEditor:在几分钟内完成3D场景增删改!弥合2D和3D生成之间的次元壁!X-Dreamer:高质量的文本到3D生成模型巴黎老年人又又又被盯上了?这一次盯上他们的竟然是“警察“!同样是30岁,为什么有人像18岁,有人像50岁本田又召回!这次是30万辆雅阁和HR-V车 因安全带缺了…全美收入最高的副业是是什么?美国年轻人竟然最喜欢干这个...上海街头皇帝被赶,天冷的一道好菜(图)校草要走演技派?普女小花很高调?​哑女夫妇完蛋了?大胖橘心态好?丑主持擅长PUA?立冬必吃的5种宝藏食材,90%的人竟不知!随手一做,吃完暖乎乎我不会原谅把别人的痛苦当做笑谈的人ICLR 2024 | Adobe提出DMV3D:3D生成只需30秒!让文本、图像都动起来的新方法!1994年,已经是30年前了一位看到上海万圣节的中年阿姨说:好想哭,又看到人了。新州90岁老人遭性侵后死亡,嫌疑人是34岁男子不如生叉烧!BK华男因手机居然对父亲做出这种事情分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速没君主命!查尔斯突爆患癌!隐忍的凯特终究也被...湾区华人的年终大假,你是哪一派?避开这些车!又召回!这次是30万辆 因安全带缺了…分割一切"3D高斯"来了!上交&华为提出SAGA:几毫秒完成3D分割一切!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。