Redian新闻
>
ICLR 2023 | 神经规范场:渲染引导空间规范变换

ICLR 2023 | 神经规范场:渲染引导空间规范变换

公众号新闻

©作者 | 占方能

单位 | 马克斯普朗克计算机所

研究方向 | 神经渲染


近期,神经场(Neural Fields)领域的巨大进展,已经显著推动了神经场景表示和神经渲染的发展。为了提高 3D 场景的计算效率和渲染质量,一个常见的范式是将 3D 坐标系统映射到另一种测量系统,例如 2D 流形和哈希表,以建模神经场。本文将这种坐标或者测量系统的转换定义为“规范变换”(gauge transformation)。


这种规范变换通常采用预定义的函数,例如 EG3D 中的垂直投影和 Instant-NGP 中的空间哈希函数。然而,这种预先定义的函数往往并非最优选择,所以一个很自然的问题浮现出来:是否能以端到端的方式直接学习规范变换,让它与神经场一同进行优化?本研究将此问题拓展为一个广义的范式,包括连续型和离散型规范变换,并设计了统一的学习框架以共同优化规范变换和神经场。

论文地址:
https://arxiv.org/abs/2305.03462

GitHub地址:

https://github.com/fnzhan/Neural-Gauge-Fields

项目地址:

https://fnzhan.com/Neural-Gauge-Fields/




介绍


规范通常表示一种测量标准或测量系统,比如温度测量中的华氏度和摄氏度。而两种规范之间的转换则被称为规范变换,比如华氏度和摄氏度之间的转换。在物理领域中,各种坐标系统的变换也可以被称之为规范变换,如图一所示的局部和总体的规范变换。

▲ 图一:物理中的规范变换


而在神经场领域中,规范变换的定义可以进一步扩展为连续变换和离散变换,如图二。

▲ 图二:神经场的规范变换


连续规范变换:如果目标规范(测量系统)是连续的,那么这种变换定义为连续规范变换。这种连续规范变换,基本等同于坐标变换。对于一个原始 3D 空间中的点x,可以通过一个神经网络 M 对它进行规范变换,从而得到它在目标规范中的新坐标即 M(x) 或者 x+M(x)。这个新坐标可以用来索引神经场,包括隐式神经场(MLP-based)和显式神经场(grid-based)。连续规范变换的典型应用包括 UV 纹理映射和学习 TriPlane 映射。


对于 UV 纹理映射,规范变换具体定义为 3D 空间到 2D UV 空间的映射,由于神经场是在 2D UV 空间进行索引,所以我们通过在 UV 空间进行均匀点采样可以得到每个点的颜色,从而得到显式的 UV,同时可以对 2D UV 进行编辑(如图)。

▲ 图三:学习 2D UV 映射和进行 UV 编辑


对于 TriPlane 映射也是类似,我们采用三个单独的网络来分别学习 3D 空间到 2D 平面的映射。我们发现这种可学习的变换可以提升 TriPlane 神经场的渲染效果和模型收敛速度,如图四所示。

▲ 图四:学习 3D 空间到 TriPlane 的规范变换


以上只是列举出两种应用,实际上这种可学习的连续规范变换可以根据目的灵活地嵌入到各种 NeRF 模型当中,比如动态场景 NeRF,和基于 NeRF 的本征分解。


离散规范变换:如果目标规范是离散的(比如哈希表空间),那么这种变换定义为离散规范变换。由于离散空间的索引参数是离散的,我们不能像连续规范变换那样直接通过网络预测索引参数值。所以,对于 3D 空间中的一个点x,我们用神经网络预测这个点在哈希表上的离散概率分布,然后通过 Top-1 操作得到最大概率点对应的哈希表索引。由于 Top-1 操作是不可微分的,所以需要通过重参数技巧来得到近似梯度进行模型优化,算法流程图五所示。

▲ 图五:离散规范变换学习中的正向/反向传播


离散规范的主要应用包括 Instant-NGP 的模型压缩,可泛化 NeRF 等。对于可泛化 NeRF,由于哈希映射变得可学习,所以多个场景都可以学习映射到同一个哈希表中,从而实现场景泛化 NeRF。




可视化分析


尽管证明了学习规范变换是可行的,但是学习到的规范变换具体遵循什么样的规律依然不清楚,所以这里对学习到的规范变换进行了可视化。对于 3D 空间和 2D 流形(球面或者平面)的规范变换,我们学习一个逆映射将 2D 流形上均匀采样的点投影到 3D 空间,如图六所示。

▲ 图六:规范变换可视化


通过观察,我们发现学习到的规范变换和场景的几何(或者说密度)有很明显的关系,物体表面的点(也就是密度比较大的点)会被很好的投影到目标平面即占有率很高,而密度小的点所在空间会被高度压缩并在目标平面只有很低的占有率。这个结果也符合直觉:物体表面对渲染结果影响最大,所以渲染损失函数倾向于让物体表面更多地占用目标平面的特征,同时压缩对渲染影响很小的低密度空间。




信息不变性规范


理想情况下,我们期望 3D 空间信息能在规范变换中保证保持不变(Information Invariant, or InfoInv),一半情况下这个很难实现,这里我们通过推导证明了神经场中的位置编码实际上实现了规范变换中的相对信息不变性,从而有助于神经场建模。而本质上,这种不变性规范是对神经场坐标施加了一个相位变换

如图七所示,将位置编码简单地和 Grid 或者 MLP-based 神经场结合都能显著提高模型效果。近期的 PET-NeuS 等工作也证明了这种方法的有效性。


▲ 图七:信息不变性规范与 Grid 和 MLP-based 神经场结合




总结


这篇文章主要介绍了神经场中的规范变换,尤其是如何通过渲染损失联合优化神经场景表示和规范变换。通过应用和实验,证明了这种可学习规范变换的优点和广泛适用性,包括 UV 映射,TriPlane 神经场等。基于这种可学习的规范变换,还有大量神经渲染任务值得深入探索和应用。



更多阅读



#投 稿 通 道#

 让你的文字被更多人看到 



如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 


PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。


📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算


📬 投稿通道:

• 投稿邮箱:[email protected] 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿


△长按添加PaperWeekly小编



🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧


·
·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
周末碎碎念国务院关于《广东省国土空间规划(2021—2035年)》的批复ICLR 2024论文审稿结果出炉!7000+高产论文创新纪录,扩散模型占比最高未经规训的小孩坏起来,大人都怕国务院关于《宁夏回族自治区国土空间规划(2021—2035年)》的批复【本周讲座预告】ME、EE、ECE热门专业求职讲解+求职时间规划颠覆对AgRP神经元必要性的认知:科学家发现AgRP神经元对于维持摄食行为和体重并非不可或缺大规模神经网络优化:神经网络损失空间“长”什么样?渡十娘|卖房变换房,南下变留下,我在北京倒腾房子那点事儿Google Cloud Next ’23 隆重登场:AI 与云科技驱动创新US News 2023梵高的柏树齐聚纽约大都会—附梵高的作品喜欢东瀛的精致,爱北美的海阔天空​NeurIPS 2023 | RayDF:实时渲染!基于射线的三维重建新方法Resolution in 2023ICLR'24 大语言模型智能体最新研究进展为什么要进行傅立叶变换?藏不住啦!美国娃都在用的时间规划表,今天给大家”偷“来啦一周快讯丨安徽省新一代信息技术产业主题基金招GP;扬子江产业引导母基金招GP;招商资本与徐州交控集团联合发起设立产业引导基金AI生图太诡异?马里兰&NYU合力解剖神经网络,CLIP模型神经元形似骷髅头ICML 2023 | 英伟达神奇研究:用别的模型权重训练神经网络,改神经元不影响输出!最全!美国研究生申请要求及时间规划方案2023 US Open 美国网球公开赛山西大学在相互作用玻色量子气体人工规范场的实验研究中取得重要进展也求建议,我上周将前公司401K roll over 到了Fidelity,大概200K左右,准备买大盘股指数,该如何操作才好?文元计划启动 |《中国文化元宇宙白皮书》面向全国征集示范场景与先锋机构ICML 2023 | 英伟达神奇研究:用别的模型权重训练神经网络,改神经元不影响输出NECAA百家论坛之四十二|田松 : 哈佛图书馆的Culture Shock : 是学术空间,也是文化空间,生活空间。医药代表的真实故事 19 等价交换世辉、金杜、环球等所晋升加盟多名合伙人;大成、德和衡新办公室开业;IFLR公布第四届IFLR1000中国奖 | 律所动态2023/08最新民调,台湾人对于独立还是统一是怎么看的?ICCV 2023 Oral | CLIP-LIT将CLIP用于无监督背光图像增强注意!EACL, NAACL, ACL 2024只接收ARR系统投稿(附时间表)LLaMA2+RLHF=脆皮大模型?ICLR 2024高分投稿:多样性驱动的红蓝对抗台湾抵御入侵的优势和弱势NeurIPS 2023 | 无惧图像中的文字,TextDiffuser提供更高质量文本渲染【监管】一次连续变换两条车道、不按导向车道行驶,这8起交通违法案例被曝光​ICLR 2023 高分论文 | 基于子图草图的图神经网络用于链路预测上海发布控烟标识系统和设置规范,进一步规范设置禁烟标识、室外吸烟点标识及引导标识【10.14直播公开课】重医附属儿童医院2023年超声引导下小儿神经阻滞和重症超声培训班(第三期)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。