Redian新闻
>
顶刊TPAMI 2023!中科院提出:基于几何分析的神经辐射场编辑方法

顶刊TPAMI 2023!中科院提出:基于几何分析的神经辐射场编辑方法

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【NeRF和Transformer】交流群

扫码加入CVer知识星球可以最快学习到最新顶会顶刊上的论文ideaCV从入门到精通资料,以及最前沿项目和应用!发论文,强烈推荐!

来源:图灵讨论班


神经辐射场作为近期一个广受关注的隐式表征方法,能合成照片级真实的多视角图像。但因为其隐式建模的性质,用户难以直观编辑神经辐射场建模对象的几何。面对这一问题,最新被IEEE TPAMI接收的论文《Interactive NeRF Geometry Editing with Shape Priors》 [1]提出了一种基于几何分析的交互式神经辐射场编辑方法。目前已有的一些借助显式几何代理的神经辐射场几何编辑方法,如NeRF-Editing [2],NeuMesh [3]等,一方面无法实现实时编辑,另一方面需要用户对几何网格代理编辑,具有一定的操作门槛。而该论文提出的方法允许用户在自动提取的盒式变形图柄上交互式编辑神经辐射场,并支持自由视角浏览。

项目主页:

http://geometrylearning.com/InteractiveNeRFEditing


Part1 研究目标


神经辐射场隐式建模场景或物体的几何和外观,提供了逼真的重建效果。但对于建模后的模型,其修改或编辑能力同样重要,以满足后续创作或应用需求。现有基于静态神经辐射场的几何编辑方法通常引入显式几何代理,在对显式几何代理编辑后,将几何代理的变化传播到神经辐射场的采样点上,利用光线弯曲实现对渲染结果的修改[2];或者在几何代理上定义特征,神经辐射场的渲染与这些特征相关联,因此当特征的空间位置随着几何代理的变化而变化后,渲染结果也会发生改变[3]。


该论文提出的交互式编辑方法考虑编辑对象的几何属性,希望在几何编辑过程中保持对象的几何属性,比如对称性。通过引入合成数据先验,提出的方法可以对建模对象进行几何分析,提取抽象盒子表示,语义分割和对称性。将这些几何属性应用于编辑后,用户可以直接利用抽象盒子作为变形图柄编辑神经辐射场几何,减轻用户的编辑负担,如图1所示。提出的方法还能进行变形传播,比如将一个奔跑马的动作序列传播到陶瓷麋鹿模型上,如图2所示。


图1. 交互式编辑神经辐射场几何


图2. 将奔跑马的动作序列传播到陶瓷麋鹿模型上


Part2 研究方法


该论文提出的方法将合成数据先验引入神经辐射场的几何编辑中,并实现交互式编辑和不同模型语义部件的组合,图3展示了方法流程图。

图3. 基于几何分析的神经辐射场编辑方法,同时支持对不同模型的语义部件的组合


几何属性提取:

该方法首先从预训练的神经辐射场网络中提取显式网格表示。由于针对单个重建模型进行几何分析比较困难,所以依靠合成数据集中的形状先验来帮助对真实重建模型的几何分析。首先,结合枚举和迭代最近点(ICP)算法对提取网格执行包括对齐和缩放在内的预处理操作。具体地,将重建模型沿三个轴中的每一个旋转一定角度,然后将随机选取的合成模型缩放到与旋转后的重建模型相似的大小;计算旋转后的重建模型和缩放后的合成模型之间的误差,并选择误差最小的旋转角度对;进一步考虑选择的旋转角度附近的角度,重复上述操作。经过一定次数的重复操作后,使用迭代最近点算法完成最终对齐,完成重建模型到合成模型的匹配。匹配后的模型通过几何分析网络[4][5]获得几何属性,包括抽象盒子表示、语义分割和对称性。


基于几何分析的编辑:

论文提出的方法使用抽象盒子表示作为变形代理对神经辐射场的几何进行交互式编辑。在编辑中同时引入对称性和语义分割信息,可以在用户编辑时保持模型的对称性,并且编辑不会超出对应的语义部分。用户可以对抽象盒子旋转、平移或缩放,这些编辑会先对网格模型变形。具体地,网格的每个顶点找到最近的两个抽象盒子,并将这两个盒子的变换的加权组合作为顶点的变换,其中权重计算为距离的倒数。为了限制编辑在对应的语义部件内,对于网格上的每个顶点,寻找模型点云上的最近点,并将最近点对应的语义标签赋给网格顶点。然后在变换的加权组合中,引入对应语义的抽象盒子,并给该盒子的变换赋予更大的权重。如旋转矩阵可以被计算为:



其中log和exp分别为矩阵的对数和指数操作。此外,系统标记了对称的抽象盒子对,若用户选择保持对称,则与用户编辑的盒子对称的抽象盒子将同时进行相应的变换,从而保持模型的对称性。在将编辑传播到网格后,提出方法使用NeRF-Editing [2]提出的两步传播方法将编辑从网格传播到隐式空间场。具体地,先将三角网格扩大形成包围网格,并从包围网格建立四面体网格,然后利用三角网格的变化对四面体网格进行变形,最后利用四面体网格对光线上的采样点进行偏移,得到变形模型的视角合成结果。


不同模型的语义部件组合:

使用语义分割,还可以将来自不同神经辐射场模型的语义部件组合成一个新的神经辐射场模型,并从任意视角浏览。用户通过标记抽象盒子指定要组合的语义部件,也可以使用抽象盒子调整对应部件的位置和大小,保证合成模型的合理性。渲染组合模型时,每个采样点会从其所在分割部件的有向包围盒对应的神经辐射场网络中获取其密度和颜色值,最后利用体渲染聚合每条光线上所有采样点的颜色,得到视角合成结果。


实时交互式编辑:

为了实现实时渲染,引入iNGP [6]中的多分辨率哈希编码结构。进一步地,只在网格表面附近或有向包围盒内部采样,大大减少了光线采样点的数量,加快了渲染速度。


Part3 实验效果


图4展示了提出方法在不同椅子上的基于几何分析的编辑结果,这些编辑都使用了对称性。第一列是抽象盒子表示在编辑前后的可视化。可以看到,使用提取的盒式变形图柄能对模型进行不同的几何编辑,并能很好地保持模型的对称性。

图4. 提出方法在不同椅子上的基于几何分析的编辑结果


图5展示了在其他类别物体上的编辑结果,编辑时没有使用对称性。用户可以将站立长颈鹿改为奔跑姿势,也能改变桌腿的朝向,使其更有设计感。


图5. 对其他类别物体的编辑结果

图6展示了将不同模型的语义部件组合成新模型的结果。用户可以交换两把椅子的上半部分和下半部分,生成两把新椅子;也可以在两个不同类别的物体,麋鹿和桌子之间组合,将鹿腿用于支撑桌面,构成一个充满创意的桌子模型。

图6. 不同模型的语义部件的组合结果

该方法也与NeRF-Editing进行了对比,在对称性保持上具有优势;同时也进行了消融实验,在编辑中不使用语义分割信息会导致编辑超出所属语义部件范围,产生不自然的编辑效果;不使用对称属性会和NeRF-Editing类似,编辑结果难以保持原有的对称性,如图7所示。





图7. 与NeRF-Editing方法的对比以及消融实验

Part4 总结和展望


该工作将合成数据集先验引入到真实神经辐射场模型的几何编辑中,实现基于几何分析的编辑方法,能自动提取变形图柄方便用户操作,编辑时保持模型的几何属性。借助提取的语义分割,提出的方法还能实现语义部件级的神经辐射场组合。在未来可以探索如何在神经辐射场中直接进行几何分析,不会因为合成数据先验限定物体类别。同时,结合一些材质光影解耦的方法,在几何编辑时相应地改变光影。


参考文献

[1] Yu-Jie Yuan, Yang-Tian Sun, Yu-Kun Lai, Yuewen Ma, Rongfei Jia, Leif Kobbelt, Lin Gao*, Interactive NeRF Geometry Editing with Shape Priors, IEEE TPAMI 2023.

[2] Yu-Jie Yuan#, Yang-Tian Sun#, Yu-Kun Lai, Yuewen Ma, Rongfei Jia, Lin Gao*, NeRF-Editing: Geometry editing of neural radiance fields, IEEE CVPR 2022.

[3] Chong Bao and Bangbang Yang, Junyi Zeng, Hujun Bao, Yinda Zhang, Zhaopeng Cui, Guofeng Zhang, Neumesh: Learning disentangled neural mesh-based implicit field for geometry and texture editing, European Conference on Computer Vision (ECCV), 2022.

[4] Kaizhi Yang and Xuejin Chen, Unsupervised learning for cuboid shape abstraction via joint segmentation from point clouds, ACM Transactions on Graphics (TOG), vol. 40, no. 4, pp. 1–11, 2021.

[5] Lin Gao, Ling-Xiao Zhang, Hsien-Yu Meng, Yi-Hui Ren, Yu-Kun Lai, Leif Kobbelt, PRS-Net: Planar reflective symmetry detection net for 3D models, IEEE Transactions on Visualization and Computer Graphics, vol. 27, no. 6, pp. 3007–3018, 2020.

[6] Thomas Müller, Alex Evans, Christoph Schied, Alexander Keller, Instant neural graphics primitives with a multiresolution hash encoding, ACM Transactions on Graphics (TOG), vol. 41, no. 4, pp. 102:1–102:15, 2022.


CVPR / ICCV 2023论文和代码下载
后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:ICCV2023,即可下载ICCV 2023论文和代码开源的论文合集

NeRF和Transformer交流群成立


扫描下方二维码,或者添加微信:CVer444,即可添加CVer小助手微信,便可申请加入CVer-NeRF或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。


一定要备注:研究方向+地点+学校/公司+昵称(如NeRF或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer444,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!


扫码加入星球学习


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
人脸编辑神器!浙大&腾讯提出FaceX:统一面部表征建立通用人脸编辑模型ICCV 2023 | 浙大&阿里提出:基于Transformer的可泛化人体表征来了!那咬一口香死人的流沙月饼帝国理工刘教授:基于爱彼迎数据的民宿共享经济定价分析|收获一作论文与导师推荐信!只要你敢投,它就敢收!这一7+业内顶刊会因此进入24年的中科院黑名单吗?医学顶刊Nature Medicine!达摩院提出:CT首次实现大规模胰腺癌筛查【一句话翻译】中译英,参考答案 09.22.2023.顶刊TPAMI 2023!西电提出TIB:通过双流信息瓶颈检测未知物体无需额外知识或训练!中科大等提出OPERA:缓解多模态大模型幻觉问题的基于注意力惩罚与回退策略的解码方法JMT 2023.08.30ICCV 2023 最佳论文候选!北大提出UniDexGrasp++:基于几何感知课程和迭代通用-专家策略学习的灵巧手抓取算法大臣们怎么想?NeurIPS 2023 | 中科院&旷视提出DropPos:全新的自监督视觉预训练代理任务顶刊TMM 2023!中科院提出CLIP-VG:基于自步课程学习实现CLIP在视觉语言理解与定位任务上的无监督迁移研究北航等提出TTP:基于大模型的遥感图像变化检测新网络,性能表现SOTA!GPT-4推理更像人了!中国科学院提出「思维传播」,类比思考完胜CoT,即插即用把ChatGPT塞进副驾驶!清华、中科院、MIT联合提出Co-Pilot人机交互框架把ChatGPT塞进副驾驶!清华、中科院、MIT联合提出Co-Pilot人机交互框架:完美把控乘客意图孤独,寂寞的Amazon软件工程师第九章第三节 联邦司法系统的组织运作JMT 2023.08.29顶刊MIA 2023!PUNet:参数高效医学图像分割的提示微调【回家的路】除夕夜宴 (2023 Chinese New Year Gala)画你所想!北航港大提出DiffSketcher:基于扩散模型的文本驱动矢量化手绘草图合成视频场景图生成任务新SOTA!中山大学提出全新时空知识嵌入框架,登顶刊TIP'24顶刊TPAMI 2023!北大&华为提出:人体动作生成综述性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 SpotlightNeurIPS 2023 | MSRA、清华、复旦等联合提出AR-Diffusion:基于自回归扩散的文本生成清华叉院提出「GenH2R」框架,用百万场景打造基于视觉的通用人机交接策略港大&百度提出LLMRec:基于LLM增强的多模态图神经网络推荐中科院研究人员领衔!【脑神经科学线下营】来了!AAAI 2024 | 武大提出神经元分类全新框架,联合学习神经元骨架与大脑回路拓扑结构火了132年!经典老牌𝙐𝙎𝙋𝘼(美国马球协会)打底衫来了!3折抢!真香JMT 2023.08.27澳洲记忆顶刊TIP 2023!浙大提出:基于全频域通道选择的的无监督异常检测GENOME RES | 北大本科生一作发表论文:基于机器学习的单细胞年龄预测方法Inno-Quark创业精英对话:基于精准基因编辑的新型生物反应平台开创者李金铃火了132年!经典老牌𝙐𝙎𝙋𝘼(美国马球协会)打底衫来了!上身就是高级感,真香!“不发顶刊就分手!”某院医学博士因没有顶刊被甩!反手就报复性发文!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。