浙大/华科提出EVE-NeRF，基于“视角-极线”信息纠缠的可泛化隐式神经辐射场

2024-03-26 05:03

最近来自浙江大学和华中科技大学的研究人员提出 EVE-NeRF 模型，一种具有泛化能力神经辐射场模型用于少样本的 3D 视图合成。模型以一种纠缠的方式聚合视角-极线特征，并引入场景不变的外观连续性和几何一致性先验，在泛化性 3D 视图合成测试中达到 SOTA，并且在真实世界中具有多种应用场景。

在 AR、VR、场景设计、自动驾驶以及电影制作等多个领域中，神经辐射场 NeRF 已经成为一种革命性的技术，它通过从一组二维图像中重建高质量的三维场景，为这些领域带来前所未有的真实感和沉浸感。

然而，传统的 NeRF 通常只适用于优化单个场景，泛化到新场景需要重新训练。另外，NeRF 的优化一般需要同一场景的 50-100 张多视角高质量图片，这在某些场景中是难以获取的。

因此，跨场景训练、少量视角需求的泛化性 NeRF 方法可提高模型的应用范围和灵活性，并节约时间和资源。

以往的泛化性 NeRF，往往需要经过三个步骤：从图像中提取 2D 特征，学习与辐射场对齐的可泛化特征，以及基于体渲染的光线合成。

然而这些方法在学习可泛化特征的阶段，没有同时关注视角和极线两个维度的特征，导致信息交互不足，最终影响新视角的渲染结果。

▲ EVE-NeRF 与仅有视角维度聚合（左上）、仅有极线维度聚合（右上）对比

另外，以往模型仅仅依靠跨场景数据集提供泛化能力，难以保持 3D 场景的外观的连续性和几何的一致性。

▲ EVE-NeRF 和其他泛化性 NeRF 对比

对此，来自浙江大学和华中科技大学的研究人员提出 EVE-NeRF 模型，只需要 3-10 张图片输入，通过纠缠聚合视角和极线两个维度的特征实现跨场景的 3D 视图合成。

论文地址：

https://arxiv.org/abs/2311.11845

项目地址：

https://github.com/tatakai1/EVENeRF

该模型有效地缓解了由仅有视角或极线维度交互所可能导致的固有几何和外观约束的缺失问题，从而进一步提高了 3D 表示的泛化能力。

模型结构

模型 pipeline 如下图所示：

EVE-NeRF 的主要流程涉及三个步骤。首先，在每个源视图中沿着整个极线采集采样点。然后，视角-极线交互（VEI）和极线-视角交互（EVI）模块的交替进行纠缠特征聚合。最后，采用 NeRF 解码器和体渲染来预测目标光线的颜色值。

实验部分

2.1 更高的渲染质量

在实验部分，作者进行了泛化性和 Few-shot 两种环境的测试，并在多种 3D 视图合成数据集进行测试，包括 LLFF、Blender、Shiny 和 DTU，并与以往发表在各大顶会的泛化性 NeRF 的 SOTA 模型进行比较。经定量测试，EVE-NeRF 模型在多项指标中均表现出了最好的效果。