国际科技财经博客移民网络热点娱乐民生时事公众号

>

大卫复活！英伟达再造「神经朗基罗」，3D重建肌肉纹理肉眼可见

大卫复活！英伟达再造「神经朗基罗」，3D重建肌肉纹理肉眼可见

公众号新闻

2023-06-02 05:06

新智元报道

编辑：桃子好困

【新智元导读】16世纪的米开朗基罗重生了！英伟达团队提出Neuralangelo，从2D视频重建3D大规模场景，将5.5米大卫雕像完美复刻。

今天，英伟达再造了16世纪的米开朗基罗「Neuralangelo」。

快看，Neuralangelo「复刻」出3D版的著名雕像大卫，大理石的细节、纹理栩栩如生。

要知道，收藏在佛罗伦萨美术学院的大卫雕像，仅身高3.96米，加上基座都有5.5米。

它甚至可以重建一栋建筑物的内外部结构，屋顶瓦片、玻璃窗格、还有各种细节都一一再现。

这一切，都是「神经朗基罗」（Neuralangelo）的魔法。

来自英伟达和约翰霍普金斯大学的研究人员提出的新型AI模型，利用神经网络重建3D物体。

最新研究已被CVPR 2023录用。

论文地址：https://research.nvidia.com/labs/dir/neuralangelo/paper.pdf

特别是，Neuralangelo可以从手机视频，无人机拍摄的视频重建「高保真的大规模场景」。

那岂不是未来，就能轻易地把一座城市、甚至外太空的视频，变成一个沉浸式的世界，再装进游戏去体验。

网友惊呼，英伟达黑了「矩阵」世界！

甚至，还有人称，苹果XR技术，再加上Neuralangelo，就能创造「new worlds」了。

效果演示

英伟达的总部

破旧的卡车

Ignatius的雕像

重建3D场景

以前的AI模型在重建3D场景时，往往难以准确捕捉到重复的纹理模式、均匀的颜色以及强烈的色彩变化。

为此，团队提出了一个将多分辨率3D哈希网格的表征能力和神经表面渲染相结合的全新方法——Neuralangelo。

去年，英伟达研究人员曾创造了一种新工具3D MoMa，将照片变成3D物体易如反掌。

NeuralAngelo建立在这一概念的基础上，允许导入更大、更详细的空间和对象。而它特别之处在于，可以准确捕捉重复的纹理模式、同质的颜色和强烈的颜色变化。

通过采用「即时神经图形基元」，也就是NVIDIA Instant NeRF技术的核心，Neuralangelo由此可以捕捉更细微的细节。

团队的方法依赖于2个关键要素：

（1）用于计算高阶导数作为平滑操作的数值梯度；

（2）在控制不同细节级别的哈希网格上进行由粗到细的优化。

即使没有辅助深度，Neuralangelo也能有效地从多视图图像中恢复密集3D表面结构，其保真度显著超过了以往的方法，使得能够从RGB视频捕捉中重建详细的大规模场景。

构建NeuralAngelo

NeuralAngelo模型是在多分辨率哈希编码，以及基于SDF的体积渲染上进行构建。

第一步：使用数值梯度来计算高阶导数

通过使用与哈希网格空间分辨率匹配的步长的数值梯度，可以优化超越局部单元。与解析梯度相比，数值梯度对SDF起到了平滑操作的作用。

第二步：逐步细化细节层次

通过逐步减小数值梯度的步长，并启用更高分辨率的哈希网格，优化的效果可以更好地恢复大面积的光滑表面和精细的几何细节。这种学习过程能够逐步提高细节的层次感。

第三步：优化

NeuralAngelo使用三个优化目标：

RGB合成损失

：输入图像和合成图像之间的RGB重建损失。

Eikonal损失

：对底层SDF进行正则化处理，使其表面法线为单位正则。

曲率损失

：对底层SDF进行正则化处理，使平均曲率不会任意变大。

「神经朗基罗」构建好了，那么它又是如何运作的呢？

可以说，Neuralangelo还原了米开朗基罗刻画大卫的整个过程：

· 首先，模型会从2D视频中选择几帧从不同角度拍摄的物体/场景的画面，并由此「看到」其深度、大小和形状。这个过程就像雕塑艺术家一开始会从多个角度构图那样。

· 然后，模型会创建一个粗糙的3D场景表征，就像艺术家开始凿刻主体的形状。

· 最后，模型会优化渲染以提高细节的清晰度，就像艺术家通过精心地修饰来模仿织物或人形的纹理。

在DPU基准定性比较中， Neuralangelo产生更准确和更高保真度的表面。

如下是Neuralangelo在DTU数据集中的定量结果，模型获得了很好的重建精度和图像合成质量。

在不同的从粗糙到精细优化方案定性比较中，当使用分析梯度AG和AG+P，物体粗糙表面还有伪影。

当使用数字梯度（NG）时，能够重建一个比较好的粗糙表面，细节也被平滑。

而英伟达的解决方案（NG+P）能够生成光滑的表面，以及精细的细节。

最终的结果是一个可以在虚拟现实应用、数字孪生或机器人开发中使用的3D物体或大规模场景。

英伟达表示，Neuralangelo将复杂材料的纹理，包括屋顶瓦片的粗糙度、大理石的光滑度，从2D视频转化为3D物体的能力，显著超越了以往的方法。

英伟达研究部高级主任、论文作者Ming-Yu Liu对这项研究的意义给出了畅想：

「Neuralangelo提供的3D重建能力将给创作者带来巨大好处，帮助他们在数字世界中重建真实世界。这个工具最终将使开发人员能够将精细的物体——不论是小型雕像，还是大型建筑——导入视频游戏或工业数字孪生的虚拟环境中。

创意的专业人士可以将这些3D对象导入到设计应用中，进一步编辑，以供艺术、电子游戏开发、机器人技术和工业数字孪生等领域使用。

作者介绍

Zhaoshuo Li（李赵硕）

李赵硕目前还是约翰霍普金斯大学的计算机科学博士生，导师是Mathias Unberath教授、Russell H Taylor教授。

他对计算机视觉、计算机图形学、深度学习有浓厚的兴趣，研究重点是从图像中重现运动和结构。

另外，他还有非常多的爱好，是摄像师、心理健康促进者、宠物狗的爱好者、还是冲浪者、跳伞者、滑雪板运动员…

Chen-Hsuan Lin

Chen-Hsuan Lin是NVIDIA Research的一名研究科学家，从事计算机视觉、计算机图形学和人工智能方面的工作。

他在卡内基梅隆大学获得了机器人学博士学位，并获得英伟达研究生奖学金。此前，他还在Facebook AI Research和Adobe Research实习。

Lin对解决3D重建、视图合成和3D内容生产的问题非常感兴趣。其研究旨在通过从互联网规模的视觉数据中学习，赋予人工智能系统人类水平的3D感知和想象能力，向真正的3D空间智能迈进。

网友热评

英伟达科学家Jim Fan表示，

为了让你了解3D建模的人工智能发展速度：该领域在3年内从左边（原始的NeRF重建的网格）到右边（英伟达的Neuralangelo）。

将现实传送到高保真模拟中不再是一个梦想。

新的Neuralangelo模型简直是一个野兽，英伟达决定淘汰我们，R.I.P.摄影测量软件。

简直就像数字世界的「米开朗基罗」。

还有网友表示想知道，用它的成本是多少？

我们可以在工厂使用无人机，然后将视频发送到这个模型，做一个数字孪生，并使用它来优化我们的流程。

对于这项技术的意义，网友认为这对游戏行业来说影响将是巨大的。

参考资料：

https://blogs.nvidia.com/blog/2023/06/01/neuralangelo-ai-research-3d-reconstruction/

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

CVPR 2023｜Crowd3D：数百人大场景3D位置、姿态、形状重建，开源benchmark数据集这种让你对蛋糕奶茶不再爱的「神药」，我劝你慎用……伦敦重建区每年房价比周边多涨2.2% ！不止房价增长，重建区还有这些好处！英伟达再燃AI算力热潮，公募看好“软硬”双投资主线市值暴涨至万亿美元后，英伟达再放大招！推出超级 AI 计算平台：集成 256 个 GH200 芯片、共享内存 144TB 妹子患舌癌被迫割舌保命，医生用她大腿肌肉，为她再造了个舌头！向太唯一的「神秘女儿」，终于露脸了《是你》对未知物体进行6D追踪和3D重建，英伟达方法取得新SOTA，入选CVPR 2023 华人的思维，某些科学家发明家的思维英伟达推出新AI模型Neuralangelo 可将视频转换为高精3D模型学而思名师让语文考题模板化，学完肉眼可见的进步了｜开团前哨速览：英伟达再投GPU云平台，台积电下调营收指引，“亚太肥胖与肌肉衰减代谢联盟成立大会暨第一届亚太肥胖与肌肉衰减代谢联盟高峰论坛”在深圳召开 “3D重置”：重塑全球经济的三大趋势 CVPR 2023｜Crowd3D：支持数百人3D/姿态/形状/位置重建的新基准新变种病毒扩散！加拿大卫生部提醒千万别揉眼睛！COVID重度感染 ICLR 2023｜场景三维重建新SOTA！基于3D Transformer的单目场景重建 “丫丫”一到家就被竹子包围了！网友：肉眼可见地胖了馋了，亲手在家里包羊肉胡萝卜馅儿饺子用了 ChatGPT 刚更新的「神器」，我的打工效率提升了 200%HEATBOYS“机甲神龟”米开朗基罗：配枪管可转的电动加特林火炮！中国不是发达国家只是装B失败的贫困户数字文艺复兴来了：英伟达造出「AI版」米开朗基罗，实现高保真3D重建 AIGC教程：如何使用Stable Diffusion，实现PBR材质纹理自由？日本人创办的各种「神奇协会」，真是大开眼界！《封神榜》大火：妈妈辈的顶流男神，让审美代际差肉眼可见的消失了英伟达再加码创企投资；高通支持端侧跑Llama 2；浙大TableGPT发布丨AIGC大事日报英伟达馋哭建模师！投喂随意视频，直出3D模型，华人一作登CVPR 2023 学而思名师让语文考题模板化，学完肉眼可见的进步了（明10点开团）3D版「分割一切」来了！NUS华人团队最新模型，单视图重建3D，又快又准必须保卫复杂 | 2023第六届宝珀理想国文学奖启动 5040 血壮山河之武汉会战鏖战幕府山 9 市值暴涨至万亿美元后，英伟达再放大招！推出超级AI计算平台：集成256个GH200芯片、共享内存144TB 隐居四线城市，她打造出「神仙花园」，理想生活不一定很贵！

热点事件追踪