Redian新闻
>
ICLR 2023 | DIM-SLAM:首个实现神经隐式稠密重建的RGB-SLAM

ICLR 2023 | DIM-SLAM:首个实现神经隐式稠密重建的RGB-SLAM

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【SLAM】微信技术交流群

Paper: Dense RGB SLAM With Neural Implicit Maps

作者:Heng Li, Xiaodong Gu, Weihao Yuan, Luwei Yang, Ping Tan

单位:HKUST,Alibaba,SFU

主页:https://poptree.github.io/DIM-SLAM/

Paper:https://openreview.net/forum?id=QUK1ExlbbA

Pipeline
一作老哥一次性挂了三个单位,看起来这博士也读的颠沛流离的。

本篇论文介绍了一种新的密集RGB SLAM方法,采用神经隐式函数来表示地图,相较于之前的方法具有不同之处。与传统的RGB-D SLAM方法不同,我们的方法不需要深度输入,并且不需要任何预训练模型。为了实现这一挑战性的目标,我们引入了一个分层的特征体积来辅助隐式地图解码器,有效地融合不同尺度的形状线索以促进地图重建。同时,我们通过匹配渲染和输入视频帧来同时解决相机运动和神经隐式地图。为了更好地约束相机姿态和场景几何,我们进一步在损失函数中应用了光度曲翘损失。我们在常用的基准测试中,如Replica和TUM上评估了我们的方法,并与现代RGB和RGB-D SLAM系统进行了比较。与之前的方法相比,我们的方法实现了优异的性能,并且甚至超过了一些最新的RGB-D SLAM方法。

本文亮点如下:

  1. 第一个使用神经隐式表达实现了稠密重建的RGB-SLAM系统
  2. 不需要任何预训练模型,如单目深度估计和光流,就能同时优化场景和相机位姿。
  3. 相机位姿的准确度超过了以前的方法并且甚至超过了一些最新的RGB-D SLAM方法。

介绍

传统的RGB-D SLAM方法需要RGB-D相机来获取深度信息,深度相机成本较高,且通常只在室内环境效果较好。因此,发展只使用RGB相机的RGB-SLAM方法变得尤为重要。同时,随着神经隐式函数的发展,如NeRF,其在3D数据处理方面表现出更加优越的性能,因此利用神经隐式函数表示地图在RGBD-SLAM中得到了广泛应用。这种表示方式具有更加紧凑、连续的特点,并且能够预测未观察到的区域,从而有助于路径规划和物体操作等应用。

对比NICE-SLAM,DIM-SLAM在某种程度上在真实场景上能恢复更好的重建结果

难点

基于神经隐式函数的RGB-SLAM方法比传统RGB-D SLAM方法更难实现,因为RGB-SLAM方法需要从视觉输入中同时估计相机姿态和场景的三维结构,而隐式函数必须从有限的视角和像素值中推断出场景的隐式表示。此外,对于大型场景,隐式函数需要具有很高的表达能力和空间分辨率,同时还需要有效的训练和优化方法在有限的时间内收敛。因此,开发一种能够在常规RGB相机上运行的神经隐式函数RGB-SLAM方法是一项具有挑战性的任务。

即使是非常小的物体也能够重建,只需要调整体素的分辨率和边长

算法

神经隐式函数在没有深度输入作为监督的情况下难以收敛,为了克服这个问题,该方法引入了一个分层的特征体素以提高场景表示能力。实验表明这个设计能够在只有RGB作为监督的情况下加速深度的收敛。同时为了能在优化深度的情况下同时优化相机位姿,我们设计了一种基于patch的光度曲翘损失函数来更好地约束相机运动和场景地图。

多尺度的SSIM warping loss,在光流中比较常见

结果

这篇文章在Replica上的相机位姿精度超过了RGBD-SLAM,如NICE-SLAM。同时与当前SOTA的RGB方法,DROID-SLAM,有相似的效果。

Results on Replica

在传统的TUM RGBD数据集上,DIM-SLAM也有与传统RGBD-SLAM方法相媲美的效果。

Results on TUM

DIM-SLAM作为RGB-only的方法,在重建的可视化上效果不逊色与RGB-D的方法,如iMAP。

Visualization on Replica

总结

NeRF based slam是一个非常火热的方向。因为这一类方法对于RGB-only的input,能够直接完成端到端的重建,并且估计出相机的位姿。这篇文章还在openreview上提供了一些video demo。
点击进入—>CV微信技术交流群


CVPR/ECCV 2022论文和代码下载


后台回复:CVPR2022,即可下载CVPR 2022论文和代码开源的论文合集

后台回复:ECCV2022,即可下载ECCV 2022论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF


SLAM 交流群成立


扫描下方二维码,或者添加微信:CVer222,即可添加CVer小助手微信,便可申请加入CVer-SLAM 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。


一定要备注:研究方向+地点+学校/公司+昵称(如SLAM+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信号: CVer222,进交流群


CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!


扫码进群

▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
文末送书 | 入门SLAM优选好书!视觉惯性SLAM:理论与源码解析国际要闻简报,轻松了解天下事(03lāo dao?láo dao!我的“海外”文章在哪里???稀疏模型最新进展!马毅+LeCun强强联手:「白盒」非监督式学习|ICLR 2023ICLR 2023 | GeneFace:高可泛化高保真度的说话人视频合成[评测]Netac Z RGB DDR5-8000 32GB(2x16GB) C38 评测ICLR 2023 | 无惧大规模GNN:中科大提出首个可证明收敛的子图采样方法ICLR 2023 | 高分论文!上海交大提出H2RBox:旋转目标检测新网络爱美丽锻炼我跑步Eruope 2023华大妈挖坑, 赵偷乐悲嚎, 汪健忘打脸ICLR2023 | 论文列表公布,5000 篇投稿,整体接收率为 31.8%2022&2023 Subaru Outback 和 2023 Honda CRV Hybrid二选一【房产资讯】吴市长提交结束市区重建的自治请愿书2023 春 祝姐妹们周末快乐!ICLR 2023 | 3D UX-Net:超强的医学图像分割新网络无惧大规模GNN,用子图也一样!中科大提出首个可证明收敛的子图采样方法 | ICLR 2023 SpotlightCORGI-PM:首个中文性别偏见探索和缓解数据集首销 3699 元,荣耀推出 MagicBook X 14 2023 笔记本 16GB+512GB 版本​ICLR 2023 | LightGCL: 简单且高效的图对比学习推荐系统ICLR 2023 | 清华大学龙明盛组提出通用时间序列神经网络骨干—TimesNet炒股破产,却在其他方面取得巨大成就的人转:2023 回国探亲(5)基于无标注网络驾驶视频,自动驾驶策略预训练新方法 | ICLR 2023首个3D人像视频生成模型来了:仅需1张2D人像,眨眼、口型都能改变 | ICLR 2023ICLR 2023论文列表公布,有机构一口气中20多篇ICLR 2023 | 屠榜OGB-LSC!Uni-Mol超进化开拓材料设计新天地ICLR 2023 | DM-NeRF:从2D图像中实现3D场景的几何分解与编辑(已开源)在种植蘑菇计算机的实验室里,科学家用菌丝体实现神经形态电路南航新增国内多地直飞东京/大阪、台北、曼谷航班!4月起,重庆航空加密重庆=新加坡航班,至每日一班!2023年IGCSE ESL口语考试倒计时准备!想实现ESL全科9/A*,其他内容如何复习?专访项飙:疫情三年之后,中国社会重建的支点是什么?ICLR 2023有哪些值得关注的GNN相关论文?​ICLR 2023 | 标识分支结点,提升图神经网络对环的计数能力彭伟@中科院信工所 - IRRGN: 用于对话回复选择任务的隐式图推理网络达尔文说过一句话ICLR 2023 放榜,31.8%的接受率,你中了吗?ICLR 2023 放榜!31.8%的接受率,你中了吗?ICLR 2023 | 漂移感知动态神经网络:基于贝叶斯理论的时间域泛化框架
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。