Redian新闻
>
英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建

英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建

公众号新闻
Bowen 投稿自 凹非寺
量子位 | 公众号 QbitAI

普通手机“随手”拍的雕像,一下就变成了精细的三维重建图。

水杯来回动的动态场景下,细节清晰可见:

静态场景效果也同样nice,狗狗突出的肋骨都被还原了出来:
对比来看其他方法,效果是酱婶的……

这就是英伟达最新提出的方法BundleSDF

这是一种可对未知物体的6D姿态追踪和三维重建的方法。

用于从单目RGBD视频序列中跟踪未知物体的6自由度运动,同时进行物体的隐式神经三维重建,方法接近于实时(10Hz)。

这种方法适用于任意刚性物体,即使视觉纹理大部分确实,仅需在第一帧中分割出物体,不需要任何额外的信息,并且不对智能体与物体的交互模式做任何假设。

目前,该方法已被CVPR 2023接收。

(论文具体内容可看下方视频介绍)

可处理大幅度姿态变化、有遮挡视频

该方法的关键是一个神经物体场,它与姿态图优化过程同时进行,以便将信息稳健地累积到一致的3D表示中,捕捉几何和外观。

方法自动维护了一组动态的姿态内存帧,以便这些线程之间进行通信。

它能处理具有大幅度姿态变化、部分和完全遮挡、无纹理表面和高光反射等具有挑战性的视频。

作者展示了HO3D、YCBInEOAT和BEHAVE数据集上的结果,证明了我们的方法显著优于现有方法。

野外测试

用于iPhone 12 Pro Max的效果:

用于Intel RealSense的效果:

该方法不仅适用于更具挑战性的动态场景,还适用于此前经常被考虑的静态场景(移动相机)。

因此实现了比专门设计用于静态场景的那些方法更好或相当的结果(即文章开头展示动图)。

与SOTA对比

HO3D数据集上三种最具竞争力方法的定性比较。

左图:6自由度姿态跟踪可视化,其中轮廓(青色)以估计的姿态渲染。

值得注意的是,如第二列所示,我们的预测姿态有时甚至会纠正GT的错误。

右图:每种方法输出的最终3D重建的正面和背面视图。

由于手部遮挡,视频中的某些部分永远不可见。虽然从相同的视角渲染网格,但是DROID-SLAM和BundleTrack的显著漂移导致网格错误旋转。

定量结果对比如下:

问题设置

给定一段单目RGBD输入视频以及仅在第一帧中目标物体的分割掩码,该方法能持续追踪物体的6-DoF姿态并重建物体的3D模型。

所有处理都是在线自回归的(没有假设未来帧可用)。

处理的物体是刚性的,但不依赖其特定丰富的纹理 - 方法适用于无纹理的物体。

此外,不需要物体的实例级CAD模型,也不需要物体类别的先验知识(例如事先对同一物体类别进行预训练)。

具体框架

首先,在连续的分割图像之间匹配特征,以获得粗略的姿态估计(第3.1节)。

其中一些带姿态的帧被存储在内存池中,以便稍后使用和精化(第3.2节)。

从内存池的子集动态创建位姿图(第3.3节);在线优化与当前姿态一起联合细化图中的所有姿态。

然后,这些更新的姿态被存储回内存池中。

最后,内存池中的所有带姿态的帧用于学习神经物体场(在单独的线程中),该场建模了物体的几何和视觉纹理(第3.4节),同时调整其先前估计的姿态,使姿态跟踪更加鲁棒。

项目地址:
https://bundlesdf.github.io/

「人工智能」、「智能汽车」微信社群邀你加入!

欢迎关注人工智能、智能汽车的小伙伴们加入交流群,与AI从业者交流、切磋,不错过最新行业发展&技术进展。

PS. 加好友请务必备注您的姓名-公司-职位噢 ~


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
大脑视觉信号被Stable Diffusion复现图像!“人类的谋略和谎言不存在了” | CVPR2023CVPR 2023 Workshop | 第三届"反无人机"研讨会&挑战赛启动,等你来战!CVPR 2023 | YOLOv7强势收录!时隔6年,YOLOv系列再登CVPR!今年 CV 热点这么多,不可错过 CVPR 2023 线下论文分享会速度提升24倍,30分钟完成室内大场景逆渲染,如视研究成果入选CVPR 20232022&2023 Subaru Outback 和 2023 Honda CRV Hybrid二选一CVPR 2023 | 结合Transformer和CNN的多任务多模态图像融合方法转:2023 回国探亲(5)CVPR 2023 Workshop | 马普所、麻省理工等举办生成模型研讨会CVPR 2023 Workshop | 视频增强质量评价挑战赛启动!CVPR 2023 | 即插即用!SQR:对于训练DETR-family目标检测的探索和思考CVPR 2023最佳论文候选出炉,12篇上榜!武大、港中文、商汤等国内机构多篇入选【限时早鸟价】大佬都开始用三维软件做二维了?来学学这些融合二三维的技巧CVPR 2023 | LED阵列+LCD面板=3072个投影仪:浙大-相芯联合团队实现复杂物体高质量数字化建模CVPR 2023 | G2SD: 让小模型也能从自监督预训练中受益的蒸馏方法生活琐记:好友聚餐,风雪无阻国际要闻简报,轻松了解天下事(03CVPR 2023 Workshop | 动态点云感知任务挑战赛启动!CVPR 2023 | 多个扩散模型相互合作,新方法实现多模态人脸生成与编辑看高清视频不用开会员,英伟达新技术真有这么厉害?ICLR 2023|场景三维重建新SOTA!基于3D Transformer的单目场景重建CVPR 2023最佳论文候选出炉!武大、港中文、商汤等国内机构多篇入选2023 春 祝姐妹们周末快乐!CVPR 2023 Workshop | 首个大规模视频全景分割比赛晨游,看文献dietary supplement没有降低LDL相对论动量和能量的一笔乱账CVPR 2023 | 正则化方法DropKey: 两行代码高效缓解视觉Transformer过拟合CVPR 2023|两行代码高效缓解视觉Transformer过拟合,美图&国科大联合提出正则化方法DropKeyCVPR 2023 | IDEA与清华提出首个一阶段3D全身人体网格重建算法录用2360篇、接收率25.78%,CVPR 2023接收结果公布英伟达新一代移动工作站 GPU 曝光:含 RTX 2000 - 5000在水一方CVPR 2023 接收结果出炉!再创历史新高!录用2360篇!(附10篇最新论文)Eruope 2023CVPR 2023|Crowd3D:数百人大场景3D位置、姿态、形状重建,开源benchmark数据集CVPR 2023|Crowd3D:支持数百人3D/姿态/形状/位置重建的新基准CVPR2023 | 微软提出高效率大规模图文检索模型CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型CVPR 2023 | 开源了!一种通用的视频闪烁去除方法随笔一则
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。