Redian新闻
>
顶刊TPAMI 2022!清华刘玉身团队提出SPD:雪花反卷积网络

顶刊TPAMI 2022!清华刘玉身团队提出SPD:雪花反卷积网络

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【计算机视觉】微信技术交流群

转载自:图形学与几何计算

点云形状补全与生成是三维计算机视觉的研究热点及难点。虽然现有的工作在单个任务上能取得不错的效果,但往往难以被灵活且高效地推广到多种不同的点云生成任务。近期,清华大学的刘玉身团队于TPAMI 2022在线发表了一项重要成果SPD[1],提出了一种通用化的雪花反卷积(SPD)用于点云补全和多个生成类任务,包括:点云自编码、新形状生成、单视图重建以及点云上采样,并开源基于计图(Jittor)的代码。
Part 1
研究问题和背景
点云形状补全[2-3]旨在从输入的残缺点云来预测高质量的完整形状。但受限于点云先天离散性和局部非结构化生成[4-5]的特点,现有的点云补全工作往往无法很好地还原局部细节特征。此项工作的早期版本曾在ICCV 2021报告[6],其动机是提出一种新的网络结构(SPD)从而能够更好地捕捉和还原局部几何细节和结构特征,例如光滑表面,锐边和锐角等。每一层SPD接收前一层的点云作为输入,并对其中每个父节点进行分裂从而生成多个子节点,这样多层SPD相互协作,使得每个初始种子节点的后代节点如雪花生长一般在三维空间中展开(如图1所示)。

图1 雪花反卷积效果可视化

同时,SPD是一种通用化的点云生成模块,可进一步将其推广到了更多的点云生成类任务,包括点云自编码、新形状生成、单视图重建以及点云上采样,并在多个现有数据集上验证了SPD的细节生成能力和泛化能力。

Part 2
方法概述

如图2所示,每一层SPD接收前一层生成的点云作为输入,并对其中每个点进行分裂。SPD捕捉形状细节的核心在于使用Skip-Transformer来融合历史偏移特征以及形状上下文信息。

图2 雪花反卷积(SPD)
如图3所示,Skip-Transformer接收当前SPD的逐点特征和前一步SPD的偏移特征作为输入,利用注意力机制来融合这两者,从而生成当前SPD的形状上下文特征。

图3 Skip-Transformer
Part 3
结果展示
下面在多个任务的现有数据集上,进行了定量和定性的实验比较,展示量化和可视化的结果。
1) 点云补全,ShapeNet-34/21数据集

ShapeNet-34/21数据集常用于验证跨类别形状补全。其中34个类用于训练,另外21个未见过的类只用于测试。表1显示SPD方法在量化结果上相较于之前的方法有可观的提升。图4中展示了跨类别补全的可视化对比。

表1 ShapeNet-34/21补全数据集上的量化结果

图4 ShapeNet-34/21数据集上跨类别补全可视化对比

2) 点云补全,ScanNet数据集

下面是ScanNet数据集的椅子类别上,验证SPD在真实数据集下的补全能力。表2和图5分别是量化和可视化对比。

表2 ScanNet数据集真实点云补全量化比较

图5 ScanNet真实点云补全可视化对比

3) 点云自编码,ShapeNet数据集

点云自编码(Auto-encoding)任务用于验证SPD从特征向量中解码完整点云的能力。下面展示在ShapeNet数据集上进行的实验,在编码器相同的情况下,SPD相较于现有方法具有更好的生成能力。表3和图6分别展示了量化和可视化对比。

表3 ShapeNet数据集上点云自编码量化比较

图6 ShapeNet数据集上点云自编码可视化对比

4) 新形状生成,ShapeNet数据集

同样在ShapeNet数据集上进行实验,也验证了SPD的新形状生成能力,结果如表4和图7所示。

表4 ShapeNet数据集上新形状生成量化比较

图7 ShapeNet数据集上新形状生成可视化

5) 单视图重建,ShapeNet

单视图重建任务可用于验证SPD从视图特征解码完整点云的能力。表5和图8分别是量化和可视化对比。

表5 ShapeNet数据集上单视图重建量化比较

图8 ShapeNet数据集上单视图重建可视化对比

6) 点云上采样,PUGAN

SPD同样可以被应用于点云上采样任务。从量化(表6)及可视化(图9)结果可以看出SPD在保证模型轻量化的同时,可以达到接近甚至超越现有方法的上采样水平。

表6 PUGAN数据集点云上采样量化比较

图9 PUGAN数据集点云上采样可视化对比

Part 4
计图开源
SPD方法已开源了基于计图(Jittor)实现的代码,网络模型的训练速度在多个任务上较PyTorch有提升。

表7 Jittor与PyTorch的训练时间对比

SPD的Jittor开源代码:

https://github.com/AllenXiangX/SPD_jittor
计图官网:
https://cg.cs.tsinghua.edu.cn/jittor/
IEEE T-PAMI论文的主页:
https://ieeexplore.ieee.org/document/9928787
参考文献

  1. Peng Xiang, Xin Wen, Yu-Shen Liu, Yan-Pei Cao, Pengfei Wan, Wen Zheng, Zhizhong Han, Snowflake Point Deconvolution for Point Cloud Completion and Generation with Skip-Transformer, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2022, DOI: 10.1109/TPAMI.2022.3217161.
  2. Xin Wen, Peng Xiang, Zhizhong Han, Yan-Pei Cao, Pengfei Wan, Wen Zheng, Yu-Shen Liu, PMP-Net++: Point Cloud Completion by Transformer-Enhanced Multi-step Point Moving Paths, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 45(1): 852-867

  3. Xin Wen, Peng Xiang, Zhizhong Han, Yan-Pei Cao, Pengfei Wan, Wen Zheng, Yu-Shen Liu, PMP-Net: Point Cloud Completion by Learning Multi-step Point Moving Paths, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2021, 7443-7452.

  4. Xin Wen, Tianyang Li, Zhizhong Han, and Yu-Shen Liu*. Point cloud completion by skip-attention network with hierarchical folding. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2020, 1939–1948.

  5. Xin Wen, Zhizhong Han, Yan-Pei Cao, Pengfei Wan, Wen Zheng, Yu-Shen Liu*. Cycle4Completion: Unpaired Point Cloud Completion using Cycle Transformation with Missing Region Coding. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2021, 13080-13089.

  6. Peng Xiang, Xin Wen,Yu-Shen Liu, Yan-Pei Cao, Pengfei Wan, Wen Zheng, Zhizhong Han, SnowflakeNet: Point Cloud Completion by Snowflake Point Deconvolution with Skip-Transformer, Proceedings of the IEEE/CVF International Conference on Computer Vision, 2021, 5499-5509.

点击进入—>CV微信技术交流群


CVPR/ECCV 2022论文和代码下载


后台回复:CVPR2022,即可下载CVPR 2022论文和代码开源的论文合集

后台回复:ECCV2022,即可下载ECCV 2022论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF


3D点云 交流群成立


扫描下方二维码,或者添加微信:CVer222,即可添加CVer小助手微信,便可申请加入CVer-3D点云 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。


一定要备注:研究方向+地点+学校/公司+昵称(如3D点云+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信号: CVer222,进交流群


CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!


扫码进群

▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Meta发布ConvNeXt V2!仅用最简单的卷积架构,性能不输Transformer轰动全球的室温超导研究,被光速证伪?南京大学闻海虎团队提交重磅论文顶刊TIP2022!领域迁移Adaboost,让模型“选择”学哪些数据!地方动态丨成都市委常委、统战部部长刘玉泉到成都欧美同学会机关调研指导工作校友活动丨珍存2022 迎接2023:清华经管EMBA内蒙古校友会2022-2023云端迎新年活动龙卷风健康快递 229平安夜晚餐ChatPDF也来了!一键上传文件即可解读,复制粘贴都省了2023建筑学专业大学排名曝光:清华位于前10,同济12!建筑学子看完都沉默了...ChatPDF:解读量化投资论文我可以!ICLR 2023 | 清华大学龙明盛组提出通用时间序列神经网络骨干—TimesNet2022 湾区公立/私立高中 UCB 录取率排名2022年数字阅读影响力期刊TOP100发布,《第一财经》杂志蝉联国内财经类媒体第一中国反卷第一名的城市,下午6点准时下班【回顾与展望】 2022,非洲收宮之旅,阿尔及利亚,埃塞俄比亚,突尼斯CVPR 2023 | 白翔团队提出:将CLIP模型用于场景文本检测扩散模型再发力!Hinton团队提出:图像和视频全景分割新框架清华风物丨收!清华体育场馆图鉴因为每周上班4天半,乐视居然成为了反卷斗士?ChatPDF也来了!一键上传文件即可解读,复制粘贴都省了...每周健走 - 4月16日: 红河谷国家城市公园(3)突发!时代广场跨年中19岁男子安检口挥刀连砍3名警员!NYPD:或恐袭【回顾与展望】2022 后疫情时代的旅游,2023 回家球迷献给梅西的作品,让人感动到哭金融游牧 信仰的颠覆(七十)2022 USNEWS发布美国薪酬最高行业TOP25澳洲这行业太卷了! 开学季反卷王: 邮费仅这个数, 啥都能寄! 最快3天到蓝柯/徐可合作团队提出新冠病毒广谱疫苗设计新策略中科大&微软提出SinDiffusion:从单个自然图像学习扩散模型SparK项目原作解读:卷积模型的首个BERT预训练时序分析五边形战士!清华提出TimesNet:预测、填补、分类、检测全面领先|ICLR 20236种卷积神经网络压缩方法Diffusion+目标检测=可控图像生成!华人团队提出GLIGEN,完美控制对象的空间位置官网满$200减$40!Costco复活节必买减价:雪蟹+三文鱼+龙虾肉! 实体店102种特价来袭!21世纪新路霸“暴走健身团”,真就没人能管得了?今天随意浏览了一下CMU 2019《细胞》:北京化工大学Jens Nielsen/刘子鹤团队提出焦磷酸肌醇调控酵解和呼吸平衡新机制你好2023,再见2022!盘点2022年度备受关注的十大事件!《西游 ABC》定档,阵容强大:杨紫琼刘玉玲吴彦祖
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。