Redian新闻
>
华为&中科大提出TinySAM:手机就能实时跑的分割一切模型

华为&中科大提出TinySAM:手机就能实时跑的分割一切模型

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【图像分割】微信交流群

扫码加入CVer学术星球可以获得最新顶会/顶刊上的论文ideaCV从入门到精通资料,以及最前沿项目和应用!发论文搞科研,强烈推荐!

作者:王云鹤@知乎(已授权)
来源丨https://zhuanlan.zhihu.com/p/674854075

分割一切模型(Segment Anything Model,SAM)展现出了强大的分割万物能力,但是网络结构复杂,计算代价高,在资源受限的端侧应用中无法直接使用。同时,我们发现在SAM的Everything推理模式中,原始的网格点prompt的方式会带来巨大的计算代价。针对这个问题,我们提出了TinySAM模型,利用知识蒸馏、量化等手段对模型做了极致的压缩,同时提出了再Everything推理模式下的层次化推理策略。TinySAM在计算代价降低多个数量级的情况下,仍然保持了SAM模型强大的zero-shot分割能力。

TinySAM: Pushing the Envelope for Efficient Segment Anything Model
论文:https://arxiv.org/abs/2312.13789
同时我们开源了TinySAM的Pytorch和Mindspore代码和模型,供大家试用:
Pytorch代码:
https://github.com/xinghaochen/TinySAM
Mindspore代码:
https://gitee.com/mindspore/models/tree/master/research/cv/TinySAM
TinySAM在手机端侧可完成给定点或框作为prompt的自动分割功能。

TinySAM: 极致高效的分割一切模型

这个工作通过知识蒸馏、后量化等方法对SAM模型做极致压缩,同时提出一种针对Everything推理的加速方法,探索分割一切模型性能和效率的极限。

图1:(a)展示了TinySAM的框架,通过一种全阶段知识蒸馏、后量化和层次化推理加速方法,模型计算量可以降低到原来的1/50;(b)展示了模型在zero-shot下游分割任务上仍然保持了良好的性能。

(1) 全阶段知识蒸馏

针对分割一切模型多模块、难优化的结构特点,我们提出一种全阶段的知识蒸馏方法,从多个特征层面进行蒸馏学习,从图像特征(embedding)、最终监督特征(mask)、中间过渡特征(token)三个层面进行蒸馏损失的设计,最大程度减少轻量化学生网络的学习难度。

图2:全阶段知识蒸馏框架

(2) 模型后量化

为了进一步降低模型计算量,提升推理效率,我们将TinySAM量化到8bit,其中卷积层和反卷积层采用channel-wise的非对称均匀量化,matmul和linear层分别采用headwise和layerwise的对称均匀量化。在量化策略上,逐层对网络进行串行量化,并采用与任务Loss更一致的hessian guided metric作为量化前后输出的距离度量。量化后的模型计算量能进一步减少到全精度的1/4左右,大幅降低计算量。

(3) 层次化分割一切

SAM模型在Everything(分割一切)推理模式中,通过密集的网格点作为Prompt进行推理,我们发现这种密集的Prompt输入和推理耗费了大量的计算量。因此,我们设计了一种层次化的分割一切的推理策略。先用较少的初始采样点得到初始结果,然后把高置信度区域的密集采样点移除,得到二次推理结果,与初始推理结果进行后处理融合得到最终的推理结果。这种策略在保持分割一切效果的同时,大幅减少了采样点数量,推理加速一倍左右。

图3:我们设计的层次化分割一切推理模式,我们先用较少的采样点得到初始的结果,然后我们把高置信度区域的密集采样点移除,得到二次推理结果后通过后处理与初始结果融合得到最终的分层推理结果。

实验结果

我们在多个zero-shot下游任务上进行了实验,包括在COCO和LVIS数据集的zero-shot实例分割实验,我们按照SAM论文的设置通过ViTDet得到的检测框作为Prompt输入到TinySAM模型中。相比MobileSAM,TinySAM在COCO的平均准确率提升0.9%,在LVIS的平均准确率能提升1.6%。即使采用8bit量化后,TinySAM仍然保持了性能优势。更多的实验结果和可视化结果请参考论文。

在CVer微信公众号后台回复:论文,即可下载论文pdf和代码链接!快学起来!

CVPR / ICCV 2023论文和代码下载

后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:ICCV2023,即可下载ICCV 2023论文和代码开源的论文合集

图像分割交流群成立


扫描下方二维码,或者添加微信:CVer444,即可添加CVer小助手微信,便可申请加入CVer-图像分割 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。


一定要备注:研究方向+地点+学校/公司+昵称(如图像分割+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer444,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!


扫码加入星球学习


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
※※※ 2023唱坛【谁是大模王】& 【 2023万圣节蒙面快闪】 活动合辑※※※无需额外知识或训练!中科大等提出OPERA:缓解多模态大模型幻觉问题的基于注意力惩罚与回退策略的解码方法NeurIPS 2023 | 北大&华为提出:多模态基础大模型的高效微调工业异常检测大模型来了!哈工大提出Myriad:利用视觉专家进行工业异常检测的大型多模态模型AAAI 2024 | 中科院信工所提出结构化概率编码框架,有效增强预训练语言模型泛化能力ABC找小留, Pro & ConChatGPT性能最多提升214%,刷新7个榜单!IDEA、港科大广州等提出ToG思维图谱几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型Q&A 申请医学院说说李克强的两岸关系政策人生完整了:第一次被逼要小费&讨论:继中餐馆,也需远离中国tony了吗?浙大提出KnowPAT框架:大模型的知识偏好对齐与垂域应用NeurIPS 2023 | 港科大&华为提出CoDA:开放词汇3D目标检测新网络朝鲜战争志愿军为什么没有全军覆没刚刚开源!中科大提出利用GPT4-V构建大规模高质量图文数据集ShareGPT4V,助力模型霸榜多项多模态榜单!CVPR 2023 | 无中生有:面向实时点云全景分割的中心聚焦网络大规模视觉模型新突破!70亿参数!Apple新作AIM:自回归图像模型抛弃编码器-解码器架构,用扩散模型做边缘检测效果更好,国防科大提出DiffusionEdge训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解AI早知道|华为HarmonyOS Next开放申请;三星发布AI手机Galaxy S24;谷歌推出几何模型刷新多个SOTA!北大提出Video-LLaVA:超强视频语言大模型!iPhone,再见!新买的格力手机,一开机就能看到董明珠,狠狠爱了!28、29 长篇民国小说《永泰里》第七章 明争暗斗 (1)&(2)书识——— 读孙过庭《书谱》加快20倍!Meta重磅提出EfficientSAM:快速分割一切!视觉全新主干!中科院&华为提出VMamba:视觉状态空间模型小甜甜即将推出新作“N Diamonds”,前任却在这时跑来沾边?红色日记 批评高潮 2.16-28模型越大,性能越好?苹果自回归视觉模型AIM:没错分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速文生图10倍速,视频实时渲染!清华发布LCM:兼容全部SD大模型、LoRA、插件等PyTorch团队重写「分割一切」模型,比原始实现快8倍北航等提出TTP:基于大模型的遥感图像变化检测新网络,性能表现SOTA!轻奢品质小团 黄石公园6日游:盐湖城接送+黄石湖自驾小艇+大提顿国家公园漂流+大提顿山缆车 5/22-9/11隔周三出发 YA6PyTorch团队重写「SAM分割一切」模型,比原始实现快8倍!低成本扩大输入分辨率!华科大提出Monkey:新的多模态大模型全澳首个!悉尼机场推出“黑科技”,AR地图功能在室内也能实时导航【资讯】EDF推出Tempo优惠电价套餐:是否适合您?分割一切"3D高斯"来了!上交&华为提出SAGA:几毫秒完成3D分割一切!重新拿起笔来
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。