Redian新闻
>
未知物体也能轻松识别分割,效果可迁移 | DeepMind研究

未知物体也能轻松识别分割,效果可迁移 | DeepMind研究

公众号新闻
Pine 发自 凹非寺
量子位 | 公众号 QbitAI

从来没有见过的新物体,它也能进行很好地分割。

这是DeepMind研究出的一种新的学习框架:目标发现和表示网络(Object discovery and representation networks,简称Odin)

以往的自我监督学习(SSL)方法能够很好地描述整个大的场景,但是很难区分出单个的物体。

现在,Odin方法做到了,并且是在没有任何监督的情况下做到的。

区分出图像中的单个物体可不是很容易的事,它是怎么做到的呢?

方法原理

能够很好地区分出图像中的各个物体,主要归功于Odin学习框架的“自我循环”。

Odin学习了两组协同工作的网络,分别是目标发现网络和目标表示网络。

目标发现网络以图像的一个裁剪部分作为输入,裁剪的部分应该包含图像的大部分区域,且这部分图像并没有在其他方面进行增强处理。

然后对输入图像生成的特征图进行聚类分析,根据不同的特征对图像中各个物体的进行分割。

目标表示网络的输入视图是目标发现网络中所生成的分割图像。

视图输入之后,对它们分别进行随机预处理,包括翻转、模糊和点级颜色转换等。

这样就能够获得两组掩模,它们除了剪裁之外的差异,其他信息都和底层图像内容相同。

而后两个掩模会通过对比损失,进而学习能够更好地表示图像中物体的特征。

具体来说,就是通过对比检测,训练一个网络来识别不同目标物体的特征,同时还有许多来自其他不相干物体的“负面”特征。

然后,最大化不同掩模中同一目标物体的相似性,最小化不同目标物体之间的相似性,进而更好地进行分割以区别不同目标物体。

与此同时,目标发现网络会定期根据目标表示网络的参数进行相应的更新。

最终的目的是确保这些对象级的特性在不同的视图中大致不变,换句话说就是将图像中的物体分隔开来。

那么Odin学习框架的效果究竟如何呢?

能够很好地区分未知物体

Odin方法在场景分割时,没有先验知识的情况下迁移学习的性能也很强大。

首先,使用Odin方法在ImageNet数据集上进行预训练,然后评估其在COCO数据集以及PASCAL和Cityscapes语义分割上的效果。

已经知道目标物体,即获得先验知识的方法在进行场景分割时,效果要明显好于其他未获得先验知识的方法。

而Odin方法即使未获得先验知识,其效果也要优于获得先验知识的DetCon和ReLICv2。

除此之外,Odin方法不仅可以应用在ResNet模型中,还可以应用到更复杂的模型中,如Swim Transformer。

在数据上,Odin框架学习的优势很明显,那在可视化的图像中,Odin的优势在何处体现了呢?

将使用Odin生成的分割图像与随机初始化的网络(第3列),ImageNet监督的网络(第4列)中获得的分割图像进行比较。

第3、4列都未能清晰地描绘出物体的边界,或者缺乏现实世界物体的一致性和局部性,而Odin生成的图像效果很明显要更好一些。

参考链接:
[1] 
https://twitter.com/DeepMind/status/1554467389290561541
[2] https://arxiv.org/abs/2203.08777

百度研究院、阿里达摩院、量子位智库

年度十大科技报告

总结2022,预见2023。来自百度研究院、阿里达摩院和量子位智库的年度十大科技报告均已发布,点击下方图片即可跳转查看。

百度研究院

阿里达摩院

量子位智库


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
多彩班芙行(4)-冰原阳光道天赋“易昺(bǐng)”,创造历史!用一张图,如何做高大上的PPT封面?这4个小技巧,小白也能轻松学会!小学语文不刷题,也能轻松打牢基础?实测是真的!管不住嘴也能成功减肥?研究建议:学会这样吃,无需节食,就能轻松对抗肥胖!华人注意!佐治亚州再现驾照诈骗,一招轻松识破骗局!学完这个教程,小白也能构建Transformer模型,DeepMind科学家推荐DIY留学申请攻略!不用中介费也能轻松上名校!谁发表了最具影响力的AI研究?谷歌遥遥领先,OpenAI成果转化率完胜DeepMind零基础看懂中国画,美育也能轻松有趣伊朗裔女医生KNOW-CKD研究最新分析,血清甘油三酯水平与非透析慢性肾病患者的不良肾脏结局是否相关?NeurIPS 2022 | 全新迁移学习范式DeRy,把知识迁移玩成活字印刷迁移学习「求解」偏微分方程,条件偏移下PDE的深度迁移算子学习Spotify 移动工程平台迁移:将 Android 和 iOS 代码库迁移到 BazelNpj Comput. Mater.: 原子间势—准确性和可迁移性富士康不守承诺农民工造反有理没有科技与狠活!厨房小白也能轻松掌握的逼格大餐AAAI 2023 Oral | 如何识别未知标签?多模态知识迁移框架实现新SOTA迁移上云或跨云迁移如何做到安全、高效、低成本?想要移民澳洲, 选对专业很重要! 雅思只要4个6, 也能轻松上岸190DeepMind提出Odin:目标发现和表示网络,未知物体也能识别和分割!真实世界中日本COVID-19患者应用抗凝药物的策略—来自CLOT-COVID研究积木式深度学习的正确玩法!新加坡国立大学发布全新迁移学习范式DeRy,把知识迁移玩成活字印刷|NeurIPS 2022玩法变了!2023,产品人该如何提炼“可迁移“的产品能力?文科生也能轻松上的STEM专业?美硕传媒STEM专业推荐+申请难度梯队盘点!《小羊上山》汉语分级读物1-5级,60万家庭都在用,轻松识字,培养自主阅读~「北美一周新闻」华人注意!美国再现驾照诈骗,一招轻松识破骗局!读书也能轻松赚钱,不用露脸,在家可做!家里没有英语环境,有了这个神器,照样带娃高效双语启蒙,老人也能轻松操作2022傅雷翻译出版奖获奖者揭晓 Le palmarès du Prix Fu Lei 2022 dévoilé艺术感超强的立体彩绘石膏画,孩子也能轻松画出来,体验当小画家的感觉!那些曾经的点心渣儿中国式家庭,英国式生活AAAI 2023 | 如何识别未知标签?多模态知识迁移框架实现新SOTA
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。