Redian新闻
>
Relate Anything来了!帮你搞定一切关系!

Relate Anything来了!帮你搞定一切关系!

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【图像分割和多模态】微信技术交流群

本月初,Meta推出的一款可以【分割一切】的模型已经引起了广泛的关注。今天,我们很荣幸向大家介绍一款名为“Relate-Anything-Model(RAM)”的机器学习模型。它赋予了Segment Anything Model(SAM)识别不同视觉概念之间的各种视觉关系的能力。该模型由南洋理工大学MMLab团队和伦敦国王学院和同济大学的VisCom实验室的同学利用闲暇时间合作开发。

演示程序链接:

https://huggingface.co/spaces/mmlab-ntu/relate-anything-model

代码链接(已开源):

https://github.com/Luodian/RelateAnything

数据集链接:

https://github.com/Jingkang50/OpenPSG

RAM模型基于ECCV'22 SenseHuman Workshop & 国际算法算例大赛“Panoptic Scene Graph Generation”赛道冠军方案(https://arxiv.org/abs/2302.02651)。RAM模型大致设计思路是:我们使用Segment Anything Model(SAM)来识别和分割图像中的物体,并提取每个分割物体的特征。我们使用Transformer模块来使分割物体之间产生交互作用,从而得到新的特征,计算它们的配对关系并分类它们的相互关系。

我们使用PSG数据集来训练我们的模型。对于每个训练图像,SAM会分割多个物体,但只有少数与PSG的ground truth(GT)mask相匹配。我们根据它们的交集-并集(IOU)分数进行简单的匹配,以便(几乎)每个GT mask都被分配到一个SAM mask中。然后,我们根据SAM的mask重新生成关系图。最后,我们使用交叉熵损失来训练我们的模型。方案图如下图所示:

让我们来看一些“Relate-Anything-Model(RAM)”的应用实例吧!我们展示了一些关于踢足球、跳舞和交朋友的RAM模型实现的图像分析结果,这些结果让人印象深刻,展示了我们模型的出色性能和多样化应用的潜力。

如果您想了解更多关于“Relate-Anything-Model(RAM)”的信息,您可以访问我们的Huggingface演示页面和数据集页面。我们希望RAM模型能够为您带来更多的启发和创新,也期待着您的反馈和建议。如果你也想训练会找关系的机器学习模型,请关注我们的工作,让我们一起探索这个神奇的机器学习世界吧!

https://github.com/Jingkang50/OpenPSG

点击进入—>【图像分割和多模态】微信技术交流群


最新CVPR 2023论文和代码下载


后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF


图像分割和多模态交流群成立


扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-图像分割或者多模态 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。


一定要备注:研究方向+地点+学校/公司+昵称(如图像分割或多模态+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信号: CVer333,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!


扫码进星球


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
lāo dao?láo dao!每天学一句英语台词|If anything goes wrong多线程如何实现事务回滚?一招帮你搞定!The Chinese Hotels Giving New Moms a Break — From Their In-Laws极寒日子越野滑雪打卡及为啥运动2023新版B1/B2 美国签证更新电子系统说明!手把手教你搞定!Young Graduates Are Selling Their Knowledge on the Streets留学生到底怎么报税?超全加拿大报税指南,手把手教你搞定报税季!神奇LLM引擎上线!帮你把GPT-3直接调成ChatGPT用 Copliot 帮你搞定 Java 样板代码宇宙人(1263期)航天南湖成功登陆上交所科创板;超5000亿元;北京5.5G来了;SpaceX披露星舰二次升空测试的发射时间表Anthony"Tony" Ciaravino:Build the safest Chinatown in America!分割一切后,Segment Anything又能分辨类别了:Meta/UTAustin提出全新开放类分割模型完美世界TA谈Stable Diffusion插件,ControlNet、Segment AnythingCaption Anything来了!可以解读清明上河图,细粒度可控的图像描述!【城事】巴黎市长将重修Châtelet 广场以方便行人穿透凄迷血色的人性光辉 -- 西尔斯基将军现象分割一切还不够,还要检测一切、生成一切,SAM二创开始了莎士比亚的杂草巴黎市长将重修Châtelet 广场以方便行人不想黑头泛滥,油光满面,不到 40 元帮你搞定麻省理工Python增强编译器Codon 让Python像C\\C++一样高效Agustín Hernández:中美洲建筑背景下的未来主义巨构一篇带你搞定波士顿3W地区公立高中~南澳散记 (增订本) :第十九章:居所 (下)UMBRO 推出 Anytime Anywhere 品牌概念 ,「总结」正被 YE 等玩家认可、探索的品牌美学Young Chinese Love Everything About Sweden. Except Living There.新奇!加拿大公司的这些福利逆天了!帮你冷冻卵子…Angelababy:一切的一切正在发生【Career Forum|4.1】Fight the Career Winter in the Tech Industry!用Meta「分割一切」搞定一切关系,唱跳偷袭效果拔群!NTU等提出全新RAM模型[打卡] 搞定一切任务的关键​Segment-and-Track Anything!视频版SAM来了,分割/跟踪/编辑一切,现已开源!唱歌有助于跑步?工作中如何时间管理?让《搞定》帮你搞定
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。