Redian新闻
>
Transformer检测神器!detrex:面向DETR系列的目标检测开源框架

Transformer检测神器!detrex:面向DETR系列的目标检测开源框架

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—> 目标检测技术交流群

前言

在我们IDEA研究院CVR团队分别开源了DAB-DETR, DN-DETR, DINO后,CVR团队一直计划做一个统一的DETR系列代码框架,支持DETR系列的算法工作,并且希望这套codebase可以拓展到更多相关的任务上,终于在9.21号,CVR团队正式开源detrex,整合重构复现了之前的开源工作并且吸纳了一系列DETR系列算法。

项目地址: 

https://github.com/IDEA-Research/detrex

项目介绍

detrex项目的主要特点包括:

1. 支持的算法足够丰富

目前已经支持的算法:

  • DETR
  • Deformable-DETR
  • Conditional-DETR
  • DAB-DETR
  • DAB-Deformable-DETR
  • DN-DETR
  • DN-Deformable-DETR
  • DINO
  • Group-DETR

并且会不断更新新的算法

2. 模块化设计与易用性

detrex在代码易用性上做了以下的改进:

  • 模块化设计:detrex解耦了DETR系列算法中的一些必要组件,方便用户替换其中的模块,例如在backbone上不仅支持了ResNet,Swin等必要的backbone,还额外支持了Timm以及Torchvision的Backbone,并且代码结构足够清晰,用户可以方便添加自己的backbone。
  • 项目管理:detrex对于每个算法,都在projects下进行了单独的维护,保证了每个算法之间不会互相影响,并且用户可以单独看具体某个算法的实现代码,不会有额外的信息干扰。
  • 轻量化的config system与training engine:detrex基于detectron2的LazyConfig进行二次开发, 整理训练代码十分简洁,配置文件十分清晰,方便用户实现自己的配置需求以及custom自己的训练流程。

3. 算法的复现效果好

在detrex下复现的算法整体结果上相比于之前的项目更好或者持平,以下是一些算法复现结果的对比:

MethodAP (original repo)AP (detrex)
Conditional-DETR-R5040.941.6
DAB-DETR-R5042.243.3
DAB-DETR-R10143.243.8
DAB-Deformable-DETR-R5048.748.9
DN-DETR-R5044.444.7
DINO-R50-12epoch49.049.0
DINO-Swin-L-12epoch56.856.9

不仅包括以上罗列的算法结果,我们还release了一批新的模型训练结果,包括DAB-Deformable-Two-Stage, DINO-Swin-Tiny, DINO-Swin-Small, DINO-Swin-Base等训练结果,可以关注我们的Model Zoo更新

  • detrex Model Zoo: https://detrex.readthedocs.io/en/latest/tutorials/Model_Zoo.html

detrex下release的权重不仅包括了detrex本身training的权重,还包括了一些原始开源仓库下convert过来的权重(具体的结果在每个算法的projects下的README中有描述),方便用户作相关的inference以及可视化。并且提供了对应的converters,用户不仅可以使用detrex对这些算法进行训练,也可以在将之前训练好的权重convert到detrex的格式下。

4. 搭配丰富的文档教程 (持续更新中)

detrex的文档地址: https://detrex.readthedocs.io/en/latest/

文档中有详细的教程教学如何安装并使用detrex,并且对于配置系统中的每一个参数也有详细的介绍,CVR团队会不断根据社区的反馈对文档内容进行更新,欢迎大家多提意见。

detrex的未来计划

在detrex功能需求上,detrex会不断优化代码实现,并且根据用户的反馈调整需求的优先级,在detrex下置顶了两个issue,用于收集社区的需求和意见,以下是issue地址

  • detrex的功能需求反馈: Roadmap of detrex
  • detrex的文档需求反馈: Roadmap of detrex documentation and tutorials

在算法实现上,detrex在未来不仅仅会支持Transformer-Based的检测算法,还会拓展到分割姿态估计等任务上,敬请期待!

detrex开源背后的团队想法

虽然detrex开源了,但是目前也只能算是beta v0.1.0版本,还有许多模块需要优化,还有更多功能需要支持,这些靠自己完成是远远不够的,开源出来也是希望能借助社区的力量,一起推动DETR系列的工作。非常非常非常欢迎从任何角度为detrex提供意见,并且欢迎任何形式的contribution,无论是issue或者是PR,也希望能有更多的contributors加入我们!


点击进入—> 目标检测技术交流群


detrex 框架代码下载


后台回复:detrex,即可上面项目代码!


目标检测和Transformer交流群成立


扫描下方二维码,或者添加微信:CVer222,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信号: CVer222,进交流群


CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!


扫码进群

▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
IKEA x OBEGRÄNSAD联名!宜家22年最受瞩目系列开售!一个基于Transformer的深度学习架构,在基因调控中组蛋白代码的定量破译方面性能超群NeurIPS 2022 | 清华提出首个退化可感知的展开式TransformerECCV 2022 | 港中文MMLab:基于Transformer的光流▲ 既然richard_hz提到了我多吉名字,那我就多说几句 ▲ECCV 2022 | 单点监督目标检测!国科大提出P2BNet:标一个点就能训练出强有力的目标检测器警察神速破案!是谁偷了我的车?!7 Papers & Radios | 无残差连接训练深度transformer;DeepMind写代码AI登Science封面无需微调!微软亚研院:高效加速大规模视觉 Transformer 密集预测任务的方法清华提出首个退化可感知的展开式Transformer|NeurIPS 2022频频出圈的Transformer,到底有什么魅力!无需新型token mixer就能SOTA:MetaFormer视觉基线模型开源,刷新ImageNet记录火爆的Transformer,可能是目前最好发论文的神器!(文末附顶会合集)平价买到高级感!IKEA全新 OBEGRÄNSAD系列,全系列都好看!Transformer作者离职创业的公司,想从老东家谷歌再拿2亿美元融资Fast and Effective!一文速览轻量化Transformer各领域研究进展最高加速9倍!字节跳动开源8比特混合精度Transformer引擎再掀强化学习变革!DeepMind提出「算法蒸馏」:可探索的预训练强化学习TransformerDeepMind新作:无需权重更新、提示和微调,transformer在试错中自主改进MICCAI 2022 | 基于对比学习和视觉Transformer的弱监督视频肠息肉检测Transformer作者创业的公司,想从老东家谷歌再拿2亿美元融资!7 Papers & Radios | ECCV 2022最佳论文;Transformer在试错中自主改进全球首个面向遥感任务设计的亿级视觉Transformer大模型NeurlPS 2022 | 用于医学图像分割的类感知生成对抗TransformerPyTorch 创始人:Transformer 太火很不好,AI 易撞墙触摸美国 27 阿拉巴马打工火爆的Transformer,可能是目前最好发论文的神器!DeepMind新作!无需权重更新、微调,Transformer在试错中自主改进!周末聚餐后,聊聊两分钟锻炼法​KDD 2022 | kgTransformer:基于知识图谱与Transformer的复杂逻辑查询超越ConvNeXt!Conv2Former:用于视觉识别的Transformer风格的ConvNet一文详解Transformers的性能优化的8种方法▲ richard_hz大佬提到了俺多吉名字,那咱就多说几句 ▲
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。