Redian新闻
>
名声大噪的YOLO迎来YOLOv8,迅速包揽目标检测、实例分割新SOTA

名声大噪的YOLO迎来YOLOv8,迅速包揽目标检测、实例分割新SOTA

公众号新闻

机器之心报道

编辑:小舟、陈萍

YOLOv8 抛弃了前几代模型的 Anchor-Base。


YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来,领域内的研究者们已经对 YOLO 进行了多次更新迭代,模型性能越来越强大。现在,YOLOv8 已正式发布。

YOLOv8 是由小型初创公司 Ultralytics 创建并维护的,值得注意的是 YOLOv5 也是由该公司创建的。


YOLOv8 项目地址:https://github.com/ultralytics/ultralytics

YOLOv8 模型介绍

与先前几个版本相比,YOLOv8 模型更快、更准确,同时为训练模型提供统一框架,以执行以下基本任务:

  • 目标检测;
  • 实例分割;
  • 图像分类。

下图是 YOLOv8 执行目标检测和实例分割的实际效果:

图源:https://www.youtube.com/watch?v=QgF5PHDCwHw

YOLOv8 的主要具有以下特点:

  • 对用户友好的 API(命令行 + Python);
  • 模型更快更准确;
  • 模型能完成目标检测、实例分割和图像分类任务;
  • 与先前所有版本的 YOLO 兼容可扩展;
  • 模型采用新的网络主干架构;
  • 无锚(Anchor-Free)检测;
  • 模型采用新的损失函数。

YOLOv8 还高效灵活地支持多种导出格式,并且可在 CPU 和 GPU 上运行该模型。YOLOv8 的整体架构如下图所示:

YOLOv8 架构。图源:GitHub 用户 RangeKing。

值得注意的是,YOLOv8 是一个无锚(Anchor-Free)模型。这意味着它直接预测对象的中心,而不是已知锚框的偏移量。由于减少了 box 预测的数量,因此这种新方法加速了一个非常复杂的推理步骤 —— 非极大值抑制 (NMS)。

图源:https://blog.roboflow.com/whats-new-in-yolov8/

YOLOv8 系列包含 5 个模型,其中 YOLOv8 Nano(YOLOv8n)是最小的模型,但速度最快;而 YOLOv8 Extra Large (YOLOv8x) 是最准确的模型,但速度最慢。


此外,YOLOv8 捆绑(bundle)了以下预训练模型:

  • 在图像分辨率为 640 的 COCO 检测数据集上训练的目标检测检查点;
  • 在图像分辨率为 640 的 COCO 分割数据集上训练的实例分割检查点;
  • 在图像分辨率为 224 的 ImageNet 数据集上预训练的图像分类模型。

从下图我们可以看到,YOLOv8 在目标检测和实例分割任务上的性能很好:


安装与使用

首先,我们需要用 git 克隆存储库:

git clone https://github.com/ultralytics/ultralytics.git

然后用一行代码安装:

pip install -r requirements.txt

如何通过命令行界面(CLI)使用 YOLOv8 ?

Ultralytics 为 YOLOv8 提供了完整的命令行界面 (CLI) API 和 Python SDK,用于执行训练、验证和推理。要使用命令行界面,需要安装 ultralytics 包。

pip install ultralytics

安装完所需的包后,用户就可以使用 yolo 命令进入 YOLOv8 CLI。下面是使用 yolo CLI 运行目标检测推理的示例:


代码中,task flag 可以接受三个参数:detect、classify、segment,分别对应三类任务。类似地,mode 也可以接受三个参数:train、val、predict。

如何在 Python API 中使用 YOLOv8?

你可以创建一个简单的 Python 文件,以导入 YOLO 模块并执行特定任务。


上面的代码表明,首先需要在 COCO128 数据集上训练 YOLOv8 Nano 模型,然后在验证集上对其进行评估,最后对样本图像进行预测。

目标检测的推理结果

下面的命令为使用 YOLOv8 Nano 模型对视频进行检测。

yolo task=detect mode=predict model=yolov8n.pt source='input/video_3.mp4' show=True

在配置有 GTX 1060 GPU 的笔记本电脑上,YOLOv8 Nano 的推理运行速度约为 105 FPS。效果如下:

采用 YOLOv8 Nano 模型进行检测推理。

不过上述 YOLOv8 Nano 模型在一些画面中会把猫检测成狗。接下来可以使用 YOLOv8 Extra Large 模型对同一视频运行检测并检查输出。

yolo task=detect mode=predict model=yolov8x.pt source='input/video_3.mp4' show=True

在配置有 GTX 1060 GPU 的笔记本电脑上,YOLOv8 Extra Large 模型的推理速度约为 17 FPS。效果如下

采用 YOLOv8 Extra large 模型进行检测推理。

尽管 YOLOv8 Extra Large 的错误分类稍微少了一些,但模型仍然在一些帧中检测错误。

实例分割的推理结果

使用 YOLOv8 进行实例分割同样简单,你只需在上面的命令中更改 task 和 model 名称。

yolo task=segment mode=predict model=yolov8x-seg.pt source='input/video_3.mp4' show=True

因为这次将实例分割与目标检测相结合,所以这一次的平均 FPS 约为 13。

使用 YOLOv8 Extra Large 模型进行分割推理。

在输出中,分割映射看起来非常干净。即使猫在最后几帧藏在积木下面,模型也能够检测并进行图像分割。

图像分类的推理结果

最后,由于 YOLOv8 已经提供了预训练分类模型,你可以使用 yolov8x-cls 模型对同一视频进行分类。

yolo task=classify mode=predict model=yolov8x-cls.pt source='input/video_3.mp4' show=True

利用 YOLOv8 Extra Large 模型进行分类推理。

默认情况下,视频中标注了模型预测的前 5 个类。用户无需任何后处理,注释直接匹配 ImageNet 类名。

YOLO 不同版本之间的对比

相比于之前的 YOLO 系列,YOLOv8 模型似乎表现得更好,不仅领先于 YOLOv5,YOLOv8 也领先于 YOLOv7 和 YOLOv6 版本。

YOLOv8 与其他 YOLO 模型的对比。

在与 640 图像分辨率下训练的 YOLO 模型相比,所有 YOLOv8 模型在参数数量相似的情况下都具有更好的吞吐量。

接下来我们详细了解一下最新的 YOLOv8 模型与 Ultralytics 的 YOLOv5 模型的性能比较。

YOLOv8 和 YOLOv5 之间的综合比较


YOLOv8 和 YOLOv5 目标检测模型对比


YOLOv8 和 YOLOv5 实例分割模型对比


YOLOv8 和 YOLOv5 图像分类模型对比


很明显,除了一个分类模型之外,最新的 YOLOv8 模型比 YOLOv5 要好得多。

由此看来,随着 YOLOv8 的发布,其在计算机视觉领域的重要性不言而喻,目标检测、图像分割以及图像分类任务都将达到新的水平。

参考链接:
https://learnopencv.com/ultralytics-yolov8/
https://blog.roboflow.com/whats-new-in-yolov8/
https://github.com/ultralytics/ultralytics


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
扩散模型再发力!Hinton团队提出:图像和视频全景分割新框架东京美食没有最好YOLOv8来啦 | 详细解读YOLOv8的改进模块!YOLOv5官方出品YOLOv8,必卷!NeurIPS 2022 | 四分钟内就能训练目标检测器,商汤基模型团队是怎么做到的?CVPR 2023 | 即插即用!SQR:对于训练DETR-family目标检测的探索和思考秋天的颜色,秋天的蓝FastTrack Universität 2023莱比锡大学公立语言项目招生简章NeurIPS 2022 | FCOS-LiDAR:全卷积单阶段3D目标检测YOLOv8来了!YOLOv5官方出品!霸王别姬DAMO-YOLO项目原作解读:兼顾速度与精度的高效目标检测框架YOLOv8已至,精度大涨!教你如何在自定义数据集上训练它Hinton组新作:基于大型全景掩码的实例分割框架,图像视频场景丝滑切换Costco今年新推的5种糕点,迅速圈粉(图)R-CNN、SPP-Net、Fast R-CNN…你都掌握了吗?一文总结目标检测必备经典模型(一)乔伊斯的这句“love loves to love love”,到底啥意思?AAAI 2023 Oral | 回归元学习,基于变分特征聚合的少样本目标检测实现新SOTAICLR 2023 | 3D UX-Net:超强的医学图像分割新网络文学城往事,值得回味CVPR 2023 | YOLOv7强势收录!时隔6年,YOLOv系列再登CVPR!NeurIPS 2022 Spotlight|生成式语义分割新范式GMMSeg,可同时处理闭集和开集识别妻子帮丈夫戒毒,可丈夫却出轨戒毒顾问,迅速同居,还有了孩子... 这??超越YOLOv8!YOLOv6 v3.0实时目标检测重磅升级!用CNN做基础模型,可变形卷积InternImage实现检测分割新纪录!ICLR 2023 | H2RBox: 旋转目标检测方法RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型(三)岁月河,岁月歌真的这么丝滑吗?Hinton组提出基于大型全景掩码的实例分割框架,图像视频场景丝滑切换积极调整心态,迅速平复焦虑,心理医生送你6个小贴士阳康之后,迅速囤一批好物,安心过节!NeurIPS 2022 | 中科院&图森未来提出FSD:全稀疏的3D目标检测器ICLR 2023 | 高分论文!上海交大提出H2RBox:旋转目标检测新网络NeurIPS 2022 | 生成式语义分割新范式GMMSeg,可同时处理闭集和开集识别
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。