YOLOv5在这里:140 FPS的最先进的对象检测

2020-06-11 00:08:58

实时目标检测技术发展迅速。改善的速度甚至更快。结果令人震惊。

3月18日,谷歌开源了他们的EfficientDet实现,这是一种不同规模的快速培训模型,其中之一提供实时输出。4月23日,Alexey Bochoviskiy等人。开源的YOLOv4。6月9日,Glenn Jocher开源实现了YOLOv5。

跳过这篇信息帖子,直接跳到我们的YOLOv5教程。几分钟内,您就可以在您的自定义数据上拥有训练有素的YOLOv5模型。

YOLO(你只看一次)是PJ·雷迪(PJ Reddie)最初在2016年出版的一本书中创造的一系列模特。YOLO型号以其高性能和令人难以置信的小巧而臭名昭著,这使得它们成为实时条件和设备部署环境的理想候选者。

PJ Reddie的研究团队负责随后推出YOLOv2和YOLOv3,这两款产品在模型性能和模型速度方面都取得了持续的改进。2020年2月,PJ·雷迪(PJ Reddie)表示,他将停止计算机视觉的研究。

2020年4月,阿列克谢·博奇科夫斯基、简健-姚望和廖宏源马克·廖宏源介绍了YOLOv4,取得了令人印象深刻的成果。

值得注意的是,YOLOv4的许多改进既来自于模型架构,也来自于改进的数据增强。(我们已经写了一个关于YOLOv4的细目,以及如何在自定义对象上训练一个YOLOv4模型。)。

Glenn Jocher发布了YOLOv5,有许多不同之处和改进。(值得注意的是,Glenn是马赛克增强的创建者,这是改进的YOLOv4中包含的一项技术。)。此次发布的YOLOv5包括五种不同型号尺寸:YOLOv5s(最小)、YOLOv5m、YOLOv5l、YOLOv5x(最大)。

首先,这是YOLO系列中第一个用PyTorch而不是PJ Reddie的Darknet编写的原生版本。“暗网”是一个非常灵活的研究框架,但它在构建时并没有考虑到生产环境。它的用户社区较小。总而言之,这导致Darknet的配置更具挑战性,生产就绪程度更低。

因为YOLOv5最初是在PyTorch中实现的,所以它受益于已建立的PyTorch生态系统:支持更简单,部署也更容易。此外,作为一个更广为人知的研究框架,在YOLOv5上迭代对于更广泛的研究社区来说可能更容易。这也使得部署到移动设备变得更简单,因为模型可以很容易地编译成ONNX和CoreML。

其次,YOLOv5的速度非常快。在运行特斯拉P100的YOLOv5Colab笔记本上,我们看到每张图像的推断时间高达0.007秒,这意味着每秒140帧!相比之下,YOLOv4在转换为相同的Ultralytics PyTorch库后达到了50FPS。

第三,YOLOv5是准确的。在我们对血细胞计数和检测(Bccd)数据集的测试中,我们在仅训练了100个纪元后,达到了大约0.895的平均平均精度(MAP)。诚然,我们在EfficientDet和YOLOv4中看到了类似的性能,但在准确度上没有任何损失的情况下,很少能看到如此全面的性能改进。

第四,YOLOv5很小。具体地说,YOLOv5的权重文件是27兆字节。我们的YOLOv4(采用Darknet架构)的权重文件是244兆字节。YOLOv5比YOLOv4小近90%。这意味着YOLOv5可以更轻松地部署到嵌入式设备上。

为此,我们出版了一本关于如何在自定义数据集上培训YOLOv5的指南,使它变得又快又容易。如果您想使用标准的可可重量,请参阅此笔记本。

想成为第一个了解新的计算机视觉教程和内容(如我们的合成数据集创建指南)的人吗?订阅我们的更新📬。

RoboFlow通过自动批注质量保证、通用批注格式转换(如Pascal VOC XML到COCO JSON和创建TFRecords)、团队共享和版本控制,以及与流行的开源计算机视觉模型的轻松集成,加速了您的计算机视觉工作流程。开始使用您的第一个1000张图像是完全免费的。