用于微尺度小目标协同检测的改进YOLOv8和SAHI模型


发布时间:

2024-06-16

来源:

作者:

由于害虫分布密集、体积小、密度高,农业生产环境中的害虫目标识别具有挑战性。此外,多变的环境照明和复杂的背景使检测过程更加复杂。本研究的重点是通过引入基于改进的YOLOv8架构的轻量级害虫图像识别模型来提高茶叶害虫的识别性能。首先,提出了切片辅助微调和切片辅助超推理(slicing-aided hyper inference,SAHI)来分割输入图像,以增强低分辨率图像和小目标检测的模型性能。然后,在ELAN的基础上,设计了一种广义高效层聚合网络(generalized efficient layer aggregation network,GELAN)来代替骨干网络中的C2f模块,增强其特征提取能力,并构建了一个轻量级模型。此外,将MS结构集成到YOLOv8的颈部网络中进行特征融合,增强了细粒度和粗粒度语义信息的提取。此外,引入了基于Transformer架构的BiFormer注意机制,以放大茶叶害虫的目标特征。最后,基于辅助边界的内部MPDIoU被用作原始损失函数的替代,以增强其对复杂害虫样本的学习能力。实验结果表明,增强的YOLOv8模型实现了96.32%的准确率和97.95%的召回率,超过了原始YOLOv8模型。此外,它达到了mAP@50得分98.17%。与Faster R-CNN、SSD、YOLOv5、YOLOv7和YOLOv8相比,其平均准确度分别高出17.04、11.23、5.78、3.75和2.71个百分点。YOLOv8的整体性能优于当前主流检测模型,检测速度为95 FPS。该模型在检测茶叶害虫等小目标时,有效地平衡了轻量级设计与高精度和高速度。可为复杂生产环境下茶园各种害虫的识别和分类提供宝贵参考,有效满足实际应用需求,为未来茶叶害虫的监测和科学防治提供指导。

 

图1  YOLOv8网络架构。

 

图2  SAHI-YOLOv8网络的总体结构。

 

图3  切片辅助推理原理图。

 

图4  切片辅助微调原理。

 

图5  切片辅助推理原则。

 

图6  可编程梯度信息(programmable gradient information,PGI)及相关网络架构和方法。

 

图7  GELAN结构。

 

图8  BRA注意力机制。

 

图9 BiFormer块。

 

图10 三种构建块模型的比较。

 

图11 内部IoU示例结构。

 

图12 茶害虫图像数据集。

 

图13 训练集文件的可视化。

 

图14 精确度、召回率、F1置信曲线。

 

图15 损失函数的变化曲线。注:黄色:边框损失值;绿色:分类损失值;红色:特征点损失值。

 

图16 四个不同茶叶害虫数据集检测效果的比较。

 

来 源

Ye R, Gao Q, Qian Y, Sun J, Li T. Improved YOLOv8 and SAHI Model for the Collaborative Detection of Small Targets at the Micro Scale: A Case Study of Pest Detection in Tea. Agronomy. 2024; 14(5):1034.

 

编辑

王春颖

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话江南平台app体育总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。