学术中心
用于微尺度小目标协同检测的改进YOLOv8和SAHI模型
发布时间:
2024-06-16
来源:
作者:
由于害虫分布密集、体积小、密度高,农业生产环境中的害虫目标识别具有挑战性。此外,多变的环境照明和复杂的背景使检测过程更加复杂。本研究的重点是通过引入基于改进的YOLOv8架构的轻量级害虫图像识别模型来提高茶叶害虫的识别性能。首先,提出了切片辅助微调和切片辅助超推理(slicing-aided hyper inference,SAHI)来分割输入图像,以增强低分辨率图像和小目标检测的模型性能。然后,在ELAN的基础上,设计了一种广义高效层聚合网络(generalized efficient layer aggregation network,GELAN)来代替骨干网络中的C2f模块,增强其特征提取能力,并构建了一个轻量级模型。此外,将MS结构集成到YOLOv8的颈部网络中进行特征融合,增强了细粒度和粗粒度语义信息的提取。此外,引入了基于Transformer架构的BiFormer注意机制,以放大茶叶害虫的目标特征。最后,基于辅助边界的内部MPDIoU被用作原始损失函数的替代,以增强其对复杂害虫样本的学习能力。实验结果表明,增强的YOLOv8模型实现了96.32%的准确率和97.95%的召回率,超过了原始YOLOv8模型。此外,它达到了mAP@50得分98.17%。与Faster R-CNN、SSD、YOLOv5、YOLOv7和YOLOv8相比,其平均准确度分别高出17.04、11.23、5.78、3.75和2.71个百分点。YOLOv8的整体性能优于当前主流检测模型,检测速度为95 FPS。该模型在检测茶叶害虫等小目标时,有效地平衡了轻量级设计与高精度和高速度。可为复杂生产环境下茶园各种害虫的识别和分类提供宝贵参考,有效满足实际应用需求,为未来茶叶害虫的监测和科学防治提供指导。
图1 YOLOv8网络架构。
图2 SAHI-YOLOv8网络的总体结构。
图3 切片辅助推理原理图。
图4 切片辅助微调原理。
图5 切片辅助推理原则。
图6 可编程梯度信息(programmable gradient information,PGI)及相关网络架构和方法。
图7 GELAN结构。
图8 BRA注意力机制。
图9 BiFormer块。
图10 三种构建块模型的比较。
图11 内部IoU示例结构。
图12 茶害虫图像数据集。
图13 训练集文件的可视化。
图14 精确度、召回率、F1置信曲线。
图15 损失函数的变化曲线。注:黄色:边框损失值;绿色:分类损失值;红色:特征点损失值。
图16 四个不同茶叶害虫数据集检测效果的比较。
Ye R, Gao Q, Qian Y, Sun J, Li T. Improved YOLOv8 and SAHI Model for the Collaborative Detection of Small Targets at the Micro Scale: A Case Study of Pest Detection in Tea. Agronomy. 2024; 14(5):1034.
编辑
王春颖
推荐新闻
视频展示