一种基于迁移学习与双次注意力机制的东北虎豹识别方法

专利2025-11-03  4


发明涉及一种野生动物识别方法,尤其是基于迁移学习与双次注意力机制融合的东北虎豹深度学习识别方法,属于人工智能。


背景技术:

1、东北虎与东北豹(panthera tigris altaica&amur leopard),位于森林生态系统食物链顶端,是国家一级保护野生动物,被世界自然保护联盟(international union forconservation of nature,iucn)评为濒临灭绝风险的物种与极危物种,具有非常重要的保护与科研价值。借助红外相机技术开展野生动物监测是目前野生动物保护最直接和有效的手段。红外相机具有对动物干扰小、背景真实、全天候等优势,可以获取野生动物活动轨迹与时空信息。随着红外相机的广泛应用,监测所获得的数据量迅速增长,面对日趋庞大的数据量,传统的人工筛选鉴别方式表现不足、耗费周期长且误判率高,亟需运用新的方法实现对海量数据集的准确分析。

2、深度学习技术的不断发展提高了目标检测的实时性与实用性,使动物识别变得更加方便快捷,利用深度学习模型可以有效的完成图像识别任务。但野生动物活动轨迹复杂,且存在复杂背景信息感染,深度学习在提取红外图像信息时特征丢失严重,导致识别精度较差。更深的网络结构能够有效加强特征提取,提高复杂背景下野生动物的识别,但复杂的网络结构也增加了训练与检测时间,对计算机的算力及性能要求也较高。


技术实现思路

1、本发明所要解决的技术问题在于提供一种基于迁移学习与双次注意力机制的东北虎豹识别方法,兼顾识别精度与检测速度,实现对野外环境中东北虎与东北豹的高效准确识别。

2、为解决上述技术问题,本发明采用的技术方案如下:

3、一种基于迁移学习与注意力机制的东北虎豹识别方法,包括以下步骤:

4、(1)使用编程语言python与深度学习框架pytorch构建东北虎豹深度学习识别模型;该深度学习模型采用yolo v5m网络为基础框架。输入层采取了mosaic数据增强方法,丰富待检测数据集,增强模型的鲁棒性;骨干网络backbone使用focus和csp结构来提取特征图;neck模块使用空间金字塔池化spp-net和路径聚合网络panet结构聚合网络特征,增强模块适应不同尺寸目标的检测能力;

5、(2)使用红外相机拍摄的东北虎豹影像数据与公开数据集,构建样本数据;

6、(3)对样本数据进行噪声处理、图像扩充、图像增强、正负样本平衡及图像标定,构建东北虎豹样本数据集。

7、(4)将得到的东北虎豹样本数据集划分为训练样本、测试样本、验证样本;

8、(5)用训练样本对深度学习模型进行训练,在训练前设置合适的超参数,选择合适的梯度下降优化器以及损失函数;

9、(6)根据验证样本的损失函数收敛情况与精度提升情况,对整个网络选择最优参数,得到最优模型;

10、(7)采用精确率(precision)、召回率(recall)、平均精度(average precision)、f1分数(f1-score)四个指标对预测结果进行精度评价,对模型整体性能进行分析。

11、作为一种优选方案,所述步骤(2)中的影像数据包含rgb三波段影像数据与灰度影像数据

12、作为一种优选方案,所述步骤(3)中的图像增强与图像扩充为使用编程语言python编写,图像标定为借助目标检测工具labelimg注释。

13、作为一种优选方案,所述步骤(5)中的对东北虎豹深度学习模型进行训练,包括以下步骤:

14、(1)初始化模型参数;

15、(2)输入训练样本和验证样本;

16、(3)前向传播;

17、(4)根据输出概率计算误差;

18、(5)反向传播;选取合适的梯度下降优化算法;

19、(6)遍历所有训练数据集,按照训练世代训练数据;

20、(7)学习次数达到阈值,得到最优模型。

21、有益效果:与现有技术相比,本发明充分利用深度学习和图像识别技术,利用深度学习模型速度快、效率高、自动化的优势实现对东北虎豹的有效识别。本发明使用yolo v5m深度学习网络结构,引入迁移学习与注意力机制技术,实现复杂背景下东北虎豹的高效识别。迁移学习是一种针对某一预训练模型进行微调后用于新模型的机器学习技术,简单说,就是把为任务a开发的模型作为初始点,重新使用在为任务b开发模型的过程中。本发明采用迁移学习对现有深度学习模型重新训练,解决了学习模型训练时间长、过程复杂、数据样本量大、迭代要求高的问题,提高了模型训练效率并更灵活地适应不可预测的条件。深度学习中的注意力机制模仿人类视觉,有选择性的关注较为重要的信息,从众多图像信息中选择出对当前任务目标更关键的信息。本发明融合迁移学习与双次注意力机制方法,在backbone层结合特征通道和特征空间两个维度的注意力,加强特征提取能力;在主干网络提取的两个有效特征层与上采样结果引入ca注意力机制,全面关注特征层的空间信息和通道信息。本发明统筹兼顾识别精度与训练速度,可实现对野生东北虎与东北豹的高效准确识别,为解决图像存在目标局部特征不明显与红外相机实时监测的问题上提供了新的思路,同时为东北虎豹及其他野生动物决策管理提供更加科学的依据。



技术特征:

1.一种基于迁移学习与双次注意力机制的东北虎豹识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于迁移学习与双次注意力机制的东北虎豹识别方法,其特征在于:所述步骤(2)中的影像数据包含rgb三波段影像数据与灰度影像数据。

3.根据权利要求1所述的基于迁移学习与双次注意力机制的东北虎豹识别方法,其特征在于:所述步骤(3)中的图像增强与图像扩充为使用编程语言python编写,图像标定为借助目标检测工具labelimg注释。

4.根据权利要求1所述的基于迁移学习与双次注意力机制的东北虎豹识别方法,其特征在于:所述步骤(5)中的对东北虎豹深度学习模型进行训练,包括以下步骤:


技术总结
本发明公开了一种基于迁移学习与双次注意力机制的东北虎豹识别方法,使用编程语言python与深度学习框架pytorch构建东北虎豹深度学习识别模型;使用红外野生动物相机获取影像数据构建样本数据,将样本数据集划分为训练样本、测试样本、验证样本;使用训练样本对北虎豹深度学习识别模型进行训练;根据验证样本的损失函数收敛情况与精度提升情况对整个网络选择最优参数,得到最优模型;采用精确率、召回率、平均精度、F1分数四个指标对预测结果进行精度评价,对模型整体性能进行分析。本发明可实现对野生东北虎与东北豹的高效准确识别,为东北虎豹及其他野生动物的决策管理提供科学依据,为智能化野生动物保护提供参考。

技术研发人员:李雪冬,杨拂晓,费龙,李蔓,陈涛
受保护的技术使用者:长春师范大学
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-17187.html

最新回复(0)