基于特征重构的图像OOD检测方法研究

专利2025-06-14  48


本发明涉及计算机视觉和深度学习应用领域,设计基于特征重构的图像ood检测方法,特别是图像处理和深度学习技术在ood检测中的应用。用于提高模型在面对未知分布数据时的识别和分类能力,为深度学习图像分类应用领域提供更加全面和可靠的安全保障,提高图像ood检测的准确性和分类模型的安全可靠性。


背景技术:

1、随着深度学习技术的发展,基于卷积神经网络(cnn)的图像处理模型在多个领域内取得了显著的成果,包括图像识别、对象检测和图像分类等。这些模型通常在大规模标注数据集上进行训练,以学习从输入图像中提取有效特征的能力。然而,当模型遇到训练期间未曾见过的数据或数据分布时,其性能往往会急剧下降。这种数据被称为ood数据,由于多种原因产生,如不同的拍摄条件、新的对象类别或图像损坏等。

2、ood检测的目的是让模型能够识别出这些与训练数据分布不匹配或损坏的样本,这对提高模型的鲁棒性和在实际应用中的可靠性至关重要。然而,现有的大多数深度学习模型或方法并没有直接解决ood数据的识别问题,这导致它们在遇到ood样本时可能产生不准确甚至错误的预测。

3、本发明提出了一种基于特征重构的图像ood检测方法,通过设计的数据处理和训练流程,显著提高模型在面对未见分布数据时的识别能力。这一方法不仅增强了模型的鲁棒性,也为深度学习模型在复杂环境中的识别提供了新的思路。


技术实现思路

1、本发明是基于特征重构的图像ood检测方法研究,目的是为了解决目前ood检测中协变量偏移负面影响和检测方法问题,提出一种基于特征重构图像ood检测方法,采用构建新的数据集图像版本和分离特征的方法,通过运用cnn和resnet-50分离语义特征和非语义特征,充分利用这两个特征信息进行图像的ood检测。

2、这种方法有助于模型更好的理解图像细节和信息,提高ood检测的准确性,同时引入自编码器,学习进一步的特征信息,结合语义特征和非语义特征的ood检测模型,更好的保障模型的良好表现。

3、为了实现上述目标,本研究提供如下研究方案:基于特征重构的图像ood检测方法研究,包括如下步骤:

4、步骤1:对图像数据集进行搜集,包括数字数据集mnist、usps、notminst,对象数据集cifar-10、cifar-100、cifar-10-c,其中mnist、cifar-10作为任务的训练集,其余数据集作为预测测试数据集,对训练集进行一些特征的变换以创建新的图像版本,从而丰富用于预测的分布外数据集。

5、步骤3:构建自编码器,将步骤2中提取到的特征信息进行重构,获得重构后的语义特征x'和非语义特征y',分别计算重构误差,将两个重构误差进行加权,训练自编码器,其训练目标函数定义如下:

6、

7、其中l表示加权重构误差,α和β表示加权系数且α+β=1,用于平衡语义特征和非语义特征误差的权重,通过最小化加权重构误差,训练自编码器,以有效地重构语义特征和非语义特征。

8、步骤4:使用测试数据集通过特征提取的两个子网络,分别提取语义特征和非语义特征信息,通过训练好的自编码器计算加权重构误差,并判断是否大于预设的阈值,以进行图像的ood检测,生成预测结果。

9、步骤5:根据预测结果,使用auroc评估模型的性能。

10、相比于现有技术,本发明具有如下优点:

11、(1)本发明在预处理阶段通过训练集数据进行一些特征的变换创建新的图像版本。进行拼接处理和噪声处理,模拟不同的特色和光照条件,增强在模拟显示场景中的检测能力,减少误分类的可能性。

12、(2)本发明从特征的角度出发,不同于分类、密度、距离等方法,通过特征的分离提取,分别针对语义特征和非语义特征,充分利用不同层次的特征信息,cnn专注提取物体的形状和大小等语义特征,resnet-50提取图像风格等非语义特征,提高神经网络的表达能力。

13、(3)本发明通过引入特征重构方法,相对与直接使用多维特征进行ood检测方法,可以不依赖与特定的模型结构,与各种深度学习模型和特征提取方法结合使用,一定程度上简化未知数据的检测过程,有效的降低了特征的维度和计算复杂度,提高了推理速度。



技术特征:

1.基于特征重构的图像ood检测方法研究,其特征包括以下步骤:

2.根据权利要求1所述的基于特征重构的图像ood检测方法研究,其特征在于所述步骤1中将图像转为张量,使用两种处理方式,拼接处理和噪声处理。

3.根据权利要求1所述的基于特征重构的图像ood检测方法研究,其特征在于所述步骤2中包括使用cnn和resnet-50进行特征分离和提取。


技术总结
一种基于特征重构的图像OOD检测方法研究,属于深度学习图像应用领域。由于传统深度学习任务通常假设训练样本和测试样本具有独立同分布的属性,即随机变量中每个变量的概率分布都相同,且这些随机变量互相独立,训练模型用于预测测试集样本,当训练集和测试集的独立同分布不成立时,检测模型精确度急剧下降,甚至对错误的预测结果给出高置信度。针对此问题,本研究方法包括对图像类公共数据集进行预处理,通过分离特征提取语义特征和非语义特征,结合特种重构方法,解决数据集协变量偏移的负面效果和检测方法问题,相较于分类、密度、距离等方法都有较好的性能提升。该方法解决了现有方法无法充分利用特征信息的问题,提高了图像OOD检测的性能。

技术研发人员:高明,宋传朗
受保护的技术使用者:哈尔滨理工大学
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-15026.html

最新回复(0)