一种训练图像分类模型的方法、装置、设备及存储介质与流程

专利2023-07-07  125



1.本技术涉及计算机技术领域,尤其涉及一种训练图像分类模型的方法、装置、设备及存储介质。


背景技术:

2.随着科技的不断发展,越来越多的设备可以通过已训练的图像分类模型,来提供图像分类服务,图像分类服务可以用于确定目标图像中目标的所属类别。
3.相关技术中,获得已训练的图像分类模型的方法,通常是基于从一种或几种图像域中获得的样本图像集对图像分类模型进行多轮迭代训练获得的。
4.然而,一方面,在样本图像集是从几种图像域中获得的时,如果几种图像域之间的相似度较低,那么图像分类模型需要学习的各图像域的特征较多,容易出现训练出的图像分类模型针对每个图像域的图像分类效果均欠佳等情况。
5.另一方面,在使用已训练的图像分类模型对待分类图像进行图像分类时,待分类图像可能与训练图像分类模型时使用的样本图像集分别属于不同的图像域,甚至可能待分类图像所属图像域和样本图像集所属图像域相似度很低。
6.那么由于图像分类模型没有对待分类图像所属图像域进行学习,因此使用图像分类模型容易出现将待分类图像中的噪声作为与目标相关的图像特征提取出来,以确定目标的所属类别等情况。
7.可见,相关技术中训练图像分类模型的方法,使得训练出的图像分类模型无法准确地提取出待分类图像中与目标相关的图像特征,从而导致训练出的图像分类模型的分类准确性和分类可靠性较低。


技术实现要素:

8.本技术实施例提供了一种训练图像分类模型的方法、装置、计算机设备及存储介质,用于解决训练得到的图像分类模型的分类准确性和分类可靠性较低的问题。
9.第一方面,提供一种训练图像分类模型的方法,包括:
10.获取多个原始样本图像集,其中,不同原始样本图像集属于不同的图像域;
11.采用至少一种图像集扩展策略,分别对所述多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集;
12.对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,其中,每个图像集聚类簇包含至少一个训练图像集,所述训练图像集为所述原始样本图像集或所述扩展样本图像集,所述多个图像集聚类簇中,至少存在一个图像集聚类簇中包含所述扩展样本图像集;
13.分别基于所述多个图像集聚类簇,对相应的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型。
14.可选的,所述至少一种图像集扩展策略包括小波变换策略时,所述采用至少一种
图像集扩展策略,分别对所述多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集,包括:
15.针对每两个原始样本图像集,执行以下操作:
16.分别对两个所述原始样本图像集进行小波变换,获得两个原始低频特征集和两个原始高频特征集;
17.对所述两个原始低频特征集进行线性插值处理,获得插值低频特征集;
18.分别对所述插值低频特征集,与所述两个原始高频特征集进行小波逆变换,获得两个扩展样本图像集。
19.可选的,所述至少一种图像集扩展策略包括傅里叶变换策略时,所述采用至少一种图像集扩展策略,分别对所述多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集,包括:
20.针对每两个原始样本图像集,执行以下操作:
21.分别对两个所述原始样本图像集进行傅里叶变换,获得两个原始相位特征集和两个原始幅度特征集;
22.对所述两个原始相位特征集进行线性插值处理,获得插值相位特征集;
23.分别对所述插值相位特征集,与所述两个原始幅度特征集进行傅里叶逆变换,获得两个扩展样本图像集。
24.可选的,所述对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,包括:
25.针对所述各个训练图像集中的每两个训练图像集,执行以下操作:
26.针对两个训练图像集,分别采用相应的图像分类模型,对所述两个训练图像集进行特征提取,获得两个图像特征集,并基于所述两个图像特征集,分别确定所述两个图像特征集各自对应的分类概率分布集;
27.针对从获得的两个分类概率分布集中选取的每两个分类概率分布,确定相应的概率分布误差,并基于获得的各概率分布误差,确定所述两个训练图像集之间的相似度;
28.基于所述各个训练图像集中的每两个训练图像集之间的相似度,对所述各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇。
29.可选的,所述基于所述各个训练图像集中的每两个训练图像集之间的相似度,对所述各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,包括:
30.基于所述各个训练图像集中的每两个训练图像集之间的相似度,确定各相似度组成的相似度矩阵和对角矩阵;
31.将所述各个训练图像集作为顶点,并基于所述相似度矩阵与所述对角矩阵之差建立各顶点之间的无向边,获得无向图;
32.对所述无向图进行图像分割处理,获得多个子图,并分别基于所述多个子图各自包含的训练图像集,建立相应的图像集聚类簇。
33.可选的,所述分别基于所述多个图像集聚类簇,对相应的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型,包括:
34.针对每个图像集聚类簇中的每两个训练图像集,执行以下操作:
35.针对两个训练图像集,分别采用相应的图像分类模型,对所述两个训练图像集进
行特征提取,获得两个图像特征集,并分别基于所述两个图像特征集,确定相应的分类概率分布集;
36.针对从获得的两个分类概率分布集中选取的每两个分类概率分布,确定相应的概率分布误差,并基于获得的各概率分布误差,确定所述图像分类模型的训练损失;
37.在获得的训练损失不满足训练目标时,调整所述图像分类模型的模型参数;
38.在获得的训练损失满足训练目标时,输出已训练的目标图像分类模型。
39.可选的,在所述分别基于所述多个图像集聚类簇,对相应的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型之后,还包括:
40.获得待分类图像;
41.分别从所述各个训练图像集中选取一个训练图像,获得多个训练图像;
42.针对所述多个训练图像,分别执行以下操作:
43.采用与训练图像相匹配的目标图像分类模型,对所述训练图像和所述待分类图像进行特征提取,获得相应的第一图像特征和第二图像特征,并分别基于所述第一图像特征和所述第二图像特征,确定相应的第一分类概率分布和第二分类概率分布;
44.在所述第一分类概率分布和所述第二分类概率分布之间的概率分布误差满足预设误差条件时,基于所述第二分类概率分布,确定所述待分类图像的目标类别。
45.第二方面,提供一种训练图像分类模型的装置,包括:
46.获取模块:用于获取多个原始样本图像集,其中,不同原始样本图像集属于不同的图像域;
47.处理模块:用于采用至少一种图像集扩展策略,分别对所述多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集;
48.所述处理模块还用于:对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,其中,每个图像集聚类簇包含至少一个训练图像集,所述训练图像集为所述原始样本图像集或所述扩展样本图像集,所述多个图像集聚类簇中,至少存在一个图像集聚类簇中包含所述扩展样本图像集;
49.所述处理模块还用于:分别基于所述多个图像集聚类簇,对相应的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型。
50.可选的,所述至少一种图像集扩展策略包括小波变换策略时,所述处理模块具体用于:
51.针对每两个原始样本图像集,执行以下操作:
52.分别对两个所述原始样本图像集进行小波变换,获得两个原始低频特征集和两个原始高频特征集;
53.对所述两个原始低频特征集进行线性插值处理,获得插值低频特征集;
54.分别对所述插值低频特征集,与所述两个原始高频特征集进行小波逆变换,获得两个扩展样本图像集。
55.可选的,所述至少一种图像集扩展策略包括傅里叶变换策略时,所述处理模块具体用于:
56.针对每两个原始样本图像集,执行以下操作:
57.分别对两个所述原始样本图像集进行傅里叶变换,获得两个原始相位特征集和两
个原始幅度特征集;
58.对所述两个原始相位特征集进行线性插值处理,获得插值相位特征集;
59.分别对所述插值相位特征集,与所述两个原始幅度特征集进行傅里叶逆变换,获得两个扩展样本图像集。
60.可选的,所述处理模块具体用于:
61.针对所述各个训练图像集中的每两个训练图像集,执行以下操作:
62.针对两个训练图像集,分别采用相应的图像分类模型,对所述两个训练图像集进行特征提取,获得两个图像特征集,并基于所述两个图像特征集,分别确定所述两个图像特征集各自对应的分类概率分布集;
63.针对从获得的两个分类概率分布集中选取的每两个分类概率分布,确定相应的概率分布误差,并基于获得的各概率分布误差,确定所述两个训练图像集之间的相似度;
64.基于所述各个训练图像集中的每两个训练图像集之间的相似度,对所述各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇。
65.可选的,所述处理模块具体用于:
66.基于所述各个训练图像集中的每两个训练图像集之间的相似度,确定各相似度组成的相似度矩阵和对角矩阵;
67.将所述各个训练图像集作为顶点,并基于所述相似度矩阵与所述对角矩阵之差建立各顶点之间的无向边,获得无向图;
68.对所述无向图进行图像分割处理,获得多个子图,并分别基于所述多个子图各自包含的训练图像集,建立相应的图像集聚类簇。
69.可选的,所述处理模块具体用于:
70.针对每个图像集聚类簇中的每两个训练图像集,执行以下操作:
71.针对两个训练图像集,分别采用相应的图像分类模型,对所述两个训练图像集进行特征提取,获得两个图像特征集,并分别基于所述两个图像特征集,确定相应的分类概率分布集;
72.针对从获得的两个分类概率分布集中选取的每两个分类概率分布,确定相应的概率分布误差,并基于获得的各概率分布误差,确定所述图像分类模型的训练损失;
73.在获得的训练损失不满足训练目标时,调整所述图像分类模型的模型参数;
74.在获得的训练损失满足训练目标时,输出已训练的目标图像分类模型。
75.可选的,所述处理模块还用于:
76.在所述分别基于所述多个图像集聚类簇,对相应的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型之后,获得待分类图像;
77.分别从所述各个训练图像集中选取一个训练图像,获得多个训练图像;
78.针对所述多个训练图像,分别执行以下操作:
79.采用与训练图像相匹配的目标图像分类模型,对所述训练图像和所述待分类图像进行特征提取,获得相应的第一图像特征和第二图像特征,并分别基于所述第一图像特征和所述第二图像特征,确定相应的第一分类概率分布和第二分类概率分布;
80.在所述第一分类概率分布和所述第二分类概率分布之间的概率分布误差满足预设误差条件时,基于所述第二分类概率分布,确定所述待分类图像的目标类别。
81.第三方面,提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面所述的方法。
82.第四方面,提供一种计算机设备,包括:
83.存储器,用于存储程序指令;
84.处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如第一方面所述的方法。
85.第五方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面所述的方法。
86.本技术实施例中,在采用一种图像扩展策略,对多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理时,可以相应的获得多个扩展样本图像集;进一步的,在采用多种图像扩展策略,对多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理时,可以更多的扩展样本图像集。使得获得的多个扩展样本图像集和多个原始样本图像集,可以覆盖到尽可能多的不可见图像域和可见图像域,从而使得基于多个扩展样本图像集和多个原始样本图像集训练得到的各目标图像分类模型可以用于确定几乎任何图像域中的待分类图像的目标分类,避免了待分类图像与训练图像分类模型时使用的训练图像集分别属于不同的图像域,甚至可能待分类图像所属图像域和训练图像集所属图像域相似度很低时,造成图像特征提取不准确,确定出的目标分类不可靠的问题。
87.进一步的,在获得由多个扩展样本图像集和多个原始样本图像集组成的多个训练图像集之后,可以对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,分别基于多个图像集聚类簇,对相应的待训练的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型。由于进行了图像集聚类处理,使得每个图像集聚类簇包含的至少一个训练图像集的图像特征较为相似,从而针对每个图像集聚类簇,对一个待训练的图像分类模型进行多轮迭代训练,使得该图像分类模型可以专注在学习一种类型的图像特征的提取过程上,避免只训练一个图像分类模型时,该图像分类模型需要学习的各图像域的特征较多,从而出现训练出的图像分类模型针对每个图像域的图像分类效果均欠佳等情况,提高了训练出每个目标图像分类模型的分类准确性和分类可靠性。
附图说明
88.图1a为本技术实施例提供的训练图像分类模型的方法的一种应用领域示意图;
89.图1b为本技术实施例提供的训练图像分类模型的方法的一种应用场景;
90.图2为本技术实施例提供的训练图像分类模型的方法的一种流程示意图一;
91.图3为本技术实施例提供的训练图像分类模型的方法的一种原理示意图一;
92.图4为本技术实施例提供的训练图像分类模型的方法的一种流程示意图二;
93.图5为本技术实施例提供的训练图像分类模型的方法的一种流程示意图三;
94.图6为本技术实施例提供的训练图像分类模型的方法的一种原理示意图二;
95.图7a为本技术实施例提供的训练图像分类模型的方法的一种原理示意图三;
96.图7b为本技术实施例提供的训练图像分类模型的方法的一种流程示意图四;
97.图8为本技术实施例提供的训练图像分类模型的装置的一种结构示意图一;
98.图9为本技术实施例提供的训练图像分类模型的装置的一种结构示意图二。
具体实施方式
99.为了使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。
100.应当说明的是,本技术实施例中,涉及到获取待分类图像等相关的数据,当本技术以上实施例运用到具体产品或技术中时,每次获取数据需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
101.下面对本技术实施例提供的训练图像分类模型的方法的应用领域进行简单介绍。
102.随着科技的不断发展,越来越多的设备可以通过已训练的图像分类模型,来提供图像分类服务,图像分类服务可以用于确定目标图像中目标的所属类别。
103.相关技术中,获得已训练的图像分类模型的方法,通常是基于从一种或几种图像域中获得的样本图像集对图像分类模型进行多轮迭代训练获得的。
104.然而,一方面,在样本图像集是从几种图像域中获得的时,如果几种图像域之间的相似度较低,那么图像分类模型需要学习的各图像域的特征较多,容易出现训练出的图像分类模型针对每个图像域的图像分类效果均欠佳等情况。
105.另一方面,在使用已训练的图像分类模型对待分类图像进行图像分类时,待分类图像可能与训练图像分类模型时使用的样本图像集分别属于不同的图像域,甚至可能待分类图像所属图像域和样本图像集所属图像域相似度很低。
106.例如,请参考图1a,样本图像集所属图像域是插画图像域和彩色照片图像域,插画图像域和彩色照片图像域中的图像为彩色图像,且包含丰富的色彩特征,而待分类图像所属图像域是素描图像域,素描图像域中的图像为黑白图像,且包含丰富的线条特征。
107.那么由于图像分类模型没有对待分类图像所属图像域进行学习,因此使用图像分类模型容易出现将待分类图像中的噪声作为与目标相关的图像特征提取出来,以确定目标的所属类别等情况。
108.可见,相关技术中训练图像分类模型的方法,使得训练出的图像分类模型无法准确地提取出待分类图像中与目标相关的图像特征,从而导致训练出的图像分类模型的分类准确性和分类可靠性较低。
109.为了解决训练出的图像分类模型的分类准确性和分类可靠性较低的问题,本技术提出一种图像分类模型的方法。该方法在获取多个原始样本图像集之后,采用至少一种图像集扩展策略,分别对多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集。其中,不同原始样本图像集属于不同的图像域。通过对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,其中,每个图像集聚类簇包含至少一个训练图像集,训练图像集为原始样本图像集或扩展样本图像集,多个图像集聚类簇中,至少存在一个图像集聚类簇中包含扩展样本图像集。分别基于多个图像集聚类簇,对相应的待训练的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型。
110.本技术实施例中,在采用一种图像扩展策略,对多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理时,可以相应的获得多个扩展样本图像集;进一步的,在采用多种图像扩展策略,对多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理时,可以更多的扩展样本图像集。使得获得的多个扩展样本图像集和多个原始样本图像集,可以覆盖到尽可能多的不可见图像域和可见图像域,从而使得基于多个扩展样
本图像集和多个原始样本图像集训练得到的各目标图像分类模型可以用于确定几乎任何图像域中的待分类图像的目标分类,避免了待分类图像与训练图像分类模型时使用的训练图像集分别属于不同的图像域,甚至可能待分类图像所属图像域和训练图像集所属图像域相似度很低时,造成图像特征提取不准确,确定出的目标分类不可靠的问题。
111.进一步的,在获得由多个扩展样本图像集和多个原始样本图像集组成的多个训练图像集之后,可以对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,分别基于多个图像集聚类簇,对相应的待训练的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型。由于进行了图像集聚类处理,使得每个图像集聚类簇包含的至少一个训练图像集的图像特征较为相似,从而针对每个图像集聚类簇,对一个待训练的图像分类模型进行多轮迭代训练,使得该图像分类模型可以专注在学习一种类型的图像特征的提取过程上,避免只训练一个图像分类模型时,该图像分类模型需要学习的各图像域的特征较多,从而出现训练出的图像分类模型针对每个图像域的图像分类效果均欠佳等情况,提高了训练出每个目标图像分类模型的分类准确性和分类可靠性。
112.下面对本技术提供的训练图像分类模型的方法的应用场景进行说明。
113.请参考图1b,为本技术提供的训练图像分类模型的方法的一种应用场景示意图。该应用场景中包括客户端101和服务端102。客户端101和服务端102之间可以通信。通信方式可以是采用有线通信技术进行通信,例如,通过连接网线或串口线进行通信;也可以是采用无线通信技术进行通信,例如,通过蓝牙或无线保真(wireless fidelity,wifi)等技术进行通信,具体不做限制。
114.客户端101泛指可以向服务端102提供样本图像集或待分类图像的设备,例如,终端设备、终端设备可以访问的第三方应用程序或终端设备可以访问的网页等。终端设备包括但不限于手机、电脑、智能交通设备、智能电器等。服务端102泛指可以训练并使用图像分类模型的设备,例如,终端设备或服务器等。服务器包括但不限于云服务器、本地服务器或关联的第三方服务器等。客户端101和服务端102均可以采用云计算,以减少本地计算资源的占用;同样也可以采用云存储,以减少本地存储资源的占用。
115.作为一种实施例,客户端101和服务端102可以是同一个设备,例如,本技术实施例可以仅通过客户端101实现,也可以仅通过服务端102实现等,具体不做限制。本技术实施例中,以客户端101和服务端102分别为不同的设备为例进行介绍。
116.下面基于图1b,以服务端102为服务器为例,对本技术实施例提供的训练图像分类模型的方法进行具体介绍。请参考图2,为本技术实施例提供的训练图像分类模型的方法的一种流程示意图。
117.s201,获取多个原始样本图像集。
118.不同原始样本图像集属于不同的图像域,每个原始样本图像集包含多个原始样本图像。由于多个原始样本图像集是可以直接获取到的,因此原始样本图像集实际上是属于可见图像域。随着图像相关技术的不断发展,设备不仅需要提供针对可见图像域中的图像的图像分类服务,还需要提供针对不可见图像域中的图像的图像分类服务。然而,不可见图像域中的图像,由于不可预见性,因此很难提前获取到,并用于对图像分类模型进行训练。因此,可以基于多个原始样本图像集,来随机的生成各种不可见图像域中的图像,并用于对图像分类模型进行训练,请参考步骤s202。
119.s202,采用至少一种图像集扩展策略,分别对多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集。
120.在获得多个原始样本图像集之后,服务器可以采用至少一种图像集扩展策略,分别对多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集。
121.例如,请参考图3,包含三个原始样本图像集,即第一原始样本图像集、第二原始样本图像集和第三原始样本图像集。每两个原始样本图像集进行图像集扩展处理,可以获得三个扩展样本图像集,即第一扩展样本图像集、第二扩展样本图像集和第三扩展样本图像集。
122.以服务器采用一种图像集扩展策略,对两个原始样本图像集,即第一原始样本图像集和第二原始样本图像集,进行图像集扩展处理为例,服务器可以依次从第一原始样本图像集从选取一张样本图像,分别与第二原始样本图像集包含的每张原始样本图像进行图像扩展,获得相应的一个扩展样本图像集,直到第一原始样本图像集中的原始样本图像全部选取完毕时,完成针对第一原始样本图像集和第二原始样本图像集的图像集扩展处理。
123.服务器也可以从第一原始样本图像集中随机选取指定数量的样本图像,基于选取的每张样本图像,分别与第二原始样本图像集包含的每张原始样本图像进行图像扩展,获得相应的一个扩展样本图像集,直到指定数量的样本图像全部选取完毕时,完成针对第一原始样本图像集和第二原始样本图像集的图像集扩展处理。
124.服务器也可以分别从第一原始样本图像集和第二原始样本图像集中随机选取相应的指定数量的样本图像,基于从第一原始样本图像集中选取的每张样本图像,分别与从第二原始样本图像集中选取的各张样本图像进行图像扩展,获得相应的扩展样本图像集,直到从第一原始样本图像集中选取的指定数量的样本图像全部选取完毕时,完成针对第一原始样本图像集和第二原始样本图像集的图像集扩展处理等,具体不做限制。
125.作为一种实施例,图像集扩展策略有多种,本技术实施例中,以一种图像集扩展策略为小波变换策略或傅里叶变化策略为例进行介绍,其他图像集扩展策略进行图像集扩展处理的过程类似,在此不再赘述。
126.在至少一种图像集扩展策略包括小波变换策略时,以对两个原始样本图像集,即第一原始样本图像集和第二原始样本图像集进行图像集扩展处理的过程为例进行介绍,每两个原始样本图像集进行图像集扩展处理的过程类似,在此不再赘述。
127.分别对两个原始样本图像集进行小波变换,获得两个原始低频特征集和两个原始高频特征集。服务器可以分别对第一原始样本图像集包含的各原始样本图像进行小波变换,获得相应的原始低频特征和原始高频特征,各原始样本图像的原始低频特征做成一个原始低频特征集,各原始样本图像的原始高频特征做成一个原始高频特征集。
128.同样的,服务器可以分别对第二原始样本图像集包含的各原始样本图像进行小波变换,获得相应的原始低频特征和原始高频特征,各原始样本图像的原始低频特征做成一个原始低频特征集,各原始样本图像的原始高频特征做成一个原始高频特征集。
129.对两个原始低频特征集进行线性插值处理,获得插值低频特征集。在针对第一原始样本图像集获得一个原始低频特征集和一个原始高频特征集;针对第二原始样本图像集获得一个原始低频特征集和一个原始高频特征集之后,服务器可以针对这两个原始低频特
征集进行线性插值处理,以这两个原始低频特征集分别为第一原始低频特征集和第二原始低频特征集为例,服务器可以从第一原始低频特征集选取一个原始低频特征,分别与第二原始低频特征集包含的各原始低频特征进行线性插值处理,获得相应的插值低频特征,直到第一原始低频特征集包含的原始低频特征全部进行了线性插值处理,将获得的各插值低频特征组成插值低频特征集。
130.服务器分别对插值低频特征集,与两个原始高频特征集进行小波逆变换,获得两个扩展样本图像集。服务器在获得插值低频特征集之后,将插值低频特征集包含的每个插值低频特征,作为一个原始低频特征集中相应的原始低频特征,与该原始高频特征集中相应的原始高频特征进行小波逆变换,获得一个扩展样本图像集,从而在与两个原始高频特征集进行小波逆变换后,获得两个扩展样本图像集。
131.作为一种实施例,在至少一种图像集扩展策略包括傅里叶变换策略时,以对两个原始样本图像集,即第一原始样本图像集和第二原始样本图像集进行图像集扩展处理的过程为例进行介绍,每两个原始样本图像集进行图像集扩展处理的过程类似,在此不再赘述。
132.分别对两个原始样本图像集进行傅里叶变换,获得两个原始相位特征集和两个原始幅度特征集。服务器可以分别对第一原始样本图像集包含的各原始样本图像进行傅里叶变换,获得相应的原始相位特征和原始幅度特征,各原始样本图像的原始相位特征做成一个原始相位特征集,各原始样本图像的原始幅度特征做成一个原始幅度特征集。
133.同样的,服务器可以分别对第二原始样本图像集包含的各原始样本图像进行傅里叶变换,获得相应的原始相位特征和原始幅度特征,各原始样本图像的原始相位特征做成一个原始相位特征集,各原始样本图像的原始幅度特征做成一个原始幅度特征集。
134.对两个原始相位特征集进行线性插值处理,获得插值相位特征集。在针对第一原始样本图像集获得一个原始相位特征集和一个原始幅度特征集;针对第二原始样本图像集获得一个原始相位特征集和一个原始幅度特征集之后,服务器可以针对这两个原始相位特征集进行线性插值处理,以这两个原始相位特征集分别为第一原始相位特征集和第二原始相位特征集为例,服务器可以从第一原始相位特征集选取一个原始相位特征,分别与第二原始相位特征集包含的各原始相位特征进行线性插值处理,获得相应的插值相位特征,直到第一原始相位特征集包含的原始相位特征全部进行了线性插值处理,将获得的各插值相位特征组成插值相位特征集。
135.服务器分别对插值相位特征集,与两个原始幅度特征集进行傅里叶逆变换,获得两个扩展样本图像集。服务器在获得插值相位特征集之后,将插值相位特征集包含的每个插值相位特征,作为一个原始相位特征集中相应的原始相位特征,与该原始幅度特征集中相应的原始幅度特征进行傅里叶逆变换,获得一个扩展样本图像集,从而在与两个原始幅度特征集进行傅里叶逆变换后,获得两个扩展样本图像集。
136.作为一种实施例,在至少一种图像集扩展策略包括小波变换策略时,也可以针对获得的两个原始高频特征集进行线性插值处理,获得插值高频特征集,再分别与两个原始低频特征集进行小波逆变换,获得两个扩展样本图像集。
137.在至少一种图像集扩展策略包括傅里叶变换策略时,也可以针对获得的两个原始幅度特征集进行线性插值处理,获得插值幅度特征集,再分别与两个原始相位特征集进行傅里叶变换,获得两个扩展样本图像集。
138.例如,请参考图4,为获得扩展样本图像集的一种流程示意图。
139.s401,原始样本图像集为m个,每两个原始样本图像集组为一对,记为pair(i,j),数量为初始化i=0。
140.s402,初始化j=0,此时,i=0,且j=0。
141.s403,设置n
α
个线性插值系数α,那么通过图像集扩展处理可以获得个扩展样本图像集,其中,l为图像集扩展策略的数量,以2为例。那么训练样本集可以扩大为原始样本图像集的倍。
142.α初始化为0.1,并在每按照α进行一轮线性插值之后,α的取值增加0.1。
143.s404,基于原始样本图像集对pair(i,j),分别采用小波变换策略和傅里叶变化策略,按照线性插值系数α进行图像集扩展处理,记为domain(i,j,α),获得相应的扩展样本图像集。其中,在图像集扩展处理过程中,进行线性插值时,按照公式(1)进行线性插值。
144.z=αx+(1-α)y
ꢀꢀꢀ
(1)
145.s405,确定α的取值是否大于0.9,在α的取值不大于0.9时,设置α的取值为α+1,重新从步骤s404开始执行。在α的取值大于0.9时,执行步骤s406。
146.s406,在α的取值大于0.9时,确定j的取值是否等于在j的取值不等于时,设置j的取值为j+1,重新从步骤s403开始执行。在j的取值等于时,执行步骤s407。
147.s407,在j的取值等于时,确定i的取值是否等于在i的取值不等于时,设置i的取值为i+1,重新从步骤s402开始执行。在i的取值等于时结束,获得多个扩展样本图像集。
148.s203,对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇。
149.在获得各原始样本图像集和各扩展样本图像集之后,可以将每个原始样本图像集和每个扩展样本图像集作为训练图像,组成多个训练图像集。服务器可以对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇。每个图像集聚类簇包含至少一个训练图像集,训练图像集为原始样本图像集或扩展样本图像集,由于是对各原始样本图像集和各扩展样本图像集进行的图像集聚类处理,那么多个图像集聚类簇中,至少存在一个图像集聚类簇中包含扩展样本图像集。
150.图像集聚类处理用于将图像特征相似度较高的每两个训练图像集汇聚在一个图像集聚类簇中。针对两个训练图像集,即第一训练图像集和第二训练图像集,服务器可以依次从第一训练图像集中选取一张训练图像,分别确定与第二训练图像集中的各训练图像之间的相似度,直到第一训练图像集中的各训练图像全部与第二训练图像集中的各训练图像确定了相似度,基于获得的训练图像之间的各相似度,确定第一训练图像集和第二训练图像集之间的相似度,例如,将训练图像之间的各相似度的平均相似度,作为第一训练图像集
和第二训练图像集之间的相似度。在获得每两个训练图像集之间的相似度之后,可以将相似度大于预设相似度阈值的每两个训练图像集汇聚在一个图像集聚类簇中。
151.作为一种实施例,还可以采用图像分类模型,对各个训练图像集进行图像集聚类处理,下面以两个训练图像集为例进行介绍,请参考图5,对其他训练图像集进行图像集聚类处理的过程类似,在此不再赘述。
152.s501,针对两个训练图像集,分别采用相应的图像分类模型,对两个训练图像集进行特征提取,获得两个图像特征集,并基于两个图像特征集,分别确定两个图像特征集各自对应的分类概率分布集。
153.以两个训练图像集中每个训练图像集包含的一张训练图像为例进行介绍,其他不再赘述。例如,针对两个训练图像集中每个训练图像集包含的一张训练图像,请参考图6,分别采用模型参数共享的两个编码器进行特征提取,获得两个图像特征。两个训练图像集各自包含的训练图像的图像特征,组成相应的图像特征集。
154.采用分类器分别基于两个图像特征,确定相应的训练图像属于每个备选分类的概率,获得两个训练图像各自的分类概率分布。两个训练图像集各自包含的训练图像的分类概率分布,组成相应的分类概率分布集。
155.作为一种实施例,在获得分类概率分布集之后,可以基于梯度的二次惩罚项确定编码器的训练损失,从而保证基于分类概率分布集计算出的相似度,是由一个再生核希尔伯特空间所限定的单位球内度量的最大值得到的。
156.s502,针对从获得的两个分类概率分布集中选取的每两个分类概率分布,确定相应的概率分布误差,并基于获得的各概率分布误差,确定两个训练图像集之间的相似度。
157.以两个分类概率分布集各自包含的一个分类概率分布为例进行介绍,其他不再赘述。例如,基于一个概率分布误差计算策略,确定两个分类概率分布之间的js散度,将该js散度作为两个分类概率分布的概率分布误差。
158.又例如,基于概率分布误差计算策略,将两个分类概率分布分别作为边缘分布p
γ
和p
θ
,基于两个边缘分布,获得联合分布γ(x,y)。两个边缘分布和联合分布分别满足公式(2)和公式(3)。
159.∫γ(x,y)dy=p
γ
(x)
ꢀꢀꢀ
(2)
160.∫γ(x,y)dx=p
θ
(y)
ꢀꢀꢀ
(3)
161.其中,∫γ(x,y)表示从x处搬∫γ(x,y)dx这么多的土方到y处。从x处搬运单位土方到y处的成本定义为d(x,y),常见的成本函数一般可以由l范数衍生出来,如‖x-y‖1、‖x-y‖2等,那么两个分类概率分布的概率分布误差请参考公式(4)。
[0162][0163]
其中,inf表示下确界即最小,也就是说要从所有的搬运方案中,找出总搬运成本∫
x
∫yγ(x,y)d(x,y)dx dy最小的方案,即两个分类概率分布的概率分布误差。
[0164]
在获得两个训练图像集中一个训练图像集包含的每张训练图像,与另一训练图像集包含的每张训练图像之间的概率分布误差之后,可以基于获得的各概率分布误差,确定这两个训练图像集之间的相似度。例如,将各概率分布误差的平均值作为两个训练图像集之间的相似度等,具体不做限制。从而可以获得各训练图像集中每两个训练图像集之间的
相似度,基于各个训练图像集中的每两个训练图像集之间的相似度,对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇。
[0165]
s503,基于各个训练图像集中的每两个训练图像集之间的相似度,对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇。
[0166]
作为一种实施例,在进行图像集聚类处理时,可以是先基于各个训练图像集中的每两个训练图像集之间的相似度,确定各相似度组成的相似度矩阵和对角矩阵。
[0167]
以基于两个训练图像集之间的相似度,确定相应的相似度矩阵和对角矩阵为例,其他训练图像集的确定过程类似,在此不再赘述,请参考公式(5)和公式(6)。
[0168][0169]
其中,s
ij
表征相似度矩阵中第i行第j列的元素,distw表征两个训练图像集之间的相似度,δ表征高斯核函数的超参数,用于控制核函数的作用范围,可以是所有距离的方差。
[0170][0171]
其中,di表征对角矩阵中第i行的对角元素,w
ij
表征相似度矩阵中第i行第j列的元素。
[0172]
在获得各个训练图像集中每两个训练图像集之间的相似度矩阵和对角矩阵之后,可以将各个训练图像集作为顶点,并基于相似度矩阵与对角矩阵之差建立各顶点之间的无向边,获得无向图。相似度矩阵与对角矩阵之差可以是进行了归一化处理后的值。在获得无向图之后,可以对无向图进行图像分割处理,获得多个子图,并分别基于多个子图各自包含的训练图像集,建立相应的图像集聚类簇。
[0173]
s204,分别基于多个图像集聚类簇,对相应的待训练的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型。
[0174]
在获得多个图像集聚类簇之后,服务器可以分别基于多个图像集聚类簇,对相应的待训练的图像分类模型进行多轮迭代训练,在图像分类模型的训练损失满足训练目标时,输出已训练的多个目标图像分类模型。
[0175]
以基于一个图像集聚类簇,对一个待训练的图像分类模型进行多轮迭代训练为例,针对一个图像集聚类簇中的每两个训练图像集,分别采用相应的图像分类模型,对两个训练图像集进行特征提取,获得两个图像特征集,并分别基于两个图像特征集,确定相应的分类概率分布集。针对从获得的两个分类概率分布集中选取的每两个分类概率分布,确定相应的概率分布误差,并基于获得的各概率分布误差,确定图像分类模型的训练损失。在获得的训练损失不满足训练目标时,调整图像分类模型的模型参数。在获得的训练损失满足训练目标时,输出已训练的目标图像分类模型。
[0176]
请参考图7a,在每轮迭代训练过程中,服务器可以采用图像分类模型对这两个训练图像集各自包含的一个训练图像进行特征提取,获得相应的图像特征,并采用分类器基于获得的两个图像特征,分别确定相应的分类概率分布。采用判别器基于获得的两个分类概率分布,确定概率分布误差,具体参考前文介绍。
[0177]
在概率分布误差较小时,说明图像分类模型在进行特征提取时,学习到了一个图像集聚类簇中各训练图像的域不变特征,因此可以基于图像集聚类簇中各训练图像之间的
概率分布误差,确定图像分类模型的训练损失。或者,如果原始样本图像具有关联的分类标签,那么还可以结合各训练图像之间的概率分布误差,以及基于分类概率分布确定出的预测分类与相应的分类标签之间的误差,确定图像分类模型的训练损失。
[0178]
例如,请参考图7b,为训练图像分类模型的一种流程示意图。
[0179]
s701,设置迭代上限i,以及更新间隔m,初始化i=0。
[0180]
s702,选取两个训练图像集,记为x和y。
[0181]
s703,分别从两个训练图像集中采样,获得从x中采样出的至少一个训练图像,以及从y中采样出的至少一个训练图像。
[0182]
s704,采用如图7a所示的图像分类模型,确定每两个训练图像之间的概率分布误差,以及梯度的二次罚项。在不调整图像分类模型的特征提取过程和分类器的模型参数的前提下,对判别器进行多轮迭代训练,调整相关的模型参数。
[0183]
s705,确定j是否大于m,如果j不大于m,那么j设置为j+1,并重新执行步骤s703。如果j大于m,那么执行步骤s706。
[0184]
s706,继续从两个训练图像集中采样,获得从x中采样出的至少一个训练图像,以及从y中采样出的至少一个训练图像。
[0185]
s707,采用如图7a所示的图像分类模型,确定每两个训练图像之间的概率分布误差,以及梯度的二次罚项。在不调整图像分类模型的特征提取过程和分类器的模型参数的前提下,对判别器进行多轮迭代训练,调整相关的模型参数。
[0186]
s708,确定i是否大于i,如果i不大于i,那么i设置为i+1,并重新执行步骤s702。如果i大于i,那么结束获得目标图像分类模型。
[0187]
作为一种实施例,在获得已训练的多个目标图像分类模型之后,可以使用获得的目标图像分类模型对待分类图像进行图像分类。在对待分类图像进行图像分类时,可以从获得的各目标图像分类模型中,选取与待分类图像具有相同域特征的目标图像分类模型进行图像分类。
[0188]
下面对选取与待分类图像具有相同域特征的目标图像分类模型的过程进行介绍。
[0189]
在获得待分类图像之后,分别从多个图像集聚类簇包含的训练图像集中选取一个训练图像,获得多个训练图像。针对多个训练图像,分别确定是否与待分类图像具有相同的域特征。下面以一个训练图像为例,其他训练图像的确定过程类似,在此不再赘述。
[0190]
采用与训练图像相匹配的目标图像分类模型,对训练图像和待分类图像进行特征提取,获得相应的第一图像特征和第二图像特征,并分别基于第一图像特征和第二图像特征,确定相应的第一分类概率分布和第二分类概率分布。在第一分类概率分布和第二分类概率分布之间的概率分布误差满足预设误差条件时,基于第二分类概率分布,确定待分类图像的目标类别。在第一分类概率分布和第二分类概率分布之间的概率分布误差不满足预设误差条件时,选取下一个训练图像继续进行确定。
[0191]
基于同一发明构思,本技术实施例提供一种训练图像分类模型的装置,能够实现前述的训练图像分类模型的方法对应的功能。请参考图8,该装置包括获取模块801和处理模块802,其中:
[0192]
获取模块801:用于获取多个原始样本图像集,其中,不同原始样本图像集属于不同的图像域;
[0193]
处理模块802:用于采用至少一种图像集扩展策略,分别对多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集;
[0194]
处理模块802还用于:对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,其中,每个图像集聚类簇包含至少一个训练图像集,训练图像集为原始样本图像集或扩展样本图像集,多个图像集聚类簇中,至少存在一个图像集聚类簇中包含扩展样本图像集;
[0195]
处理模块802还用于:分别基于多个图像集聚类簇,对相应的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型。
[0196]
在一种可能的实施例中,至少一种图像集扩展策略包括小波变换策略时,处理模块802具体用于:
[0197]
针对每两个原始样本图像集,执行以下操作:
[0198]
分别对两个原始样本图像集进行小波变换,获得两个原始低频特征集和两个原始高频特征集;
[0199]
对两个原始低频特征集进行线性插值处理,获得插值低频特征集;
[0200]
分别对插值低频特征集,与两个原始高频特征集进行小波逆变换,获得两个扩展样本图像集。
[0201]
在一种可能的实施例中,至少一种图像集扩展策略包括傅里叶变换策略时,处理模块802具体用于:
[0202]
针对每两个原始样本图像集,执行以下操作:
[0203]
分别对两个原始样本图像集进行傅里叶变换,获得两个原始相位特征集和两个原始幅度特征集;
[0204]
对两个原始相位特征集进行线性插值处理,获得插值相位特征集;
[0205]
分别对插值相位特征集,与两个原始幅度特征集进行傅里叶逆变换,获得两个扩展样本图像集。
[0206]
在一种可能的实施例中,处理模块802具体用于:
[0207]
针对各个训练图像集中的每两个训练图像集,执行以下操作:
[0208]
针对两个训练图像集,分别采用相应的图像分类模型,对两个训练图像集进行特征提取,获得两个图像特征集,并基于两个图像特征集,分别确定两个图像特征集各自对应的分类概率分布集;
[0209]
针对从获得的两个分类概率分布集中选取的每两个分类概率分布,确定相应的概率分布误差,并基于获得的各概率分布误差,确定两个训练图像集之间的相似度;
[0210]
基于各个训练图像集中的每两个训练图像集之间的相似度,对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇。
[0211]
在一种可能的实施例中,处理模块802具体用于:
[0212]
基于各个训练图像集中的每两个训练图像集之间的相似度,确定各相似度组成的相似度矩阵和对角矩阵;
[0213]
将各个训练图像集作为顶点,并基于相似度矩阵与对角矩阵之差建立各顶点之间的无向边,获得无向图;
[0214]
对无向图进行图像分割处理,获得多个子图,并分别基于多个子图各自包含的训
练图像集,建立相应的图像集聚类簇。
[0215]
在一种可能的实施例中,处理模块802具体用于:
[0216]
针对每个图像集聚类簇中的每两个训练图像集,执行以下操作:
[0217]
针对两个训练图像集,分别采用相应的图像分类模型,对两个训练图像集进行特征提取,获得两个图像特征集,并分别基于两个图像特征集,确定相应的分类概率分布集;
[0218]
针对从获得的两个分类概率分布集中选取的每两个分类概率分布,确定相应的概率分布误差,并基于获得的各概率分布误差,确定图像分类模型的训练损失;
[0219]
在获得的训练损失不满足训练目标时,调整图像分类模型的模型参数;
[0220]
在获得的训练损失满足训练目标时,输出已训练的目标图像分类模型。
[0221]
在一种可能的实施例中,处理模块802还用于:
[0222]
在分别基于多个图像集聚类簇,对相应的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型之后,获得待分类图像;
[0223]
分别从各个训练图像集中选取一个训练图像,获得多个训练图像;
[0224]
针对多个训练图像,分别执行以下操作:
[0225]
采用与训练图像相匹配的目标图像分类模型,对训练图像和待分类图像进行特征提取,获得相应的第一图像特征和第二图像特征,并分别基于第一图像特征和第二图像特征,确定相应的第一分类概率分布和第二分类概率分布;
[0226]
在第一分类概率分布和第二分类概率分布之间的概率分布误差满足预设误差条件时,基于第二分类概率分布,确定待分类图像的目标类别。
[0227]
请参照图9,上述训练图像分类模型的装置可以运行在计算机设备900上,数据存储程序的当前版本和历史版本以及数据存储程序对应的应用软件可以安装在计算机设备900上,该计算机设备900包括处理器980以及存储器920。在一些实施例中,该计算机设备900可以包括显示单元940,显示单元940包括显示面板941,用于显示由用户交互操作界面等。
[0228]
在一种可能的实施例中,可以采用液晶显示器(liquid crystal display,lcd)或有机发光二极管oled(organic light-emitting diode)等形式来配置显示面板941。
[0229]
处理器980用于读取计算机程序,然后执行计算机程序定义的方法,例如处理器980读取数据存储程序或文件等,从而在该计算机设备900上运行数据存储程序,在显示单元940上显示对应的界面。处理器980可以包括一个或多个通用处理器,还可包括一个或多个dsp(digital signal processor,数字信号处理器),用于执行相关操作,以实现本技术实施例所提供的技术方案。
[0230]
存储器920一般包括内存和外存,内存可以为随机存储器(ram),只读存储器(rom),以及高速缓存(cache)等。外存可以为硬盘、光盘、usb盘、软盘或磁带机等。存储器920用于存储计算机程序和其他数据,该计算机程序包括各客户端对应的应用程序等,其他数据可包括操作系统或应用程序被运行后产生的数据,该数据包括系统数据(例如操作系统的配置参数)和用户数据。本技术实施例中程序指令存储在存储器920中,处理器980执行存储器920中的程序指令,实现前文图论述的任意的一种方法。
[0231]
上述显示单元940用于接收输入的数字信息、字符信息或接触式触摸操作/非接触式手势,以及产生与计算机设备900的用户设置以及功能控制有关的信号输入等。具体地,
本技术实施例中,该显示单元940可以包括显示面板941。显示面板941例如触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在显示面板941上或在显示面板941的操作),并根据预先设定的程式驱动相应的连接装置。
[0232]
在一种可能的实施例中,显示面板941可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测玩家的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器980,并能接收处理器980发来的命令并加以执行。
[0233]
其中,显示面板941可以采用电阻式、电容式、红外线以及表面声波等多种类型实现。除了显示单元940,在一些实施例中,计算机设备900还可以包括输入单元930,输入单元930可以包括图像输入设备931和其他输入设备932,其中其他输入设备可以但不限于包括物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
[0234]
除以上之外,计算机设备900还可以包括用于给其他模块供电的电源990、音频电路960、近场通信模块970和rf电路910。计算机设备900还可以包括一个或多个传感器950,例如加速度传感器、光传感器、压力传感器等。音频电路960具体包括扬声器961和麦克风962等,例如计算机设备900可以通过麦克风962采集用户的声音,进行相应的操作等。
[0235]
作为一种实施例,处理器980的数量可以是一个或多个,处理器980和存储器920可以是耦合设置,也可以是相对独立设置。
[0236]
作为一种实施例,图9中的处理器980可以用于实现如图8中的获取模块801和处理模块802的功能。
[0237]
作为一种实施例,图9中的处理器980可以用于实现前文论述的服务器或终端设备对应的功能。
[0238]
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0239]
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,例如,通过计算机程序产品体现,该计算机程序产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
[0240]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0241]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精
神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。

技术特征:
1.一种训练图像分类模型的方法,其特征在于,包括:获取多个原始样本图像集,其中,不同原始样本图像集属于不同的图像域;采用至少一种图像集扩展策略,分别对所述多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集;对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,其中,每个图像集聚类簇包含至少一个训练图像集,所述训练图像集为所述原始样本图像集或所述扩展样本图像集,所述多个图像集聚类簇中,至少存在一个图像集聚类簇中包含所述扩展样本图像集;分别基于所述多个图像集聚类簇,对相应的待训练的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型。2.根据权利要求1所述的方法,其特征在于,所述至少一种图像集扩展策略包括小波变换策略时,所述采用至少一种图像集扩展策略,分别对所述多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集,包括:针对每两个原始样本图像集,执行以下操作:分别对两个所述原始样本图像集进行小波变换,获得两个原始低频特征集和两个原始高频特征集;对所述两个原始低频特征集进行线性插值处理,获得插值低频特征集;分别对所述插值低频特征集,与所述两个原始高频特征集进行小波逆变换,获得两个扩展样本图像集。3.根据权利要求1所述的方法,其特征在于,所述至少一种图像集扩展策略包括傅里叶变换策略时,所述采用至少一种图像集扩展策略,分别对所述多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集,包括:针对每两个原始样本图像集,执行以下操作:分别对两个所述原始样本图像集进行傅里叶变换,获得两个原始相位特征集和两个原始幅度特征集;对所述两个原始相位特征集进行线性插值处理,获得插值相位特征集;分别对所述插值相位特征集,与所述两个原始幅度特征集进行傅里叶逆变换,获得两个扩展样本图像集。4.根据权利要求1所述的方法,其特征在于,所述对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,包括:针对所述各个训练图像集中的每两个训练图像集,执行以下操作:针对两个训练图像集,分别采用相应的图像分类模型,对所述两个训练图像集进行特征提取,获得两个图像特征集,并基于所述两个图像特征集,分别确定所述两个图像特征集各自对应的分类概率分布集;针对从获得的两个分类概率分布集中选取的每两个分类概率分布,确定相应的概率分布误差,并基于获得的各概率分布误差,确定所述两个训练图像集之间的相似度;基于所述各个训练图像集中的每两个训练图像集之间的相似度,对所述各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇。5.根据权利要求4所述的方法,其特征在于,所述基于所述各个训练图像集中的每两个训练图像集之间的相似度,对所述各个训练图像集进行图像集聚类处理,获得多个图像集
聚类簇,包括:基于所述各个训练图像集中的每两个训练图像集之间的相似度,确定各相似度组成的相似度矩阵和对角矩阵;将所述各个训练图像集作为顶点,并基于所述相似度矩阵与所述对角矩阵之差建立各顶点之间的无向边,获得无向图;对所述无向图进行图像分割处理,获得多个子图,并分别基于所述多个子图各自包含的训练图像集,建立相应的图像集聚类簇。6.根据权利要求1~5任一项所述的方法,其特征在于,所述分别基于所述多个图像集聚类簇,对相应的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型,包括:针对每个图像集聚类簇中的每两个训练图像集,执行以下操作:针对两个训练图像集,分别采用相应的图像分类模型,对所述两个训练图像集进行特征提取,获得两个图像特征集,并分别基于所述两个图像特征集,确定相应的分类概率分布集;针对从获得的两个分类概率分布集中选取的每两个分类概率分布,确定相应的概率分布误差,并基于获得的各概率分布误差,确定所述图像分类模型的训练损失;在获得的训练损失不满足训练目标时,调整所述图像分类模型的模型参数;在获得的训练损失满足训练目标时,输出已训练的目标图像分类模型。7.根据权利要求1~5任一项所述的方法,其特征在于,在所述分别基于所述多个图像集聚类簇,对相应的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型之后,还包括:获得待分类图像;分别从所述各个训练图像集中选取一个训练图像,获得多个训练图像;针对所述多个训练图像,分别执行以下操作:采用与训练图像相匹配的目标图像分类模型,对所述训练图像和所述待分类图像进行特征提取,获得相应的第一图像特征和第二图像特征,并分别基于所述第一图像特征和所述第二图像特征,确定相应的第一分类概率分布和第二分类概率分布;在所述第一分类概率分布和所述第二分类概率分布之间的概率分布误差满足预设误差条件时,基于所述第二分类概率分布,确定所述待分类图像的目标类别。8.一种训练图像分类模型的装置,其特征在于,包括:获取模块:用于获取多个原始样本图像集,其中,不同原始样本图像集属于不同的图像域;处理模块:用于采用至少一种图像集扩展策略,分别对所述多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集;所述处理模块还用于:对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,其中,每个图像集聚类簇包含至少一个训练图像集,所述训练图像集为所述原始样本图像集或所述扩展样本图像集,所述多个图像集聚类簇中,至少存在一个图像集聚类簇中包含所述扩展样本图像集;所述处理模块还用于:分别基于所述多个图像集聚类簇,对相应的图像分类模型进行
多轮迭代训练,输出已训练的多个目标图像分类模型。9.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1~7中任一项所述的方法。10.一种计算机设备,其特征在于,包括:存储器,用于存储程序指令;处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如权利要求1~7中任一项所述的方法。11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1~7中任一项所述的方法。

技术总结
本申请提供一种训练图像分类模型的方法、装置、设备及存储介质,可以应用于人工智能领域等,用于解决训练得到的图像分类模型的分类准确性和分类可靠性较低的问题。该方法包括:获取多个原始样本图像集;采用至少一种图像集扩展策略,分别对所述多个原始样本图像集中的每两个原始样本图像集进行图像集扩展处理,获得多个扩展样本图像集;对各个训练图像集进行图像集聚类处理,获得多个图像集聚类簇,其中,每个图像集聚类簇包含至少一个训练图像集,所述训练图像集为所述原始样本图像集或所述扩展样本图像集;分别基于所述多个图像集聚类簇,对相应的待训练的图像分类模型进行多轮迭代训练,输出已训练的多个目标图像分类模型。输出已训练的多个目标图像分类模型。输出已训练的多个目标图像分类模型。


技术研发人员:马媛媛 王仁根 张学涵 蔡丹平 黄鹏 吴立 周祥明 张朋
受保护的技术使用者:浙江大华技术股份有限公司
技术研发日:2022.07.13
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-3744.html

最新回复(0)