分类模型的训练方法、训练装置、电子设备和可读介质与流程

专利2025-11-18  16


本公开的实施例涉及人工智能,具体涉及分类模型的训练方法、训练装置、电子设备和可读介质。


背景技术:

1、机器学习是一类算法的总称。这些算法通常用于从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类。更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果。只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的目标一般是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化(generalization)能力。

2、该背景技术部分中所公开的以上信息仅用于增强对本发明构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。


技术实现思路

1、本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的一些实施例提出了分类模型的训练方法、训练装置、电子设备、计算机可读介质和计算机程序产品,来解决以上背景技术部分提到的技术问题中的一项或多项。

2、第一方面,本公开的一些实施例提供了一种分类模型的训练方法,包括:根据训练数据,确定分类模型的训练参数,其中,训练数据中包括至少一个类别的正样本图片;将训练数据输入分类模型,进行模型训练;响应于确定分类模型完成预设次数的迭代计算,确定分类模型的召回率;根据分类模型的召回率,确定分类模型的训练状态。

3、在一些实施例中,根据训练数据,确定分类模型的训练参数,包括:统计训练数据中所有样本图片的总数量、正样本图片的类别个数和正样本图片的总数量;根据所有样本图片的总数量,确定模型训练的目标迭代次数;根据正样本图片的类别个数和正样本图片的总数量,确定分类模型单次迭代所使用的数据量。

4、在一些实施例中,根据分类模型的召回率,确定分类模型的训练状态,包括:响应于确定分类模型不满足收敛条件,确定当前迭代计算完成后分类模型的分析数据,其中,分析数据包括以下至少一项:召回率类间平均误差、召回率类间最大误差和指标提升率;根据分析数据确定分类模型的优化调整数据,以及根据调整后的数据训练分类模型。

5、在一些实施例中,收敛条件包括以下至少一项:分类模型的累计迭代次数大于第一阈值;完成预设迭代次数范围内的迭代计算所得到的各模型召回率中,最小召回率大于第二阈值,其中,预设迭代次数范围为累计迭代次数与第一阈值的差值至累计迭代次数;在对应预设迭代次数范围内的各模型召回率中,最大召回率与最小召回率的差值大于第三阈值。

6、在一些实施例中,根据分析数据确定分类模型的优化调整数据,包括:响应于确定召回率类间平均误差大于或等于第四阈值,确定调整分类模型单次迭代所使用的数据量。

7、在一些实施例中,根据分析数据确定分类模型的优化调整数据,包括:响应于确定召回率类间最大误差小于第四阈值,且指标提升率大于或等于第五阈值,确定调整分类模型的目标迭代次数。

8、在一些实施例中,根据分析数据确定分类模型的优化调整数据,还包括:响应于确定召回率类间平均误差小于第四阈值,且第四阈值小于或等于召回率类间最大误差,确定调整训练数据;或者响应于确定召回率类间最大误差小于第四阈值,且指标提升率小于第五阈值,确定增加训练数据的数据量。

9、在一些实施例中,该训练方法还包括:响应于确定分类模型的累计迭代次数达到目标迭代次数,结束分类模型的训练,以及确定当前模型的召回率;响应于确定召回率大于第二阈值,确定分类模型训练完成。

10、在一些实施例中,训练数据通过以下方法得到:响应于接收到多个类别的视频图像,对每个类别的视频图像进行抽帧处理,得到该类别下的正样本图片集;对多个类别的正样本图片集中的图片数量进行分析,确定是否满足预设数据条件;响应于确定满足预设数据条件,基于多个类别的正样本图片集,补充生成负样本图片集;将多个类别的正样本图片集和负样本图片集作为训练数据。

11、在一些实施例中,对每个类别的视频图像进行抽帧处理,得到该类别下的正样本图片集,包括:对于每个类别的视频图像,抽取第预设帧的视频图像进行保存;按照视频帧的先后顺序,基于后续视频帧与最新保存的视频图像的视频帧的帧值差,确定视频图像之间的相似度;响应于确定相似度小于预设相似度,对该后续视频帧的视频图像进行保存;根据保存的各视频图像得到该类别下的正样本图片集。

12、在一些实施例中,预设数据条件包括:多个类别的正样本图片集中,第一正样本图片集中的图片数量大于第一预设值,且第二正样本图片集与第一正样本图片集的图片数量比值小于第二预设值,其中,第一正样本图片集、第二正样本图片集分别为多个正样本图片集中,图片数量最少、最多的正样本图片集;以及基于多个类别的正样本图片集,补充生成负样本图片集,包括:统计多个类别的正样本图片集中正样本图片的总数量,生成与该总数量相同的负样本图片,得到负样本图片集。

13、第二方面,本公开的一些实施例提供了一种分类模型的训练装置,包括:参数确定单元,被配置成根据训练数据,确定分类模型的训练参数,其中,训练数据中包括至少一个类别的正样本图片;模型训练单元,被配置成将训练数据输入分类模型,进行模型训练;召回率确定单元,被配置成响应于确定分类模型完成预设次数的迭代计算,确定分类模型的召回率;状态确定单元,被配置成根据分类模型的召回率,确定分类模型的训练状态。

14、在一些实施例中,参数确定单元可以进一步被配置成统计训练数据中所有样本图片的总数量、正样本图片的类别个数和正样本图片的总数量;根据所有样本图片的总数量,确定模型训练的目标迭代次数;根据正样本图片的类别个数和正样本图片的总数量,确定分类模型单次迭代所使用的数据量。

15、在一些实施例中,状态确定单元可以包括调整子单元,被配置成响应于确定分类模型不满足收敛条件,确定当前迭代计算完成后分类模型的分析数据,其中,分析数据包括以下至少一项:召回率类间平均误差、召回率类间最大误差和指标提升率;根据分析数据确定分类模型的优化调整数据,以及根据调整后的数据训练分类模型。

16、在一些实施例中,收敛条件可以包括以下至少一项:分类模型的累计迭代次数大于第一阈值;完成预设迭代次数范围内的迭代计算所得到的各模型召回率中,最小召回率大于第二阈值,其中,预设迭代次数范围为累计迭代次数与第一阈值的差值至累计迭代次数;在对应预设迭代次数范围内的各模型召回率中,最大召回率与最小召回率的差值大于第三阈值。

17、在一些实施例中,调整子单元可以进一步被配置成响应于确定召回率类间平均误差大于或等于第四阈值,确定调整分类模型单次迭代所使用的数据量。

18、在一些实施例中,调整子单元可以进一步被配置成响应于确定召回率类间最大误差小于第四阈值,且指标提升率大于或等于第五阈值,确定调整分类模型的目标迭代次数。

19、在一些实施例中,调整子单元还可以进一步被配置成响应于确定召回率类间平均误差小于第四阈值,且第四阈值小于或等于召回率类间最大误差,确定调整训练数据;或者响应于确定召回率类间最大误差小于第四阈值,且指标提升率小于第五阈值,确定增加训练数据的数据量。

20、在一些实施例中,该训练装置还可以包括训练完成确定单元,被配置成响应于确定分类模型的累计迭代次数达到目标迭代次数,结束分类模型的训练,以及确定当前模型的召回率;响应于确定召回率大于第二阈值,确定分类模型训练完成。

21、在一些实施例中,该训练装置还可以包括训练数据生成单元,被配置成响应于接收到多个类别的视频图像,对每个类别的视频图像进行抽帧处理,得到该类别下的正样本图片集;对多个类别的正样本图片集中的图片数量进行分析,确定是否满足预设数据条件;响应于确定满足预设数据条件,基于多个类别的正样本图片集,补充生成负样本图片集;将多个类别的正样本图片集和负样本图片集作为训练数据。

22、在一些实施例中,训练数据生成单元可以进一步被配置成对于每个类别的视频图像,抽取第预设帧的视频图像进行保存;按照视频帧的先后顺序,基于后续视频帧与最新保存的视频图像的视频帧的帧值差,确定视频图像之间的相似度;响应于确定相似度小于预设相似度,对该后续视频帧的视频图像进行保存;根据保存的各视频图像得到该类别下的正样本图片集。

23、在一些实施例中,预设数据条件可以包括:多个类别的正样本图片集中,第一正样本图片集中的图片数量大于第一预设值,且第二正样本图片集与第一正样本图片集的图片数量比值小于第二预设值,其中,第一正样本图片集、第二正样本图片集分别为多个正样本图片集中,图片数量最少、最多的正样本图片集;以及训练数据生成单元可以进一步被配置成统计多个类别的正样本图片集中正样本图片的总数量,生成与该总数量相同的负样本图片,得到负样本图片集。

24、第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面中任一实现方式所描述的训练方法。

25、第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现上述第一方面中任一实现方式所描述的训练方法。

26、第五方面,本公开的一些实施例提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述第一方面中任一实现方式所描述的训练方法。

27、本公开的上述各个实施例具有如下有益效果:本公开的一些实施例的分类模型的训练方法,有助于提高模型的训练效率和分类结果的准确度。具体来说,在模型构建与训练的相关技术,通常需要相关人员具有一定的机器学习知识或经验。而模型参数的设置和优化调整往往会影响模型的训练效率。并且目标阈值的设置一般会影响模型预测结果的准确度。通常情况下,对于不了解机器学习和模型训练的人员来说,很难完成模型训练。并且得到的模型往往也无法达到预期效果。

28、基于此,本公开的一些实施例的分类模型的训练方法,首先可以根据训练数据,来确定模型的训练参数,以进行模型训练。即不同的训练数据一般会确定出不同的训练参数。另外,在模型训练过程中,可以根据分类模型的召回率,来确定分类模型的训练状态。也就是说,对于不了解机器学习和模型训练的人员,在本公开训练方法的辅助作用下,可以较为轻松地实现模型训练。并且通过大数据确定的模型参数、目标阈值等数据较为适合且高效。这样既可以提升模型的训练效率,又可以保证模型预测结果的准确度。


技术特征:

1.一种分类模型的训练方法,包括:

2.根据权利要求1所述的训练方法,其中,所述根据训练数据,确定分类模型的训练参数,包括:

3.根据权利要求2所述的训练方法,其中,所述根据所述分类模型的召回率,确定所述分类模型的训练状态,包括:

4.根据权利要求3所述的训练方法,其中,所述收敛条件包括以下至少一项:

5.根据权利要求3所述的训练方法,其中,所述根据所述分析数据确定所述分类模型的优化调整数据,包括:

6.根据权利要求3所述的训练方法,其中,所述根据所述分析数据确定所述分类模型的优化调整数据,包括:

7.根据权利要求3所述的训练方法,其中,所述根据所述分析数据确定所述分类模型的优化调整数据,还包括:

8.根据权利要求4所述的训练方法,其中,所述训练方法还包括:

9.根据权利要求1-8之一所述的训练方法,其中,所述训练数据通过以下方法得到:

10.根据权利要求9所述的训练方法,其中,所述对每个类别的视频图像进行抽帧处理,得到该类别下的正样本图片集,包括:

11.根据权利要求9所述的训练方法,其中,所述预设数据条件包括:

12.一种分类模型的训练装置,包括:

13.一种电子设备,包括:

14.一种计算机可读介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时,实现如权利要求1-11中任一所述的训练方法。

15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时,实现如权利要求1-11中任一项所述的训练方法。


技术总结
本公开的实施例公开了分类模型的训练方法、训练装置、电子设备和可读介质。该训练方法的一具体实施方式包括:根据训练数据,确定分类模型的训练参数,其中,训练数据中包括至少一个类别的正样本图片;将训练数据输入分类模型,进行模型训练;响应于确定分类模型完成预设次数的迭代计算,确定分类模型的召回率;根据分类模型的召回率,确定分类模型的训练状态。该实施方式与人工智能技术有关,可以将分类网络模型的训练算法系统化。通过分析训练数据,可以确定模型的训练参数。通过分析训练过程中的召回率,可以提供模型的优化建议。从而使不懂算法的用户也能训练出高精度的分类模型。这样有助于提高模型的训练效率和分类结果准确度。

技术研发人员:周芳汝,杨玫
受保护的技术使用者:北京沃东天骏信息技术有限公司
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-17726.html

最新回复(0)