本技术属于人工智能领域,尤其涉及一种异常检测方法、模型训练方法、装置、设备、介质及产品。
背景技术:
1、随着运营监控系统由独立静态物理系统的传统基础架构,转向含有本地、托管云、私有环境和公有环境的动态组合基础架构,环境所产生的数据量迎来爆发式增长,传统的信息技术管理解决方案已经无法跟上数据量增长的步伐。在业务的执行过程中,接口的数据量或者网站访问的数据量可能存在数据量过高或者过低的异常,需要及时确定出异常,以及时采取补救措施。
2、目前,确定数据量异常的方式有,通过历史数据预测出一个未来时间段的数据量预测曲线,然后再用实际曲线与预测曲线进行比较,若实际曲线中存在与预测曲线差距过大的点,则判定该点的数据量异常。而传统方案中,是采用大量的训练数据直接训练得到单个预测模型,再将该模型应用到所有场景中,但由于实际应用中的存在多种类型的数据,这些数据的变化趋势并不相同,导致训练出的预测模型无法针对每种场景下的数据量进行精准预测,进而导致异常判定的准确性偏低。
技术实现思路
1、本技术实施例提供一种异常检测方法、模型训练方法、装置、设备、介质及产品,能够提高对未来数据量预测的准确性,从而提高异常判定的准确性。
2、一方面,本技术实施例提供一种异常检测模型训练方法,包括:
3、获取多个初始时间序列;时间序列中各时间点的值为业务数据量,所述初始时间序列中各时间点的业务数据量满足预设要求;
4、滤除各所述初始时间序列的噪声,以得到对应的多个目标时间序列;
5、采用周期分类算法,将多个所述目标时间序列划分为周期序列集合以及非周期序列集合;
6、采用聚类算法,将所述周期序列集合按周期特性进行分类,得到多个聚类集合;
7、基于所述非周期序列集合以及各所述聚类集合,分别训练数据异常检测模型中对应的序列预测子模型;所述数据异常检测模型用于根据未来目标时间段的预测时间序列,确定对应的实际时间序列中不满足所述预设要求的异常时间点;所述预测时间序列为基于对应的目标序列预测子模型,根据历史时间序列预测得到。
8、另一方面,所述采用周期分类算法,将多个所述目标时间序列划分为周期序列集合以及非周期序列集合,包括:
9、基于快速傅里叶变换算法,将多个所述目标时间序列划分为第一周期序列集合以及待定序列集合;
10、基于连续小波变换算法,将所述待定序列集合划分为第二周期序列集合以及所述非周期序列集合;所述周期序列集合包括所述第一周期序列集合以及所述第二周期序列集合。
11、另一方面,所述基于快速傅里叶变换算法,将多个所述目标时间序列划分为第一周期序列集合以及待定序列集合,包括:
12、基于快速傅里叶变换算法,确定各所述目标时间序列的频谱中最大幅值所对应的目标频率;
13、基于所述目标频率,确定各所述目标时间序列的目标周期;
14、以各所述目标周期为时间步长,将对应的所述目标时间序列划分为多个目标区间;
15、分别确定各所述目标时间序列中的所有所述目标区间的目标方差;
16、将所述目标方差大于方差阈值的各所述目标时间序列组成的集合,确定为所述第一周期序列集合;
17、将所述目标方差不大于所述方差阈值的各所述目标时间序列,确定为所述待定序列集合。
18、另一方面,所述基于连续小波变换算法,将所述待定序列集合划分为第二周期序列集合以及所述非周期序列集合,包括:
19、基于连续小波变换算法,确定所述待定序列集合中各待定序列的目标小波全谱;
20、将所述目标小波全谱大于小波全谱阈值的各所述待定序列组成的集合,确定为所述非周期序列集合;
21、将所述目标小波全谱不大于所述小波全谱阈值的各所述待定序列组成的集合,确定为所述第二周期序列集合。
22、另一方面,所述采用聚类算法,将所述周期序列集合按周期特性进行分类,得到多个聚类集合,包括:
23、基于形状计算距离方法(constrained shape based distance,csbd),量化所述周期序列集合中各周期序列之间的相似程度,得到量化结果;
24、根据所述量化结果,采用基于密度聚类方法(ordering points to identify theclustering structure,optics),将所述周期序列集合按周期特性进行分类,得到多个所述聚类集合。
25、另一方面,所述滤除各所述初始时间序列的噪声,以得到对应的多个目标时间序列,包括:
26、采用hp滤波算法,滤除各所述初始时间序列的噪声,以得到对应的多个所述目标时间序列。
27、再一方面,本技术实施例提供了一种异常检测方法,包括:
28、获取历史预设时间段的历史时间序列;
29、基于所述历史时间序列,从所述数据异常检测模型的各序列预测子模型中,确定对应的目标序列预测子模型;所述数据异常检测模型根据如上所述的异常检测模型训练方法训练得到;
30、基于所述目标序列预测子模型,根据所述历史时间序列,预测未来目标时间段的预测时间序列;
31、获取所述目标时间段的实际时间序列;
32、基于所述数据异常检测模型,确定所述目标时间段中,所述预测时间序列以及实际时间序列在各时间点的目标差异;
33、在所述目标差异不满足预设差异条件的情况下,确定对应时间点的数据量存在异常。
34、另一方面,所述基于所述历史时间序列,从所述数据异常检测模型的各序列预测子模型中,确定对应的目标序列预测子模型之前,所述方法还包括:
35、获取与所述历史时间序列相同种类的标志历史时间序列;
36、分别基于各所述序列预测子模型,根据所述标志历史时间序列,预测得到多个标志时间序列;
37、分别计算各所述标志时间序列与对应时间段的实际时间序列之间的误差指标;
38、将所述误差指标满足预设误差要求的所述标志时间序列所对应的所述序列预测子模型,确定为所述目标序列预测子模型。
39、另一方面,在所述分别计算各所述标志时间序列与对应时间段的实际时间序列之间的误差指标之前,所述方法还包括:
40、计算所述标志时间序列与实际时间序列之间的目标相似度;
41、基于所述目标相似度,对不同量级的所述标志时间序列以及实际时间序列,进行统一量纲处理。
42、另一方面,所述预设差异条件为所述目标差异大于差异阈值;
43、所述在所述目标差异不满足预设差异条件的情况下,确定对应时间点的数据量存在异常之前,所述方法还包括:
44、基于四分位法设定所述差异阈值。
45、再一方面,本技术实施例提供了一种异常检测模型训练装置,包括:
46、第一获取模块,用于获取多个初始时间序列;时间序列中各时间点的值为业务数据量,所述初始时间序列中各时间点的业务数据量满足预设要求;
47、滤除模块,用于滤除各所述初始时间序列的噪声,以得到对应的多个目标时间序列;
48、划分模块,用于采用周期分类算法,将多个所述目标时间序列划分为周期序列集合以及非周期序列集合;
49、聚类模块,用于采用聚类算法,将所述周期序列集合按周期特性进行分类,得到多个聚类集合;
50、训练模块,用于基于所述非周期序列集合以及各所述聚类集合,分别训练数据异常检测模型中对应的序列预测子模型;所述数据异常检测模型用于根据未来目标时间段的预测时间序列,确定对应的实际时间序列中不满足所述预设要求的异常时间点;所述预测时间序列为基于对应的目标序列预测子模型,根据历史时间序列预测得到。
51、再一方面,本技术实施例提供了一种异常检测装置,包括:
52、第二获取模块,用于获取历史预设时间段的历史时间序列;
53、第一确定模块,用于基于所述历史时间序列,从数据异常检测模型的各序列预测子模型中,确定对应的目标序列预测子模型;所述数据异常检测模型根据如上所述的异常检测模型训练方法训练得到;
54、第一预测模块,用于基于所述目标序列预测子模型,根据所述历史时间序列,预测未来目标时间段的预测时间序列;
55、第三获取模块,用于获取所述目标时间段的实际时间序列;
56、第二确定模块,用于基于所述数据异常检测模型,确定所述目标时间段中,所述预测时间序列以及实际时间序列在各时间点的目标差异;
57、第三确定模块,用于在所述目标差异不满足预设差异条件的情况下,确定对应时间点的数据量存在异常。
58、再一方面,本技术实施例提供了一种电子设备,所述设备包括:处理器以及存储有计算机程序指令的存储器;
59、所述处理器执行所述计算机程序指令时实现如上所述的异常检测模型训练方法以及异常检测方法。
60、再一方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如上所述的异常检测模型训练方法以及异常检测方法。
61、再一方面,本技术实施例提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如上所述的异常检测模型训练方法以及异常检测方法。
62、本技术实施例的异常检测模型训练方法,将满足预设要求的业务数据量的时间序列作为训练数据进行模型训练。先滤除数据的噪声,然后采用周期分类算法划分为周期序列集合以及非周期序列集合,接着采用聚类算法得到多个聚类集合。至此,得到非周期序列集合以及多个属于周期序列的聚类集合。然后分别基于这些集合,训练数据异常检测模型中对应的序列预测子模型。数据异常检测模型用于根据预测时间序列,确定实际时间序列中不满足预设要求的异常时间点。可见,本技术实施例将用于训练的时间序列分类为多个集合,再基于对应类别的序列集合训练对应的子模型,在后续检测异常时,可针对不同场景下的历史数据,选择更合适的子模型,从而得到更加准确的预测时间序列,进而保证了异常检测的准确性。且上述各算法在功能上相互配合、互相增强,共同实现了对时间序列异常的精准定位与稳健检测。
1.一种异常检测模型训练方法,其特征在于,包括:
2.根据权利要求1所述的异常检测模型训练方法,其特征在于,所述采用周期分类算法,将多个所述目标时间序列划分为周期序列集合以及非周期序列集合,包括:
3.根据权利要求2所述的异常检测模型训练方法,其特征在于,所述基于快速傅里叶变换算法,将多个所述目标时间序列划分为第一周期序列集合以及待定序列集合,包括:
4.根据权利要求3所述的异常检测模型训练方法,其特征在于,所述基于连续小波变换算法,将所述待定序列集合划分为第二周期序列集合以及所述非周期序列集合,包括:
5.根据权利要求1所述的异常检测模型训练方法,其特征在于,所述采用聚类算法,将所述周期序列集合按周期特性进行分类,得到多个聚类集合,包括:
6.根据权利要求1所述的异常检测模型训练方法,其特征在于,所述滤除各所述初始时间序列的噪声,以得到对应的多个目标时间序列,包括:
7.一种异常检测方法,其特征在于,包括:
8.根据权利要求7所述的异常检测方法,其特征在于,所述基于所述历史时间序列,从所述数据异常检测模型的各序列预测子模型中,确定对应的目标序列预测子模型之前,所述方法还包括:
9.根据权利要求8所述的异常检测方法,其特征在于,在所述分别计算各所述标志时间序列与对应时间段的实际时间序列之间的误差指标之前,所述方法还包括:
10.根据权利要求7所述的异常检测方法,其特征在于,所述预设差异条件为所述目标差异大于差异阈值;
11.一种异常检测模型训练装置,其特征在于,包括:
12.一种异常检测装置,其特征在于,包括:
13.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1至6任意一项所述的异常检测模型训练方法或如权利要求7至10任意一项所述的异常检测方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1至6任意一项所述的异常检测模型训练方法或如权利要求7至10任意一项所述的异常检测方法。
