1.本发明涉及数据监测领域,尤其涉及一种产品成分数据监测方法、装置、电子设备及存储介质。
背景技术:2.在制造业生产过程的质量管理中,控制图作为统计过程控制 (statistics process control,spc)的一种工具常被用来监控过程中的异常波动,主要是应用数理统计分析对产品生产过程进行在线实时监控,通过监测产品的质量特性变化来判断生产过程中的是处于受控还是失控状态,一旦失控就发出警报,生产人员可以及时发现异常并进行调整从而达到生产质量控制的目的。
3.在实际的制造业场景中,如化学、食品等行业,往往需要对产品的各个质量特性的比例或浓度等进行控制,这种质量特性就是成分数据。产成品的质量受成分数据分布的影响较大,因此常常运用多元控制图对成分数据的分布状态进行监控,从而实现对生产质量的控制。
4.然而,现有的统计过程控制只能监测生产过程中的状态,无法根据监测数据进一步识别异常模式,需要人工检查异常来源。因此,现有技术在对产品成分进行监测的过程中,存在无法自动处理异常数据,进而无法确定异常模式的问题。
技术实现要素:5.有鉴于此,有必要提供一种产品成分数据监测方法、装置、电子设备及存储介质,能够有效监测出产品成分数据中失控数据对应的具体异常模式类型。
6.为了解决上述问题,本发明提供一种产品成分数据监测方法,包括:
7.获取产品成分数据对应的控制图样本集,并基于预设条件,筛选出失控成分数据样本集;
8.将失控成分数据样本集输入至初始基于自适应增强的向量机模型,以失控成分数据样本集对应的异常偏移模式为输出,迭代训练,确定训练完备的基于自适应增强的向量机模型;
9.获取实时失控成分数据,将实时失控成分数据输入至训练完备的基于自适应增强的向量机模型,确定待测产品的异常偏移模式。
10.进一步地,初始基于自适应增强的向量机模型包括多个弱分类器,并通过自适应增强算法对多个弱分类器进行加权运算,组成一个强分类器;通过支持向量机算法将强分类器的数据映射到高维的特征空间中进行分类。
11.进一步地,支持向量机算法包括核参数和惩罚因子,通过差分进化算法对核参数和惩罚因子进行寻优。
12.进一步地,控制图样本集的性能指标包括受控状态下的平均运行长度和失控状态下的平均运行长度。
13.进一步地,通过马尔科夫链算法求解受控状态下的平均运行长度;通过蒙特卡罗方仿真法求解失控状态下的平均运行长度。
14.进一步地,获取控制图样本集的步骤,包括:
15.获取产品成分数据;
16.对产品成分数据样本进行等距对数比变换,确定均值坐标向量样本;
17.根据均值坐标向量样本确定统计量样本,构造控制图样本集。
18.进一步地,获取产品成分数据,包括:
19.对采集到的产品生产数据进行小波变换降噪处理,得到产品成分数据。
20.为了解决上述问题,本发明还提供一种产品成分数据监测装置,包括:
21.失控成分数据样本集获取模块,用于获取产品成分数据对应的控制图样本集,并基于预设条件,筛选出失控成分数据样本集;
22.模型训练模块,用于将失控成分数据样本集输入至初始基于自适应增强的向量机模型,以失控成分数据样本集对应的异常偏移模式为输出,迭代训练,确定训练完备的基于自适应增强的向量机模型;
23.异常偏移模式确定模块,用于获取实时失控成分数据,将实时失控成分数据输入至训练完备的基于自适应增强的向量机模型,确定待测产品的异常偏移模式。
24.为了解决上述问题,本发明还提供一种电子设备,包括处理器以及存储器,存储器上存储有计算机程序,计算机程序被处理器执行时,实现如前文所述的产品成分数据监测方法。
25.为了解决上述问题,本发明还提供一种计算机可读存储介质,存储介质存储有计算机程序指令,当计算机程序指令被计算机执行时,使计算机执行如前文所述的产品成分数据监测方法。
26.采用上述技术方案的有益效果是:本发明提供一种产品成分数据监测方法、装置、电子设备及存储介质,该方法包括:首先,基于预设条件,筛选出控制图样本集中的失控成分数据样本集;然后,根据失控成分数据样本集训练初始基于自适应增强的向量机模型,得到对应的异常偏移模式;最后,根据训练完备的基于自适应增强的向量机模型确定待测产品的异常偏移模式。通过将产品成分数据转换为控制图样本集进行判断,不仅结果简洁明确,并且便于溯源;在获取到失控成分统计量后,基于自适应增强的向量机模型能够确定异常偏移模式,从而实现自动处理异常数据以及确定产品的异常模式。
附图说明
27.图1为本发明提供的产品成分数据监测方法一实施例的流程示意图;
28.图2为本发明提供的构造成分数据控制图一实施例的流程示意图;
29.图3为本发明提供的初始基于自适应增强的向量机模型一实施例的结构示意图;
30.图4为本发明提供的产品成分数据监测装置一实施例的结构示意图;
31.图5为本发明提供的电子设备一实施例的结构框图。
具体实施方式
32.下面结合附图来具体描述本发明的优选实施例,其中,附图构成本技术一部分,并
与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
33.在陈述实施例之前,先对产品成分的异常模式进行阐述:
34.以三元过程为例,因为产品的成分数据具有定和的限制,其中有一个变量发生偏移,就会引起另一个或变量发生偏移,因此只有单一变量发生偏移的情况不存在。
35.对于三元过程,即对于只涉及三种成分的产品,主要有以下几种异常模式:第一和第二个变量均发生偏移、第一和第三个变量均发生偏移、第二和第三个变量均发生偏移和三个变量均发生偏移的情况。可以表示为12种异常模式分别是:(1,-1,0)、(1,0,-1)、(0,1,-1)、(-1,1,0)、(-1,0, 1)、(0,-1,1);(1,-1,-1)、(-1,1,-1)、(1,-1,1)、(1,1,-1)、(1,-1,1)、(-1,1, 1)。其中正常和异常的状态分别用0和
±
1表示,+代表变量向上发生偏移,-代表变量向下发生偏移。
36.具体如下图所示:
37.异常模式异常偏移模式(1,-1,0)成分1上偏移,成分2下偏移(1,0,-1)成分1上偏移,成分3下偏移(0,1,-1)成分2上偏移,成分3下偏移(-1,1,0)成分1下偏移,成分2上偏移(-1,0,1)成分1下偏移,成分3上偏移(0,-1,1)成分2下偏移,成分3上偏移(1,-1,-1)成分1上偏移,成分2下偏移,成分3下偏移(-1,1,-1)成分1下偏移,成分2上偏移,成分3下偏移(1,-1,1)成分1上偏移,成分2下偏移,成分3上偏移(1,1,-1)成分1上偏移,成分2上偏移,成分3下偏移(1,-1,1)成分1上偏移,成分2下偏移,成分3上偏移(-1,1,1)成分1下偏移,成分2上偏移,成分3上偏移
38.目前,为了控制产品的各个质量特性的比例或浓度等,通常对产品的成分数据进行监控。然而,现有的多元控制图由于识别精度不高,难以根据生产数据,实现自动处理异常数据,更不用说根据异常的生产数据确定产品的异常模式。
39.因此,现有技术在对产品成分进行监测的过程中,存在无法根据产品成分数据中失控数据确定对应的具体异常模式的问题。
40.为了上述问题,本发明提供了一种产品成分数据监测方法、装置、电子设备及存储介质,以下分别进行详细说明。
41.如图1所示,图1为本发明提供的产品成分数据监测方法一实施例的流程示意图,包括:
42.步骤s101:获取产品成分数据对应的控制图样本集,并基于预设条件,筛选出失控成分数据样本集。
43.步骤s102:将失控成分数据样本集输入至初始基于自适应增强的向量机模型,以失控成分数据样本集对应的异常偏移模式为输出,迭代训练,确定训练完备的基于自适应增强的向量机模型。
44.步骤s103:获取实时失控成分数据,将实时失控成分数据输入至训练完备的基于
自适应增强的向量机模型,确定待测产品的异常偏移模式。
45.本实施例中,首先,基于预设条件,根据控制图样本集获取产品的失控成分数据样本集,然后,通过基于自适应增强的向量机模型,确定失控成分数据样本集对应的异常偏移模式。通过控制图对产品成分数据进行判断,得到失控成分数据样本集,不仅结果简洁明确,并且便于溯源;在获取到失控成分数据样本集后,基于自适应增强的向量机模型能够确定异常偏移模式,实现了自动处理异常数据,并根据异常数据自动确定产品的异常偏移模式。
46.作为优选的实施例,在步骤s101中,为了获取多组产品成分数据数据,并且保证产品成分数据的精度,需要对采集到的产品生产数据进行预处理,剔除异常值。
47.在一具体实施例中,对采集到的产品生产数据进行小波变换降噪处理,从而得到产品成分数据。
48.通过小波变换降噪处理,将产品生产数据中的信号和噪音在不同尺度下进行小波分解时,由于信号和噪音表现出来的传递特性截然相反,即噪声的模极大值随着小波尺度的增大而缩小,而信号的模极大值随着尺度的增大而增大。通过这一特性可以把信号中的噪声部分去除,然后从去噪后的模极大值来重建原始信号,达到去除噪声的目的,使得产品成分数据更为精确。
49.进一步地,在得到产品成分数据后,还需要获取控制图样本集。
50.在一具体实施例中,如图2所示,图2为本技术提供的获取控制图样本集一实施例的流程示意图,包括:
51.步骤s111:获取产品成分数据。
52.在一具体实施例中,通过随机采样,抽取采集到样本容量为n的p维成分数据,记作x
i,j
={x
i,1
,x
i,2
,l,x
i,n
};其中,每个x
i,j
均服从正态分布。
53.步骤s112:对产品成分数据样本进行等距对数比变换,确定均值坐标向量样本。
54.在一具体实施例中,将每个成分数据做等距对数比变换,得到均值坐标向量,其中,计算均值坐标向量的公式为:
[0055][0056]
其中,z
i,j
服从加法逻辑正态分布。
[0057]
步骤s113:根据均值坐标向量样本确定统计量样本,构造控制图样本集。
[0058]
在一具体实施例中,通过多变量累积和算法,对均值坐标向量进行处理,得到统计量样本;根据统计量样本构造控制图样本集。
[0059]
其中,计算统计量样本的公式如下:
[0060]ci
={(y
i-1
+z
i-μ0)'σ
0-1
(y
i-1
+z
i-μ0)}
1/2
[0061][0062]
qi=[yi'σ
0-1
yi]
1/2
[0063]
其中,qi为统计量样本,k为过程偏移系数,zi为样本的均值坐标向量,zi∈r
p-1
,i=1,2,l。
[0064]
本实施例中,通过对产品成分数据进行等距对数比变换,实现产品成分数据服从加法逻辑正态化,使得均值坐标向量更能体现出成分数据的特点;通过多变量累积和算法得到产品的统计量样本,并构造控制图样本集,便于直观地获取监测结果。
[0065]
进一步地,控制图样本集的性能指标包括:受控状态下的平均运行长度和失控状态下的平均运行长度。其中,失控状态下的平均运行长度越大越能有效降低控制图样本集的虚警率,受控状态下的平均运行长度越小越能有效减少控制图样本集的漏报率。
[0066]
为了得到受控状态下的平均运行长度的最优值,利用马尔科夫链进行求解。
[0067]
在一具体实施例中,受控状态下的平均运行长度的公式为:
[0068]
arl0=h'(i-p)-1e[0069]
其中,arl0是受控状态下的平均运行长度,h=(1,0,0,
…
)是m+1维的初始向量,i是(m+1,m+1)的单位矩阵,p是(m+1,m+1)的概率转移矩阵, e是m+1的列向量。
[0070]
为了得到失控状态下的平均运行长度的最优值,利用蒙特卡罗方仿真法进行求解。
[0071]
在一具体实施例中,设定受控状态下平均运行链长arl0的值,选取基于成分数据的变量累积和控制图的一组参数k和h;生成服从正态分布且偏移系数为δ的随机数;根据给定的参数k,计算统计量样本qi;记录失控状态的运行链长;重复上述步骤104次,得到104次rl,计算rl的期望值即为失控状态下的平均运行长度,记作arl1。
[0072]
本实施例中,通过计算得到受控状态下的平均运行长度的最优值和失控状态下的平均运行长度的最优值,保证了控制图的性能,提高了结果的可靠度。
[0073]
进一步地,在步骤s101中,得到了控制图样本集后,还需要基于预设条件,才能筛选出失控成分数据样本集。
[0074]
在一具体实施例中,根据经验或历史记录,设置初始受控平均链长;然后,利用马尔科夫链求解受控平均链长的实际值,取偏移参考系数 k=1/2*δ,并用matlab软件中的fsolve函数,求解马尔科夫链中受控平均链长的实际值的非线性方程,得到此时的控制限,即为本实施例中的预设条件。
[0075]
进一步地,在确定预设条件后,遍历比较控制图样本集与预设条件,若控制图样本集小于预设条件,判断该控制图样本集受控;若大于预设条件,则判断该控制图样本集失控,记作失控成分数据样本集,并记录。
[0076]
通过上述方式,不仅将成分数据进行了区分,提取出了异常成分数据,并且还将异常的成分数据进行了梳理,生成了成分数据控制图,便于后续使用。
[0077]
进一步地,在步骤s102中,确定失控成分数据样本集之后,还需要对失控成分数据样本集进行分析,确定失控成分数据样本集对应的异常偏移模式。
[0078]
作为优选的实施例,在步骤s102中,如图3所示,图3为本发明提供的初始基于自适应增强的向量机模型一实施例的结构示意图,初始基于自适应增强的向量机模型包括多个弱分类器(a1、a2、a3、a4),以及其组成的强分类器(a)。
[0079]
本实施例中,通过自适应增强算法对多个弱分类器(a1、a2、a3、 a4)进行加权运算,组成一个强分类器(a),然后,通过支持向量机算法将强分类器的数据映射到高维的特
征空间中进行分类。
[0080]
在一具体实施例中,自适应增强算法对弱分类器进行加权组成一个强分类器,因此,强分类器的性能依赖于弱分类器的分类效果。支持向量机算法是将低维的数据映射到高维的特征空间中进行分类,在一定程度上弥补了自适应增强算法误差随着迭代次数增多而增大的问题,因此,选择支持向量机算法作为自适应增强算法的弱分类器可以提升分类算法的分类准确率。
[0081]
也就是说,通过将自适应增强算法与支持向量机算法融合,形成一个集成算法,对两种算法取长补短,从而实现提升算法的性能。
[0082]
在一具体实施例中,支持向量机算法包括其核参数和惩罚因子,如果核参数值选取的不合适,就会出现“过学习”或“欠学习”现象;选取的子惩罚因子不合适,就会出现“过拟合”或“欠拟合”的结果。为了提高支持向量机算法的性能,保证结果的可靠性,需要选取最优的核参数和惩罚因子。
[0083]
进一步地,为了对核参数和惩罚因子进行寻优,运用差分进化算法进行处理。
[0084]
差分进化算法是一种模拟自然界生物进化过程的启发式算法,通过随机搜索群体中的差异性,在迭代过程中不断地逼近最优解,最后达到全局收敛。该方法目前主要应用在求解全局的最优解或者和其他算法结合形成混合算法的问题中。其主要的思想是将随机选择群体中的两个个体向量差加上第三个个体作为变异个体,将变异个体与目标个体交叉形成新的个体并和目标个体相比较,选择更优的个体进入下一代群体中。在迭代过程中不断的改进群体的质量向最优解靠近。
[0085]
差分进化算法主要通过变异,交叉和选择三个步骤求取全局最优解。变异是通过三个个体向量获得新的个体向量,若第一个体和第二个体的差异越小,对新个体产生的影响就越小。在算法迭代初期时,由于两两之间差异过大,随机搜索的范围就越大;在算法迭代中后期时,两两之间差异变小,此时搜索的范围也会变小,算法趋向最优值。交叉是为了提高种群个体的多样性,在交叉过程中将变异个体和目标个体交叉形成新的试验个体,确保试验个体至少能在变异个体中获取一个值,避免无效交叉。选择的目的是将最好的个体保留下来,基于贪婪的选择思想比较适应度值,留下试验个体和目标个体中较优的个体,使得子代个体适应度值总是优于父代的个体适应度值。
[0086]
通过差分进化算法确定最优的核参数和最优的惩罚因子,提高了支持向量机算法的可靠度,保证了根据支持向量机算法确定的基于自适应增强的向量机模型的判断精度,从而有效保证了获取到的异常偏移模式的可靠度。
[0087]
通过上述方式,首先,通过将产品成分数据转化成控制图样本集,将成分数据图示化,提高了结果的直观性;然后,基于预设条件,根据控制图样本集判断产品成分是否可控,实现对产品成分的初步监测;进一步地,对于失控成分数据样本集,根据基于自适应增强的向量机模型,得到其对应的异常偏移模式,从而实现根据产品的成分数据,自动处理异常数据,并确定异常偏移模式。
[0088]
为了解决上述问题,本发明还提供了一种产品成分数据监测装置,如图4所示,图4为本发明提供的产品成分数据监测装置一实施例的结构示意图,产品成分数据监测装置400包括:
[0089]
失控成分数据样本集获取模块401,用于获取产品成分数据对应的控制图样本集,
并基于预设条件,筛选出失控成分数据样本集;
[0090]
模型训练模块402,用于将失控成分数据样本集输入至初始基于自适应增强的向量机模型,以失控成分数据样本集对应的异常偏移模式为输出,迭代训练,确定训练完备的基于自适应增强的向量机模型;
[0091]
异常偏移模式确定模块403,用于获取实时失控成分数据,将实时失控成分数据输入至训练完备的基于自适应增强的向量机模型,确定待测产品的异常偏移模式。
[0092]
本发明还相应提供了一种电子设备,如图5所示,图5为本发明提供的电子设备一实施例的结构框图。电子设备500可以是移动终端、桌上型计算机、笔记本、掌上电脑及服务器等计算设备。电子设备500包括处理器501以及存储器502,其中,存储器502上存储有产品成分数据监测程序503。
[0093]
存储器502在一些实施例中可以是计算机设备的内部存储单元,例如计算机设备的硬盘或内存。存储器502在另一些实施例中也可以是计算机设备的外部存储设备,例如计算机设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd) 卡,闪存卡(flash card)等。进一步地,存储器502还可以既包括计算机设备的内部存储单元也包括外部存储设备。存储器502用于存储安装于计算机设备的应用软件及各类数据,例如安装计算机设备的程序代码等。存储器502还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中,产品成分数据监测程序503可被处理器501所执行,从而实现本发明各实施例的产品成分数据监测方法。
[0094]
处理器501在一些实施例中可以是一中央处理器(central processingunit,cpu),微处理器或其他数据处理芯片,用于运行存储器502中存储的程序代码或处理数据,例如执行产品成分数据监测程序等。
[0095]
本实施例还提供了一种计算机可读存储介质,其上存储有产品成分数据监测程序,计算机该程序被处理器执行时,实现如上述任一技术方案所述的产品成分数据监测方法。
[0096]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程 rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram) 或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0097]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
技术特征:1.一种产品成分数据监测方法,其特征在于,包括:获取产品成分数据对应的控制图样本集,并基于预设条件,筛选出失控成分数据样本集;将所述失控成分数据样本集输入至初始基于自适应增强的向量机模型,以所述失控成分数据样本集对应的异常偏移模式为输出,迭代训练,确定训练完备的基于自适应增强的向量机模型;获取实时失控成分数据,将所述实时失控成分数据输入至所述训练完备的基于自适应增强的向量机模型,确定所述待测产品的异常偏移模式。2.根据权利要求1所述的产品成分数据监测方法,其特征在于,所述初始基于自适应增强的向量机模型包括多个弱分类器,并通过自适应增强算法对所述多个弱分类器进行加权运算,组成一个强分类器;通过支持向量机算法将所述强分类器的数据映射到高维的特征空间中进行分类。3.根据权利要求2所述的产品成分数据监测方法,其特征在于,所述支持向量机算法包括核参数和惩罚因子,通过差分进化算法对所述核参数和所述惩罚因子进行寻优。4.根据权利要求1所述的产品成分数据监测方法,其特征在于,所述控制图样本集的性能指标包括受控状态下的平均运行长度和失控状态下的平均运行长度。5.根据权利要求4所述的产品成分数据监测方法,其特征在于,通过马尔科夫链算法求解所述受控状态下的平均运行长度;通过蒙特卡罗方仿真法求解所述失控状态下的平均运行长度。6.根据权利要求1所述的产品成分数据监测方法,其特征在于,获取所述控制图样本集的步骤,包括:获取所述产品成分数据;对所述产品成分数据样本进行等距对数比变换,确定均值坐标向量样本;根据所述均值坐标向量样本确定统计量样本,构造控制图样本集。7.根据权利要求6所述的产品成分数据监测方法,其特征在于,所述获取所述产品成分数据,包括:对采集到的产品生产数据进行小波变换降噪处理,得到所述产品成分数据。8.一种产品成分数据监测装置,其特征在于,包括:失控成分数据样本集获取模块,用于获取产品成分数据对应的控制图样本集,并基于预设条件,筛选出失控成分数据样本集;模型训练模块,用于将所述失控成分数据样本集输入至初始基于自适应增强的向量机模型,以所述失控成分数据样本集对应的异常偏移模式为输出,迭代训练,确定训练完备的基于自适应增强的向量机模型;异常偏移模式确定模块,用于获取实时失控成分数据,将所述实时失控成分数据输入至所述训练完备的基于自适应增强的向量机模型,确定所述待测产品的异常偏移模式。9.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1-7任一项所述的产品成分数据监测方法。10.一种存储介质,其特征在于,所述存储介质存储有计算机程序指令,当所述计算机
程序指令被计算机执行时,使计算机执行根据权利要求1至7中任一所述的产品成分数据监测方法。
技术总结本发明提供一种产品成分数据监测方法、装置、电子设备及存储介质,该方法包括:首先,基于预设条件,筛选出控制图样本集中的失控成分数据样本集;然后,根据失控成分数据样本集训练初始基于自适应增强的向量机模型,得到对应的异常偏移模式;最后,根据训练完备的基于自适应增强的向量机模型确定待测产品的异常偏移模式。通过将产品成分数据转换为控制图样本集进行判断,不仅结果简洁明确,并且便于溯源;在获取到失控成分统计量后,基于自适应增强的向量机模型能够确定异常偏移模式,从而实现自动处理异常数据以及确定产品的异常模式。动处理异常数据以及确定产品的异常模式。动处理异常数据以及确定产品的异常模式。
技术研发人员:张莹 向佳敏 褚娜
受保护的技术使用者:武汉理工大学
技术研发日:2022.07.20
技术公布日:2022/11/1