本发明涉及一种数据驱动的故障检测方法,尤其涉及一种基于多子空间划分的典型早期故障检测方法。
背景技术:
1、现代流程工业发展迅速,对其安全、可靠要求逐渐变高,对复杂的工业系统进行故障检测、预警显得尤为重要。近些年,基于数据驱动的多元统计过程监控深得研究者的青睐,常用的算法包括主成分分析法(principal component analysis,pca)、偏最小二乘法(partial least square,pls)、邻域保持嵌入(neighborhood preserving embedding,npe)等。但是,由于早期故障缺乏明显的特征,具有隐蔽性、随机性、与正常状态偏差小等特点,相较于常规故障很难检测,但是随时间发展对正常工况的恶化逐渐增大;同时由于整个工业过程中控制单元的数量和变量的复杂性,如果只使用传统的多元统计方法,检测早期故障的效果并不理想。为了避免直接从复杂的工业流程中检测早期故障,提高检测的准确性,多子空间分布式方法是一种有效的解决方案。
2、虽然多子空间分布式方法已被证明是有效的,但由于不是性能驱动的,在不考虑故障信息的情况下无法达到最优的检测性能。因此,有必要采用找出与典型早期故障相关的变量,选择最佳变量,并为每个典型早期故障建立特定的模型。kl(kullback-leiblerdivergence,kld)可以对比两个概率分布之间的差异性,相比现有的多元统计更加敏感。本发明通过kl散度比较正常数据集和典型早期故障数据集之间概率分布差异,选择最敏感变量构造与该故障相关的最优子空间。同时对互信息矩阵进行稀疏化处理,通过全部过程变量间的相关性强弱关系去除冗余变量,降低噪声干扰,划分为常规子空间,从而保证对于常规故障的检测能力。然后,在子空间内,使用加权平均移动窗口实现数据的重构增强,并通过npe算法提取数据特征,实现故障检测。综上,本发明方法不仅保持对于常规故障的检测准确率,而且还具有对传统多元统计方法难以检测的典型早期故障的检测能力。
技术实现思路
1、本发明所要解决的主要技术问题是:第一是典型早期故障特征微弱,变量变化不明显问题,通过kl散度选取对难以检测的典型早期故障敏感的变量构建特定子空间,并在后续子空间检测环节进行数据增强提升检测能力。第二是保证常规故障的检测能力问题,利用稀疏化互信息矩阵去除冗余变量构建常规子空间,在数据增强的基础上引入npe算法提取数据的流形信息,并利用得到的特征信息进行建模,最终采用贝叶斯推理融合建立相应统计量并进行监测。
2、本发明为解决上述问题所采用的技术方案为:一种基于多子空间划分的典型早期故障检测方法,包括以下步骤:
3、(1)采集工业流程中正常运行状态下的样本数据和典型早期故障的历史工况数据,其中正常工况过程数据集为典型早期故障数据集为计算正常数据集的均值μ和标准差σ,并按照公式(1)进行z-score标准化,得到训练数据x∈rn×p,y∈rn×p;
4、
5、其中x与y为标准化后数据集的单一采样点时刻的数据,即数据集x和y的一行数据,其中x∈r1×p,y∈r1×p;
6、(2)使用kld量化正常和故障条件下变量分布的差异,选择敏感变量构建对应典型早期故障的特定子空间,其具体实施过程如下所示:
7、①逐一计算两数据集中对应变量xi和yi(i=1,2,......,p)之间的kld,通常表示为:
8、
9、②考虑到kld的基本定义是非对称的,因此不适合用作距离度量,在实际应用中,采用一种改进的对称形式:
10、
11、③kld较大的过程变量被认为对故障有较大的影响,对同一类型的典型早期故障敏感的变量将放在同一子块中,变量xi对第j个典型早期故障的贡献如下所示:
12、
13、④将变量按贡献率由大到小进行排序,按以下方法计算累积贡献率(ccr):
14、
15、⑤取大于ccr极限的前d个敏感变量构建第j个典型早期故障的特定子空间bj;
16、(3)针对正常工况数据集x,使用稀疏化的互信息矩阵排除过程变量中的冗余变量,减小噪声干扰,构建常规故障子空间,具体操作过程如下所示:
17、①互信息用于度量两个变量之间的线性和非线性关系,通过两个变量的互信息量i(xi,xk)(i,k=1,2,......,p)判断变量之间相关性的强弱,互信息矩阵的定义如下:
18、
19、②设计一个阈值,将小于阈值的互信息降为零,并对mi矩阵进行稀疏变换,得到新的矩阵mis,将稀疏矩阵mis转换为距离度量矩阵,互信息越大,距离越小,样本越相似,公式如下:
20、
21、③在获得距离测量矩阵后,采用层次聚类方法根据距离大小对不同变量进行分类,保证强相关性变量划分至同一子空间,排除冗余变量干扰,构建常规故障子空间bn1,bn2,...;
22、(4)在各子空间中使用加权平均移动窗口进行重构数据,实现数据增强,具体操作过程如下所示:
23、①使用加权平均移动窗口实现数据增强,针对t时刻的数据样本,需要确定一个长度为d的移动窗口,并为窗口中的数据分配不同的权重,在时间t-d+1之前引入故障的数据处理如下:
24、x′t=wtxt+δt+wt-1xt-1+δ(t-1)+…+wt-d+1xt-d+1+δ(t-d+1) (8)
25、②其中δt,δ(t-1)和δ(t-d+1)分别是故障产生的相应时刻的偏差,wt是归一化后窗口中数据的权重,如下公式所示:
26、
27、(5)将实现增强的过程数据通过npe保持流形结构同时提取特征,构建监控统计量,建立子空间故障检测模型,具体操作过程如下所示:
28、①计算每个数据与其他n-1个数据之间的欧氏距离,然后选择最近的k个数据作为邻居,如果xa是xb的邻居,则节点a和节点b之间连接一条直线;
29、②w为待求的权重矩阵,节点a和节点b之间的权重为wab,当两个不同的节点之间没有直线连接,权重值设为零,如果两个不同的节点之间存在直线连接,则通过最小化以下目标函数获得权重值wab:
30、min∑a||x(a)-∑bwabx(b)||=∑a||∑bwab(x(a)-x(b))|| (10)
31、其中,∑bwab=1,j=1,2,...,n(wab=0(a=b)) (11)
32、③通过计算下式的特征值和特征向量得到投影向量p,其中xe为数据增强后的子空间数据集:
33、
34、其中,m=(i一w)t(i-w)(13)
35、④因此,得到特征值所对应的特征向量集p=[p1,p2,…,pn],然后,建立子空间中的监测统计量为:
36、t2=xtpptx (14)
37、(6)给定置信水平α,取95%,确定各故障子空间控制限
38、步骤(1)~(6)为本发明方法的离线建模阶段,如下所示步骤(7)~(11)为本发明方法的在线监测过程;
39、(7)获取在线样本利用正常数据集的均值和标准差对其执行标准化,得到:
40、(8)根据离线建模步骤(2)和(3)得到的子空间划分标准对在线数据样本xnew进行划分,从而得到各子空间中的样本数据;
41、(9)在各子空间内首先按照步骤(4)对输入数据进行数据增强,将增强后的数据按照离线建模阶段(5)得到的投影矩阵,计算各子空间在线样本的统计量具体公式如下:
42、
43、(10)对于常规故障子空间bn1,bn2,...,在得到步骤(9)的各子空间统计数据后,各子空间需要通过贝叶斯推断融合将统计数据进行统计合并,构建为一个综合监控统计量:
44、①
45、其中,
46、p(xb)=p(xb|n)p(n)+p(xb|f)p(f) (18)
47、②条件概率p(xb|f)的定义如下:
48、
49、jb,new(b=n1,n2,......nn)是在线检测的数据集中常规故障子空间的统计数据,jb,lim为步骤(6)中对应的常规子空间的控制限;
50、(11)按照如下判别逻辑进行在线监控:如果在线采集样本的典型早期故障子空间的监控统计量则系统发生了典型早期故障1,需要及时处理相关故障,同理可判断典型早期故障2、3等是否发生;如果bic>置信水平α,则系统发生了常规故障,反之则系统无故障发生;
51、与传统的多元统计方法相比,本发明方法的优势在于:
52、考虑到kl散度针对不同数据分布间微小差异的敏感性,通过计算典型早期故障的历史工况与正常工况的数据样本kl散度,划分特定的早期故障子空间,使得后续针对早期故障的检测率明显提升。同时采用稀疏的互信息矩阵排除冗余变量,划分常规故障子空间,保证了针对常规故障的检测能力。另外,本发明考虑到故障数据的特征微弱问题,在子空间内采用了加权平均移动窗口实现数据增强,并采用npe保持流形结构提取特征,实现故障检测;
1.一种基于多子空间划分的典型早期故障检测方法,其特征在于:所述方法包括以下步骤:
2.根据权利要求1所述的一种基于多子空间划分的典型早期故障检测方法,其特征在于,所述步骤(3)中根据kl散度将训练数据集正常和故障条件之间变量分布的差异量化,选择敏感变量构建对应典型早期故障的特定子空间,其具体实施过程如下所示:
3.根据权利要求1所述的一种基于多子空间划分的典型早期故障检测方法,其特征在于,所述步骤(4)中针对正常工况数据集x,使用稀疏化的互信息矩阵排除过程变量中的冗余变量,减小噪声干扰,构建常规故障子空间,具体操作过程如下所示:
4.根据权利要求1所述的一种基于多子空间划分的典型早期故障检测方法,其特征在于,所述步骤(5)中使用加权平均移动窗口进行重构数据,实现数据增强的具体操作过程如下所示:
