本发明涉及埋地管道阴极保护,具体涉及基于随机森林模型的阴极保护系统故障诊断方法及系统。
背景技术:
1、现代工业系统正呈现出向大型化、复杂化的方向发展,设施的运行状态与企业的经济效益密切相关。大型系统一旦发生故障,必定会带来严重后果,威胁人员生命安全和财产损失;而故障诊断技术往往能够在时间区间内快速的诊断出故障类型,甚至提前预测故障的发生,指导相关工作人员及时处理并修复相关故障。
2、现有埋地管道多采用强制电流阴极保护法,通过阴极保护系统对埋地管道施加强制阴极电流,使管道与阳极地床之间的电位处于一定范围内,防止埋地管道被土壤腐蚀,因此保障阴极保护系统的正常运行十分重要;传统的阴极保护系统故障诊断过程对管道运维人员及其经验水平依赖程度较高,而专业的技术人员需要经过现场多次实践,逐一排查检测才能确定故障,不但容易引起严重后果,且传统的方法需要从阴极保护系统中各个独立设备、子系统、子单元进行逐个排查需要耗费大量时间,而逐个单一排查过程中难以发现阴极保护系统中各组成单元之间的关联关系,容易造成误诊,漏诊。
技术实现思路
1、本发明所要解决的技术问题是:传统的阴极保护系统故障诊断过程对管道运维人员及其经验水平依赖程度较高,且需要从阴极保护系统中各个独立子单元进行逐个排查不仅耗费大量时间,而且排查过程中难以发现各个子单元之间的关联关系,容易造成误诊和漏诊;本发明目的在于提供基于随机森林模型的阴极保护系统故障诊断方法及系统,通过采用随机森林模型来进行埋地管道阴极保护系统的故障诊断,不但减少对专业技术人员的依赖程度,且可以及时做出精准判断,便于尽早完成修复处理。
2、本发明通过下述技术方案实现:
3、本方案提供基于随机森林模型的阴极保护系统故障诊断方法,所述方法包括步骤:
4、(一)采集恒电位仪的运行数据并进行数据预处理;
5、(二)将预处理得到的数据集输入已构建好的随机森林故障诊断模型进行阴极保护系统故障诊断,得出故障诊断结果;
6、所述随机森林故障诊断模型构建方法包括步骤:
7、t1,采样历史恒电位仪的运行数据并生成训练样本集和测试样本集;
8、t2,提取特征向量集确定节点分裂方式;
9、t3,基于取特征向量集和节点分裂方式生成第一随机森林,对特征向量集进行平衡处理后生成第二随机森林;
10、t4,将第一随机森林与第二随机森林的叠加输出作为阴极保护系统故障诊断模型。
11、本方案工作原理:传统的阴极保护系统故障诊断过程对管道运维人员及其经验水平依赖程度较高,且需要从阴极保护系统中各个独立子单元进行逐个排查不仅耗费大量时间,而且排查过程中难以发现各个子单元之间的关联关系,容易造成误诊和漏诊;本方案以恒电位仪的运行数据为基础,对整个阴极保护系统进行故障诊断,根据现场收集的恒电位仪的运行数据结合故障诊断模型自动诊断出阴极保护系统的故障,对阴极保护系统进行粗略的故障定位,技术人员无需从阴极保护系统中各个独立设备、子系统、子单元进行逐个排查,只需要对故障诊断结果定位的故障点进行人工修复和和检验;减少人工干预,还厘清了恒电位仪故障诊断所需的基本参数,为下一步恒电位仪的选型计算和阴极保护系统的建设提供了依据;本方案基于随机森林方法构建故障诊断模型,基于现有的随机森林算法进行改进,通过第一随机森林与第二随机森林的叠加输出作为阴极保护系统故障诊断模型,将双重随机森林分析方法引入到阴极保护系统故障诊断过程,可获得准确性更高、误差更小的诊断结果,减少误诊和漏诊概率。
12、根据传统随机森林方法对阴极保护系统进行故障诊断分类时的投票结果,发现当分类发生错误时,支持该结果的最大投票率通常都较低,通过对稀少类的加权来提高分类的精确率,权重较难选择,也较难在提高精确率的同时获得较高的召回率;因此本方案以模型组合的思想对故障诊断算法进行改进,建立第二个随机森林诊断模型,而且第二个诊断模型的构建是基于平衡处理后的训练集,通过两个模型的协同工作来提高诊断的精确率和召回率。
13、进一步优化方案为,所述恒电位仪的运行数据包括:当前开机状态、工作模式、油温报警状态、声光报警信号和特征信息;
14、所述特征信息包括:恒电位仪的输出电压、恒电位仪的控制电位和恒电位仪的输出电流;
15、所述工作模式包括恒电流模式和恒电流模式,所述恒电流模式为恒电位仪的输出电流保持恒定;所述恒电位模式为恒电位仪的输出电流保持恒定。
16、进一步优化方案为,阴极保护系统故障诊断过程包括以下步骤:
17、s1,在当前时刻的开机状态为正常开机,且未出现油温报警的状态下判断恒电位仪的工作模式:当恒电位仪为恒电流模式时进入s2,当恒电位仪为恒电位模式时进入s3;
18、s2,判断恒电位仪的输出电流是否超出电流阈值:若是则判定阴极保护系统为阴极保护系统外围故障或阳极地床故障,否则判定故障诊断结果为恒电位仪正常;
19、s3,判断恒电位仪是否有声光报警信号:若是则进入s4,否则判定故障诊断结果为恒电位仪正常;
20、s4,基于特征信息和声光报警信号确定阴极保护系统的故障诊断结果。
21、进一步优化方案为,s4包括:
22、当恒电位仪的控制电位超出电位阈值、恒电位仪的输出电压超出电压阈值,且恒电位仪的输出电流超出电流阈值时,判定故障诊断结果为参比电极故障;
23、当只有恒电位仪的输出电压超出电压阈值时,判定故障诊断结果为阳极地床故障;
24、当只有恒电位仪的控制电位超出电位阈值时,判定故障诊断结果为外部直流干扰;
25、当恒电位仪的输出电流超出电流阈值时,判定故障诊断结果为电隔离故障、浪涌保护器故障或固态去耦合器故障;
26、当电位仪的控制电位超出电位阈值,且恒电位仪的输出电压超出电压阈值时,判定故障诊断结果为阳极地床故障或阴极保护站外围故障;
27、当电位仪的控制电位超出电位阈值,且恒电位仪的输出电流超出电流阈值时,判定故障诊断结果为阳极地床故障、阴极保护系统外围故障、电隔离故障、浪涌保护器故障、固态去耦合器故障、防腐层故障、线路阴极保护设施故障或外部直流干扰。
28、进一步优化方案为,t1包括以下过程:
29、对历史恒电位仪的运行数据进行数据预处理得到n个数据集;
30、对n个数据集进行0.2n~2n的有放回抽样,统计获得的去重后样本集作为训练样本集,未被选中的样本形成测试样本集。
31、进一步优化方案为,所述特征向量集的获取方法包括步骤:
32、t21,利用训练样本集建立随机森林模型,并保存森林;
33、t22,将训练样本集以及测试样本集同时导入森林,训练样本集和测试样本集被分到森林的不同的叶节点上;
34、t23,获取全体森林不同的叶节点上样本集的相似度矩阵prox;
35、t24,在相似度矩阵prox的基础上得到训练样本集和测试样本集的三维尺度或四维尺度变换得到特征向量集。
36、相似度矩阵prox可以看成是通过随机森林将原始属性空间中的样本映射到相似性空间中,用两两样本之间的相似性程度来描述训练样本集与测试样本集之间的关系,随机森林在这个过程中被当成是一种特征映射的工具,在这个相似度空间中,进一步寻求进行特征提取的三维尺度或四维尺度变换,将上述prox矩阵进行如下变换得到标准化后的cv矩阵:
37、
38、其中prox(-,f)是第一坐标的平均值,prox(b,-)是第二坐标的平均值,prox(一,一)是两个坐标的平均值,设cv矩阵的特征值为θ(j),且按照从大到小的顺序排列,其对应的特征向量为uk(b),则特征向量kl(b)表示为:
39、
40、其中为第j维的变换尺度。通过前几维的变换尺度来近似表示特征向量kl(b).这个过程通过以下途径实现:按从大到小顺序排列cv矩阵的特征值,提取cv矩阵数值较大的那部分特征值以及其对应的特征向量来近似表达特征向量kl(b);通常第一维和第二维变换尺度构成的两维图可以给出有关数据的有用信息;一般说来,三维或四维的变换尺度已经能够较好的描述数据。
41、利用训练样本建立随机森林模型之后,对于新来的无标签的测试样本集数据,不用重新训练建立随机森林模型即可得到表征训练样本集和测试样本集之间关系的相似性矩阵,在此基础上的特征提取方法不仅学习了训练训练样本集的全部信息,还利用了测试样本集的分布信息,从而近似构建出整个样本空间的分布信息,使得特征提取更加准确。
42、进一步优化方案为,t3包括以下子步骤:
43、t31,基于特征向量集按随机森林算法的树生成过程得到第一随机森林的分类模型:
44、{h(x,yk)};
45、其中参数y表示随机森林两个方面的随机要素:从特征向量集中等权重随机获得训练样本,从特征向量i=1,2,…,n中随机选择特征进行树的节点分裂;yk表示y的第k次实现,与随机森林中第k颗树相对应;
46、t32,从特征向量集kl中选择出包含阴极保护系统故障的第一特征向量,组成新的特征向量集k′l;
47、t33,在特征向量集k′l的基础上得到第二随机森林的分类模型:h′(x,y′k)。
48、进一步优化方案为,t4包括以下子步骤:
49、t41,对第一随机森林的分类模型进行投票决策:
50、
51、其中i{.}为示性函数,t为随机森林中树的总数;h(x,yk)为第一随机森林的分类器,k=1,2,3.......n;q为第一随机森林的投票因子;
52、当q≥t/2时,信任该投票并以第一随机森林的分类模型的输出作为诊断结果;
53、当q<t/2时,进入t42;
54、t42,对第二随机森林的分类模型进行投票决策:
55、
56、其中h′(x,y′k)为第一随机森林的分类器,k=1,2,3.......n;q′为第二随机森林的投票因子;
57、当q′≥t/a时,t/a为预设阈值,信任该投票并以第二随机森林的分类模型的输出作为诊断结果;否则记录异常,确定为误报或新的阴极保护系统故障类型。
58、随机森林算法中要求输入为离散的属性,而运行数据中的特征信息:恒电位仪的输出电压、恒电位仪的控制电位和恒电位仪的输出电流是故障诊断的重要数据源;那么输入数据就包含有连续性数据,因此要先对输入数据做离散化处理。
59、进一步优化方案为,所述数据预处理过程包括:
60、先将运行数据中的特征信息离散化处理成数据集:设定划分区间个数为s,则各数据集所取的断点集合为:
61、
62、式中a为数据集,ai为数据集,i=1,2,3,…m;
63、再对各数据集进行无量纲化处理得到多个数据集;
64、由于数据集中数值会有波动较大的情形,为了方便准确建立模型,要先对数据集中的输出电压、输出电位进和输出电流进行无量纲化处理。
65、将运行数据中与特征信息时间对应的当前开机状态、工作模式、油温报警状态、声光报警信号对应添加至各数据集中。
66、本方案还提供基于随机森林的阴极保护系统故障诊断系统,用于实现上述方案所述的阴极保护系统故障诊断方法,包括采集模块、诊断模块、特征提取模块、采样模块、和模型构建模块;
67、所述采集模块用于采集恒电位仪的运行数据并进行数据预处理;
68、所述诊断模块用于将预处理后的运行数据输入已构建好的故障诊断模型进行阴极保护系统故障诊断,得出故障诊断结果;
69、所述采样模块用于采样历史恒电位仪的运行数据集并生成训练样本集和测试样本集;
70、所述特征提取模块用于提取特征向量集确定节点分裂方式;
71、所述模型构建模块用于基于特征向量集和节点分裂方式生成第一随机森林,还对特征向量集进行平衡处理后生成第二随机森林;
72、所述模型构建模块还用于将第一随机森林与第二随机森林的叠加输出作为阴极保护系统故障诊断模型。
73、本发明与现有技术相比,具有如下的优点和有益效果:
74、本发明提供的基于随机森林模型的阴极保护系统故障诊断方法及系统,以恒电位仪的运行数据为基础,对整个阴极保护系统进行故障诊断,根据现场收集的恒电位仪的运行数据结合故障诊断模型自动诊断出阴极保护系统的故障,对阴极保护系统进行粗略的故障定位,技术人员无需从阴极保护系统中各个独立设备、子系统、子单元进行逐个排查,只需要对故障诊断结果定位的故障点进行人工修复和和检验;减少人工干预,为阴极保护系统的下一步精确定位故障和及时故障修复建设提供了依据;本方案基于随机森林方法构建故障诊断模型,基于现有的随机森林算法进行改进,通过第一随机森林与第二随机森林的叠加输出作为阴极保护系统故障诊断模型,将双重随机森林分析方法引入到阴极保护系统故障诊断过程,可获得准确性更高、误差更小的诊断结果,减少误诊和漏诊概率。本发明还以模型组合的思想对故障诊断算法进行改进,建立第二个随机森林诊断模型,而且第二个诊断模型的构建是基于平衡处理后的训练集,通过两个模型的协同工作来提高诊断的精确率和召回率。
1.基于随机森林模型的阴极保护系统故障诊断方法,其特征在于,所述方法包括步骤:
2.根据权利要求1所述的基于随机森林模型的阴极保护系统故障诊断方法,其特征在于,所述恒电位仪的运行数据包括:当前开机状态、工作模式、油温报警状态、声光报警信号和特征信息;
3.根据权利要求2所述的基于随机森林模型的阴极保护系统故障诊断方法,其特征在于,阴极保护系统故障诊断过程包括以下步骤:
4.根据权利要求3所述的基于随机森林模型的阴极保护系统故障诊断方法,其特征在于,s4包括:
5.根据权利要求2所述的基于随机森林模型的阴极保护系统故障诊断方法,其特征在于,t1包括以下过程:
6.根据权利要求1所述的基于随机森林模型的阴极保护系统故障诊断方法,其特征在于,所述特征向量集的获取方法包括步骤:
7.根据权利要求1所述的基于随机森林模型的阴极保护系统故障诊断方法,其特征在于,t3包括以下子步骤:
8.根据权利要求7所述的基于随机森林模型的阴极保护系统故障诊断方法,其特征在于,t4包括以下子步骤:
9.根据权利要求5所述的基于随机森林模型的阴极保护系统故障诊断方法,其特征在于,所述数据预处理过程包括:
10.基于随机森林的阴极保护系统故障诊断系统,用于实现权利要求1-9任意一项所述的阴极保护系统故障诊断方法,其特征在于,包括采集模块、诊断模块、特征提取模块、采样模块、和模型构建模块;
