一种电力OPGW光缆应力应变影响因素关联分析方法、电子设备及存储介质

专利2023-02-02  179


一种电力opgw光缆应力应变影响因素关联分析方法、电子设备及存储介质
技术领域
1.本发明属于光纤传感及数据算法领域,具体涉及一种电力opgw(optical fiber composite overhead ground wire,光纤复合架空地线)光缆应力应变影响因素关联分析方法、电子设备及存储介质。


背景技术:

2.随着工业化进程和电力行业的快速发展,电力系统在能源供用体系中起到不可替代的作用,而输电线路是保障电力系统远距离输送能源的重要环节。电力系统中opgw光缆是把光纤放置在架空高压输电线的地线中,用以构成输电线路上的光纤通信网,这种结构形式兼具地线与通信双重功能,而这种居于电力杆塔高处的特殊架构方式,不可避免地会造成光缆产生应力应变,若光缆产生应力应变不能被及时发现,应力累计到一定数值就会引起opgw光缆断缆,严重影响线路控制区域的通信信息交流,更严重时会引起电力电缆的故障,造成大面积停电的影响。影响opgw光缆应力应变的关键影响因素有:光缆运行年限、杆塔所处位置的地形、杆塔之间的档距及高差等。
3.目前针对关联分析算法领域主要涉及挖掘频繁项集apriori算法、灰色关联法、数据挖掘hotspot算法。
4.(1)挖掘频繁项集apriori算法
5.挖掘频繁项集apriori算法主要应用在关联属性维度少且数据为离散类型的关联分析中,该方法的核心思想是通过连接产生候选项及其支持度,然后通过剪枝生成频繁项集。该方法的优势在于算法原理简单,易于实现,但可能产生庞大的候选集,需多次遍历数据集且算法效率较低,故不适用于数据量较大的关联分析中。
6.(2)灰色关联法
7.灰色关联法是按照发展趋势做分析,优点是对样本量的多少没有过多的要求,也不需要分布规律且计算量较小,但灰色关联法是借助于灰色关联度来完成计算分析工作的,现有的模型不足以解决某些实际关联分析问题,因此,该方法主要作为一种辅助手段补充分析。
8.(3)数据挖掘hotspot算法
9.hotspot是一种主要用于挖掘数值型特征与类别型标签之间的关联规则的算法。hotspot能够发现在某个取值区间内,某个类别发生的概率,适用于记录指标取连续性数值的情况。


技术实现要素:

10.本发明的目的在于通过数据挖掘hotspot算法对电力opgw光缆产生应力应变的影响因素进行关联分析,给出opgw光缆产生应力应变与关键影响因素的具体影响关系,用于电力opgw光缆产生应力应变进行理论预警,减少电力运维人员检修光缆的工作量,更好地
保障电网安全可靠运行。
11.为实现上述目的,本发明提供如下技术方案:
12.一种电力opgw光缆应力应变影响因素关联分析方法,包括如下步骤:
13.s1、测量电力opgw光缆纤芯的布里渊频移曲线数据,并进行应力应变分析,整理分析作为备用数据源;
14.s2、对步骤s1备用数据源中的数据进行抽取、清洗、异常值进行转换,得到数据源;
15.s3、对步骤s2的数据源进行属性规约和数据变换,使数据源符合数据挖掘hotspot算法的格式要求,将处理好的数据源确定为建模数据;
16.s4、针对步骤s3中的建模数据,采用数据挖掘hotspot算法进行应力应变影响因素的关联规则分析,并生成关联规则树,对挖掘出来的数据以树的形式进行展示,得到关键影响因素区间范围的集合。
17.进一步的,步骤s1中的电力opgw光缆纤芯布里渊频移曲线数据是由分布式布里渊光纤应变检测仪测量得到。
18.进一步的,步骤s2中的具体实现方法包括如下步骤:
19.s2.1、抽取备用数据源中存在应力应变的线路数据作为数据源;
20.s2.2、将运行年限、所处地形、档距、高差存在分歧的线路数据及其杆塔信息剔除,进行数据清洗,得到包含有运行年限、所处地形、档距、高差的线路数据。
21.进一步的,步骤s2中的数据源的异常值为所处地形线路数据,异常值转换方法为:平原地形设置数值为200,丘陵地形设置数值为350,为了使数据更加准确,一般山地地形设置数值为500,山地地形设置数值为600。
22.进一步的,步骤s3中的具体实现方法包括如下步骤:
23.s3.1、考虑电力设备实际运行过程中数据的采集的延后性,分析关联因素时考虑累计效应,定义规则如表1所示:
24.表1 累计效应定义规则
[0025][0026][0027]
s3.2、对线路数据有无发生应变进行规则定义,如下表所示:
[0028]
表2 线路数据规则
[0029]
指标描述规则描述杆塔区间是否发生应变有无应变发生应变有没有发生应变无
[0030]
s3.3、经过数据抽取、数据清洗、异常值处理、属性规约和数据变换,形成数据挖掘
hotspot算法的输入数据形式,得到最终的建模数据。
[0031]
进一步的,步骤s4中的具体实现方法包括如下步骤:
[0032]
s4.1、数据输入:首先将建模数据以xls格式输入到数据挖掘hotspot算法中,同时建立关联规则树保存路径;
[0033]
s4.2、参数设定:设定最小支持度minsupport、最小置信度minimprovement;同时设置打印节点root、最大分支数maxbranches参数;
[0034]
s4.3、数据预处理:通过hs_preprocess函数返回三个参数,分别是目标列编码unique_labels、矩阵数据参数data、属性参数attributes,目标列编码unique_labels为有、无;矩阵数据参数data总数据为4685*5的二维矩阵数据,行是线路杆塔数据,列是4个属性列和1个目标列;属性参数attributes为4个属性列和1个目标列的文字标题数据;
[0035]
s4.4、hotspot算法调用:通过hotspot函数构建关联规则树,hotspot函数具有六个变量,分别为data、unique_labels、minsupport、minimprovement、maxbrances、labelstat eindex;
[0036]
data为4685*5的二维矩阵数据,行是线路杆塔数据,前四列是属性列加最后一列是目标列;unique_labels是目标列的编码;minsupport是最小支持度;minimprovement是最小置信度;maxbrances是最大分支数;labelstateindex是目标列的目标状态的下标;输出参数为node,输出hotspot关联规则树的根节点;
[0037]
s4.5、打印关联规则树,print_hsnode程序函数模块是将constructchildren程序模块中构建好的关联规则树逐条打印。
[0038]
进一步的,步骤s4.4中的具体实现方法包括如下步骤:
[0039]
s4.4.1、初始化参数,attr_state_count函数计算label的不同状态的个数,即有无应变的数据个数;
[0040]
s4.4.2、创建根节点,constructchildren程序函数模块用于产生根节点返回到关联规则树中;
[0041]
s4.4.3、针对每个子树继续往下执行,对于每个孩子节点,构造其自身的孩子节点;
[0042]
进一步的,步骤s4.4.2中的具体实现方法包括如下步骤:
[0043]
s4.4.2.1、通过evaluateattr函数进行筛选,筛选出的属性列加入到queue中:首先对连续性数值变量进行排序,然后对各个事务进行遍历,在遍历过程中,核心是设置四个值,分别为targetleft、targetright、leftcount、rightcount,其中targetleft、targetright分别表示遍历点左、右两边满足应力应变的事务个数,leftcount、rightcount分别表示遍历点左、右事务个数,具体关系详见如下公式:
[0044]
targetleft=σ(a
left
∪b
left
)
[0045]
targetright=σ(a
right
∪b
right
)
[0046]
leftcount=σ(a
left
)
[0047]
rightcount=σ(a
right
)
[0048]
以上四式中,a
left
和b
left
表示遍历点左边的候选数据与目标数据项集,a
right
和b
right
表示遍历点右边的候选数据与目标数据项集,若遍历中数据为存在应变的,则targetleft自加1,targetright自减1,反之,若遍历数据为不存在应变的,则leftcount自
加1,rightcount自减1;σ为取集合数的函数;
[0049]
targetleft、targetright、leftcount、rightcount满足以下关系式:
[0050]
targetleft+targetright=σ(a∪b)
[0051]
leftcount+rightcount=σ(a)
[0052]
上式中,a和b分别表示候选数据与目标数据项集,最终targetleft与targetright的总和为存在应变的数据个数,leftcount与rightcount的总和为候选数据总数;
[0053]
通过设置并维护targetleft、targetright、leftcount、rightcount四个值,可在o(n)的时间复杂度内寻找到最优支持度,设置遍历点左边有应变率参数为bestmeritone、遍历点右边无应变率参数为bestmerittwo、遍历点左边输出阈值参数为deltaone和遍历点右边输出阈值参数deltatwo为参数,具体定义如下式所示:
[0054][0055][0056][0057][0058]
经过参数设置,可得到最后的最优支持度,具体如下式所示:
[0059][0060]
上式中bestsupport为最优支持度,minsupportcount为最小支持度minsupport乘以候选数据总数的结果,hotspot算法通过最优支持度进行关联规则树的数据添加工作,h为m项事务集,通过增加一个事务项变为h',h'为m+1项事务集,若通过增加第j
t
个事务集,使得bestsupport》0&&delta/targetvalue》=minimprovement,则将其加入关联规则树中,表示加入的第j
t
个事务集对h和h'的关联性有贡献,此处delta包括deltaone和deltatwo两个参数,targetvalue表示应变率;
[0061]
s4.4.2.2、queue_sort函数对queue序列进行有选择性地属性排列,在queue_sort中优先对属性参数attrindex进行排序,即运行年限、地形地貌、档距、高差,再对支持度进行排序,即发生应变概率的大小。
[0062]
电子设备,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现本发明所述一种电力opgw光缆应力应变影响因素关联分析方法的步骤。
[0063]
计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种电力opgw光缆应力应变影响因素关联分析方法。
[0064]
本发明的有益效果:
[0065]
本发明所述的一种电力opgw光缆应力应变影响因素关联分析方法使用了数据挖掘hotspot算法,用于生成关联规则树,给出关键影响因素的区间范围,能够对现网在运电力opgw光缆健康运行情况进行合理预测,可行性强,关联结果准确率高,对于应力应变测试的有效性、消除应力应变的影响及提升光缆安全运行水平具有重要的意义,为电力骨干通信网可靠运行提供技术支撑手段。
[0066]
针对数据挖掘hotspot算法是一个分析连续性数值的关联规则算法,本发明提出了一种属性规约和数据变换的方法,将非数值型数据转换为数值型数据,能够满足数据挖掘hotspot算法对于数据源的格式要求,可以有效解决关联规则树的正确生成问题。
附图说明
[0067]
图1为本发明所述的一种电力opgw光缆应力应变影响因素关联分析方法的流程图;
[0068]
图2为本发明所述的一种电力opgw光缆应力应变影响因素关联分析方法的数据挖掘算法hotspot算法中函数关系图;
[0069]
图3为本发明所述的一种电力opgw光缆应力应变影响因素关联分析方法的数据挖掘算法hotspot算法生成的关联规则树。
具体实施方式
[0070]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施方式,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅用以解释本发明,并不用于限定本发明,即所描述的具体实施方式仅仅是本发明一部分实施方式,而不是全部的具体实施方式。通常在此处附图中描述和展示的本发明具体实施方式的组件可以以各种不同的配置来布置和设计,本发明还可以具有其他实施方式。
[0071]
因此,以下对在附图中提供的本发明的具体实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定具体实施方式。基于本发明的具体实施方式,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他具体实施方式,都属于本发明保护的范围。
[0072]
本发明提供了一种电力opgw光缆应力应变关键影响因素关联分析方法。如图1所示,首先,对opgw光缆进行的应力应变测试数据进行抽取及清洗;其次,对异常值进行处理;接着,确认属性因子为:运行年限、地形地貌、档距、高差及确认目标因子为有应变并形成最终的建模数据;然后,采用关联规则算法hotspot进行应力应变的关联规则挖掘,并生成关联规则树;最后,得到最终的关联规则集合。
[0073]
为能进一步了解本发明的发明内容、特点及功效,兹例举以下具体实施方式,并配合附图详细说明如下:
[0074]
具体实施方式一:
[0075]
一种电力opgw光缆应力应变影响因素关联分析方法,包括如下步骤:
[0076]
s1、测量电力opgw光缆纤芯的布里渊频移曲线数据,并进行应力应变分析,整理分析作为备用数据源;
[0077]
进一步的,步骤s1中的电力opgw光缆纤芯布里渊频移曲线数据是由分布式布里渊
光纤应变检测仪测量得到。
[0078]
s2、对步骤s1备用数据源中的数据进行抽取、清洗、异常值进行转换,得到数据源;
[0079]
进一步的,步骤s2中的具体实现方法包括如下步骤:
[0080]
s2.1、抽取备用数据源中存在应力应变的线路数据作为数据源;
[0081]
s2.2、将运行年限、所处地形、档距、高差存在分歧的线路数据及其杆塔信息剔除,进行数据清洗,得到包含有运行年限、所处地形、档距、高差的线路数据;
[0082]
进一步的,步骤s2中的数据源的异常值为:
[0083]
opgw光缆应力应变因素一为运行年限,形式符合算法数据要求;
[0084]
opgw光缆应力应变因素二为地形地貌,形式需进行异常值转换,平原地形设置数值为200,丘陵地形设置数值为350,为了使数据更加准确结合实际增加了“一般山地”地形,一般山地地形设置数值为500,山地地形设置数值为600,数据转换前后如表3所示:
[0085]
表3 数据源的异常值转换表
[0086]
地形地貌转换数值平原200丘陵350一般山地500山地600
[0087]
opgw光缆应力应变因素三为档距,形式符合算法数据要求;
[0088]
opgw光缆应力应变因素四为高差,形式符合算法数据要求。
[0089]
s3、对步骤s2的数据源进行属性规约和数据变换,使数据源符合数据挖掘hotspot算法的格式要求,将处理好的数据源确定为建模数据;
[0090]
进一步的,步骤s3的具体实现方法包括如下步骤:
[0091]
s3.1、考虑电力设备实际运行过程中数据的采集的延后性,分析关联因素时考虑累计效应,定义规则如表4所示:
[0092]
表4 累计效应定义规则
[0093][0094][0095]
s3.2、对线路数据有无发生应变进行规则定义,如表5所示:
[0096]
表5 线路数据规则
[0097]
指标描述规则描述杆塔区间是否发生应变有无应变发生应变有没有发生应变无
[0098]
s3.3、经过数据抽取、数据清洗、异常值处理、属性规约和数据变换,形成数据挖掘hotspot算法的输入数据形式,得到最终的建模数据,部分建模数据举例如表6所示;
[0099]
表6 建模数据举例
[0100]
位置年份有无应变电压线路名称运行年限地形地貌档距高差a2016有500kv1520043315a2016无500kv1520029612a2016有500kv1520043315a2007有500kv2142004920a2007有500kv2142004560b2001有500kv3202004733b2001无500kv3202004286b2001无500kv3202003983c2012无500kv4920049533
[0101]
s4、针对步骤s3中的建模数据,采用数据挖掘hotspot算法进行应力应变影响因素的关联规则分析,并生成关联规则树,对挖掘出来的数据以树的形式进行展示,得到关键影响因素区间范围的集合,具体流程如图2所示;
[0102]
步骤s4中的具体实现方法包括如下步骤:
[0103]
s4.1、数据输入:首先将建模数据以xls格式输入到数据挖掘hotspot算法中,同时建立关联规则树保存路径;
[0104]
s4.2、参数设定:设定最小支持度minsupport、最小置信度minimprovement;同时设置打印节点root、最大分支数maxbrances参数;
[0105]
s4.3、数据预处理:通过hs_preprocess函数返回三个参数,分别是目标列编码unique_labels、矩阵数据参数data、属性参数attributes,目标列编码unique_labels为有、无;矩阵数据参数data总数据为4685*5的二维矩阵数据,行是线路杆塔数据,列是4个属性列和1个目标列;属性参数attributes为4个属性列和1个目标列的文字标题数据;
[0106]
s4.4、hotspot算法调用:通过hotspot函数构建关联规则树,hotspot函数具有六个变量,分别为data、unique_labels、minsupport、minimprovement、maxbrances、labelstateindex;
[0107]
data为4685*5的二维矩阵数据,行是线路杆塔数据,前四列是属性列加最后一列是目标列;unique_labels是目标列的编码;minsupport是最小支持度;minimprovement是最小置信度;maxbrances是最大分支数;labelstateindex是目标列的目标状态的下标;输出参数为node,输出hotspot关联规则树的根节点;
[0108]
步骤s4.4中的具体实现方法包括如下步骤:
[0109]
s4.4.1、初始化参数,attr_state_count函数计算label的不同状态的个数,即有无应变的数据个数;
[0110]
s4.4.2、创建根节点,constructchildren程序函数模块用于产生根节点返回到关联规则树中;
[0111]
步骤s4.4.2中的具体实现方法包括如下步骤:
[0112]
s4.4.2.1、通过evaluateattr函数进行筛选,筛选出的属性列加入到queue中:首
先对连续性数值变量进行排序,然后对各个事务进行遍历,在遍历过程中,核心是设置四个值,分别为targetleft、targetright、leftcount、rightcount,其中targetleft、targetright分别表示遍历点左、右两边满足应力应变的事务个数,leftcount、rightcount分别表示遍历点左、右事务个数,具体关系详见如下公式:
[0113]
targetleft=σ(a
left
∪b
left
)
[0114]
targetright=σ(a
right
∪b
right
)
[0115]
leftcount=σ(a
left
)
[0116]
rightcount=σ(a
right
)
[0117]
以上四个公式中,a
left
和b
left
表示遍历点左边的候选数据与目标数据项集;a
right
和b
right
表示遍历点右边的候选数据与目标数据项集。若遍历中数据为存在应变的,则targetleft自加1,targetright自减1;反之,若遍历数据为不存在应变的,则leftcount自加1,rightcount自减1;σ为取集合数的函数;
[0118]
targetleft、targetright、leftcount、rightcount满足以下关系式:
[0119]
targetleft+targetright=σ(a∪b)
[0120]
leftcount+rightcount=σ(a)
[0121]
上式中,a和b分别表示候选数据与目标数据项集,最终targetleft与targetright的总和为存在应变的数据个数,leftcount与rightcount的总和为候选数据总数;
[0122]
通过设置并维护targetleft、targetright、leftcount、rightcount四个值,可在o(n)的时间复杂度内寻找到最优支持度,设置遍历点左边有应变率参数为bestmeritone、遍历点右边无应变率参数为bestmerittwo、遍历点左边输出阈值参数为deltaone和遍历点右边输出阈值参数为deltatwo,具体定义如下式所示:
[0123][0124][0125][0126][0127]
经过参数设置,可得到最后的最优支持度,具体如下式所示:
[0128][0129]
上式中bestsupport为最优支持度,minsupportcount为最小支持度minsupport乘以候选数据总数的结果,hotspot算法通过最优支持度进行关联规则树的数据添加工作,h为m项事务集,通过增加一个事务项变为h

,h

为m+1项事务集,若通过增加第j
t
个事务集,使得bestsupport>0&&delta/targetvalue>=minimprovement,则将其加入关联规则树
中,表示加入的第j
t
个事务集对h和h

的关联性有贡献,此处delta包括deltaone和deltatwo两个参数,targetvalue表示应变率;
[0130]
s4.4.2.2、queue_sort函数对queue序列进行有选择性地属性排列,在queue_sort中优先对attrindex进行排序,即运行年限、地形地貌、档距、高差,再对支持度进行排序,即发生应变概率的大小;
[0131]
s4.4.3、针对每个子树继续往下执行,对于每个孩子节点,构造其自身的孩子节点;
[0132]
s4.5、打印关联规则树,print_hsnode程序函数模块是将constructchildren程序模块中构建好的关联规则树逐条打印,如图3所示。
[0133]
建模数据中数据总量为4685条数据,其中有应力应变的数据个数为697个,应变率为14.8773%。最终得到的关联规则集合如表7所示:
[0134]
表7 关联规则集合
[0135]
属性因子影响因子范围发生应变概率运行年限(13,15]25.4047%地形地貌》50039.604%档距(266,538)47%高差≤2148.4211%
[0136]
经过以上分析可发现,opgw光缆产生应力应变的因素中运行年限、地形地貌、档距、高差是有着一定非线性的关联关系的,根据关联规则树算法结果显示,对于同时满足运行年限在13到15年、地形地貌为一般山地以上、档距在266到538之间、高差21以内的线路杆塔区间,电力通信光缆发生应力应变的概率达48.4211%,接近一半的概率,故对符合此种情况的电力杆塔区间需要重点进行检修作业,对于电力通信系统正常运行起到了重要的数据指导作用。
[0137]
具体实施方式二:
[0138]
根据具体实施方式一所述的电子设备,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现具体实施方式一所述一种电力opgw光缆应力应变影响因素关联分析方法的步骤
[0139]
本发明的计算机装置可以是包括有处理器以及存储器等装置,例如包含中央处理器的单片机等。并且,处理器用于执行存储器中存储的计算机程序时实现上述的基于creo软件的可修改由关系驱动的推荐数据的推荐方法的步骤。
[0140]
所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application spec ific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0141]
所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括
高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0142]
具体实施方式三:
[0143]
计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现具体实施方式一所述的一种电力opgw光缆应力应变影响因素关联分析方法。
[0144]
本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质,包括但不限于非易失性存储器、易失性存储器、铁电存储器等,计算机可读存储介质上存储有计算机程序,当计算机装置的处理器读取并执行存储器中所存储的计算机程序时,可以实现上述的基于creo软件的可修改由关系驱动的建模数据的建模方法的步骤。
[0145]
所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0146]
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0147]
虽然在上文中已经参考具体实施方式对本技术进行了描述,然而在不脱离本技术的范围的情况下,可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是,只要不存在结构冲突,本技术所披露的具体实施方式中的各项特征均可通过任意方式相互结合起来使用,在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此,本技术并不局限于文中公开的特定具体实施方式,而是包括落入权利要求的范围内的所有技术方案。

技术特征:
1.一种电力opgw光缆应力应变影响因素关联分析方法,其特征在于:包括如下步骤:s1、测量电力opgw光缆纤芯布里渊频移曲线数据,并进行应力应变分析,整理作为备用数据源;s2、对步骤s1备用数据源中的数据进行抽取、清洗、异常值进行转换,得到数据源;s3、对步骤s2的数据源进行属性规约和数据变换,使数据源符合数据挖掘hotspot算法的格式要求,将处理好的数据源确定为建模数据;s4、针对步骤s3中的建模数据,采用数据挖掘hotspot算法进行应力应变影响因素的关联规则分析,并生成关联规则树,对挖掘出来的数据以树的形式进行展示,得到关键影响因素区间范围的集合。2.根据权利要求1所述的一种电力opgw光缆应力应变影响因素关联分析方法,其特征在于:步骤s1中的电力opgw光缆纤芯布里渊频移曲线数据是由分布式布里渊光纤应变检测仪测量得到。3.根据权利要求2所述的一种电力opgw光缆应力应变影响因素关联分析方法,其特征在于:步骤s2中的具体实现方法包括如下步骤:s2.1、抽取备用数据源中存在应力应变的线路数据作为数据源;s2.2、将运行年限、所处地形、档距、高差存在分歧的线路数据及其杆塔信息剔除,进行数据清洗,得到包含有运行年限、所处地形、档距、高差的线路数据。4.根据权利要求3所述的一种电力opgw光缆应力应变影响因素关联分析方法,其特征在于:步骤s2中的数据源的异常值为所处地形线路数据,异常值转换方法为:平原地形设置数值为200,丘陵地形设置数值为350,为了使数据更加准确,一般山地地形设置数值为500,山地地形设置数值为600。5.根据权利要求4所述的一种电力opgw光缆应力应变影响因素关联分析方法,其特征在于:步骤s3中的具体实现方法包括如下步骤:s3.1、考虑电力设备实际运行过程中数据的采集的延后性,分析关联因素时考虑累计效应,定义运行年限、地形、档高、高差的规则;s3.2、对线路数据有无发生应变进行规则定义;s3.3、经过数据抽取、数据清洗、异常值处理、属性规约和数据变换,形成数据挖掘hotspot算法的输入数据形式,得到最终的建模数据。6.根据权利要求5所述的一种电力opgw光缆应力应变影响因素关联分析方法,其特征在于:步骤s4中的具体实现方法包括如下步骤:s4.1、数据输入:首先将建模数据以xls格式输入到数据挖掘hotspot算法中,同时建立关联规则树保存路径;s4.2、参数设定:设定最小支持度minsupport、最小置信度minimprovement,同时设置打印节点root、最大分支数maxbrances参数;s4.3、数据预处理:通过hs_preprocess函数返回三个参数,分别是目标列编码unique_labels、矩阵数据参数data、属性参数attributes,目标列编码unique_labels为有、无;矩阵数据参数data总数据为4685*5的二维矩阵数据,行是线路杆塔数据,列是4个属性列和1个目标列;属性参数attributes为4个属性列和1个目标列的文字标题数据;s4.4、hotspot算法调用:通过hotspot函数构建关联规则树,hotspot函数具有六个变
量,分别为data、unique_labels、minsupport、minimprovement、maxbrances、labelstateindex;data为4685*5的二维矩阵数据,行是线路杆塔数据,前四列是属性列加最后一列是目标列;unique_labels是目标列的编码;minsupport是最小支持度;minimprovement是最小置信度;maxbrances是最大分支数;labelstateindex是目标列的目标状态的下标;输出参数为node,输出hotspot关联规则树的根节点;s4.5、打印关联规则树,print_hsnode程序函数模块是将constructchildren程序模块中构建好的关联规则树逐条打印。7.根据权利要求6所述的一种电力opgw光缆应力应变影响因素关联分析方法,其特征在于:步骤s4.4中的具体实现方法包括如下步骤:s4.4.1、初始化参数,attr_state_count函数计算label的不同状态的个数,即有无应变的数据个数;s4.4.2、创建根节点,constructchildren程序函数模块用于产生根节点返回到关联规则树中;s4.4.3、针对每个子树继续往下执行,对于每个孩子节点,构造其自身的孩子节点。8.根据权利要求7所述的一种电力opgw光缆应力应变影响因素关联分析方法,其特征在于:步骤s4.4.2中的具体实现方法包括如下步骤:s4.4.2.1、通过evaluateattr函数进行筛选,将筛选出的属性列加入到queue中:首先对连续性数值变量进行排序,然后对各个事务进行遍历,在遍历过程中,核心是设置四个值,分别为targetleft、targetright、leftcount、rightcount,其中targetleft、targetright分别表示遍历点左、右两边满足应力应变的事务个数,leftcount、rightcount分别表示遍历点左、右事务个数,具体关系详见如下公式:targetleft=σ(a
left
∪b
left
)targetright=σ(a
right
∪b
right
)leftcount=σ(a
left
)rightcount=σ(a
right
)以上四个公式中,a
left
和b
left
表示遍历点左边的候选数据与目标数据项集;a
right
和b
right
表示遍历点右边的候选数据与目标数据项集,若遍历中数据为存在应变的,则targetleft自加1,targetright自减1;反之,若遍历数据为不存在应变的,则leftcount自加1,rightcount自减1;σ为取集合数的函数;targetleft、targetright、leftcount、rightcount满足以下关系式:targetleft+targetright=σ(a∪b)leftcount+rightcount=σ(a)上式中,a和b分别表示候选数据与目标数据项集,最终targetleft与targetright的总和为存在应变的数据个数,leftcount与rightcount的总和为候选数据总数;通过设置并维护targetleft、targetright、leftcount、rightcount四个值,可在o(n)的时间复杂度内寻找到最优支持度,设置遍历点左边有应变率参数为bestmeritone、遍历点右边无应变率参数为bestmerittwo、遍历点左边输出阈值参数为deltaone和遍历点右边输出阈值参数为deltatwo,具体定义如下式所示:
经过参数设置,可得到最后的最优支持度,具体如下式所示:上式中,bestsupport为最优支持度;minsupportcount为最小支持度minsupport乘以候选数据总数的结果;hotspot算法通过最优支持度进行关联规则树的数据添加工作,h为m项事务集,通过增加一个事务项变为h

,h

为m+1项事务集,若通过增加第j
t
个事务集,使得bestsupport>0&&delta/targetvalue>=minimprovement,则将其加入关联规则树中,表示加入的第j
t
个事务集对h和h

的关联性有贡献,此处delta包括deltaone和deltatwo两个参数,targetvalue表示应变率;s4.4.2.2、queue_sort函数对queue序列进行有选择性地属性排列,在queue_sort中优先对attrindex进行排序,即运行年限、地形地貌、档距、高差,再对支持度进行排序,即发生应变概率的大小。9.电子设备,其特征在于,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现权利要求1-8任一项所述一种电力opgw光缆应力应变影响因素关联分析方法的步骤。10.计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8任一项所述的一种电力opgw光缆应力应变影响因素关联分析方法。

技术总结
一种电力OPGW光缆应力应变影响因素关联分析方法、电子设备及存储介质,属于光纤传感及数据算法领域。为解决电力OPGW光缆产生应力应变进行预警的方法。本发明方法包括测量电力OPGW光缆纤芯布里渊频移曲线数据,并进行应力应变分析,整理作为备用数据源,对其中的数据进行抽取、清洗、异常值进行转换,得到数据源,进行属性规约和数据变换,将处理好的数据源确定为建模数据,采用数据挖掘HotSpot算法进行应力应变影响因素的关联规则分析,并生成关联规则树,对挖掘出来的数据以树的形式进行展示,得到关键影响因素区间范围的集合。本发明对于应力应变测试的有效性、消除应力应变的影响及提升光缆安全运行水平具有重要的意义。响及提升光缆安全运行水平具有重要的意义。响及提升光缆安全运行水平具有重要的意义。


技术研发人员:张洪英 李毅 张金天
受保护的技术使用者:哈尔滨理工大学
技术研发日:2022.07.22
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-575.html

最新回复(0)