基于混合相似度的风力发电机组运行状态评估方法与流程

专利2023-06-01  108



1.本发明涉及风力发电机组运行状态评估领域,具体涉及一种基于混合相似度的风力发电机组运行状态评估方法。


背景技术:

2.近年来,绿色可持续能源逐渐兴起,尤其是风力发电,随着风电装机容量稳定增长,风力发电量持续增长,使得风力发电机组长期稳定运行成为了一个重大的挑战,保证其发电量、经济性,需要对风力发电机组进行长期的运维检修、故障排查,因此建立一种能评估风力发电机组运行状态的方法,根据风力发电机组不同的运行状态进行针对性的检修、维护,是保证风力发电机组长期稳定的运行的重要途径。
3.目前风力发电机组运行状态的评估方法是研究热点,已经进行了大量的研究工作,采用了功率曲线差异识别、异常数据检测、神经网络分析等方法,目前最为常用的风力发电机组运行状态评估方法主要有以下几种:
4.(1)基于功率曲线的差异识别方法
5.风速功率特性曲线是风力发电机组设计的基础,对于判断风机运行是否正常和有无潜在故障具有重要作用,通过综合判断个体风机风速功率曲线、整体趋势以及标准功率曲线之间的差异程度可以对风机的运行状态进行分类,能有效评估出风机的健康状态。但是该方法需要的数据量较大,且需要人工对风速功率特性曲线进行观察,步骤较为复杂。
6.(2)基于异常数据特征的检测方法
7.风力发电机组在运行过程中受到湍流、气象因素和零部件故障等影响,运行数据中存在大量偏离正常工作特性的异常数据,比如在机组故障、测量终端故障、停机检修时功率为零;弃风限电、传感器失灵、极端天气时功率数据分布过于无规律且离散。但是该方法过于依赖人工经验判断,没有形成指标体系,且实际运行场景的风力发电机组数据集复杂,对于异常原因的解释不具有普适性。
8.(3)基于神经网络的运行状态评价方法
9.基于神经网络的风机运行状态评价方法根据搭建的神经网络模型对实时样本数据进行预测,并计算scada系统的监测值与所述预测值之间的平均绝对百分比误差,对该误差进行分析,得到评估风力发电机组运行状态的指标。但是神经网络开发时间长、需要数据量大,且“黑盒子”性质很难解释是什么导致了这个评价值,而在风力发电机组状态监测技术领域,可解释性非常重要。


技术实现要素:

10.本发明的目的是提供一种基于混合相似度的风力发电机组运行状态评估方法,极大地提高了风力发电机组运行状态评估的准确性。
11.本发明采取如下技术方案实现上述目的,基于混合相似度的风力发电机组运行状态评估方法,包括:
12.步骤1、获取风力发电机组scada系统监测数据;
13.步骤2、在监测数据中选取需要评估的指标;
14.步骤3、选取所述指标设置时间范围内的数据;
15.步骤4、获取所述指标在设置时间范围内数据的小时均值;
16.步骤5、对获取的小时均值数据进行归一化处理;
17.步骤6、对归一化处理后的数据求取最大互信息数与时间动态规整相似度;
18.步骤7、根据最大互信息数和时间动态规整相似度求取混合相似度;
19.步骤8、设置上下侧分位数,根据上下侧分位数对混合相似度进行分类;
20.步骤9、根据混合相似度的分类对风力发电机组运行状态进行评估。
21.进一步的是,步骤1中,获取风力发电机组scada系统监测数据的具体方法包括:
22.获取风力发电机组scada系统监测数据,时间范围为[t,t+δt],δt为时间间隔,数据精度大于1小时。
[0023]
进一步的是,步骤2中,选取需要评估的指标的具体方法包括:
[0024]
根据需求选取需要评估的指标,所述指标包括有功功率、一秒平均风速、机舱内温度以及发电机平均转速。
[0025]
进一步的是,步骤3中,选取所述指标设置时间范围内的数据的具体方法包括:
[0026]
选取该项指标一段长时间范围的数据,长时间范围大于等于第一阈值时间;以及选取该指标多段短时间范围的数据,短时间范围大于等于第二阈值时间。
[0027]
进一步的是,步骤5中,归一化处理的具体方法包括:
[0028]
归一化的方法采用z-score标准化,x*=(x-μ)/σ,x为原始数据,μ为原始数据的均值,σ为原始数据的标准差;其中,长时间范围的归一化数据为标准曲线,短时间范围的数据为实际曲线。
[0029]
进一步的是,
[0030]
步骤6中,求取最大互信息数的具体方法包括:
[0031]
求实际曲线与标准曲线的最大互信息数,最大互信息数的计算方法如下:
[0032]
i[x;y]为实际曲线数据与标准曲线数据的联合概率,p(x)为实际曲线数据的概率密度分布,p(y)为标准曲线数据的概率密度分布,p(x,y)为实际曲线数据与标准曲线数据的联合概率密度分布函数,|x|为x方向共被分成的段数,|y|为y方向共被分成的段数,b为分区网格的大小的限制值,|x||y|<b为x方向段数乘y方向段数的值小于网格大小限制值时间的情况,min(|x|,|y|)为x方向和y方向被分成的段数中较小的段数,mic为所求得的最大互信息系数。
[0033]
进一步的是,步骤6中,求取时间动态规整相似度的具体方法包括:
[0034]
求实际曲线与标准曲线的时间动态规整相似度,时间动态规整相似度的计算方法如下:
[0035]
动态时间规整距离即dtwd是两个序列之间的距离的度量,使用动态时间规整距离从dtwd获得相似度dtws:dtws=1/(1+dtwd),dtwd为动态时间规整距离,dtws为动态时间规整相似度。
[0036]
进一步的是,步骤7中,根据最大互信息数和时间动态规整相似度求取混合相似度的具体方法包括:
[0037]
混合相似度的计算方法如下:mic为标准曲线与实际曲线的最大互信息数,dtws为标准曲线与实际曲线的时间动态规整相似度,s为混合相似度。
[0038]
进一步的是,步骤8中,根据上下侧分位数对混合相似度进行分类的具体方法包括:
[0039]
设置上侧分位数为a,下侧分位数为b,根据分位数将混合相似度分为三个时段范围,
[0040]
第一时段为[0,a),第二时段为[a,b),第三时段为[b,100%)。
[0041]
进一步的是,步骤9中,根据混合相似度的分类对风力发电机组运行状态进行评估的具体方法包括:
[0042]
混合相似度处于高时段,即在第三时段,则该时段风力发电机组的运行状态良好;
[0043]
混合相似度处于中间时段,即在第二时段,则该时段风力发电机组的运行状态一般;
[0044]
混合相似度处于低时段,即在第一时段,则该时段风力发电机组的运行状态差。
[0045]
本发明无需过多指标和过于复杂的模型,本发明收集风力发电机组scada系统的监测数据,选择某一项需要评估的指标,以该项指标某一段长时间范围的小时均值作为标准曲线,以该项数据多段短时间范围的小时均值作为实际曲线,求出这两条曲线的最大互信息数和时间动态规整相似度,随后求出最大互信息数和时间动态规整相似度的平方和再开根号,这个数据为本方法所述的混合相似度,利用混合相似度对风力发电机组的运行状态进行评估。最大互信息数可以衡量两个特征变量之间线性或非线性的关联程度;时间轨迹相似度能捕获时间推移的关系;基于最大互信息数和时间轨迹相似度算出的混合相似度准确度更高。因此,本发明极大地提高了风力发电机组运行状态评估的准确性。
附图说明
[0046]
图1是本发明实施例提供的基于混合相似度的风力发电机组运行状态评估的方法流程图;
[0047]
图2是本发明实施例提供的有功功率小时平均值曲线图;
[0048]
图3是本发明实施例提供的归一化后的平均有功功率标准曲线图;
[0049]
图4是本发明实施例提供的归一化后的有功功率实际曲线与标准曲线第一对比图;
[0050]
图5是本发明实施例提供的归一化后的有功功率实际曲线与标准曲线第二对比图;
[0051]
图6是本发明实施例提供的归一化后的有功功率实际曲线与标准曲线第三对比图。
具体实施方式
[0052]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是
本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0053]
本发明基于混合相似度的风力发电机组运行状态评估方法,如图1所示,包括:
[0054]
步骤1、获取风力发电机组scada系统监测数据;
[0055]
步骤2、在监测数据中选取需要评估的指标;
[0056]
步骤3、选取所述指标设置时间范围内的数据;
[0057]
步骤4、获取所述指标在设置时间范围内数据的小时均值;
[0058]
步骤5、对获取的小时均值数据进行归一化处理;
[0059]
步骤6、对归一化处理后的数据求取最大互信息数与时间动态规整相似度;
[0060]
步骤7、根据最大互信息数和时间动态规整相似度求取混合相似度;
[0061]
步骤8、设置上下侧分位数,根据上下侧分位数对混合相似度进行分类;
[0062]
步骤9、根据混合相似度的分类对风力发电机组运行状态进行评估。
[0063]
步骤1中,获取风力发电机组scada系统监测数据的具体方法包括:
[0064]
获取风力发电机组scada系统监测数据,时间范围为[t,t+δt],δt为时间间隔,数据精度大于1小时。例如收集西南地区某风机厂scada系统监测数据,时间范围2018年9月至2019年9月,数据间隔时间为1h。
[0065]
步骤2中,选取需要评估的指标的具体方法包括:
[0066]
根据需求选取需要评估的指标,所述指标包括但不限于有功功率、一秒平均风速、机舱内温度以及发电机平均转速。
[0067]
例如,选取风力发电机组有功功率(kw)作为需要评估的指标。
[0068]
步骤3中,选取所述指标设置时间范围内的数据的具体方法包括:
[0069]
选取该项指标一段长时间范围的数据,长时间范围大于等于第一阈值时间,第一阈值时间可以为1年、11个月、9个月、8个月等,也可以根据实际需要设置;以及选取该指标多段短时间范围的数据,短时间范围大于等于第二阈值时间,第二阈值时间可以为15天,也可以根据实际需要设置。
[0070]
例如,选取风力发电机组2018年10月至2019年9月有功功率作为长时间范围的数据;选取风力发电机组2018年10月至2019年9月有功功率中每15天为一段短时间范围,共计24段数据。
[0071]
然后求小时均值,例如获取风力发电机组2018年10月至2019年9月有功功率作为长时间范围的数据的小时均值,计算结果如图2所示,共计1组数据,获取风力发电机组2018年10月至2019年9月有功功率中每15天的小时均值,共计24组数据。
[0072]
步骤5中,归一化处理的具体方法包括:
[0073]
归一化的方法采用z-score标准化,x*=(x-μ)/σ,x为原始数据,μ为原始数据的均值,σ为原始数据的标准差;其中,长时间范围的归一化数据为标准曲线,标准曲线如图3所示,短时间范围的数据为实际曲线。
[0074]
步骤6中,求取最大互信息数的具体方法包括:
[0075]
求实际曲线与标准曲线的最大互信息数,最大互信息数的计算方法如下:
[0076]
i[x;
y]为实际曲线数据与标准曲线数据的联合概率,p(x)为实际曲线数据的概率密度分布,p(y)为标准曲线数据的概率密度分布,p(x,y)为实际曲线数据与标准曲线数据的联合概率密度分布函数,|x|为x方向共被分成的段数,|y|为y方向共被分成的段数,b为分区网格的大小的限制值,|x||y|<b为x方向段数乘y方向段数的值小于网格大小限制值时间的情况,min(|x|,|y|)为x方向和y方向被分成的段数中较小的段数,mic为所求得的最大互信息系数。
[0077]
计算结果共计24个值:0.1144,0.5488,0.3113,0.6549,0.4591,0.5488,0.3113,0.5488,0.7881,0.6549,0.1909,0.6549,0.3113,0.7881,0.0612,0.164,0.1909,0.6549,0.1379,0.4631,0.6549,0.6549,0.4109,0.5488。
[0078]
步骤6中,求取时间动态规整相似度的具体方法包括:
[0079]
求实际曲线与标准曲线的时间动态规整相似度,时间动态规整相似度的计算方法如下:
[0080]
动态时间规整距离即dtwd是两个序列之间的距离的度量,使用动态时间规整距离从dtwd获得相似度dtws:dtws=1/(1+dtwd),dtwd为动态时间规整距离,dtws为动态时间规整相似度。
[0081]
计算结果共计24个值:0.1681,0.4533,0.2833,0.4135,0.3583,0.3144,0.2603,0.5291,0.3579,0.4311,0.253,0.3583,0.1781,0.4942,0.1194,0.1713,0.2378,0.2651,0.1976,0.3036,0.4135,0.4221,0.2629,0.3343。
[0082]
步骤7中,根据最大互信息数和时间动态规整相似度求取混合相似度的具体方法包括:
[0083]
混合相似度的计算方法如下:mic为标准曲线与实际曲线的最大互信息数,dtws为标准曲线与实际曲线的时间动态规整相似度,s为混合相似度。
[0084]
计算结果共计24个值:0.2034,0.7118,0.4209,0.7745,0.5824,0.6325,0.4058,0.7623,0.8656,0.784,0.3169,0.7465,0.3586,0.9302,0.1341,0.2371,0.3049,0.7065,0.2409,0.5537,0.7745,0.7791,0.4878,0.6426。
[0085]
步骤8中,根据上下侧分位数对混合相似度进行分类的具体方法包括:
[0086]
设置上侧分位数为a,下侧分位数为b,根据分位数将混合相似度分为三个时段范围,
[0087]
第一时段为[0,a),第二时段为[a,b),第三时段为[b,100%)。
[0088]
例如,设置上侧分位数为20%,下侧分位数为80%,根据分位数将混合相似度分为三个范围0~20%,20%~80%,80%~100%。
[0089]
位于0~20%区间的数据:0.2034,0.4209,0.4058,0.3169,0.3586,0.1341,0.2371,0.3049,0.2409,0.4878;
[0090]
位于20%~80%区间的数据:0.5824,0.5537;
[0091]
位于80%~100%区间的数据:0.7118,0.7745,0.6325,0.7623,0.8656,0.784,0.7465,0.9302,0.7065,0.7745,0.7791,0.6426。
[0092]
步骤9中,根据混合相似度的分类对风力发电机组运行状态进行评估的具体方法包括:
[0093]
混合相似度处于高时段,即在第三时段,则该时段风力发电机组的运行状态良好;
[0094]
混合相似度处于中间时段,即在第二时段,则该时段风力发电机组的运行状态一般;
[0095]
混合相似度处于低时段,即在第一时段,则该时段风力发电机组的运行状态差。
[0096]
在本发明的一种实施例中,具体评估如下:
[0097]
对风力发电机组运行状态进行评估,主要分为以下三类:
[0098]
(1)混合相似度高的时段,即分位数在80%-100%的时段,该时段风力发电机组的运行状态良好,如图4所示,为s=0.9302的实际曲线与标准曲线对比图,实际曲线数据为步骤1中获取的西南地区某风机厂scada系统2019年4月11日~2019年4月26日共计15天的有功功率数据的小时均值,可以发现该时段风力发电机组有功功率与总体情况基本一致,风力发电机组异常概率小。
[0099]
(2)混合相似度中等的时段,即分位数在20%-80%的时段,该时段风力发电机组的运行状态一般,如图5所示,为s=0.5537的实际曲线与标准曲线对比图,实际曲线数据为步骤1中获取的西南地区某风机厂scada系统2019年7月10日~2019年7月25日共计15天的有功功率数据的小时均值,可以发现该时段风力发电机组有功功率变化波动大,但是总体趋势与标准曲线相似,风力发电机组异常概率中等。
[0100]
(3)混合相似度低的时段,即分位数在0-20%的时段,该时段风力发电机组的运行状态差,如图6所示,为s=0.2034的实际曲线与标准曲线对比图,实际曲线数据为步骤1中获取的西南地区某风机厂scada系统2018年9月28日~2018年10月13日共计15天的有功功率数据的小时均值,可以发现该时段风力发电机组有功功率变化极不规律,且很多时候风力发电机组没有运行,风力发电机组异常概率大。
[0101]
本发明克服了现有技术中对风机运行状态评估需要数据量大、模型复杂、可解释性不足的问题,本发明只需要一项历史scada指标和一种简易的混合相似度算法就能对风机运行状态进行分类并评估,普适性强、效率高、评估准确度高。

技术特征:
1.基于混合相似度的风力发电机组运行状态评估方法,其特征在于,包括:步骤1、获取风力发电机组scada系统监测数据;步骤2、在监测数据中选取需要评估的指标;步骤3、选取所述指标设置时间范围内的数据;步骤4、获取所述指标在设置时间范围内数据的小时均值;步骤5、对获取的小时均值数据进行归一化处理;步骤6、对归一化处理后的数据求取最大互信息数与时间动态规整相似度;步骤7、根据最大互信息数和时间动态规整相似度求取混合相似度;步骤8、设置上下侧分位数,根据上下侧分位数对混合相似度进行分类;步骤9、根据混合相似度的分类对风力发电机组运行状态进行评估。2.根据权利要求1所述的基于混合相似度的风力发电机组运行状态评估方法,其特征在于,步骤1中,获取风力发电机组scada系统监测数据的具体方法包括:获取风力发电机组scada系统监测数据,时间范围为[t,t+δt],δt为时间间隔,数据精度大于1小时。3.根据权利要求1所述的基于混合相似度的风力发电机组运行状态评估方法,其特征在于,步骤2中,选取需要评估的指标的具体方法包括:根据需求选取需要评估的指标,所述指标包括有功功率、一秒平均风速、机舱内温度以及发电机平均转速。4.根据权利要求1所述的基于混合相似度的风力发电机组运行状态评估方法,其特征在于,步骤3中,选取所述指标设置时间范围内的数据的具体方法包括:选取该项指标一段长时间范围的数据,长时间范围大于等于第一阈值时间;以及选取该指标多段短时间范围的数据,短时间范围大于等于第二阈值时间。5.根据权利要求4所述的基于混合相似度的风力发电机组运行状态评估方法,其特征在于,步骤5中,归一化处理的具体方法包括:归一化的方法采用z-score标准化,x*=(x-μ)/σ,x为原始数据,μ为原始数据的均值,σ为原始数据的标准差;其中,长时间范围的归一化数据为标准曲线,短时间范围的数据为实际曲线。6.根据权利要求5所述的基于混合相似度的风力发电机组运行状态评估方法,其特征在于,步骤6中,求取最大互信息数的具体方法包括:求实际曲线与标准曲线的最大互信息数,最大互信息数的计算方法如下:i[x;y]为实际曲线数据与标准曲线数据的联合概率,p(x)为实际曲线数据的概率密度分布,p(y)为标准曲线数据的概率密度分布,p(x,y)为实际曲线数据与标准曲线数据的联合概率密度分布函数,|x|为x方向共被分成的段数,|y|为y方向共被分成的段数,b为分区网格的大小的限制值,|x||y|<b为x方向段数乘y方向段数的值小于网格大小限制值时间的情况,min(|x|,|y|)为x方向和y方向被分成的段数中较小的段数,mic为所求得的最大互信息系数。7.根据权利要求6所述的基于混合相似度的风力发电机组运行状态评估方法,其特征
在于,步骤6中,求取时间动态规整相似度的具体方法包括:求实际曲线与标准曲线的时间动态规整相似度,时间动态规整相似度的计算方法如下:动态时间规整距离即dtw
d
是两个序列之间的距离的度量,使用动态时间规整距离从dtw
d
获得相似度dtw
s
:dtw
s
=1/(1+dtw
d
),dtw
d
为动态时间规整距离,dtws为动态时间规整相似度。8.根据权利要求7所述的基于混合相似度的风力发电机组运行状态评估方法,其特征在于,步骤7中,根据最大互信息数和时间动态规整相似度求取混合相似度的具体方法包括:混合相似度的计算方法如下:mic为标准曲线与实际曲线的最大互信息数,dtws为标准曲线与实际曲线的时间动态规整相似度,s为混合相似度。9.根据权利要求1所述的基于混合相似度的风力发电机组运行状态评估方法,其特征在于,步骤8中,根据上下侧分位数对混合相似度进行分类的具体方法包括:设置上侧分位数为a,下侧分位数为b,根据分位数将混合相似度分为三个时段范围,第一时段为[0,a),第二时段为[a,b),第三时段为[b,100%)。10.根据权利要求9所述的基于混合相似度的风力发电机组运行状态评估方法,其特征在于,步骤9中,根据混合相似度的分类对风力发电机组运行状态进行评估的具体方法包括:混合相似度处于高时段,即在第三时段,则该时段风力发电机组的运行状态良好;混合相似度处于中间时段,即在第二时段,则该时段风力发电机组的运行状态一般;混合相似度处于低时段,即在第一时段,则该时段风力发电机组的运行状态差。

技术总结
本发明涉及风力发电机组运行状态评估领域,具体涉及一种基于混合相似度的风力发电机组运行状态评估方法,极大地提高了风力发电机组运行状态评估的准确性。技术方案包括:获取风力发电机组SCADA系统监测数据,在监测数据中选取需要评估的指标,选取所述指标设置时间范围内的数据,获取所述指标在设置时间范围内数据的小时均值,对获取的小时均值数据进行归一化处理,对归一化处理后的数据求取最大互信息数与时间动态规整相似度,根据最大互信息数和时间动态规整相似度求取混合相似度,设置上下侧分位数,根据上下侧分位数对混合相似度进行分类,根据混合相似度的分类对风力发电机组运行状态进行评估。本发明适用于风力发电机组运行状态评估。运行状态评估。运行状态评估。


技术研发人员:彭莉 姜阳 赖刚 张亮 廖礼 张志伟 邱向东 熊涛 李培宇 仇欣 彭雷 周少平 钟桂良 李美儒 吴迪
受保护的技术使用者:中国电建集团成都勘测设计研究院有限公司
技术研发日:2022.07.25
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-2983.html

最新回复(0)