本发明涉及深度学习方法和异常检测技术在风电机组异常识别领域的应用,特别是涉及一种风力发电机异常识别方法。
背景技术:
1、风力发电作为清洁能源的重要来源,其在全球范围内得到了广泛的发展和应用。然而,风力发电机机组在运行过程中可能会出现各种异常情况,如叶片损坏、机械故障、电气故障等,这些异常情况可能会导致设备损坏、能源损失甚至安全事故。因此,对风力发电机机组状态实时监测,确保风电机组安全和可靠运行变得至关重要。
技术实现思路
1、鉴于以上所述现有技术的缺点,本发明的目的在于提供一种风力发电机异常识别方法,用于解决现有技术中风力发电机机组在运行过程中发生异常没有实时监控到的问题。
2、为实现上述目的及其他相关目的,本发明提供一种风力发电机异常识别方法包括:
3、数据收集,通过数据采集与监视控制系统收集具有若干参数时间序列的风电数据,构成初始风机数据集;
4、数据标记,通过孤立森林算法对所述初始风机数据集进行清洗,分离得到正异常数据;
5、数据预处理,对所述正异常数据进行缺失值填充和归一化数据预处理,获得预处理数据;
6、数据集划分,将所述预处理数据划分为训练数据和测试数据;
7、协同相似图构建策略,通过k最近邻、基于阈值的余弦相似性、基于阈值的马氏距离和最小生成树四种距离度量方法分别生成多个邻接矩阵,利用多个所述邻接矩阵间的相似度生成最优邻接矩阵,所述最优邻接矩阵与所述特征矩阵结合得到图数据;
8、ssgc-gat模型,gat模型由输入层、隐藏层以及输出层构成,将所述图数据作为gat模型的输入,得到ssgc-gat模型;
9、ssgc-gat异常识别模型训练,将所述训练数据输入所述ssgc-gat模型进行训练,获得训练完成的ssgc-gat模型;
10、ssgc-gat异常识别模型测试,将所述测试数据输入训练完成的ssgc-gat模型,获得每个ssgc-gat模型的每个标签概率分布,基于ssgc-gat模型异常识别结果。
11、可选的,所述数据收集中,所述风电数据中选择风速、功率、风向、温度的特征参数。
12、可选的,所述数据标记中,所述初始风机数据集清洗后分离出正常样本和异常样本,采用prototype generation方法对正常样本进行采样,选取与所述异常样本相同的数据量作为所述正常样本,选取出来的所述正常样本和所述异常样本为所述正异常数据。
13、可选的,所述数据预处理中,采用均值填充方法对缺失值进行填充,通过对数据进行归一化处理,其中,x′代表归一化后数据,x代表原始数据,xmax和xmin分别代表原始数据的最大值和最小值。
14、可选的,所述数据集划分中,所述训练数据占总样本数的80%,所述测试数据占总样本数的20%。
15、可选的,所述协同相似图构建策略包括:
16、通过k最近邻、基于阈值的余弦相似性、基于阈值的马氏距离和最小生成树四种距离度量方法生成多个邻接矩阵;
17、利用frobenius范数来计算所述邻接矩阵间的距离,并转换成相似度存储在权重矩阵w′中;
18、将所述权重矩阵w′进行归一化;
19、循环遍历每个所述邻接矩阵,将所述邻接矩阵与对应所述权重矩阵w’中的权重相乘,将结果相加得到融合矩阵f;
20、使用中位数阈值化的方法,将所述融合矩阵f转化为二值矩阵。
21、可选的,利用frobenius范数来计算所述邻接矩阵间的距离中,所述邻接矩阵间的距离dij=||ai-aj||f。
22、可选的,ssgc-gat模型的构建包括:
23、计算某单一节点i的注意力系数,假设它有一个邻接点j∈ni,经过线性变换后分别是whi和whj,则邻接点对该节点i的注意力系数是:eij=a([whi||whj]),j∈ni,其中w为权重矩阵;
24、对线性变化后的值加入非线性激活函数为:leakyrelu(·),最终得到的注意力系数计算公式为:αij=leakyrelu(eij);
25、对邻接点特征进行加权求和,得到新的节点特征其中hi是图注意力层输出,σ(·)是激活函数,由此得到单层图注意力层特征;
26、对于多头注意力机制,使用k个独立的注意力机制,得到不同子空间的特征信息;在每一层图注意力层中,计算出k个独立的转换矩阵w(k);根据上一步骤并行的计算多个子空间的注意力信息,并拼接起来,将得到的结果再次拼接得到其中是通过第k个转换矩阵w(k)计算得到的权重系数;
27、将多个图注意力层进行聚合得到其中l表示网络层数;
28、定义每个样本组的特征为x,将图嵌入表示定义为
29、可选的,ssgc-gat异常识别模型训练中,具有以下步骤:
30、参数设置,将注意力机制的注意力头数分别设置为a和b,设置批次大小nbatch,最大训练迭代次数nepoch。
31、输出层使用sigmoid函数对结果进行分类,即y=sigmoid(wz),其中w为可训练的模型参数;
32、将划分好的训练数据输入至ssgc-gat模型中进行训练,得到识别结果;
33、计算模型的损失函数其中n是样本个数,yi代表第i个样本的真实标签值,xi代表softmax分类器的输出;
34、更新基本模型参数;
35、重复训练过程,直到达到最大迭代次数,最终得到训练完成的ssgc-gat模型。
36、可选的,参数设置的过程中,利用dropout的方法来避免过度拟合,dropout率设置为0.1。
37、上述一种风力发电机异常识别方法所实现的方案中,通过实时采集若干参数时间序列的风电数据,并对数据进行分析来确定风电机组的运行状态,及时发现并识别出现的异常情况,以确保风电机组的安全运行。本发明中提出一种基于图注意力网络的风电机组异常识别方法,利用图注意力网络良好的特征自学习特性对风电机组可能存在的异常进行识,提高风电机组运行地安全性和可靠性。与现有技术相比,本方案基于数据采集与监视控制系统,提出基于图注意力网络的风电机组异常识别方法,所提出的方法有效提高了异常识别的准确性。
1.一种风力发电机异常识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种风力发电机异常识别方法,其特征在于:所述数据收集中,所述风电数据中选择风速、功率、风向、温度的特征参数。
3.根据权利要求2所述的一种风力发电机异常识别方法,其特征在于:所述数据标记中,所述初始风机数据集清洗后分离出正常样本和异常样本,采用prototype generation方法对正常样本进行采样,选取与所述异常样本相同的数据量作为所述正常样本,选取出来的所述正常样本和所述异常样本为所述正异常数据。
4.根据权利要求1所述的一种风力发电机异常识别方法,其特征在于:所述数据预处理中,采用均值填充方法对缺失值进行填充,通过对数据进行归一化处理,其中,x′代表归一化后数据,x代表原始数据,xmax和xmin分别代表原始数据的最大值和最小值。
5.根据权利要求4所述的一种风力发电机异常识别方法,其特征在于:所述数据集划分中,所述训练数据占总样本数的80%,所述测试数据占总样本数的20%。
6.根据权利要求1所述的一种风力发电机异常识别方法,其特征在于:所述协同相似图构建策略包括:
7.根据权利要求6所述的一种风力发电机异常识别方法,其特征在于:利用frobenius范数来计算所述邻接矩阵间的距离中,所述邻接矩阵间的距离dij=||ai-aj||f。
8.根据权利要求7所述的一种风力发电机异常识别方法,其特征在于:ssgc-gat模型的构建包括:
9.根据权利要求1-8任一项所述的一种风力发电机异常识别方法,其特征在于:ssgc-gat异常识别模型训练中,具有以下步骤:
10.根据权利要求9所述的一种风力发电机异常识别方法,其特征在于:参数设置的过程中,利用dropout的方法来避免过度拟合,dropout率设置为0.1。
