本发明属于多维异质微电网群主动安全自主学习,涉及一种微电网群两阶段主动应急自愈学习方法,尤其是一种知-智融合协同的微电网群两阶段主动应急自愈学习方法。
背景技术:
1、大规模分布式异质微电网群具有高度开放互联、强不确定性、信息能源深度融合和系统脆弱性增强等特点,导致传统的集中式调控策略难以及时、有效、准确、安全地对其进行管控,亟需发展人工智能技术提升开放环境下异质微电网群模型和算法的可泛化、可协同、可进化能力。
2、针对微电群局部故障、源荷大范围波动等导致的系统韧性降低问题,尽管基于模型的方法(例如:基于模型预测、多时间尺度等)在微电网故障系统调控中也取得很好的性能,但它们严重依赖于对微电网和参数的准确了解,这对于当今复杂的微电网群系统来说并不实用。
3、近年来,分布式电源输出的随机性和波动性严重威胁着微电网的电压安全和运行稳定,因此需要一种不依赖模型、微电网自主学习以应对故障的方法。
4、经检索,未发现与本发明相同或相近似的现有技术的公开文献。
技术实现思路
1、本发明的目的在于克服现有技术的不足,提出一种知-智融合协同的微电网群两阶段主动应急自愈学习方法,通过在第一阶段提出了一种数据知识融合驱动的信息物理耦合不确定参数自主辨识方法,在第二阶段提出了一种多智能体群智协同网络重构方法,进而实现知-智融合协同的网络精准快速重构恢复。
2、本发明解决其现实问题是采取以下技术方案实现的:
3、一种知-智融合协同的微电网群两阶段主动应急自愈学习方法,包括以下步骤:
4、步骤s1,基于耦合不确定性及时空信息、微网高精度信息等的数据驱动,结合深度残差收缩网络和深度对抗神经网络,提出一种深度融合神经网络自主辨识算法;
5、步骤s2,在步骤s1的基础上,利用历史数据形成微电网不确定性先验知识;
6、步骤s3,数据知识融合驱动,形成分布式电源出力、储能充放电功率与负荷波动的随机性等不确定性动态参数的事故动态知识库;
7、步骤s4,以优化得到的参数作为基础,首先划分智能体分区,其次对各个智能体进行微观搭建,最后形成多智能体能量管理系统;
8、步骤s5,基于势博弈理论和神经网络联想记忆,提出一种网络重构算法,并将该算法与s4提出的多智能体能量管理系统交互协作,共同构成多智能体群智协同网络重构框架,最终完成完成微电网应急自愈学习。
9、而且,所述步骤s1的具体步骤包括:
10、步骤s11,构建深度残差收缩网络的残差收缩模块;
11、输入特征向量xl进入卷积层第l层,xl尺寸为c×w。xl通过转换模块得到残差特征xl+2;
12、xl+1=relu(ωl+1xl+bl+1)
13、xl+2=ωl+2relu(ωl+1xl+bl+1)+bl+2
14、其中,ωl+1分别代表了第l+1层和第l+2层的权重参数。b l+1和b l+2是第l+1层和第l+2层的偏置参数。xl+2通过取绝对值和全局平均池化后得到一个尺寸为c×1的向量再通过三层全连接层、批标准化、激活函数relu和sigmoid后得到尺寸为c×1的参数向量α,α∈(0,1),阈值为τ:
15、
16、α利用收缩算子s和门控参数进行软阈值操作,实现收缩,得到稀疏特征y;
17、
18、软阈值化后的y与残差项相加后得到最后的输出xl+3,尺寸为c×w。
19、步骤s12,构建并训练深度对抗神经网络,形成深度融合神经网络自主辨识算法;
20、整个网络的训练过程可以表示为:
21、(1)第一步计算损失函数v(g),
22、v(g)=(1-y)log(1-d(g(z)))
23、其中,y是平衡损失的参数,z是输入,g(z)是生成器的输出,d(g(z))是生成器生成的数据g(z)为真实样本的概率。图3中,gloss代表损失函数v(g)。
24、(2)第二步计算损失函数v(d):
25、v(d)=-((1-y)log(1-d((g(z)))+ylogd(x)))
26、其中,x是真实样本,d(x)表示真实样本数据是真实样本的概率。图3中,dloss代表损失函数v(d)。
27、(3)第三步是计算总损失函数,用下式表示:
28、mginmdaxv(d,g)=ex~pdata[logd(x)]+ex~pdata[log(1-d(g(z)))]
29、当判别器的输入x来自真实数据时,输出接近于1。当判别器的输入z来自噪声变量时,输出接近于0。d的判别能力越强,d(x)越大,d(g(z))越小,从而导致v(d,g)越大。当生成的数据与真实数据非常接近,d无法判断时,则结束训练。
30、而且,所述步骤s2的具体步骤包括:
31、步骤s21,历史数据预处理及特征提取:对历史数据进行清洗和标记,去除异常值和噪声;
32、步骤s22,利用集成学习技术,将历史数据中的不确定性信息整合到深度强化学习的经验池中。
33、而且,所述步骤s3的具体步骤包括:
34、步骤s31,建立微网运行成本最小化函数如下:
35、分布式电源输出模型:
36、pdistributed=f(wweather,xcontrol)
37、其中,pdistributed是分布式电源的输出功率,wweather是天气条件,xcontrol是控制变量;
38、负荷需求模型:
39、ldemand=g(ttime,tload,xother)
40、其中,ldemand是负荷需求,ttime是时间,tload是负荷类型,xother是其他相关条件,例如能源采购、负荷响应、能源储备和停电成本等。
41、在满足用户负荷供电需求的前提下,取微网整体运行成本最小作为目标函数,目标函数包括五个部分:cbattery为储能系统成本,cde为分布式电源设备成本,cdg为分布式电源发电成本,ce为排放成本,cgrid为与电网的换电成本。如式:
42、f1=min(cbattery+cde+cdg+ce+cgrid)
43、其中,f1表示微电网在一个时期内的总体运行成本。
44、
45、上式中,co为电池充放电维护成本,pm为电池充放电功率。
46、
47、式中,ffuel代表燃料成本,fmain代表设备成本,fss代表储能成本,ki为dg单元i的运行维护系数,pi为dg单元i的功率。
48、
49、上式中,pde为分布式电源发电功率,ei为设备产生的i型废气的惩罚成本,λi为i型废气的排放系数。
50、步骤s32,建立微网能量供需不平衡的惩罚函数如下:
51、首先,能源供需平衡约束为:
52、∑pdistributed=∑ldemand
53、这个约束确保微电网中的总能源供给pdistributed与总能源需求ldemand平衡。
54、分布式电源容量约束:
55、pdistributed≤pmax
56、这个约束限制了分布式电源的输出功率不能超过其最大容量pmax。
57、负荷需求约束:
58、ldemand≥lmin_demand
59、这个约束确保负荷需求满足最小需求量lmin-demand。
60、储能系统约束:
61、ec≤emax
62、ef≤emax
63、c≤cmax
64、其中,ec和ef分别代表充放电速率,emax为最大充放电速率,c为储能系统充放电状态,cmax为储能系统容量。这些约束确保储能系统的充放电速率和充放电状态在规定的范围内。
65、微电网能量供需不平衡的惩罚函数penalty为:
66、
67、其中,piline,req是微电网必须的电力交换,是偏离微电网调度的惩罚成本,piline是微电网实际的电力交换,mg为总分区数量,t为所在分区mg的节点总数,mg∈(1,mg)共计△t时间内的惩罚为penalty。
68、步骤s33,将分析和建模得到的运行成本最小化函数、能源供需平衡约束函数、惩罚函数的不确定性参数信息整合到一个动态知识库中,以形成微电网不确定性的事故动态知识库;对于每个不确定性参数,记录其历史数据、统计特征、动态变化趋势的信息。
69、步骤s34,将事故动态知识库与步骤s1和s2中的数据知识融合方法结合起来,以驱动微电网系统的智能化决策和优化。
70、而且,所述步骤s4的具体步骤包括:
71、步骤s41,提出了一种启发式划分智能体agent的方法,采用试错的方法将节点首先按照地理划分得到初步分区,一个分区对应一个智能体,初步分区后进行调整得到最终分区;
72、其评估方式如下:
73、
74、其中,rn,t代表节点的功率损耗,closs和cswitch表示功率损耗和切换操作的代价系数;约束由成本函数描述,包括开关损失和电压损失。un,m,t,un,m,t-1分别表示t时间和t-1时间,第n个节点受控开关m的开关状态;mn表示开关的总数,m∈[1,mn],ptloss表示节点在t时刻的有功功率损失;
75、步骤s42,对agent个体进行微观搭建,在多智能体深度强化学习中,将多智能体合作问题表述为马尔可夫决策过程;
76、马尔可夫决策过程被定义为一个元组(d,s,a,o,t,r,γ),其中d={1,...,n}是一个有n个智能体的智能体集合,s是状态空间;a=×i∈dai是所有智能体的联合动作空间,其中包括智能体i的个体动作空间ai;o×i∈doi是联合观测空间,其中包括智能体i的观测集oi;t是转移概率,r是每个智能体的共享奖励函数,γ是折扣因子。在每个时间步t,每个智能体i首先根据环境获得自己的观察oti∈oi,然后基于随机策略πti:oi×ai→[0,1]选择ati∈ai处的动作,该策略以未知的转移概率传递t:s×a1×···×an→s进入下一个状态。接下来,接收联合奖励rt∈r:s×a。马尔可夫决策的目标是找到一个联合最优策略π=×i∈dπi达到最大预期收益j=eπ其中γ是平衡长期和短期奖励重要性的折扣因子,t是时间范围。
77、步骤s43,建立多智能体能量管理系统;
78、所述多智能体能量管理系统的模型分为三个层次:反应层、决策层和协作层;在该系统内,信息与指令互相流动,采用了双向传输机制:从上至下传达agent的意图和认知,而从下至上则是决策和行动的指示。
79、而且,所述步骤s5的具体步骤包括:
80、步骤s51,对微电网不同智能体的脆弱性进行评估,脆弱性在[20,100]的范围内进行系统优化与重构;
81、步骤s52,基于势博弈理论和神经网络联想记忆,提出一种网络重构算法,进行微电网动态重构;
82、步骤s53,将s52的网络重构算法与s4提出的多智能体能量管理系统交互协作,共同构成多智能体群智协同网络重构框架,最终完成微电网应急自愈学习。
83、而且,所述步骤s51的具体步骤包括:
84、步骤s511,利用神经网络联想记忆来识别当前微电网系统的状态;通过对历史数据的学习,利用神经网络可以预测当前微电网系统下一时刻处于的状态,包括各个节点的电力供需情况、能量转移路径;
85、神经网络联想记忆算法如下:
86、对于给定的区域,取记忆模式数量为s,记忆模式p(1),p(2),...,p(m)∈dn,dn为包含n个智能体的微电网系统状态的n维空间,m∈{1,2,...,s},给出以下联想记忆算法:
87、(1)ci为微网系统中不同智能体的重要性或优先级,aij和bij分别为智能体之间的关联强度和电力传输强度,ii为微网系统中各个智能体的初始状态及太阳能电池板、风力发电机等设备的初始输入数据;取ci,aij,bij和ii,i、j=1,2,...,n的值,使得ci>0,c-a-b是非奇异m矩阵,其中c=diag(c1,c2,...,cn),a=(aij)n×n且b=(bij)n×n。
88、(2)根据记忆模式p(1),p(2),...,p(s)∈dn的特征识电压波动的区域1,2,...,s。
89、步骤s512,进行节点脆弱性分析,选取电压波动脆弱性、过负荷脆弱性、负荷低功率因数脆弱性3个指标参数,以正常运行工况为基准,3个指标参数偏移程度作为评估系统的危害程度。电压波动的脆弱性指标计算公式为:y=20∣x﹣1∣。即当该节点电压为额定值时,节点的风险值取0,当其在额定值的±5%时,节点的风险值取1。电压波动范围在(0.95,1.05)内为正常,过负荷脆弱性指标计算公式为:y=10(x﹣0.9),反之,负荷低功率因数脆弱性指标计算公式为为:y=﹣10(x﹣0.9)。
90、步骤s513,综合脆弱性评估;构建系统脆弱性强度isv计算模型为:
91、
92、式中:γj表示第j类故障发生的概率;λi表示节点i的结构脆弱性强度;ωi表示第i项评价指标对系统脆弱性影响强度的权重系数,i=1,2,3;ufvb表示电压波动的偏移度;lfvb表示过负荷的偏移度;pfvb表示低功率因数的偏移度;m和n分别表示故障个数和节点个数。
93、而且,所述步骤s52的具体步骤包括:
94、步骤s521,构造势函数;
95、势函数如下:
96、
97、其中,g(y)为微网整体经济效益,即各智能体收益之和,n为节点个数,fi为节点处的效益总和,包括风力发电系统效益fwt、光伏发电系统效益fpv、蓄电池储能系统收益fde、柴油机发电系统fba:
98、fi=fpv+fwt+fde+fba
99、fwt=μpwtδt-γwtpwtδt
100、fpv=μppvδt-γpvppvδt
101、式中:μ为单位电价;pwt为风机阵列的单位时间输出功率、ppv为光伏阵列的单位时间输出功率;γwt为风机、阵列的单位维护成本、γpv为光伏阵列的单位维护成本;△t为时间区间长度。
102、fba=μpbaδt-γba|pba|δt
103、式中:pba为蓄电池的输出功率,γba为蓄电池的单位维护成本;pba为负代表蓄电池充电,pba为正代表蓄电池放电。
104、fde=(μpde-ρoildoil-γdepde)δt
105、式中:柴油机单位维护成本为γde,柴油机的收益函数为fde;燃油单价为ρoil,doil为耗油量。
106、步骤s522,微电网的势博弈模型需满足供需平衡,采用惩罚因子来满足这一条件,罚函数为:
107、
108、式中:α为惩罚因子;∑kpk、∑mlm分别为总输出功率和总负荷需求,惩罚f作为负奖励添加到奖励r中。
109、步骤s523,网络优化重构的收敛判据:基于有功功率负荷分配的一致性网络优化重构;
110、在实际微电网群系统中,有功功率负荷分配一致性算法如下式:
111、
112、式中:pi为表示为智能体i被分配的有功功率负荷;pei为智能体额定有功功率负荷;mij表示为权重系数,矩阵形式如式:
113、r[k+1]=mr[k]
114、式中:m表示为状态转移矩阵;r[k]表示为比率矩阵。
115、为改善有功功率分配的迭代性能,引入误差ei:
116、
117、将误差ei带入有功功率负荷分配一致性算法公式,得下式:
118、
119、经反复迭代,有功功率负荷分配占比收敛于一个常数,如下式:
120、
121、式中:p1*…pn*表示为智能实际输出功率;p1…pn表示为智能体最大输出功率;k表示为常数。至此,网络优化重构收敛,算法结束。
122、本发明的优点和有益效果:
123、本发明提出一种知-智融合协同的微电网群两阶段主动应急自愈学习方法,首先基于耦合不确定性及时空信息、微网高精度信息等的数据驱动,结合深度残差收缩网络和深度对抗神经网络,提出一种深度融合神经网络自主辨识算法。并进一步利用历史数据形成微电网不确定性先验知识;通过数据知识融合驱动,实现分布式电源出力、储能充放电功率与负荷波动的随机性等不确定性动态参数的事故动态知识库,第一阶段完成。通过第一阶段的数据驱动优化和事故动态知识库的构建,可以有效识别和应对微电网中的不确定性和动态参数波动,减少事故的发生,从而提高微电网的安全性和稳定性。以第一阶段优化得到的参数作为第二阶段优化的基础,首先划分智能体分区,其次对各个智能体进行微观搭建,最后形成多智能体能量管理系统;基于势博弈理论和神经网络联想记忆,提出一种网络重构算法,利用该算法与s4提出的多智能体能量管理系统交互协作,共同构成多智能体群智协同网络重构框架,从而完成第二阶段。本发明结合了深度学习和神经网络技术,使得微电网能够自主学习和优化,形成多智能体协同网络,提升了微电网的智能化水平,为未来微电网的发展打下了坚实基础。
124、2、本发明提供一种异质微电网的知-智融合协同的微电网群两阶段主动应急自愈学习方法方法,包括:第一阶段,利用微网高精度数据实时分析微电网群故障信息,基于深度融合神经网络自主辨识算法和微电网不确定性先验知识构建事故动态知识库;第二阶段,研究基于多智能体深度强化学习的能量管理系统,解决传统算法对模型的依赖性;探究多智能体与能量管理系统的多重映射关系,研究结合势博弈理论的网络重构算法,实现知-智融合协同的网络精准快速重构恢复。
1.一种知-智融合协同的微电网群两阶段主动应急自愈学习方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种知-智融合协同的微电网群两阶段主动应急自愈学习方法,其特征在于:所述步骤s1的具体步骤包括:
3.根据权利要求1所述的一种知-智融合协同的微电网群两阶段主动应急自愈学习方法,其特征在于:所述步骤s2的具体步骤包括:
4.根据权利要求1所述的一种知-智融合协同的微电网群两阶段主动应急自愈学习方法,其特征在于:所述步骤s3的具体步骤包括:
5.根据权利要求1所述的一种知-智融合协同的微电网群两阶段主动应急自愈学习方法,其特征在于:所述步骤s4的具体步骤包括:
6.根据权利要求1所述的一种知-智融合协同的微电网群两阶段主动应急自愈学习方法,其特征在于:所述步骤s5的具体步骤包括:
7.根据权利要求6所述的一种知-智融合协同的微电网群两阶段主动应急自愈学习方法,其特征在于:所述步骤s51的具体步骤包括:
8.根据权利要求6所述的一种知-智融合协同的微电网群两阶段主动应急自愈学习方法,其特征在于:所述步骤s52的具体步骤包括:
