1.本发明涉及电力技术领域,具体涉及一种多能负荷短期预测方法。
背景技术:2.电力负荷预测在电力系统的稳定经济运行中占据着不可或缺的地位。用电负荷预测是根据电力负荷、经济、社会、气象等历史数据,探索用电负荷历史数据变化规律对未来负荷的影响,寻求用电负荷与自身的历史变化以及各种相关因素之间的内在联系,从而对未来的用电负荷进行准确的预测。电力系统的主要任务,就是为各种类型的电力用户提供经济、稳定、高质量的电能,应能及时响应电力用户不同的用电负荷需求量与用电负荷特性的要求。因此,在电力系统规划设计、运行管理与电力市场交易的整个过程中,必须对用电负荷量的变化、质的变化进行准确的预测。在电力进入市场化运行后,用电负荷预测实际上是对电力市场需求的预测,电力供需瞬时平衡的特点,决定了电力行业的预测需求相较于其余行业更为紧迫,更好地进行用电负荷预测工作,以保障电力系统的安全、经济运行,同时稳步推进电力工业市场化进程,已经成为电力系统的业内共识。
3.随着电网智能化程度的不断提高、电力市场营销机制的逐渐深入,用户侧与电网侧的信息交互频率升高、范围更广。电网运转层面需要尽可能准确地把握负荷侧的重大调整特征,从而通过相应的调度措施保证系统的可靠运行;而市场营运体制则更关心用户的用电行为特征,以合理调整发电计划,提升在电力市场环境中的竞争力。基于上述分析,崭新发展背景下的电力系统对负荷预测提出了更为精细的要求,即不仅要满足电网生产调度的需求,而且对于负荷特征的刻画也要更准确。
4.综合能源系统集成电、热、冷、气等多种能源形式,涉及能量的转换、分配与有机协调,是实现能源互联网多能互补特性的重要物理载体。随着时间流逝,满足时代发展要求、响应政策文件导向的能源互联网以及综合能源系统的领域产业将进一步拓宽壮大,肩负综合能源系统运行核心基础重任的多能负荷预测业务亟待广泛深入的研究,以推进我国能源转型革命大计。然而,开展新兴的综合能源系统多能负荷短期预测研究面临的难点在于,一方面,单一负荷预测的非线性复杂特性本质并未改变,因此需要在科学正确的理论指导下灵活地分析负荷与各种外部关联信息的交织内涵,以及负荷自身内在历史发展逻辑与负荷未来变化的影响机理;另一方面,综合能源系统中多种形式能源借助能源耦合转换设备,在动态响应用户多能需求的前提下能够进行高效的相互转化,因此多能负荷预测在传统负荷预测的基础上,还需要对多能耦合特征加以合理的分析研究,从而充分参悉多能负荷发展性质变化规律。
5.随着人工智能概念的普及与技术的发展,机器学习与深度学习在负荷预测研究中得到了广泛的支持与应用。其中,神经网络、支持向量机回归等机器学习方法由于其强大的数据挖掘能力,以及解决复杂非线性问题的优越性,相关研究发展趋势迅速。
6.(1)特征处理
7.人工智能类预测模型的特征选择、降维与提取等特征处理工作是影响预测精度的
重要影响因素,在机器学习的典型工程应用中,特征选择方法可以大致分类为过滤法、包装法以及嵌入法;特征降维方法则包括主成分分析法与线性判别分析法等等;特征提取方法包括主成分分析法、智能学习法等等。
8.(2)相关分析
9.在综合能源系统中,多能负荷之间复杂的耦合关系直接影响到多能负荷短期预测的精度性能,因此考虑负荷特征分析是提升多能负荷短期预测精度的关键切入点。现有的负荷相关分析技术主要为线性相关分析、定量信息相关分析、静态相关分析等等。
技术实现要素:10.为了解决上述背景技术所存在的至少一技术问题,本发明提供一种多能负荷短期预测方法。
11.为实现上述目的,本发明的技术方案是:
12.一种多能负荷短期预测方法,包括:
13.获取数据,所述数据包括多能负荷历史曲线以及负荷影响因素的历史信息;
14.进行数据预处理,并执行动态copula相关分析与负荷模糊聚类分析;
15.基于模糊优化曲线形态分析算法,对每类负荷曲线簇分别进行特征识别提取,实现负荷初次特征提取;
16.基于统计频率分布,计算判别得到每类负荷曲线簇的总体特征分布集合,实现负荷二次特征提取;
17.基于机器学习算法分类建立组合负荷预测模型,依据每类负荷曲线簇的历史特征数据进行组合模型训练;
18.利用概率转移链模型判断预测时段负荷所属的分类,基于该类训练完成的负荷预测模型进行负荷特征的预测,并针对未来用电特征展开分析;
19.基于拟合重构技术,重构预测特征至负荷曲线原始维度,完成负荷预测。
20.本发明与现有技术相比,其有益效果在于:
21.针对综合能源系统多能负荷短期预测模型普遍存在的负荷曲线特征点处预测精度以及整体预测精度较差的问题,本发明提出一种基于动态copula相关分析与两阶段式模糊优化负荷特征识别组合模型的多能负荷短期预测方法。首先,本方法通过动态copula相关分析,能够对多能负荷之间复杂非线性的耦合关系进行动态的量化分析,从而为预测模型输入的建立提供强有力的蕴藏信息参考支撑;其次,本方法运用模糊聚类分析方法进行历史负荷曲线聚类,从而依据聚类结果分别进行每类负荷的特征分析,使得预测模型的应用有着明确的针对性,并且在同类负荷曲线具有相似负荷特征的基础上,基于自适应调整阈值的模糊优化曲线形态分析法进行初次特征提取,并应用统计频率分布模型进行二次特征提取,从而对同类负荷曲线进行两阶段式负荷特征识别与提取,不仅解决了负荷预测工作中的特征选取以及降维的难题,而且使得负荷提取得到的特征更加明确、可解释性更强,同时指向负荷特征的预测模型能够合理地解决预测结果中负荷特征处预测精度较低的问题;此外,本方法应用概率转移链模型解决待预测日的分类判别问题,从而更加具有实际应用价值;最后,两阶段式模糊优化负荷特征识别方法能够与多种机器学习方法结合形成组合预测模型,具有卓越的泛化性能;同时预测得到的未来负荷特征也能够与多种逆向重构
方式进行组合,从而将负荷由特征维度重构至负荷原始维度,具有优秀的应用潜力。两阶段式模糊优化负荷特征识别组合模型相较于传统模型在计算效率与具体性能上均有高效的提升,能够适应实际多能负荷预测工作的发展动态。
附图说明
22.图1为本发明实施例提供的多能负荷短期预测方法的流程图;
23.图2为narx神经网络结构图;
24.图3为为本发明多能负荷短期预测方法的关键技术实施框架图。
具体实施方式
25.实施例:
26.下面结合附图和实施例对本发明的技术方案做进一步的说明。
27.参阅图1所示,本实施例提供的多能负荷短期预测方法,包括:
28.101、获取数据,所述数据包括多能负荷历史曲线以及负荷影响因素的历史信息。
29.102、进行数据预处理,并执行动态copula相关分析与负荷模糊聚类分析。
30.对于多能负荷短期预测工作,精确掌握以多能负荷各自的历史发展规律与多能负荷之间的耦合转换关系为代表的内部负荷特征,以及多能负荷与气象等相关影响因素的外部负荷特征是提升最终预测精度的关键所在。相比较于多能负荷各自的历史发展规律以及多能负荷与气象等相关影响因素关联特性,多能负荷之间复杂而灵活的耦合转换相关特征的研究较少,因此需要更为准确的刻画方法辅助分析,从而有效优化多能负荷短期预测模型的总体性能。引入动态copula相关分析方法对多能负荷时间序列之间的非线性耦合转换关联特征进行建模分析,从而更为确切地量化研究多能负荷的特征分析方法,为优化多能负荷短期预测模型的输入特征提供可靠的决策参考。如此,在此步骤中,通过动态copula相关分析,能够对多能负荷之间复杂非线性的耦合关系进行动态的量化分析,从而为预测模型输入的建立提供强有力的蕴藏信息参考支撑
31.103、基于模糊优化曲线形态分析算法,对每类负荷曲线簇分别进行特征识别提取(负荷初次特征提取);
32.104、基于统计频率分布,计算判别得到每类负荷曲线簇的总体特征分布集合(负荷二次特征提取);
33.如此,通过步骤103和104,在同类负荷曲线具有相似负荷特征的基础上,基于自适应调整阈值的模糊优化曲线形态分析方法进行初次特征提取,并应用统计频率分布模型进行二次特征提取,从而对同类负荷曲线进行两阶段式负荷特征识别与提取,不仅解决了负荷预测工作中的特征选取以及降维的复杂度问题,而且使得负荷提取得到的特征更加明确、可解释性更强,同时指向负荷特征的预测模型能够合理地解决负荷预测结果中负荷特征处预测精度低的问题。
34.105、基于机器学习算法分类建立组合负荷预测模型,依据每类负荷曲线簇的历史特征数据进行组合模型训练。
35.经由两阶段(初次和二次)形式的模糊优化负荷特征识别提取后,输出的统一负荷特征集合能够与多种机器学习模型进行结合,形成组合预测模型,如神经网络模型、支持向
量机回归模型等。其中,narx神经网络模型由于其合理的结构性能,捕捉时序序列的非线性能力优秀,同时其并行分布的训练模式提高了模型的容错性与稳定性,因此相较于其余典型机器学习模型的竞争力更强。
36.相较于由输入层、隐含层、输出层组成的传统前馈型神经网络,narx神经网络增加了由输出层至输入层的反馈连接,从而形成循环型神经网络。narx神经网络结构如图2所示。其中,[d-1
,...,d-n
]代表时延算子;ωh、ωv分别为输入层至隐含层的连接权重系数,以及隐含层至输出层的连接权重系数;ψ、φ则分别表示隐含层及输出层神经元的激励函数。因此,narx神经网络模型的输入-输出关系可以由下式进行描述:
[0037][0038]
式(1)中,i(
·
)为narx模型的输入,o(
·
)为narx模型的输出,f(
·
)是典型的非线性激励函数,n则为外部输入以及自身输出的时延阶数。结合式(1)可见,narx神经网络下一时刻的输出o(t+1),总是由之前时刻的网络外部输入[i(t),i(t-1),...,i(t-n)],以及网络的自身输出[o(t),o(t-1),...,o(t-n)]所决定。因此,narx模型能够充分考虑时间序列的历史蕴藏信息,从而用于精细刻画预测时刻的时间序列状态。
[0039]
如此,两阶段式模糊优化负荷特征识别方法能够与多种机器学习方法结合形成组合预测模型,具有优秀的泛化性能;同时预测得到的未来负荷特征也能够与多种逆向重构方式进行组合,从而将负荷由特征维度重构至负荷原始维度,具有广阔的应用前景。
[0040]
106、利用概率转移链模型判断预测时段负荷所属的分类,基于该类训练完成的负荷预测模型进行负荷特征的预测,并针对未来用电特征展开分析。
[0041]
应用概率转移链模型解决部分负荷预测相关因素信息未知情况下的待预测日的分类判别问题,具有实际应用价值。
[0042]
107、基于拟合重构技术,重构预测特征至负荷曲线原始维度,完成负荷预测
[0043]
为完成用电负荷预测工作,需要重构预测特征集至日负荷曲线原始维度。在已有未来日负荷曲线的特征点的情况下,直观的用电负荷曲线逆向重构方法主要是分段线性插值法,如式(2)所示:
[0044][0045]
此外,用电负荷曲线逆向重构方法还有连接更为光滑、结果较为精确的b样条插值法,如式(3)所示:
[0046][0047]
如图3所示,为本发明多能负荷短期预测方法的关键技术实施框架图,在步骤101中,该多能负荷历史曲线以及负荷影响因素的历史信息数据包括电负荷序列数据、热负荷
序列数据、冷负荷序列数据、气象数据、日类型数据。
[0048]
在步骤102中,所述动态copula相关分析包括:
[0049]
对电负荷序列数据、热负荷序列数据、冷负荷序列数据之间的非线性耦合转换关联特征进行建模分析;所述建模分析包括:
[0050]
n维变量的联合分布函数可以由为n个变量的边缘分布函数与表征变量之间的复杂相关特性的copula函数的组合表达进行构建。假定存在某一组n维变量x=[x1,x2,
…
,xn],其中各维变量的边缘分布函数为f1(x1),f2(x2),...,fn(xn),则该n维变量的联合分布函数与联合密度函数可由式(4)、式(5)进行分析描述:
[0051]
f(x1,x2,
…
,xn)=c[f1(x1),f2(x2),
…
,fn(xn)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0052][0053]
式中,f(
·
)为n维变量的联合分布函数;c(
·
)为表征n维变量之间的复杂相关特性的copula分布函数;f(
·
)表示n维变量的联合密度函数;c(
·
)表示copula密度函数;f(
·
)为各维变量的密度函数。
[0054]
由式(4)和式(5)可见,通过对copula分布函数c(
·
)进行求导,可以得到copula密度函数c(
·
),如式(6)所示。
[0055][0056]
通过对copula分布函数与copula密度函数的求取,能够精细地描述多元随机变量之间的复杂关联。基于动态copula分布函数对随机变量进行相关特征分析,能够从不同的角度反映出随机变量的关联特性。假设边缘分布函数为u=f(x)和v=g(y)的二阶随机变量(x,y)的为copula函数为c(u,v),则动态copula分布函数及其密度函数形式如下所示:
[0057][0058]
式中,式中,为动态copula函数的时变上尾与时变下尾相关系数。由动态copula函数导出的相关系数则具有时变特性,能够对变量序列的非线性动态变化特征进行详细的描述,从而能够动态量化多能负荷之间的复杂非线性耦合相关性。
[0059]
在上述步骤102中,所述负荷模糊聚类分析包括:
[0060]
对电负荷序列数据、热负荷序列数据、冷负荷序列数据、气象数据、日类型数据中的每一类数据都进行如下步骤操作:
[0061]
步骤1:初始化:设定总的数据样本集合为x={xj|j=1,2,
…
n},聚类数目为m(2≤m≤n);即要将x划分为m类,记为x1,x2,
…
,xm;此时有同时,设定m个初始聚类中心,记为c=(c1(k),c2(k),
…
,cm(k));步骤2:由公式(8)计算样本xj到聚类中心ci的欧氏距离d
ji
;
[0062][0063]
其中,t为数据样本的聚类指标总数;
[0064]
步骤3:由公式(9)计算样本xj对第i类的隶属度u
ji
;
[0065][0066]
根据最小距离原则,对x进行聚类;假设满足关系式(10)
[0067][0068]
则有其中i0=1,2,
…
,m;
[0069]
步骤4:按公式(11)更新聚类中心;
[0070][0071]
步骤5:假设此时存在i={1,2,
…
,m},满足ci(k+1)≠ci(k),则转到步骤2重新执行流程;否则,负荷模糊聚类结束。
[0072]
在上述步骤103中,负荷初次特征提取方法的流程可简述为:
[0073]
步骤1:用一条直线虚拟连接目标曲线的首尾两点,并求出当前目标曲线上其余各目标点到该直线的垂直距离;
[0074]
步骤2:设定曲线形态分析算法的阈值,并选出步骤1中计算得出的垂距最大值与阈值相比较,若大于阈值,则保留与直线的垂距最大值所对应的数据点;否则,舍弃直线两端点间的所有数据点;
[0075]
步骤3:基于所保留的数据点,将目标曲线划分成两部分处理,每部分视作新的目标曲线,重复步骤1、步骤2中的操作,基于二分法的思想反复迭代,即仍然选择垂距最大值与阈值比较,依次判断取舍,直到无点可舍去。最后,得到满足预定精度阈值的曲线特征点,并舍去其他点,即可完成目标曲线的特征提取。
[0076]
定义论域e∈[0,1]为初次特征提取的阈值取值区域。为简化操作,本文设置阈值在[0,1]区间内取值,取值间隔为0.1。sat(ε)代表曲线形态分析算法的阈值取值对于某一簇相似曲线的隶属度。
[0077][0078]
式(12)中,阈值隶属度sat(ε)由两部分相加组成,可以看作为某一阈值下的指定相似曲线簇的总体曲线特征提取满意度。其中,第一部分的d(ε)为指定相似曲线簇中识别提取得到曲线特征与原始曲线的平均匹配度,以此判断所提取的曲线特征是否能够充分反映原始曲线的形状特征。第二部分的z(ε)为曲线特征点数量对原始曲线点数量的百分比
值,即为曲线特征提取压缩原始曲线的平均百分比率。a、b为相应的比例系数。
[0079]
1)平均相似匹配度d(ε)。
[0080]
由于曲线特征的时间维度相比于原始曲线有所减小,不再是一一对应映射的关系,因此引入动态时间规整距离(dynamic time warping,dtw)对曲线特征与原始曲线的匹配度进行计算。通过计算dtw距离,能够合理衡量两段存在长度差异的时间序列的相似性。设曲线原始序列与特征序列为x、y,则其序列长度分别为l
x
、ly。定义规整路径w=[w1,w2,
…
,wk],其中wi=(pi,qi)∈[1:l
x
]
×
[1:ly],1≤i≤k。规整路径需要满足边界性、连续性与单调性,如式(13)所示。
[0081][0082]
则原始序列x和特征序列y之间的规整路径累积距离fw(x,y)可由式(14)进行计算。
[0083][0084]
最优规整路径w
*
下的规整路径累积距离达到最小,此时的规整路径累积距离即为dtw距离。
[0085][0086]
基于动态规划的思想,可由式(16)递归计算最优规整路径的累积距离。
[0087]ddtw
(xi,yj)=d(xi,yj)+min(d
dtw
(x
i-1
,yj),d
dtw
(xi,y
j-1
),d
dtw
(x
i-1
,y
j-1
))
ꢀꢀꢀꢀ
(16)
[0088]
迭代计算到d
dtw
(x
lx
,y
ly
)时即为所求的x和y之间的dtw距离。
[0089]
极限情况下的曲线特征只包括原始曲线的首末端点,记连接原始曲线首末端点的直线为y0,则相似曲线簇中识别提取得到曲线特征与原始曲线的平均匹配度d(ε)通过公式(17)计算:
[0090][0091]
式(13)中,n为当前相似曲线簇中包含的曲线数目。
[0092]
2)平均压缩比率z(ε)。
[0093]
通过公式(18)计算相似曲线簇中识别提取得到曲线特征与原始曲线的平均压缩比率z(ε):
[0094][0095]
式(14)中,num(
·
)函数代表求取序列中的数据数目。
[0096]
3)比例系数a、b。
[0097]
比例系数a、b的设置关系到对平均匹配度d(ε)以及平均压缩比率z(ε)的重视程
度。
[0098]
在上述步骤103中,负荷二次特征提取包括:
[0099]
基于模糊优化阈值的曲线形态分析算法完成对某一类负荷曲线簇中全体负荷曲线各自的负荷特征初次提取后,应用统计频率分布的思想,二次提取该类负荷曲线簇的总体特征。记该类负荷曲线簇在负荷特征识别提取过程中产生的所有不重复的m个负荷特征编号集合为i=[i1,i2,
…
,ii,
…
,im],相应的出现频次为g=[g1,g2,
…
,gi,
…
,gm],则对于该类负荷曲线簇的各负荷特征统计频率由公式(19)计算得到。然后,由公式(20)判断该负荷特征是否适合作为该类负荷曲线簇的总体特征之一。若满足公式(20),则其对应的ii加入到更新的该类负荷曲线簇的特征编号集合i
′
中,即ii∈i
′
。
[0100][0101][0102]
最终,经过模糊优化阈值的曲线形态分析算法初次特征提取以及统计频率分布二次特征提取计算所得到的集合i
′
,即作为该类负荷曲线簇的总体特征标志。
[0103]
在上述步骤106中,基于概率转移链模型来进行待预测日分类判别包括:
[0104]
应用概率转移链模型,首先需要确定所研究系统的状态空间大小。假设历史负荷的类别编码序列总共包含r种状态,记作[s1,s2,
…
,si,
…
,sj,
…
,sr],当负荷fcm聚类的结果为m类时,任意一种状态si的取值范围为[1,m]。由概率转移链的定义,状态si经过n步后转移到状态sj的概率由公式(21)计算得出
[0105]
p
ij
(n)=t
ij
(n)/tiꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(21)
[0106]
式中,t
ij
(n)表示历史状态序列中状态si经过n步后转移到状态sj的次数;ti表示历史状态序列中si状态出现的总次数。
[0107]
反复依据公式(21)可以计算得出概率转移链的n步状态转移概率矩阵,如公式(22)以及公式(23)所示:
[0108][0109][0110]
由概率转移矩阵预测第r+1步的状态时,首先寻出概率转移矩阵的第r行的状态sr的最大转移概率,假设为p
ru
(n),其中u=1,2,
…
,r。则由概率转移链的定义,可以判别出状态su为第r+1步的最大概率状态。通过上述方式,能够合理地判别处待预测日归属于何种已知的分类,从而开展相应的预测工作。
[0111]
综上,与现有技术相比,本发明具有以下优点:
[0112]
(1)运用模糊聚类分析方法进行历史负荷曲线聚类,从而依据聚类结果分别进行每类负荷的特征分析,使得预测模型的应用有着明确的针对性。
[0113]
(2)在同类负荷曲线具有相似负荷特征的基础上,基于自适应调整阈值的模糊优化曲线形态分析方法进行初次特征提取,并应用统计频率分布模型进行二次特征提取,从而对同类负荷曲线进行两阶段式负荷特征识别与提取,不仅解决了负荷预测工作中的特征选取以及降维的复杂度问题,而且使得负荷提取得到的特征更加明确、可解释性更强,同时指向负荷特征的预测模型能够合理地解决负荷预测结果中负荷特征处预测精度低的问题。
[0114]
(3)应用概率转移链模型解决部分负荷预测相关因素信息未知情况下的待预测日的分类判别问题,具有实际应用价值。
[0115]
(4)两阶段式模糊优化负荷特征识别方法能够与多种机器学习方法结合形成组合预测模型,具有优秀的泛化性能;同时预测得到的未来负荷特征也能够与多种逆向重构方式进行组合,从而将负荷由特征维度重构至负荷原始维度,具有广阔的应用前景。
[0116]
上述实施例只是为了说明本发明的技术构思及特点,其目的是在于让本领域内的普通技术人员能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡是根据本发明内容的实质所做出的等效的变化或修饰,都应涵盖在本发明的保护范围内。
技术特征:1.一种多能负荷短期预测方法,其特征在于,包括:获取数据,所述数据包括多能负荷历史曲线以及负荷影响因素的历史信息;进行数据预处理,并执行动态copula相关分析与负荷模糊聚类分析;基于模糊优化曲线形态分析算法,对每类负荷曲线簇分别进行特征识别提取,实现负荷初次特征提取;基于统计频率分布,计算判别得到每类负荷曲线簇的总体特征分布集合,实现负荷二次特征提取;基于机器学习算法分类建立组合负荷预测模型,依据每类负荷曲线簇的历史特征数据进行组合模型训练;利用概率转移链模型判断预测时段负荷所属的分类,基于该类训练完成的负荷预测模型进行负荷特征的预测,并针对未来用电特征展开分析;基于拟合重构技术,重构预测特征至负荷曲线原始维度,完成负荷预测。2.如权利要求1所述的多能负荷短期预测方法,其特征在于,所述基于机器学习算法分类建立组合负荷预测模型,依据每类负荷曲线簇的历史特征数据进行组合模型训练包括:经由两阶段形式的模糊优化负荷特征识别提取后,输出的统一负荷特征集合能够与多种机器学习模型进行结合,形成组合预测模型;所述组合预测模型采用narx神经网络模型,narx神经网络模型的输入-输出关系由下式进行描述:式(1)中,i(
·
)为narx模型的输入,o(
·
)为narx模型的输出,f(
·
)是典型的非线性激励函数,n则为外部输入以及自身输出的时延阶数。3.如权利要求1或2所述的多能负荷短期预测方法,其特征在于,所述基于拟合重构技术,重构预测特征至负荷曲线原始维度,完成负荷预测包括:为完成用电负荷预测工作,需要重构预测特征集至日负荷曲线原始维度;在已有未来日负荷曲线的特征点的情况下,直观的用电负荷曲线逆向重构方法主要是分段线性插值法,如式(2)所示:或,如式(3)所示:4.如权利要求1所述的多能负荷短期预测方法,其特征在于,所述多能负荷历史曲线以及负荷影响因素的历史信息数据包括电负荷序列数据、热负荷序列数据、冷负荷序列数据、
气象数据、日类型数据。5.如权利要求4所述的多能负荷短期预测方法,其特征在于,所述动态copula相关分析包括:对电负荷序列数据、热负荷序列数据、冷负荷序列数据之间的非线性耦合转换关联特征进行建模分析;所述建模分析包括:n维变量的联合分布函数由为n个变量的边缘分布函数与表征变量之间的复杂相关特性的copula函数的组合表达进行构建;假定存在某一组n维变量x=[x1,x2,
…
,x
n
],其中各维变量的边缘分布函数为f1(x1),f2(x2),
…
,f
n
(x
n
),则该n维变量的联合分布函数与联合密度函数由式(4)、式(5)进行分析描述:f(x1,x2,
…
,x
n
)=c[f1(x1),f2(x2),
…
,f
n
(x
n
)]
ꢀꢀꢀꢀ
(4)式中,f(
·
)为n维变量的联合分布函数;c(
·
)为表征n维变量之间的复杂相关特性的copula分布函数;f(
·
)表示n维变量的联合密度函数;c(
·
)表示copula密度函数;f(
·
)为各维变量的密度函数;由式(4)和式(5)见,通过对copula分布函数c(
·
)进行求导,得到copula密度函数c(
·
),如式(6)所示;通过对copula分布函数与copula密度函数的求取,能够描述多元随机变量之间的复杂关联;基于动态copula分布函数对随机变量进行相关特征分析,能够从不同的角度反映出随机变量的关联特性;假设边缘分布函数为u=f(x)和v=g(y)的二阶随机变量(x,y)的为copula函数为c(u,v),则动态copula分布函数及其密度函数形式如下所示:式中,式中,为动态copula函数的时变上尾与时变下尾相关系数;由动态copula函数导出的相关系数则具有时变特性,能够对变量序列的非线性动态变化特征进行描述,从而能够动态量化多能负荷之间的复杂非线性耦合相关性。6.如权利要求4或5所述的多能负荷短期预测方法,其特征在于,所述负荷模糊聚类分析包括:对电负荷序列数据、热负荷序列数据、冷负荷序列数据、气象数据、日类型数据中的每一类数据都进行如下步骤操作:步骤1:初始化:设定总的数据样本集合为x={x
j
|j=1,2,
…
n},聚类数目为m(2≤m≤n);即要将x划分为m类,记为x1,x2,
…
,x
m
;此时有同时,设定m个初始聚类中心,记为c=(c1(k),c2(k),
…
,c
m
(k));步骤2:由公式(8)计算样本x
j
到聚类中心c
i
的欧氏距离d
ji
;
其中,t为数据样本的聚类指标总数;步骤3:由公式(9)计算样本x
j
对第i类的隶属度u
ji
;根据最小距离原则,对x进行聚类;假设满足关系式(10)则有x
i0
=x
i0
∪{x
j
},其中i0=1,2,
…
,m;步骤4:按公式(11)更新聚类中心;步骤5:假设此时存在i={1,2,
…
,m},满足c
i
(k+1)≠c
i
(k),则转到步骤2重新执行流程;否则,负荷模糊聚类结束。7.如权利要求6所述的多能负荷短期预测方法,其特征在于,所述基于模糊优化曲线形态分析算法,对每类负荷曲线簇分别进行特征识别提取包括:步骤1:用一条直线虚拟连接目标曲线的首尾两点,并求出当前目标曲线上其余各目标点到该直线的垂直距离;步骤2:设定曲线形态分析算法的阈值,并选出步骤1中计算得出的垂距最大值与阈值相比较,若大于阈值,则保留与直线的垂距最大值所对应的数据点;否则,舍弃直线两端点间的所有数据点;步骤3:基于所保留的数据点,将目标曲线划分成两部分处理,每部分视作新的目标曲线,重复步骤1、步骤2中的操作,基于二分法的思想反复迭代,即仍然选择垂距最大值与阈值比较,依次判断取舍,直到无点可舍去;最后,得到满足预定精度阈值的曲线特征点,并舍去其他点,即可完成目标曲线的特征提取。8.如权利要求7所述的多能负荷短期预测方法,其特征在于,所述基于模糊优化曲线形态分析算法,对每类负荷曲线簇分别进行特征识别提取还包括:定义论域e∈[0,1]为初次特征提取的阈值取值区域;设置阈值在[0,1]区间内取值,取值间隔为0.1;sat(ε)代表曲线形态分析算法的阈值取值对于某一簇相似曲线的隶属度;式(12)中,阈值隶属度sat(ε)由两部分相加组成,看作为某一阈值下的指定相似曲线簇的总体曲线特征提取满意度;其中,第一部分的d(ε)为指定相似曲线簇中识别提取得到
曲线特征与原始曲线的平均匹配度,以此判断所提取的曲线特征是否能够充分反映原始曲线的形状特征;第二部分的z(ε)为曲线特征点数量对原始曲线点数量的百分比值,即为曲线特征提取压缩原始曲线的平均百分比率;a、b为相应的比例系数;1)平均相似匹配度d(ε)引入动态时间规整距离对曲线特征与原始曲线的匹配度进行计算;设曲线原始序列与特征序列为x、y,则其序列长度分别为l
x
、l
y
。定义规整路径w=[w1,w2,
…
,w
k
],其中w
i
=(p
i
,q
i
)∈[1:l
x
]
×
[1:l
y
],1≤i≤k;规整路径需要满足边界性、连续性与单调性,如式(13)所示:则原始序列x和特征序列y之间的规整路径累积距离f
w
(x,y)由式(14)进行计算;最优规整路径w
*
下的规整路径累积距离达到最小,此时的规整路径累积距离即为dtw距离;基于动态规划的思想,由式(16)递归计算最优规整路径的累积距离;d
dtw
(x
i
,y
j
)=d(x
i
,y
j
)+min(d
dtw
(x
i-1
,y
j
),d
dtw
(x
i
,y
j-1
),d
dtw
(x
i-1
,y
j-1
))
ꢀꢀꢀꢀ
(16)迭代计算到d
dtw
(x
lx
,y
ly
)时即为所求的x和y之间的dtw距离;极限情况下的曲线特征只包括原始曲线的首末端点,记连接原始曲线首末端点的直线为y0,则相似曲线簇中识别提取得到曲线特征与原始曲线的平均匹配度d(ε)通过公式(17)计算:式(13)中,n为当前相似曲线簇中包含的曲线数目;2)平均压缩比率z(ε)通过公式(18)计算相似曲线簇中识别提取得到曲线特征与原始曲线的平均压缩比率z(ε):式(14)中,num(
·
)函数代表求取序列中的数据数目;3)比例系数a、b比例系数a、b的设置关系到对平均匹配度d(ε)以及平均压缩比率z(ε)的重视程度。9.如权利要求8所述的多能负荷短期预测方法,其特征在于,所述基于统计频率分布,
计算判别得到每类负荷曲线簇的总体特征分布集合包括:基于模糊优化阈值的曲线形态分析算法完成对某一类负荷曲线簇中全体负荷曲线各自的负荷特征初次提取后,应用统计频率分布的思想,二次提取该类负荷曲线簇的总体特征;记该类负荷曲线簇在负荷特征识别提取过程中产生的所有不重复的m个负荷特征编号集合为i=[i1,i2,
…
,i
i
,
…
,i
m
],相应的出现频次为g=[g1,g2,
…
,g
i
,
…
,g
m
],则对于该类负荷曲线簇的各负荷特征统计频率由公式(19)计算得到;然后,由公式(20)判断该负荷特征是否适合作为该类负荷曲线簇的总体特征之一;若满足公式(20),则其对应的i
i
加入到更新的该类负荷曲线簇的特征编号集合i
′
中,即i
i
∈i
′
;;最终,经过模糊优化阈值的曲线形态分析算法初次特征提取以及统计频率分布二次特征提取计算所得到的集合i
′
,即作为该类负荷曲线簇的总体特征标志。10.如权利要求9所述的多能负荷短期预测方法,其特征在于,所述概率转移链模型为:应用概率转移链模型,首先需要确定所研究系统的状态空间大小;假设历史负荷的类别编码序列总共包含r种状态,记作[s1,s2,
…
,s
i
,
…
,s
j
,
…
,s
r
],当负荷fcm聚类的结果为m类时,任意一种状态s
i
的取值范围为[1,m];由概率转移链的定义,状态s
i
经过n步后转移到状态s
j
的概率由公式(21)计算得出p
ij
(n)=t
ij
(n)/t
i
ꢀꢀꢀꢀ
(21)式中,t
ij
(n)表示历史状态序列中状态s
i
经过n步后转移到状态s
j
的次数;t
i
表示历史状态序列中s
i
状态出现的总次数;反复依据公式(21)可以计算得出概率转移链的n步状态转移概率矩阵,如公式(22)以及公式(23)所示:及公式(23)所示:由概率转移矩阵预测第r+1步的状态时,首先寻出概率转移矩阵的第r行的状态s
r
的最大转移概率,假设为p
ru
(n),其中u=1,2,
…
,r;则由概率转移链的定义,判别出状态s
u
为第r+1步的最大概率状态。
技术总结本发明公开了一种多能负荷短期预测方法,包括:获取数据;进行数据预处理,并执行动态Copula相关分析与负荷模糊聚类分析;基于模糊优化曲线形态分析算法,对每类负荷曲线簇分别进行特征识别提取;基于统计频率分布,计算判别得到每类负荷曲线簇的总体特征分布集合;基于机器学习算法分类建立组合负荷预测模型,依据每类负荷曲线簇的历史特征数据进行组合模型训练;用概率转移链模型判断预测时段负荷所属的分类,基于该类训练完成的负荷预测模型进行负荷特征的预测,并针对未来用电特征展开分析。两阶段式模糊优化负荷特征识别组合模型相较于传统模型在计算效率与具体性能上均有高效的提升,能够适应实际多能负荷预测工作的发展动态。展动态。展动态。
技术研发人员:谢敏 林盛振 叶佳南 张世平 刘明波
受保护的技术使用者:华南理工大学
技术研发日:2022.06.15
技术公布日:2022/11/1