本发明涉及新能源发电的光伏预测,具体涉及一种预测超短期光伏发电出力的混合模型建立方法。
背景技术:
1、随着全球能源需求的不断增长,可再生能源的开发和利用受到了广泛关注。在众多可再生能源中,太阳能光伏发电具有清洁、可再生、环保等优点,成为未来能源发展的重要方向。近年来,光伏发电系统在我国得到了广泛的应用,其装机容量逐年攀升。然而,光伏发电出力受天气、温度、湿度等多种因素影响,具有很大的不确定性和波动性,给电网调度和运行带来了一定的挑战。
2、为了提高光伏发电出力的预测精度,研究者们提出了多种预测方法,包括统计方法和物理方法。统计方法如时间序列分析、线性回归等,依赖于历史数据进行建模;物理方法则基于太阳辐射传输模型,考虑大气层、云层等因素对太阳辐射的影响。然而,这些方法在预测超短期光伏发电出力时存在一定的局限性。统计方法可能无法捕捉到数据中的非线性关系,而物理方法计算复杂,对输入参数的敏感性较高。
技术实现思路
1、本发明的目的是为了解决现有技术中存在的缺点,而提出的一种预测超短期光伏发电出力的混合模型建立方法。
2、为实现上述目的,本发明采用了如下技术方案:一种预测超短期光伏发电出力的混合模型建立方法,所述混合模型建立方法步骤如下:
3、s1:数据集采集原始数据:
4、所述原始数据包括:光伏发电用户基本信息、气象变量数据以及实际功率数据;
5、所述光伏发电用户基本信息包括9个光伏发电用户的位置和装机容量的信息,即用户f1-f9;
6、所述气象变量数据为9个光伏发电用户从2022年1月到2024年1月份,每间隔15分钟的气象数据,包括光照强度、温度、湿度、风速;
7、所述实际功率数据是9个光伏发电用户从2022年1月到2024年1月份,每间隔15分钟的发电出力数据;
8、s2:数据预处理:
9、对步骤s1中收集的原始数据进行数据预处理;
10、数据预处理包括合并数据集;划分训练集、验证集和测试集;对实际功率数据进行索引的重置;
11、通过上述数据预处理,原始数据被转换为适合预测模型使用的格式,并包含了必要的特征和目标变量;
12、s3:特征工程处理;
13、对原始数据进行了深入的特征工程处理;
14、包括:气象特征处理、历史值特征提取、异常值处理、光照与当天最强光照的比值特征提取、当天的平均光照特征提取以及温度与当天最高温最低温的差值特征提取;
15、通过这些特征工程处理步骤,原始数据被转换为包含丰富信息且适合预测模型使用的格式,为光伏发电出力预测模型的构建和训练提供了数据基础;
16、s4:构建预测超短期光伏发电出力的混合模型:
17、通过结合了lightgbm、xgboost和catboost三种先进的梯度提升算法,以实现光伏发电出力的准确预测;
18、s41:模型参数配置:
19、为lightgbm、xgboost和catboost算法分别配置了参数,包括学习率、树的数量、树的深度;
20、s42:训练-交叉验证:
21、使用五折交叉验证方法将数据集分为5个折叠,每个折叠包含一部分训练数据和验证数据;
22、针对每个折叠,使用训练数据集对lightgbm、xgboost和catboost三种算法进行模型训练;
23、在每个折叠的验证数据集上评估模型性能;
24、计算每个折叠的均方根误差(rmse)作为性能评估指标,最终评估结果是多个折叠的rmse平均值;
25、s43:模型融合:
26、采用了模型融合技术将三个模型的预测结果进行平均;
27、s5:模型性能评估:
28、步骤s4中的混合模型构建后,对混合模型进行评估:
29、均方根误差(ermse)由公式1可以得到:
30、
31、准确率(cr)由公式2可以得到:
32、cr=1-ermse 公式2;
33、合格率(qr)由公式3、公式4可以得到:
34、
35、s6:模型特征重要性分析:
36、在模型构建和性能评估的过程中,还进行特征重要性分析,以确定对光伏发电出力预测影响最大的特征。
37、较佳的,所述步骤s2中,数据预处理包括:
38、s21:从指定的文件路径读取气象变量数据、实际功率数据和光伏发电用户基本信息;
39、s22:将气象变量数据与光伏发电用户基本信息合并,以便包含光伏用户的编号、装机容量、经度和纬度信息;
40、s23:将时间戳转换为上海时区的日期时间格式;
41、s24:对实际功率数据进行索引的重置:
42、将实际功率数据从多层索引转换为单层索引,并重命名功率列为target;提取实际功率数据的级别,并将其转换为整数,以便与步骤s23中的时间戳进行匹配;
43、s25:将处理后的气象变量数据与实际功率数据合并,划分训练集、验证集和测试集;其中将用户f1-f7的数据作为训练集和验证集,用户f8和f9的数据用于模型的最终测试评估。
44、较佳的,所述步骤s3中,
45、所述气象特征处理:对风速和风向特征进行转换,以捕捉风对光伏发电的影响;
46、所述历史值特征提取:通过对辐照强度和温度进行差分处理,提取了辐照强度和温度的历史值特征;
47、所述异常值处理:检测和处理数据中的异常值,以减少模型对异常数据的敏感性;
48、所述光照与当天最强光照的比值特征提取:计算光伏发电出力数据中每个时间点的辐照强度与当天最强光照的比值;
49、所述当天的平均光照特征提取:通过分组聚合计算了每个光伏用户在白天/黑夜状态下当天的平均辐照强度,从而得到了每个光伏用户在特定时间段内的平均光照条件;
50、所述温度与当天最高温最低温的差值特征提取:计算了光伏发电出力数据中每个时间点的温度与当天最高温度和最低温度的差值。
51、较佳的,所述步骤s5中,对用户f8和f9的数据进行了消融实验,以验证融合模型中各个组件的重要性;所述消融实验是通过移除或替换模型中的关键组件来评估其对整体性能的影响。
52、较佳的,所述步骤s1中光伏发电出力预测的数据集是由数字中国创新大赛提供。
53、较佳的,所述步骤s5模型性能评估中评估指标参考了《调度侧风电或光伏功率预测系统技术要求》。
54、第二方面,本发明提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述存储器存储计算机程序;所述处理器执行前述的给予预测超短期光伏发电出力的混合模型建立方法。
55、第三方面,本发明提供一种可读存储介质,存储有计算机程序;所述计算机程序被处理器执行时基于预测超短期光伏发电出力的混合模型建立方法。
56、与现有技术相比,本发明的有益效果为:
57、(1)本发明通过模型融合技术,提高了预测的准确性,降低了预测误差。其次,通过在用户f8和f9的数据上进行训练和测试,该融合模型显示出了良好的泛化能力,这意味着该模型能够适应不同时间、地点和条件下的光伏发电出力预测,减少过拟合的风险。
58、(2)从经济和环境效益的角度来看,本发明能够减少预测准确率低带来的考核费用,提高光伏电站的经济效益。同时,该模型有助于推动光伏发电的大规模应用,减少对化石燃料的依赖,促进可再生能源的使用,对环境保护具有积极意义。
59、(3)在实际应用中,本发明提出的模型能够支持电网调度和光伏电站管理,提高电网的稳定性和可靠性。光伏电站运营商可以通过该模型制定有效的运维策略,降低运行成本,提高经济效益。
1.一种预测超短期光伏发电出力的混合模型建立方法,其特征在于:所述混合模型建立方法步骤如下:
2.如权利要求1所述的一种预测超短期光伏发电出力的混合模型建立方法,其特征在于:所述步骤s2中,数据预处理包括:
3.如权利要求1所述的一种预测超短期光伏发电出力的混合模型建立方法,其特征在于:所述步骤s3中,
4.如权利要求1所述的一种预测超短期光伏发电出力的混合模型建立方法,其特征在于:所述步骤s5中,对用户f8和f9的数据进行了消融实验,以验证融合模型中各个组件的重要性;所述消融实验是通过移除或替换模型中的关键组件来评估其对整体性能的影响。
5.如权利要求1所述的一种预测超短期光伏发电出力的混合模型建立方法,其特征在于:所述步骤s1中光伏发电出力预测的数据集是由数字中国创新大赛提供。
6.如权利要求1所述的一种预测超短期光伏发电出力的混合模型建立方法,其特征在于:所述步骤s5模型性能评估中评估指标参考了《调度侧风电或光伏功率预测系统技术要求》。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述存储器存储计算机程序;其特征在于:所述处理器执行如权利要求1-6中任意一项所述的基于预测超短期光伏发电出力的混合模型建立方法。
8.一种可读存储介质,存储有计算机程序;其特征在于:所述计算机程序被处理器执行时用于实现如权利要求1-6中任意一项所述的基于预测超短期光伏发电出力的混合模型建立方法。
